가장 기본이 되는 라인 차트(시간의 흐름에 따른 데이터 변화서 – Plot 이라 하는 것 같습니다.)을 알아보겠습니다.
라인 차트는 데이터 포인트들을 선으로 연결하여 시각화하는 그래프 유형입니다.
각 데이터 포인트는 보통 x축과 y축에 위치하며, 이 포인트들을 직선이나 곡선으로 연결해서 전체적인 데이터의 트렌드나 변화를 나타냅니다.
- 시간에 따른 데이터 변화 관찰: 주식 가격, 온도 변화, 웹사이트 방문자 수 등 시간의 흐름에 따른 데이터의 추세를 보여줄 때 주로 사용됩니다.
- 경제 데이터: 경제 성장률, 실업률 등 경제적 지표들을 시각화할 때 라인 차트를 많이 사용해요.
- 과학적 연구: 실험 데이터나 관측 데이터의 변화를 시각적으로 표현할 때 유용합니다. 예를 들어 화학 반응에서 온도나 압력의 변화를 표시할 수 있어요.
- 비즈니스 퍼포먼스 모니터링: 매출 증가율, 제품 생산량 등 기업의 성과를 시간에 따라 추적할 때 사용합니다.
Plot Code
import matplotlib.pyplot as plt
import numpy as np
under_y = [-8, -6, -1, 5, 11, 17, 22, 22, 15, 8, 1, -6]
high_y = [2, 5, 11, 18, 23, 27, 29, 30, 26, 20, 12, 4]
x = ['January', 'February', 'March', 'April', 'May', 'June',
'July', 'August', 'September', 'October', 'November', 'December' ]
plt.plot(x, under_y, 'ro--', label="High C°")
plt.plot(x, high_y, 'bo--', label="Low C°")
plt.xticks(rotation=-60)
plt.xlabel('Month')
plt.ylabel('C°')
plt.legend()
plt.show()
Plot 은 데이터 사이의 관계와 시간에 따른 변화를 명확하게 보여주는 효과적인 방법이라서, 다양한 분야에서 광범위하게 활용되고 있습니다.
데이분석시 가장 처음 그리는 차트라고 할 수 있습니다.
이유로는 데이터의 수치와 흐름만 보다보니 전처리 하기 쉽고, 깊게 분석하기 전에 대략적으로 보기 좋습니다.
그런데 그만큼 중요한 키 정보를 얻어 내는 일은 많지 않습니다.
왜냐면 라인차트에서 중요 정보가 보인다면 대부분의 담당자들이 직관적으로 알 수 있는 내용입니다. 그러다 보니 데이터 분석을 할 필요가 없죠.
저는 1)라인 차트에서 X, Y 값을 바꿔 가면서 그려보고, 일반적인 표준 편차와 비교 해보는 작업을 데이터 분석시 제일 처음 하는 것 같습니다.
이 단계에서 뭔가 알아내면 좋지만 사실 데이터의 성향을 파악하는 작업에 가깝습니다.
그 후 좀 2)더 상세히 들어가 데이터를 분석하게 되죠.
그리고 왠만하면 3)리포트를 작성할때도 라인 차트를 쓰려고 노력합니다. 이유는 저말고 다른 사람이 이해를 해야되니 가장 직관적 보여야 하기 때문이죠.