가장 기본이 되는 라인 차트(시간의 흐름에 따른 데이터 변화서 – Plot 이라 하는 것 같습니다.)을 알아보겠습니다.

라인 차트는 데이터 포인트들을 선으로 연결하여 시각화하는 그래프 유형입니다.

각 데이터 포인트는 보통 x축과 y축에 위치하며, 이 포인트들을 직선이나 곡선으로 연결해서 전체적인 데이터의 트렌드나 변화를 나타냅니다.

  • 시간에 따른 데이터 변화 관찰: 주식 가격, 온도 변화, 웹사이트 방문자 수 등 시간의 흐름에 따른 데이터의 추세를 보여줄 때 주로 사용됩니다.
  • 경제 데이터: 경제 성장률, 실업률 등 경제적 지표들을 시각화할 때 라인 차트를 많이 사용해요.
  • 과학적 연구: 실험 데이터나 관측 데이터의 변화를 시각적으로 표현할 때 유용합니다. 예를 들어 화학 반응에서 온도나 압력의 변화를 표시할 수 있어요.
  • 비즈니스 퍼포먼스 모니터링: 매출 증가율, 제품 생산량 등 기업의 성과를 시간에 따라 추적할 때 사용합니다.

Plot Code

import matplotlib.pyplot as plt
import numpy as np

under_y = [-8, -6, -1, 5, 11, 17, 22, 22, 15, 8, 1, -6]
high_y = [2, 5, 11, 18, 23, 27, 29, 30, 26, 20, 12, 4]

x = ['January', 'February', 'March', 'April', 'May', 'June',
     'July', 'August', 'September', 'October', 'November', 'December' ]

plt.plot(x, under_y, 'ro--', label="High C°")
plt.plot(x, high_y, 'bo--', label="Low C°")

plt.xticks(rotation=-60)
plt.xlabel('Month')
plt.ylabel('C°')
plt.legend()

plt.show()

Plot 은 데이터 사이의 관계와 시간에 따른 변화를 명확하게 보여주는 효과적인 방법이라서, 다양한 분야에서 광범위하게 활용되고 있습니다.

데이분석시 가장 처음 그리는 차트라고 할 수 있습니다.

이유로는 데이터의 수치와 흐름만 보다보니 전처리 하기 쉽고, 깊게 분석하기 전에 대략적으로 보기 좋습니다.

그런데 그만큼 중요한 키 정보를 얻어 내는 일은 많지 않습니다.

왜냐면 라인차트에서 중요 정보가 보인다면 대부분의 담당자들이 직관적으로 알 수 있는 내용입니다. 그러다 보니 데이터 분석을 할 필요가 없죠.

저는 1)라인 차트에서 X, Y 값을 바꿔 가면서 그려보고, 일반적인 표준 편차와 비교 해보는 작업을 데이터 분석시 제일 처음 하는 것 같습니다.

이 단계에서 뭔가 알아내면 좋지만 사실 데이터의 성향을 파악하는 작업에 가깝습니다.

그 후 좀 2)더 상세히 들어가 데이터를 분석하게 되죠.

그리고 왠만하면 3)리포트를 작성할때도 라인 차트를 쓰려고 노력합니다. 이유는 저말고 다른 사람이 이해를 해야되니 가장 직관적 보여야 하기 때문이죠.

By Mark

답글 남기기

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다