Data Handling/시계열데이터

Pandas로 하는 시계열 데이터분석 (2) [TimeZone, Visualize]

아네스 2020. 12. 29. 13:30
반응형

TimeZone

localize로 설정한 것과 replace로 tzinfo를 바꾼것에서 시간차이가 나니 localize를 써서 바꾸자.

그 시간에 맞게끔 timezone 을 바꾸면서 datetime도 같이 조정해 주고싶다면 .astimezone으로 바꾸면 된다.

 

둘이 2018-12-31 15:00 과 2019-1-1 00:00 이 같다고 나옴.

timezone이 다른것을 보정해서 bool 연산을 해준다.(신기하네)

 

최근 금요일을 구하는데, timedelta로 더하는게 위와같은 오류(주석)를 없애준다.

 

DataFrame의 시각화

Apple 주식의 Volume과 Adj Close를 가져와서 그려보면 둘간의 scale차이떄문에 Adj Close가 Constant처럼 보인다.

하지만 분명히 변동성을 가지고있음.

이렇게 .plot()안에 secondary_y 를 주면 오른쪽 y축에 Volume 스케일이 따로 뜨면서 그래프를 겹쳐 그릴 수 있다.

 

위와같이 datetime index를 통해서 slicing할 수 있지만 plot 내의 xlim, ylim을 통해서 x,y축 scale조정이 가능하다.

 

fig.autofmt_xdate()을 하면 알아서 겹치지 않게 조정해주고

ax.xaxis.set_major_locator()와 ax.xaxis.set_major_formatter() 통해서 얼마나 촘촘하게, 그리고 X 축 index의 format또한 다시 정할 수 있다.

import matplotlib.dates as dates를 선언해줘야한다.

 

반응형