GIL's LAB

실험 2. 종목 간 선후행 관계 파악 (1) 실험 설계 본문

퀀트 투자/실험 일지

실험 2. 종목 간 선후행 관계 파악 (1) 실험 설계

GIL~ 2021. 9. 5. 20:14

두 번째 실험에서는 종목 간 선후행 관계가 존재하는지를 확인하고자 한다.

가령, 한 종목의 주가가 올라가면 다른 종목의 주가가 뒤따라서 올라가는 그러한 관계를 확인하고자 한다.

그럼 실험 대상과 방법에 대해 알아보자.

 

실험 대상

  • 종목: 2016년 9월 1일부터 2021년 8월 31일까지 주가 데이터가 있는 코스피 종목 (즉, 2016년 9월 1일 이전에 상장해서 현재까지 상장폐지되지 않은 종목)
  • 구간: 2016년 9월 1일 ~ 2021년 8월 31일 (이하 전구간) / 2020년 9월 1일 ~ 2021년 8월 31일 (이하 최신구간)

 

실험 이해를 위한 배경 지식

  • 시계열의 정상성 (stationarity)이란 시계열의 확률적인 성질들이 시간의 흐름에 따라 변하지 않는다는 것을 의미하며, 정상 시계열은 정상성을 갖는 시계열을 의미한다. 많은 시계열 분석 방법이 이러한 정상 시계열을 대상으로 하고 있고, 정상 시계열인지를 판단하는 통계적인 방법으로는 adfuller 검정이 있다. 
  • 비정상 시계열일지라도 차분이나 변환을 통해 정상 시계열로 바꿀 수 있다. 
  • 길이가 T인 시계열 x에 대한 1차 차분은 다음과 같이 이후 값에서 이전 값을 뺀 것으로 정의된다. 

  • 시계열 간 인과관계를 분석하는데 있어 자주 사용되는 방법은 그랜저 인과관계 (Granger Causality) 분석이 있다. 시계열 A와 B가 있을 때, B를 예측하는데 과거의 B값만 사용하는 것보다 과거의 A값도 같이 사용했을 때 예측 정확도가 통계적으로 유의하게 올라간다면, A가 B를 그랜저 인과한다고 부른다. 쉽게 생각해서 A가 B에 대해 선행하는 시계열이라고 볼 수 있다. 
  • 그랜저 인과관계 분석에 사용되는 두 시계열은 정상 시계열이어야 한다. 

 

실험 방법

각 구간에 대해 다음과 같이 선/후행 관계를 파악한다.

(1) 종목별 종가의 1차 차분을 계산한다. 

(2) 1차 차분에 대해 adfuller 검정을 수행하여, 정상 시계열이라고 판단되는 종목의 1차 차분만 남긴다.

(3) 정상 시계열이라 판단된 종목 집합으로부터 선택 가능한 모든 순서 쌍 (A, B)를 선택하여, lag를 1부터 10까지 바꿔가면서 그랜저 인과관계 분석을 실시한다.

(4) 모든 순서 쌍에 대해 p-value가 가장 작은 lag와 그 때의 p-value를 확인한다. 만약 p-value가 0.01 이상이라면 두 종목은 관계가 없다고 간주하고, 0.01 미만이라면 A가 B에 대해 lag만큼 선행한다고 간주한다. 

 

실험 결과 정리 및 응용 방법

  • 종목 간 선후 관계들을 시각적으로 이해할 수 있도록 정리한다.
  • 피어 그룹별 대장주가 무엇인지 식별한다. 
  • 종목 간 선후 관계를 바탕으로 주가를 예측하는 추가 실험을 진행한다.

 

수집하고 싶은 금융 데이터나 실험하고 싶은 퀀트 관련 아이디어가 있으면 댓글로 남겨주세요! 
관련 포스팅을 준비하도록 하겠습니다!

 

Comments