1 분 소요

논문 분석

Accurate Multivariate Stock Movement Prediction via Data-Axis Transformer with Multi-Level Contexts의 내용을 바탕으로 한 인공지능 주가 예측에 대한 정리.

문제 설정

주가 정보를 바탕으로 오늘의 주식 가격을 정확히 예측하는 것은 매우 어렵다. 왜냐하면 주식 가격을 책정하는 데에는 이전의 가격 정보 뿐만이 아니라 경제의 흐름, 기업 이슈, 투자자 심리, 등의 여러 외부 요인이 작용하기 때문이다. 따라서 해당 연구에서는 예측이 아닌 분류를 이용하여 주식 가격의 움직임(가격 상승, 가격 하락)을 예측한다.

기존 연구는 크게 univariate model과 multivariate model이 있다.

  1. Univariate model: 특정 주식의 가격은 독립적으로 움직인다고 가정한다.
  2. Multivariate model: 여러 주식 사이의 correlation을 고려하여 가격을 예측한다.

multivariate model에서 가장 중점적으로 고려되는 변인은 correlation이다. 예를 들어 반도체 시장의 호황/불황 여부에 따라 삼성전자, sk하이닉스의 주가 움직임이 결정될 수 있다. 즉, 보다 정확한 예측을 위해서는 correlation을 어떻게 활용할 지 고민해봐야 한다. 기존 연구들에서는 해당 correlation을 미리 설정한 후 학습을 진행한 반면, 해당 연구에서는 사전에 correlation에 대한 사전 정보 없이 학습을 하는 경우를 고려한다.

분석 기법: DTML을 이용한 주식 가격 예측

  1. Time-axis attention: 2/11의 주식 가격을 예측하기 위해서 2/1 ~ 2/10일의 주식 데이터를 모았다고 할 때, 그 중 어떤 날짜의 주식 가격 정보가 가장 예측에 도움이 되는 지 학습한다.
  2. Context aggregation: 주식은 시장에 독립적으로 움직이지 않는다. 즉, 개별종목을 예측할 때, 시장의 흐름도 같이 분석해야 한다.
  3. Data-axis attention: 여러 종목 간의 상관관계를 transformmer를 이용하여 학습할 수 있다.

image
위는 3가지 요소를 이용하여 분석하는 DTML의 전체 구조이다.

Time-axis attention

우선 time-axis attention에서는 각 종목의 주식 가격 정보를 input으로 입력받는다. 해당 단계에서는 개별 종목의 가격을 하나의 vector로 요약하는 것이 목표이다.

Context aggregation

다음으로 context aggregation에서는 개별 종목의 vector 정보를 얻어 이와 함께 market index를 이용하여 multi level context vector를 생성한다. 이는 개별 종목 정보 뿐만 아니라 market 정보까지 이용한다.

Data-axis attention

마지막으로 data-axis attention에서는 해당 vector들의 가중평균을 구하여 등락을 결정한다.

댓글남기기