2023 NH 투자증권 빅데이터 경진대회, “블룸버그, 나스닥과 함께 세계속으로!”

아이디어 | 정형 | 언어 | 해외주식 분석 | 금융 | 정성평가

  • moneyIcon 상금 : 5,000만 원
  • 1,134명 마감

 

🧐GPT based TM &뉴스 중요도 산정 모델 - 뉴스&주가 데이터의 결합 ✋

공동작성자

stroke
2023.10.07 03:47 1,369 조회 language

안녕하세요! Team_DIFI입니다.

<분석 배경>
  다양한 주체로부터 제공되는 정보의 방대함으로 인해 투자자는 원하는 정보를 신속하게 얻기 힘들며, 이로 인해 불필요한 시간 소비가 발생하게 됩니다. 이러한 문제점을 해결하기 위해 저희는 금융 시장을 고려한 뉴스 체계를 제안하여 투자자들이 투자에 필요한 정보에만 신속하게 접근하고 이해하기 쉽도록 만드는 프로세스가 필요하다고 판단하였습니다. 또한 저희는 투자자에게 뉴스가 노출되는 전 단계에서 ‘정보의 중요성과 주요 키워드’에 대한 깊은 이해를 반영한 프로세스가 필요하다고 판단하였습니다.
  본 팀의 목표는 ‘투자자의 직관적 뉴스 경험을 제안’ 하는 것입니다. 이를 통해 저희는 투자자가 뉴스에 불필요한 시간을 소비하는 과정을 축소하고, 더 효율적이고 몰입도 있는 뉴스 경험을 제공하기 위한 초석을 다지려고 합니다.

분석 절차는 아래와 같습니다. (Google Colab)

<Part 1. 금융 시장의 뉴스 체계를 제안>
1) 2023년 1월 나스닥 RSS Feed 데이터를 Manual Labeling 진행
2) Manual Labeling 이후 뉴스 분류 모델을 구축, 학습 진행
3) 2~8월에 대해서 학습한 모델을 적용해서 모든 뉴스에 대해서 Labeling

<Part 2. ChatGPT based Topic Modeling>
1) 분류한 뉴스 카테고리 별 Topic Modeling을 실행
2) 토픽의 객관적인 해석을 위해 ChatGPT의 해석을 반영

<Part3. 뉴스 중요도 산정 모델 & 해석>
1) 뉴스 키워드 데이터와 주가 변동을 이용한 중요도 산정
2)  XAI를 통한 키워드 발견

각 과정마다의 실행 이유&해석을 코드에 반영하였습니다. 

클릭해주셔서 감사합니다!

코드