2023 NH 투자증권 빅데이터 경진대회, “블룸버그, 나스닥과 함께 세계속으로!”

아이디어 | 정형 | 언어 | 해외주식 분석 | 금융 | 정성평가

  • moneyIcon 상금 : 5,000만 원
  • 1,137명 마감

 

뉴스 키워드를 이용한 다음날 주가 경향성 예측

공동작성자

stroke
2023.10.08 17:26 2,040 조회 language

뉴스가 발행된 다음날의 주가 경향성을 예측하여 주식 시장 투자자들에게 실질적인 도움을 제공하는 것을 주요 목표로 설정하였습니다. 수집된 데이터를 활용하여 뉴스와 주가 데이터 간의 상호작용을 분석하고, 이를 기반으로 예측 모델을 구축하는 것이 핵심 목표입니다.
모델을 학습시키기 위해 주식과 관련된 감성사전을 구축하였으며, 이를 활용하여 뉴스 기사의 감성 및 주가에 미치는 영향을 평가합니다. 이렇게 구축된 모델은 이후에 발행되는 뉴스를 실시간으로 분석하고, 미래의 주가 움직임에 대한 예측을 수행합니다.

-1~6월의 데이터를 train set으로, 7~8월의 데이터를 test set으로 설정
-제공받은 데이터에서 피드 컨텐츠 데이터와 종목 시세 정보 데이터에 모두 포함되어 있는 종목 10개를 추려서 진행
-정보를 담고 있는 단어만 추출하기 위해 nltk 라이브러리 사용
-해당 종목의 뉴스 업로드 기준 다음날의 주가 경향성을 파악하기 위해 나스닥에서 종가 데이터 추출하여 사용
-LSTM 모델을 사용하여 주가 경향성 예측
-정확도를 높이기 위해 추후 더 많은 학습 데이터 구축 필요

외부 데이터 구글 드라이브 링크: https://drive.google.com/drive/folders/1FzTVZnXfpcJUQBbEyjve0z1_vxJMD_2D?usp=drive_link
❗️이 드라이브 내에 있는 파일을 다운로드해 코드를 돌리는 계정의 구글 드라이브에 옮긴 후 코드 실행해 주시길 바랍니다. 파일 업로드 오류가 계속 떠서 구글 드라이브 마운트 방식을 선택하였습니다. 

코드