분석시각화 대회 코드 공유 게시물은
내용 확인 후
좋아요(투표) 가능합니다.
뉴스 키워드를 이용한 다음날 주가 경향성 예측
공동작성자
뉴스가 발행된 다음날의 주가 경향성을 예측하여 주식 시장 투자자들에게 실질적인 도움을 제공하는 것을 주요 목표로 설정하였습니다. 수집된 데이터를 활용하여 뉴스와 주가 데이터 간의 상호작용을 분석하고, 이를 기반으로 예측 모델을 구축하는 것이 핵심 목표입니다.
모델을 학습시키기 위해 주식과 관련된 감성사전을 구축하였으며, 이를 활용하여 뉴스 기사의 감성 및 주가에 미치는 영향을 평가합니다. 이렇게 구축된 모델은 이후에 발행되는 뉴스를 실시간으로 분석하고, 미래의 주가 움직임에 대한 예측을 수행합니다.
-1~6월의 데이터를 train set으로, 7~8월의 데이터를 test set으로 설정
-제공받은 데이터에서 피드 컨텐츠 데이터와 종목 시세 정보 데이터에 모두 포함되어 있는 종목 10개를 추려서 진행
-정보를 담고 있는 단어만 추출하기 위해 nltk 라이브러리 사용
-해당 종목의 뉴스 업로드 기준 다음날의 주가 경향성을 파악하기 위해 나스닥에서 종가 데이터 추출하여 사용
-LSTM 모델을 사용하여 주가 경향성 예측
-정확도를 높이기 위해 추후 더 많은 학습 데이터 구축 필요
외부 데이터 구글 드라이브 링크: https://drive.google.com/drive/folders/1FzTVZnXfpcJUQBbEyjve0z1_vxJMD_2D?usp=drive_link
❗️이 드라이브 내에 있는 파일을 다운로드해 코드를 돌리는 계정의 구글 드라이브에 옮긴 후 코드 실행해 주시길 바랍니다. 파일 업로드 오류가 계속 떠서 구글 드라이브 마운트 방식을 선택하였습니다.
데이콘(주) | 대표 김국진 | 699-81-01021
통신판매업 신고번호: 제 2021-서울영등포-1704호
서울특별시 영등포구 은행로 3 익스콘벤처타워 901호
이메일 dacon@dacon.io | 전화번호: 070-4102-0545
Copyright ⓒ DACON Inc. All rights reserved