분석시각화 대회 코드 공유 게시물은
내용 확인 후
좋아요(투표) 가능합니다.
BERT를 이용한 최근 주목받는 테마의 관련주 분석
공동작성자
<크롤링>
1. newspaper 라이브러리를 이용한 NASDAQ_RSS_IFO text crawling
2. yfinance library를 이용한 stock description crawling, 재무제표 crawling
3. selenium과, bs4를 이용한 미국 경제 뉴스 CNBC crawling(2023.1.1~2023.8.31)
<크롤링 완료 후 데이터 저장 링크>
https://drive.google.com/drive/folders/1I-pmi33w6z_hUanRpHdbuSRRXG7LN79v?usp=sharing
<분석 flow>
1. BERTopic을 이용해 8월 중 CNBC에서 언급량이 많은 테마 찾기
2. 찾은 테마와 관련주 찾기
3. 재무제표 데이터를 기반으로 xgboost를 이용해 주가 상승 확률값 도출
4. NASDAQ_RSS_IFO 데이터를 기반으로 FinBERT를 이용해 각 기업별 sentimental score 도출
5. 주가 상승 확률값과 sentimental score 를 종합해 관련주 리스트 구축
* 토픽모델링 시각화 결과는 drive에 첨부했습니다.
데이콘(주) | 대표 김국진 | 699-81-01021
통신판매업 신고번호: 제 2021-서울영등포-1704호
서울특별시 영등포구 은행로 3 익스콘벤처타워 901호
이메일 dacon@dacon.io | 전화번호: 070-4102-0545
Copyright ⓒ DACON Inc. All rights reserved
정말 좋네요!!