분석시각화 대회 코드 공유 게시물은
내용 확인 후
좋아요(투표) 가능합니다.
BERT를 이용한 최근 주목받는 테마의 관련주 분석
<크롤링>
1. newspaper 라이브러리를 이용한 NASDAQ_RSS_IFO text crawling
2. yfinance library를 이용한 stock description crawling, 재무제표 crawling
3. selenium과, bs4를 이용한 미국 경제 뉴스 CNBC crawling(2023.1.1~2023.8.31)
<크롤링 완료 후 데이터 저장 링크>
https://drive.google.com/drive/folders/1I-pmi33w6z_hUanRpHdbuSRRXG7LN79v?usp=sharing
<분석 flow>
1. BERTopic을 이용해 8월 중 CNBC에서 언급량이 많은 테마 찾기
2. 찾은 테마와 관련주 찾기
3. 재무제표 데이터를 기반으로 xgboost를 이용해 주가 상승 확률값 도출
4. NASDAQ_RSS_IFO 데이터를 기반으로 FinBERT를 이용해 각 기업별 sentimental score 도출
5. 주가 상승 확률값과 sentimental score 를 종합해 관련주 리스트 구축
* 토픽모델링 시각화 결과는 drive에 첨부했습니다.
DACON Co.,Ltd | CEO Kookjin Kim | 699-81-01021
Mail-order-sales Registration Number: 2021-서울영등포-1704
Business Providing Employment Information Number: J1204020250004
#901, Eunhaeng-ro 3, Yeongdeungpo-gu, Seoul 07237
E-mail dacon@dacon.io |
Tel. 070-4102-0545
Copyright ⓒ DACON Inc. All rights reserved
정말 좋네요!!