2023 NH 투자증권 빅데이터 경진대회, “블룸버그, 나스닥과 함께 세계속으로!”

아이디어 | 정형 | 언어 | 해외주식 분석 | 금융 | 정성평가

  • moneyIcon 상금 : 5,000만 원
  • 1,093명 마감

 

BERT를 이용한 최근 주목받는 테마의 관련주 분석

공동작성자

stroke
2023.10.14 22:11 1,971 조회 language

<크롤링>
1. newspaper 라이브러리를 이용한 NASDAQ_RSS_IFO text crawling
2. yfinance library를 이용한 stock description crawling, 재무제표 crawling
3. selenium과, bs4를 이용한 미국 경제 뉴스 CNBC crawling(2023.1.1~2023.8.31)

<크롤링 완료 후 데이터 저장 링크>
https://drive.google.com/drive/folders/1I-pmi33w6z_hUanRpHdbuSRRXG7LN79v?usp=sharing

<분석 flow>
1. BERTopic을 이용해 8월 중 CNBC에서 언급량이 많은 테마 찾기
2. 찾은 테마와 관련주 찾기
3. 재무제표 데이터를 기반으로 xgboost를 이용해 주가 상승 확률값 도출
4. NASDAQ_RSS_IFO 데이터를 기반으로 FinBERT를 이용해 각 기업별 sentimental score 도출
5. 주가 상승 확률값과 sentimental score 를 종합해 관련주 리스트 구축

* 토픽모델링 시각화 결과는 drive에 첨부했습니다.

코드
로그인이 필요합니다
0 / 1000
렛츠두짱
2023.10.15 16:32

정말 좋네요!!