2023 NH 투자증권 빅데이터 경진대회, “블룸버그, 나스닥과 함께 세계속으로!”

아이디어 | 정형 | 언어 | 해외주식 분석 | 금융 | 정성평가

  • moneyIcon Prize : 5,000만 원
  • 1,134명 마감

 

BERT를 이용한 최근 주목받는 기술 테마의 관련주 분석

공동작성자

stroke
2023.10.16 07:50 1,489 Views language

<크롤링>
1. newspaper 라이브러리를 이용한 NASDAQ_RSS_IFO text crawling
2. yfinance library를 이용한 stock description crawling, 재무제표 crawling
3. selenium과, bs4를 이용한 미국 경제 뉴스 CNBC crawling(2023.1.1~2023.8.31)

<분석 flow>
1. BERTopic을 이용해 8월 중 CNBC에서 언급량이 많은 테마 찾기
2. 찾은 테마와 관련주 찾기
3. 재무제표 데이터를 기반으로 xgboost를 이용해 주가 상승 확률값 도출
4. NASDAQ_RSS_IFO 데이터를 기반으로 FinBERT를 이용해 각 기업별 sentimental score 도출
5. 주가 상승 확률값과 sentimental score 를 종합해 관련주 리스트 구축

Code