제1회 KRX 금융 빅데이터 활용 아이디어 경진대회

알고리즘 | 정형 | 회귀 | 금융 | 정성평가

  • moneyIcon 상금 : 총 2,000만원
  • 837명 마감
마감

 

성균관대학교 인공지능 학회 - 내 주식은 왜 떨어졌나(뉴스 크롤링/NLP/빈도분석/주가데이터 결합/시각화)

2022.07.18 16:10 2,925 조회 language

저는 현재 LG생건 주주입니다. 본전치기 겨우 하고 있습니다...
주식투자를 하면서 잃기도 하고 벌기도 해봤습니다. 
그 과정에서 내 주식이 왜 오르고 왜 떨어졌는지 이해할 수 없는 상황이 부지기수였습니다.
그럴 때마다 어떤 상황에서 주가가 오르고 떨어지는지 내가 알 수 있으면 좋겠다고 생각했습니다.
물론 종목에 대하여 뉴스를  꼼꼼히 읽어보면 좋겠지만 바쁜 현대인에게는 무리일 것입니다.

그래서 생각한 것이 뉴스크롤링을 통하여 빈도분석을 실행하고 이를 차트에서 확인할 수 있게 하고자 한 것입니다.
주식은 큰 틀에서는 환율, 금리, 해외증시 등 다양한 요소에 영향을 받고, 내부적으로는 해당 기업(종목)의 이슈들에 영향을 받는다고 생각합니다.

그래서 
1차적으로는 종목별 일별 뉴스를 크롤링하여 빈도분석하여 종목의 이슈를 추출해내고(이때 신문사는 매경, 한경, 이데일리, 헤럴드경제 총 4개사로 제한했습니다)
2차적으로는 네이버 금융에서 선정한 일별 주요뉴스의 제목을 크롤링하여  전체 시장과 경제 전반에 대한 이슈를 추출하고자 했습니다.
  (해당 링크는 22년 7월 17일 주요뉴스입니다.  https://finance.naver.com/news/mainnews.naver?date=2022-07-17 )

해당 코드는 Konlpy, fake_useragent, finance-datareader를 별도로 설치해야 돌아갈 것입니다.
Konlpy설치가 처음이신 분들은 코랩에서 돌리시는 게 더 낫을 것 같습니다... (코랩에서 통으로 돌리셔도 돌아갑니다)

부족한 코드지만 리뷰해주신다면 대단히 감사하겠습니다.

+ 종목은 하이브로 수행했습니다 (수행시간 대략 50분)
+ 멀티프로세스와 멀티쓰레드를 활용하여 크롤링하는 코드를 추가할 예정입니다. 대략 20배는 빨라질 거라고 하네요 ㄷㄷ

PDF
코드
로그인이 필요합니다
0 / 1000
양이마
2022.07.20 10:10

정말 흥미로운 분석이네요~ 잘봤습니다^^

망토
2022.07.22 10:55

흥미로는 분석입니다. 

이전 글
리더보드 평가 기간 연장
대회 - 제1회 KRX 금융 빅데이터 활용 아이디어 경진대회
좋아요 4
조회 2,635
댓글 0
2년 전
현재 글
성균관대학교 인공지능 학회 - 내 주식은 왜 떨어졌나(뉴스 크롤링/NLP/빈도분석/주가데이터 결합/시각화)
대회 - 제1회 KRX 금융 빅데이터 활용 아이디어 경진대회
좋아요 23
조회 2,925
댓글 2
2년 전
다음 글
토픽모델링과 토픽트렌드를 활용한 LSTM 딥러닝 정확도 개선
대회 - 제1회 KRX 금융 빅데이터 활용 아이디어 경진대회
좋아요 31
조회 8,602
댓글 6
2년 전