분석시각화 대회 코드 공유 게시물은
내용 확인 후
좋아요(투표) 가능합니다.
성균관대학교 인공지능 학회 - 내 주식은 왜 떨어졌나(뉴스 크롤링/NLP/빈도분석/주가데이터 결합/시각화)
저는 현재 LG생건 주주입니다. 본전치기 겨우 하고 있습니다...
주식투자를 하면서 잃기도 하고 벌기도 해봤습니다.
그 과정에서 내 주식이 왜 오르고 왜 떨어졌는지 이해할 수 없는 상황이 부지기수였습니다.
그럴 때마다 어떤 상황에서 주가가 오르고 떨어지는지 내가 알 수 있으면 좋겠다고 생각했습니다.
물론 종목에 대하여 뉴스를 꼼꼼히 읽어보면 좋겠지만 바쁜 현대인에게는 무리일 것입니다.
그래서 생각한 것이 뉴스크롤링을 통하여 빈도분석을 실행하고 이를 차트에서 확인할 수 있게 하고자 한 것입니다.
주식은 큰 틀에서는 환율, 금리, 해외증시 등 다양한 요소에 영향을 받고, 내부적으로는 해당 기업(종목)의 이슈들에 영향을 받는다고 생각합니다.
그래서
1차적으로는 종목별 일별 뉴스를 크롤링하여 빈도분석하여 종목의 이슈를 추출해내고(이때 신문사는 매경, 한경, 이데일리, 헤럴드경제 총 4개사로 제한했습니다)
2차적으로는 네이버 금융에서 선정한 일별 주요뉴스의 제목을 크롤링하여 전체 시장과 경제 전반에 대한 이슈를 추출하고자 했습니다.
(해당 링크는 22년 7월 17일 주요뉴스입니다. https://finance.naver.com/news/mainnews.naver?date=2022-07-17 )
해당 코드는 Konlpy, fake_useragent, finance-datareader를 별도로 설치해야 돌아갈 것입니다.
Konlpy설치가 처음이신 분들은 코랩에서 돌리시는 게 더 낫을 것 같습니다... (코랩에서 통으로 돌리셔도 돌아갑니다)
부족한 코드지만 리뷰해주신다면 대단히 감사하겠습니다.
+ 종목은 하이브로 수행했습니다 (수행시간 대략 50분)
+ 멀티프로세스와 멀티쓰레드를 활용하여 크롤링하는 코드를 추가할 예정입니다. 대략 20배는 빨라질 거라고 하네요 ㄷㄷ
데이콘(주) | 대표 김국진 | 699-81-01021
통신판매업 신고번호: 제 2021-서울영등포-1704호
서울특별시 영등포구 은행로 3 익스콘벤처타워 901호
이메일 dacon@dacon.io | 전화번호: 070-4102-0545
Copyright ⓒ DACON Inc. All rights reserved
정말 흥미로운 분석이네요~ 잘봤습니다^^