분석시각화 대회 코드 공유 게시물은
내용 확인 후
좋아요(투표) 가능합니다.
뉴스 내용을 기반으로 산업, 세부 산업, 종목을 예측하는 딥러닝 모델 제작
공동작성자
Contents
1 데이터 전처리
1.0.1 ifo와 screener,qut 데이터 합치기
1.0.2 학습할 데이터 만들기
2 자연어처리
2.0.1 불용어 처리하기
3 "티커종목코드" 별로 "Tokenized_뉴스요약정보"의 단어 빈도를 딕셔너리 형태로 저장
3.1 result_df로 단어의 빈도 만들기
3.0.2 result_df에서 티커종목코드에 대한 단어의 빈도수 정규화하기.
3.0.3 각 티커 종목코드에 대한 문장을 수치화하는 normalized_dict로 요약
3.1 같은 방식으로 "세부 산업분야"에 대한 뉴스요약문장을 수치화하기
3.2 같은 방식으로 "산업분야"에 대한 뉴스요약문장을 수치화하기
4 뉴스 내용을 기반으로 산업, 세부 산업, 종목을 예측하는 딥러닝 모델 제작
4.0.1 종목별 학습
4.0.2 세부 산업분야별 학습
4.0.3 산업별 학습
5 '제목정보'를 모델에 넣어서 학습이 이뤄지는지 확인하기
5.0.1 종목
5.0.2 세부 산업분야
5.0.3 산업분야
6 최종 결과물
데이콘(주) | 대표 김국진 | 699-81-01021
통신판매업 신고번호: 제 2021-서울영등포-1704호
서울특별시 영등포구 은행로 3 익스콘벤처타워 901호
이메일 dacon@dacon.io | 전화번호: 070-4102-0545
Copyright ⓒ DACON Inc. All rights reserved
사용된 외부 데이터의 출처: https://www.nasdaq.com/market-activity/stocks/screener
화면의 Download CSV 클릭