2023 NH 투자증권 빅데이터 경진대회, “블룸버그, 나스닥과 함께 세계속으로!”

아이디어 | 정형 | 언어 | 해외주식 분석 | 금융 | 정성평가

  • moneyIcon Prize : 5,000만 원
  • 1,137명 마감

 

상관계수를 통한 국내 및 미국 종가 예측 GRU모델링

공동작성자

stroke
2023.10.16 07:52 1,747 Views language

분석흐름
1. 상관계수 국내 미국 종목 0.8이상인 수 추출
2. 상 하위 종목 500개 추출
3. GRU모델링
4. 원하는 종목 별 종가 예측 확인

-외부 데이터
https://drive.google.com/file/d/1-UH1xd7YyzVaXGONExRtGqjARg3pq9HM/view

Code
로그인이 필요합니다
0 / 1000
faloi
2023.10.16 07:56

[csv_summary]
- NASDAQ_DT_FC_STK_QUT.csv: 대회에 제공된 데이터(usa2)
- kor_data.csv: 불러온 원본 데이터(data)
- all_data.csv: 원본 데이터 기반으로 만든 데이터(all_data)
- all_data2.csv: all_data에서 각 코드별 행 수가 164개가 아닌(164일치의 데이터가 없는) 코드 삭제(all_data2)
- results_kor.csv: all_data2에서 종목별 각 월의 Change 컬럼의 기하평균 계산한 Change, Code컬럼이 있음(results_kor)
- usa_code.csv: sql처리한 csv파일
- results_usa.csv: 종목별 각 월의 Change 컬럼의 기하평균 계산한 Change, Code컬럼이 있음(results_usa)
- high_corr.csv: 한국과 미국 종목간 상관계수가 0.8 이상(high_corr)
- high_corr500.csv: 상관계수 높은 순위 500(corr500)
- usa_result.csv: corr500에 해당하는 미국 주식의 Code와 ticker정보가 들어있음(usa_result)
- kor_result.csv: corr500에 해당하는 한국 주식의 COde와 ticker정보가 들어있음(kor_result)
- df.csv: corr500에 해당하는 미국 주식의 Name, Ticker, Industry, Sector, Business정보가 들어있음(df)
- df2.csv: corr500에 해당하는 한국 주식의 Name, Ticker, Industry, Sector, Business정보가 들어있음(df2)
- high_corr_result: df.csv와 df2.csv를 합친 데이터
- low_corr500.csv: 상관계수 낮은 순위 500(corr500)
- usa_low_result.csv: corr500에 해당하는 미국 주식의 Code와 ticker정보가 들어있음(usa_result)

faloi
2023.10.16 07:57

- kor_low_result.csv: corr500에 해당하는 한국 주식의 COde와 ticker정보가 들어있음(kor_result)
- df11.csv: corr500에 해당하는 미국 주식의 Name, Ticker, Industry, Sector, Business정보가 들어있음(df)
- df22.csv: corr500에 해당하는 한국 주식의 Name, Ticker, Industry, Sector, Business정보가 들어있음(df2)
- low_corr_result.csv: df11.csv와 df22.csv를 합친 데이터
- usa_df.csv: tck_iem_cd, gts_iem_ong_pr 등의 컬럼이 있는 usa_code.csv와 합친 데이터