2021년(제2회) NH투자증권 빅데이터 경진대회

알고리즘 | 정형 | 회귀 | 금융 | RMSE

  • moneyIcon 상금 : 총 5,000만원 규모 상금 및 경품 제공
  • 832명 마감
마감

 

대회 관련 문의입니다.

작성자 비공개
2021.09.25 23:54 851 조회

대회를 진행하면서 궁금한 점들이 몇가지있어 문의 남깁니다.


1) train에서 주식 매수기간과 보유기간을 사용해서 매도 날짜를 계산하고, 매도 시점의 데이터를 사용하는 게 DATA LEAKAGE인가요?

2) iem_info 데이터 언제 기준으로 집계된건가요?

3) 2021년에 장이 열리는날, 열리지 않는 날과 관련된 데이터를 사용해도 될까요? 2021년에 수집된 데이터가 아니라 DATA LEAKAGE가 아니라고 판단되는데 맞나요?


로그인이 필요합니다
0 / 1000
DACONIO
2021.12.21 12:26

안녕하세요 작성자님.

1) 매도 날짜가 2021년 이전이면 괜찮지만, 매도 날짜가 2021년 이후 시점으로 예측되어 2021년 데이터를 사용하는 것은  Data Leakage에 해당합니다.
즉, 2021년 데이터만 사용하지 않는다면 매도 시점 데이터를 사용해도 무방합니다.
2) 2번 문의 사항은 주최측에 문의 후 답변드리겠습니다.
3) 2021년 개장일시 데이터가 2021년 이전에 공개되었다면 사용 가능하십니다.

감사합니다. 
데이콘 드림.