NH Investment & Securities Big Data Competition

Algorithm | Structured | Regression | Finance | RMSE

  • moneyIcon Prize : 총 5,000만원 규모 상금 및 경품 제공
  • 832 Users Completed
Closed

 

hold_d 데이터 질문입니다.

Anonymous
2021.09.08 16:25 1,121 Views

test_set의 hold_d는 매수일자 ~ 2021년에 매도한 날짜의 차이를 뜻하고

train_set의 hold_d는 매수일자 ~ 매도일자 날짜의 차이를 뜻하는것 같은데,

따라서 train_set의 past_d는 = hold_d인것 같고, test 셋의 hold_d만 bnc_hist데이터로부터 뽑아내야 하는것 맞나요 ?



Login Required
0 / 1000
DACONIO
2021.12.21 12:18

안녕하세요.

train_set의 hold_d는 baseline에서 언급한 past_d와 다른 개념의 column입니다.
baseline에서 언급한 past_d는 계좌 ID가 동일한, 즉 같은 고객이 이전에 보유했던 주식의 이력을 의미합니다.
past_d를 새로운 feature로 사용할 수 있다는 한 가지 방법을 제시한 것일 뿐 정답은 아닙니다.

또한 test셋의 hold_d는 모델 학습으로 추론해야 하는 값으로 stk_bnc_hist데이터에서 뽑아내는 것이 불가능합니다.
stk_bnc_hist 데이터에는 2020년까지의 데이터가 존재합니다. 

감사합니다. 
데이콘 드림.