DASCHOOL! Fall Special Discount
분석시각화 대회 코드 공유 게시물은
내용 확인 후
좋아요(투표) 가능합니다.
hold_d 데이터 질문입니다.
test_set의 hold_d는 매수일자 ~ 2021년에 매도한 날짜의 차이를 뜻하고
train_set의 hold_d는 매수일자 ~ 매도일자 날짜의 차이를 뜻하는것 같은데,
따라서 train_set의 past_d는 = hold_d인것 같고, test 셋의 hold_d만 bnc_hist데이터로부터 뽑아내야 하는것 맞나요 ?
DACON Co.,Ltd | CEO Kookjin Kim | 699-81-01021
Mail-order-sales Registration Number: 2021-서울영등포-1704
Business Providing Employment Information Number: J1204020250004
#901, Eunhaeng-ro 3, Yeongdeungpo-gu, Seoul 07237
E-mail dacon@dacon.io |
Tel. 070-4102-0545
Copyright ⓒ DACON Inc. All rights reserved
안녕하세요.
train_set의 hold_d는 baseline에서 언급한 past_d와 다른 개념의 column입니다.
baseline에서 언급한 past_d는 계좌 ID가 동일한, 즉 같은 고객이 이전에 보유했던 주식의 이력을 의미합니다.
past_d를 새로운 feature로 사용할 수 있다는 한 가지 방법을 제시한 것일 뿐 정답은 아닙니다.
또한 test셋의 hold_d는 모델 학습으로 추론해야 하는 값으로 stk_bnc_hist데이터에서 뽑아내는 것이 불가능합니다.
stk_bnc_hist 데이터에는 2020년까지의 데이터가 존재합니다.
감사합니다.
데이콘 드림.