데이스쿨! 가을맞이 특별할인
분석시각화 대회 코드 공유 게시물은
내용 확인 후
좋아요(투표) 가능합니다.
hold_d 데이터 질문입니다.
test_set의 hold_d는 매수일자 ~ 2021년에 매도한 날짜의 차이를 뜻하고
train_set의 hold_d는 매수일자 ~ 매도일자 날짜의 차이를 뜻하는것 같은데,
따라서 train_set의 past_d는 = hold_d인것 같고, test 셋의 hold_d만 bnc_hist데이터로부터 뽑아내야 하는것 맞나요 ?
데이콘(주) | 대표 김국진 | 699-81-01021
통신판매업 신고번호: 제 2021-서울영등포-1704호
직업정보제공사업 신고번호: J1204020250004
서울특별시 영등포구 은행로 3 익스콘벤처타워 901호
이메일 dacon@dacon.io |
전화번호: 070-4102-0545
Copyright ⓒ DACON Inc. All rights reserved
안녕하세요.
train_set의 hold_d는 baseline에서 언급한 past_d와 다른 개념의 column입니다.
baseline에서 언급한 past_d는 계좌 ID가 동일한, 즉 같은 고객이 이전에 보유했던 주식의 이력을 의미합니다.
past_d를 새로운 feature로 사용할 수 있다는 한 가지 방법을 제시한 것일 뿐 정답은 아닙니다.
또한 test셋의 hold_d는 모델 학습으로 추론해야 하는 값으로 stk_bnc_hist데이터에서 뽑아내는 것이 불가능합니다.
stk_bnc_hist 데이터에는 2020년까지의 데이터가 존재합니다.
감사합니다.
데이콘 드림.