2021년(제2회) NH투자증권 빅데이터 경진대회

알고리즘 | 정형 | 회귀 | 금융 | RMSE

  • moneyIcon 상금 : 총 5,000만원 규모 상금 및 경품 제공
  • 832명 마감
마감

 

데이터 질문

작성자 비공개
2021.09.07 13:29 1,260 조회

추가적으로 새로운 feature로 사용할 수 있는 정보에는 고객의 이전 주식 보유이력이 있습니다.(past_d로 칭하겠습니다.)

stk_bnc_hist.csv 데이터를 살펴보면 stk_hld_test.csv 고객들의 이전 주식 보유이력(past_d)을 확인할 수 있습니다.

stk_hld_train.csv도 마찬가지로 past_d column을 만들 수 있을 것으로 보입니다.


힌트 부분에 stk_bnc_hist.csv  데이터를 살펴보면 past_d 를 볼수있다고 적혀있는데요 hist 데이터에는 그런 것을 볼수없고 test.csv 파일에서 찾아볼수있는데

잘못 적혀있는건가요?

로그인이 필요합니다
0 / 1000
DACONIO
2021.09.07 14:08

안녕하세요.
베이스라인에서 칭한 past_d는 hist_d와는 별개의 개념입니다.
hist_d는 hold_d를 2021년을 기준으로 끊은 개념이지만, past_d는 동일한 고객이 이전에 매수하고 매도를 완료한 주식 보유기간을 의미합니다.
감사합니다.

anonymous
작성자
2021.09.07 14:20

답변감사합니다

anonymous
작성자
2021.09.07 14:36

삭제된 댓글입니다

DACONIO
2021.09.07 14:36

past_d 정보는 stk_bnc_hist.csv 데이터에서 매수 매도 날짜를 이용하여 직접 구성하셔야 합니다.

anonymous
작성자
2021.09.07 14:43

감사합니다. 

DACONIO
2021.09.07 14:45

추가적으로 궁금하신 점은 언제든지 알려주시면 답변 드리겠습니다!

anonymous
작성자
2021.09.14 14:50

한가지 더 궁금한게 생겨서 질문드립니다.  hist_d 를 산출할때 매수시점 ~ 20 년 12 31일 로 끊은 결과를 제가 직접(휴일 및 휴장일)  계산해보았는데 몇가지 케이스들은 잘맞는데 일부 케이스들에서  1~2일 차이가 납니다. 혹시 데이콘 측에서 이런 매수일자,매도일자 사이의 영업일 계산할때 쓰인 휴장일 에대한 데이터는 따로 제공을 받을수가없나요??