NH Investment & Securities Big Data Competition

Algorithm | Structured | Regression | Finance | RMSE

  • moneyIcon Prize : 총 5,000만원 규모 상금 및 경품 제공
  • 832 Users Completed
Closed

 

data leakage 문의 드립니다.

Anonymous
2021.09.09 09:09 1,071 Views

hist 데이터는 train, test 데이터에 대한 이력이 모두 포함된 것으로 알고 있습니다.

단적인 예로 hist로 groupby를 해서 얻은 feature를 train과 test에 merge하여 사용해도 가능한가요?

예를 들어 hist에서 계좌별 거래 건수 같은 feature가 있을 것 같습니다.

Login Required
0 / 1000
DACONIO
2021.12.21 12:19

안녕하세요.

hist 데이터는 2021년 이전의 데이터로만 이루어져 있기 때문에 사용 가능하십니다.
따라서 말씀하신 것처럼 hist로 groupby 해서 얻은 feature를 사용할 수 있습니다.

감사합니다. 
데이콘 드림.