제1회 국민대학교 AI빅데이터 분석 경진대회

알고리즘 | 정형 | 추천시스템 | Recall

  • moneyIcon 상금 : 400 만원
  • 1,171명 마감

 

data leakage

2023.10.25 15:12 1,565 조회

submission의 이력서 고유 ID를 train set에 있는 이력서 고유 ID와 매칭해서 다른 feature들을 가져오는 것은 data leakage 인가요?

로그인이 필요합니다
0 / 1000
DACON.GM
2023.10.25 15:21

학습 데이터에 있는 이력서 고유 ID와 Submission 이력서 고유 ID (추천을 진행해야할 이력서 ID)와 동일합니다.
따라서 "submission의 이력서 고유 ID를 train set에 있는 이력서 고유 ID와 매칭해서 다른 feature들을 가져오는 것은" Data Leakage에 해당하지 않습니다.

18_ML
2023.10.25 15:21

감사합니다.