The 1st Kookmin University AI Bigdata Analysis Competition

Algorithm | Tabular | Recommendation System | Recall

 

data leakage

2023.10.25 15:12 2,736 Views

submission의 이력서 고유 ID를 train set에 있는 이력서 고유 ID와 매칭해서 다른 feature들을 가져오는 것은 data leakage 인가요?

Login Required
0 / 1000
DACON.GM
2023.10.25 15:21

학습 데이터에 있는 이력서 고유 ID와 Submission 이력서 고유 ID (추천을 진행해야할 이력서 ID)와 동일합니다.
따라서 "submission의 이력서 고유 ID를 train set에 있는 이력서 고유 ID와 매칭해서 다른 feature들을 가져오는 것은" Data Leakage에 해당하지 않습니다.

18_ML
2023.10.25 15:21

감사합니다.