분석시각화 대회 코드 공유 게시물은
내용 확인 후
좋아요(투표) 가능합니다.
월간 데이콘 항공편 지연 예측 AI 경진대회
데이터 질문입니다.
Label Encoder 할 때 train ,test를 concat해서 사용해도 되나요?
혹시 test, train 데이터를 concat 해서 정보를 찾는 것도 data leakage에 해당하나요?
안녕하세요, KateLee 님
test 정보를 활용하는 것은 data leakage 해당합니다.
감사합니다.
DACON Co.,Ltd | CEO Kookjin Kim | 699-81-01021
Mail-order-sales Registration Number: 2021-서울영등포-1704
Business Providing Employment Information Number: J1204020250004
#901, Eunhaeng-ro 3, Yeongdeungpo-gu, Seoul 07237
E-mail dacon@dacon.io |
Tel. 070-4102-0545
Copyright ⓒ DACON Inc. All rights reserved
안녕하세요, kalus 님
train, test를 concat해서 한 번에 Label Encoder를 사용하는 것은 data leakage에 해당합니다.
감사합니다.