DASCHOOL 할인 리턴즈
분석시각화 대회 코드 공유 게시물은
내용 확인 후
좋아요(투표) 가능합니다.
규정 관련 질문입니다.
안녕하세요! 데이콘 경진대회에 처음으로 참가하는 참가자입니다.
규정 상, test 데이터는 학습에 사용하지 말라고 되어있습니다.
궁금한 점은 train 데이터를 scaling 하는 과정에서 test 데이터도 합쳐서 scaling을 진행하고 싶은데 이것 역시 규정에 어긋나는 것인가요??
답변 기다리겠습니다!
DACON Co.,Ltd | CEO Kookjin Kim | 699-81-01021
Mail-order-sales Registration Number: 2021-서울영등포-1704
Business Providing Employment Information Number: J1204020250004
#901, Eunhaeng-ro 3, Yeongdeungpo-gu, Seoul 07237
E-mail dacon@dacon.io |
Tel. 070-4102-0545
Copyright ⓒ DACON Inc. All rights reserved
안녕하세요 작성자님.
test 데이터를 합쳐서 scaling하는 것은 data leakage에 해당합니다.
test 데이터 셋은 없다고 생각하고 전처리, 학습을 진행해야 합니다.
감사합니다.
데이콘 드림.