데이스쿨 할인 리턴즈
분석시각화 대회 코드 공유 게시물은
내용 확인 후
좋아요(투표) 가능합니다.
규정 관련 질문입니다.
안녕하세요! 데이콘 경진대회에 처음으로 참가하는 참가자입니다.
규정 상, test 데이터는 학습에 사용하지 말라고 되어있습니다.
궁금한 점은 train 데이터를 scaling 하는 과정에서 test 데이터도 합쳐서 scaling을 진행하고 싶은데 이것 역시 규정에 어긋나는 것인가요??
답변 기다리겠습니다!
데이콘(주) | 대표 김국진 | 699-81-01021
통신판매업 신고번호: 제 2021-서울영등포-1704호
직업정보제공사업 신고번호: J1204020250004
서울특별시 영등포구 은행로 3 익스콘벤처타워 901호
이메일 dacon@dacon.io |
전화번호: 070-4102-0545
Copyright ⓒ DACON Inc. All rights reserved
안녕하세요 작성자님.
test 데이터를 합쳐서 scaling하는 것은 data leakage에 해당합니다.
test 데이터 셋은 없다고 생각하고 전처리, 학습을 진행해야 합니다.
감사합니다.
데이콘 드림.