[신규 오픈 기념] 데이스쿨 최대 40% 할인 🎁
분석시각화 대회 코드 공유 게시물은
내용 확인 후
좋아요(투표) 가능합니다.
Data Leakage
안녕하세요.
데이터 분석 입문자입니다.
test dataset을 submission형태에 맞추기 위해 150개의 단지코드 샘플로 변경할 때
같은 단지코드 내에 있는 데이터들끼리 값을 조합해도 상관없는 건가요?
단순하게 test 데이터는 샘플별로 독립적으로 다뤄야한다는 생각이 있었는데
해당 대회는 특별한 경우라 그렇지 않아도 되는 것인지 궁금합니다.
그렇다면 같은 단지코드 데이터에서 평균을 내서 사용한다면 그건 leakage인가요?
같은 단지코드 데이터에서 평균을 내서 사용하는 것은 leakage가 아닙니다.
감사합니다.
네 알겠습니다 감사합니다.
데이콘(주) | 대표 김국진 | 699-81-01021
통신판매업 신고번호: 제 2021-서울영등포-1704호
서울특별시 영등포구 은행로 3 익스콘벤처타워 901호
이메일 dacon@dacon.io | 전화번호: 070-4102-0545
Copyright ⓒ DACON Inc. All rights reserved
안녕하세요. 작성자님
같은 단지코드의 데이터는 단지 1개의 데이터로 해당 단지의 주차 수요를 예측하기위해 결합하는 것은 data leakage가 아닙니다.
감사합니다.
데이콘 드림.