데이스쿨 할인 리턴-즈!
분석시각화 대회 코드 공유 게시물은
내용 확인 후
좋아요(투표) 가능합니다.
팔당댐 홍수 안전운영에 따른 한강 수위예측 AI 경진대회
test 데이터 결측치 처리 관련 질문드립니다.
Data leakage 해당하는 경우에 보면
이 부분이 있는데 이 부분에 관하여 질문을 드리고 싶습니다.
제가 결측치 처리를 해당 년도 달의 평균으로 처리하고 있습니다.
그런데, 저 부분에 따르면,
test data인 2022-06 ~ 2022-07까지의 X데이터의 결측치 처리하는 과정에서
2022-06의 결측치를 2022-06의 평균으로, 2022-07의 결측치는 2022-07의 평균으로 대체하면 안된다는 것인가요?
데이콘(주) | 대표 김국진 | 699-81-01021
통신판매업 신고번호: 제 2021-서울영등포-1704호
서울특별시 영등포구 은행로 3 익스콘벤처타워 901호
이메일 dacon@dacon.io | 전화번호: 070-4102-0545
Copyright ⓒ DACON Inc. All rights reserved
안녕하세요,
말씀해주신 결측치 처리 방법은 Data Leakage에 해당합니다.
예를들어 6월 10일 17시 00분의 수위를 예측한다고 했을 때, 말씀해주신 결측치 처리방법을 활용하면 추론하고자 하는 기간 이후의 데이터를 활용한 것이 됩니다.
감사합니다.