데이스쿨! 가을맞이 특별할인
분석시각화 대회 코드 공유 게시물은
내용 확인 후
좋아요(투표) 가능합니다.
전력 수요량 예측 경진대회
올려주신 결측치 처리 코드 관련 질문 있습니다. 직전 값이 높아 이후 데이터가 결측치인 경우에, 높은 계량값...
올려주신 결측치 처리 코드 관련 질문 있습니다. 직전 값이 높아 이후 데이터가 결측치인 경우에, 높은 계량값을 결측치+1 만큼의 개수로 나누어 각 셀에 대치하는 방법에 대해 '시계열 분석 및 머신러닝의 과적합을 방지하기 위해' 라고 설명이 되어있는데요, 이러한 결측치 대체 방법이 과적합을 방지하는데 어떤 식으로 도움이 되는지 궁금합니다.
데이콘(주) | 대표 김국진 | 699-81-01021
통신판매업 신고번호: 제 2021-서울영등포-1704호
직업정보제공사업 신고번호: J1204020250004
서울특별시 영등포구 은행로 3 익스콘벤처타워 901호
이메일 dacon@dacon.io |
전화번호: 070-4102-0545
Copyright ⓒ DACON Inc. All rights reserved
시계열 분석이나 머신러닝 등에서 직전 값이 높은 것을 처리하지 않고 그대로 모델링을 하였을 때,
원래 측정이 되어야 하는 값보다 높은 상태이고 이후 부분이 결측치로 되어,
이후 예측값을 산출하는데 원래 예측되어야 하는 값보다 훨씬 크게 나타나는 등의 문제가 발생할 것으로 판단하였습니다.
해당 방법으로 결측치를 처리하여서 값이 훨씬 크게 나타나는 것을 방지하는 것을 과적합 방지 라고 판단하여 설명을 적었는데 해당 부분에 대해서 설명을 부족하게 드린 것 같습니다.
해당 설명에 대해서는 수정 후에 게시된 내용을 참고해주신다면 감사드릴 것 같습니다.