전력 수요량 예측 경진대회

올려주신 결측치 처리 코드 관련 질문 있습니다. 직전 값이 높아 이후 데이터가 결측치인 경우에, 높은 계량값...

2019.10.07 18:08 4,789 Views

올려주신 결측치 처리 코드 관련 질문 있습니다. 직전 값이 높아 이후 데이터가 결측치인 경우에, 높은 계량값을 결측치+1 만큼의 개수로 나누어 각 셀에 대치하는 방법에 대해 '시계열 분석 및 머신러닝의 과적합을 방지하기 위해' 라고 설명이 되어있는데요, 이러한 결측치 대체 방법이 과적합을 방지하는데 어떤 식으로 도움이 되는지 궁금합니다.

Login Required
0 / 1000
송근구ㅡㄴ
2022.02.14 16:20

시계열 분석이나 머신러닝 등에서 직전 값이 높은 것을 처리하지 않고 그대로 모델링을 하였을 때,

원래 측정이 되어야 하는 값보다 높은 상태이고 이후 부분이 결측치로 되어,

이후 예측값을 산출하는데 원래 예측되어야 하는 값보다 훨씬 크게 나타나는 등의 문제가 발생할 것으로 판단하였습니다.

해당 방법으로 결측치를 처리하여서 값이 훨씬 크게 나타나는 것을 방지하는 것을 과적합 방지 라고 판단하여 설명을 적었는데 해당 부분에 대해서 설명을 부족하게 드린 것 같습니다.

해당 설명에 대해서는 수정 후에 게시된 내용을 참고해주신다면 감사드릴 것 같습니다.