분석시각화 대회 코드 공유 게시물은
내용 확인 후
좋아요(투표) 가능합니다.
질문이 있습니다. 통신문제가 1~5시에 발생했을 경우 1~2시에는 총합이 2~5시에는 결측치가 발생한다고 ...
질문이 있습니다.
통신문제가 1~5시에 발생했을 경우 1~2시에는 총합이 2~5시에는 결측치가 발생한다고 이해하였는데,
1~4시에는 결측치 4~5시에 총합이 적힌 데이터도 있는건가요??
ex) 0.226 NA NA NA NA NA NA NA NA 3.1 NA NA NA NA NA NA 0.279
이런경우에 3.1이 근접한 모든 NA의 합인지 아니면 말씀대로 3.1은 3.1 뒷부분의 NA의 합이며 앞의 NA는 오류라고 인식하면 되는 건가요?
DACON Co.,Ltd | CEO Kookjin Kim | 699-81-01021
Mail-order-sales Registration Number: 2021-서울영등포-1704
Business Providing Employment Information Number: J1204020250004
#901, Eunhaeng-ro 3, Yeongdeungpo-gu, Seoul 07237
E-mail dacon@dacon.io |
Tel. 070-4102-0545
Copyright ⓒ DACON Inc. All rights reserved
dsawawdad님 안녕하세요
현재 결측치가 발생하는 이유 중 하나가 미터기의 오류로 인한 누적문제인 것이지, 모든 결측치가 해당 문제를 가지고 있는 것은 아닙니다.
예시를 들어주신 것처럼 3.1의 근접한 모든 NA의 값들의 합이 아닌 3.1 뒷부분의 NA 합이라고 이야기 드릴 수 있습니다.
앞의 경우는 인식 오류 혹은 해당 시간대에 사용을 하지 않아 생기는 문제로 파악 할 수 있습니다. (이는 정확한 것은 아닙니다.)
이러한 결측치 처리의 문제는 정답이 없기 때문에 참가자분들의 역량에 달려있으며,
데이콘에서 제공해드리는 결측치 처리 코드를 참고하시면은 해당 결측치를 처리 할 때의 기준을
실제로 존재하는 값들 사이에 결측치가 존재하는 경우 모두를 처리하는 것이 아닌 각 세대의 median 이상의 값일 경우로 제안을 드린 상황입니다.
자세한 코드는 https://dacon.io/cpt11/205743 를 참고해주신다면 감사드리겠습니다.