분석시각화 대회 코드 공유 게시물은
내용 확인 후
좋아요(투표) 가능합니다.
[시각화]이해하기 쉬운 간단한 시각화와 인사이트 구하기
해당 데이터가 무엇 인지에 대해 알기 위한 정말 간단한 시각화 입니다.
모두 화이팅 입니다.
감사합니다 ^0^
세세히 분석하신 부분 공유해 주셔서 감사드립니다.
이해한 바로는 이상치 계산에 대해서 전체 데이터를 기준으로 quartile을 계산하시는 것 같은데,
실제 전처리 과정에서는 개별 건물로 quartile을 계산하고 첫 쿼터 이하만 드랍해도 좋을 듯 합니다.
차트에서 이상치가 많은 건물 10개중 4개는 사실 해당 건물의 사용량이 전체 데이터셋 사용량보다 현저히 많거나 (건물 3: 평균 2만 kwh) 적어 그 건물의 전체 기간 데이터가 모두 이상치로 분류된 사례로 보입니다.
첫 쿼터 이하만 드랍하는 이유는 전력 사용량 집계가 잘못되거나 갑자기 전력을 많이 사용해 발생하는 Peak보다 정전 또는 평시 사용하는 전기/전자제품을 잠시 꺼두어 발생한 Trough가 더 많을 것 같기 때문입니다.
좋은 정보 감사드립니다, 어쩐지 점수가 더 나아지지 않다더니, 정전은 생각도 못했네요;;
좋은 인사이트 감사합니다!!
DACON Co.,Ltd | CEO Kookjin Kim | 699-81-01021
Mail-order-sales Registration Number: 2021-서울영등포-1704
Business Providing Employment Information Number: J1204020250004
#901, Eunhaeng-ro 3, Yeongdeungpo-gu, Seoul 07237
E-mail dacon@dacon.io |
Tel. 070-4102-0545
Copyright ⓒ DACON Inc. All rights reserved
최곱니다!!따봉!! 이해하기 쉬워욤