분석시각화 대회 코드 공유 게시물은
내용 확인 후
좋아요(투표) 가능합니다.
데이터 기초 분석 자료
데이터 로드하여 간단한 전처리 및 일별 집계(평균, 최소, 최대)후 같은 일자로 join한 프로그램입니다.
기본적인 시각화를 이용해 데이터의 패턴을 살펴봤습니다.
유효한 것으로 판단되는 패턴
1. 기온의 주기성("일별 기온 추이" 참고)
2. 기온과 전력수급실적의 상관성("기온 vs 전력수급실적" 참고)
+ 현재까지 기온 外 다른 요소들과 target variables 간의 유효한 상관성은 확인되지 않음
+ 현재까지 기온과 SMP와의 유효한 상관성은 확인되지 않음
특이사항
1. 최대SMP 400원 이상 2일(2019-7-26, 2019-12-14)
2. 최대SMP , 최소SMP는 hourly_smp_v1.csv에서 직접 계산한 것과 target_v1.csv 값이 일치하나, 평균SMP는 일치하지 않음
target_v1.csv의 평균SMP은 단순평균이 아니고, 시간대별 발전량으로 가중평균한 것으로 추정됨(시간대별 발전량 데이터 없음)
잘 이해가 안가는게 있어서 질문드립니다. # SMP 일별 집계 부분 코드는 R코드인가요?
전부 파이썬 코드이고, dfply라는 data manipulation 패키지를 이용한 부분입니다. dfply는 R의 dplyr를 파이썬으로 구현한 버전인데, pandas를 쓸 때보다 코드가 짧아지고 직관적이게 되어 일부 대체해서 사용하고 있습니다. 다만 약간씩 신경쓰이는 버그들이 있어 완전 대체는 불가능합니다. dfply 사용법을 간단하게 찾아보시면 도움 될 것 같습니다.
좋은 데이터 분석과 답변 감사합니다.
데이콘(주) | 대표 김국진 | 699-81-01021
통신판매업 신고번호: 제 2021-서울영등포-1704호
서울특별시 영등포구 은행로 3 익스콘벤처타워 901호
이메일 dacon@dacon.io | 전화번호: 070-4102-0545
Copyright ⓒ DACON Inc. All rights reserved
첫날부터 부지런하십니다! 시작 가이드라인을 잡아주셔서 감사합니다~