AI프렌즈 공공 데이터 활용 전력수요 및 SMP 예측 AI 경진대회

알고리즘 | 정형 | 회귀 | 에너지 | WRMSSE

  • moneyIcon 상금 : 총 250만원
  • 602명 마감

 

데이터 기초 분석 자료

2020.05.01 20:41 6,557 조회 language

데이터 로드하여 간단한 전처리 및 일별 집계(평균, 최소, 최대)후 같은 일자로 join한 프로그램입니다.
기본적인 시각화를 이용해 데이터의 패턴을 살펴봤습니다.

유효한 것으로 판단되는 패턴
1. 기온의 주기성("일별 기온 추이" 참고)
2. 기온과 전력수급실적의 상관성("기온 vs 전력수급실적" 참고)
+ 현재까지 기온 外 다른 요소들과 target variables 간의 유효한 상관성은 확인되지 않음
+ 현재까지 기온과 SMP와의 유효한 상관성은 확인되지 않음

특이사항
1. 최대SMP 400원 이상 2일(2019-7-26, 2019-12-14)
2. 최대SMP , 최소SMP는 hourly_smp_v1.csv에서 직접 계산한 것과 target_v1.csv 값이 일치하나, 평균SMP는 일치하지 않음
target_v1.csv의 평균SMP은 단순평균이 아니고, 시간대별 발전량으로 가중평균한 것으로 추정됨(시간대별 발전량 데이터 없음)

코드
로그인이 필요합니다
0 / 1000
Python
2020.05.01 22:05

첫날부터 부지런하십니다! 시작 가이드라인을 잡아주셔서 감사합니다~

Codemonkey
2020.05.02 06:40

잘 이해가 안가는게 있어서 질문드립니다. # SMP 일별 집계 부분 코드는 R코드인가요? 

김나맥
2020.05.02 10:10

전부 파이썬 코드이고, dfply라는 data manipulation 패키지를 이용한 부분입니다. dfply는 R의 dplyr를 파이썬으로 구현한 버전인데, pandas를 쓸 때보다 코드가 짧아지고 직관적이게 되어 일부 대체해서 사용하고 있습니다. 다만 약간씩 신경쓰이는 버그들이 있어 완전 대체는 불가능합니다. dfply 사용법을 간단하게 찾아보시면 도움 될 것 같습니다.

Codemonkey
2020.05.02 14:19

좋은 데이터 분석과 답변 감사합니다. 

이전 글
유가 데이터 수집기 (from 네이버금융)
대회 - AI프렌즈 공공 데이터 활용 전력수요 및 SMP 예측 AI 경진대회
좋아요 16
조회 7,203
댓글 1
4년 전
현재 글
데이터 기초 분석 자료
대회 - AI프렌즈 공공 데이터 활용 전력수요 및 SMP 예측 AI 경진대회
좋아요 19
조회 6,557
댓글 5
4년 전
다음 글
다음 글이 존재하지 않습니다.