분석시각화 대회 코드 공유 게시물은
내용 확인 후
좋아요(투표) 가능합니다.
[EDA] 태양광 발전소는 일사량의 노예 - (1탄) 멀고도 가까운 일사량
안녕하세요.
다들 퍼블릭 평가 그리고 사전평가 진행하시느라 고생많으셨습니다. 프라이빗 평가에서도 좋은 결과 있으시길 바랍니다.
아직 대회가 진행중이라 핵심적인 내용을 가리기 위해 코드 및 코드 출력이 일부 제거된 노트북 파일입니다. 따라서 당연하게도 코드가 정상적으로 돌아가지 않습니다.
다만 유추하신다면 비슷하게 코드 작성하시기엔 어려움이 없으실겁니다. 아이디어 위주로 봐주시면 감사하겠습니다.
수정되지 않은 원본은 대회 종료 후 공유해 보도록 하겠습니다. 감사합니다
[핵심요점]
1. 당진 발전소에 위치한 3개의 태양광은 정남향이 아니다.
2. 운량에 대한 예보는 그리 정확하지 않다.
+운량 예보는 과거에는 1,2,3,4로 4개값으로 분류해서 예보했으나 지금은 1,3,4만 사용된다
3. 일사량이 당연하게도 중요한 변수인 만큼 미래의 일사량을 정확히 확보 또는 예측 하는것이 중요하다
4. 일사량을 변수로 사용해도 발전량의 패턴과 일사량의 패턴을 비교하면 추가적인 가공 없이는 설명력이 부족하다
특히 매년 4월과 10월에 봉우리를 2개 갖는 곡선형인데 가공없는 일사량 데이터로는 10월에 나타나는 local maxima를 설명하기 어렵다.
(가장 마지막 시각 자료중 [발전량, ghi, cs_corrected, ghi_corrected] 비교 참고. cs는 clear sky의 약자로 완전히 맑다는 가정하에 예상되는 일사량)
PS. 올해 초에 있었던 태양광 발전량 예측대회도 참가했었는데 그때 경험이 도움이 많이 됐습니다.
그때 코드도 첨부드립니다.
https://dacon.io/codeshare/2366
데이콘(주) | 대표 김국진 | 699-81-01021
통신판매업 신고번호: 제 2021-서울영등포-1704호
서울특별시 영등포구 은행로 3 익스콘벤처타워 901호
이메일 dacon@dacon.io | 전화번호: 070-4102-0545
Copyright ⓒ DACON Inc. All rights reserved
코드도 많이 생략되어있고 주석을 너무 대충달아서 가독성이 낮으실것 같아서 그래프 설명 추가합니다.
위에서부터 그래프 1번입니다.
[출력 그래프 설명]
1. 당진, 울산 발전소의 위성사진
2. 발전소별 발전량 전체기간 시각화
3. 관측값과 예보값의 비교. 운량의 경우 선 그래프로는 잘 안보여서 히트맵으로 바꿨습니다.
4. 발전소간 상관관계 비교. 당진에 위치한 3개의 경우 높은 선형성을 보임.
(다만 2019년의 경우 당진 수상태양광이 outperform 하는 모습을 보이고
2018년의 경우 당진태양광이 outperform하는 모습을 보임. 저도 이유는 모르겠습니다)
5. feature간 상관관계 비교
5-1 feature-발전량 scatter plot (오른쪽 스케일에 따라 빨간색이 2018년부터 초록색이 가장 최근)
5-2 시간에 따른 발전량과 (태양위치+일사량) 관련 데이터의 그래프 비교
5-3 변수 히트맵.(spearman correlation 사용했습니다)