분석시각화 대회 코드 공유 게시물은
내용 확인 후
좋아요(투표) 가능합니다.
동서발전 태양광 발전량 예측 AI 경진대회
늦은 장마와 변덕스러운 날씨, 그리고 맑은 날 가중치
안녕하세요, 세아아부지입니다.
Private에 꾸준히 참여하고 계신 팀들이 많지는 않네요.
몇가지 생각을 또 공유해봅니다.
1. 올해는 "늦은 장마", "장마 vs 스콜"
원래 6월 말 시작하는 장마가 7월로 밀려서 올해는 늦은 장마라고 하네요.
장마 기간의 발전량 예측은 상식적으로는 쉽습니다.
하루 종일 흐리고 비가 오면 발전이 안되는 건 당연할텐데요, 변수가 있습니다.
모두가 느끼고 경험한 것처럼 장마기간에 비가 계속 올 때도 있지만 동남아 스콜처럼 쏟아붇고 갑자기 맑아질 때가 많았습니다.
기상청 예보는 "구름 많음", "강수량 00mm"인데 실제 날씨는 맑아서 발전이 잘 될 가능성이 있죠.
물론 대책은 없습니다. 복불복의 영역이라고 생각합니다.
실제 대회가 끝나는 7월초가 장마기간으로 들어가면서 마지막까지 긴장의 끈을 놓을 수 없겠네요.
2. 맑은 날 가중치 > 흐린 날 가중치
그저께나 어제는 날씨가 맑아서 발전소들이 잘 돌아갔네요!
맑은 날은 예측이 쉬운 편이라 대부분의 팀들의 점수가 개선되었는데요,
저를 포함해서 태양의 고도 등을 고려한 것으로 보이는 팀들이 조금 더 많은 개선폭을 보입니다.
그리고 또 이유가 있는데요, 규칙 상 맑은 날이 더 많은 가중치를 갖습니다.
발전 설비 용량의 10%를 넘는 시간의 관측값만 평가 대상에 포함되는데요,
train 데이터를 가지고 대충 계산해보면 6월, 7월 운량이 0~4 인 경우 10~11시간 정도가 평가 대상에 포함되고
운량이 8~10인 경우 앞뒤로 두시간 정도씩은 충분히 발전하지 못해서 약 7시간 정도가 평가 대상에 포함되는 것으로 보입니다.
비율로 따져보면 맑은 날이 완전 흐린 날에 비해 1.5배나 더 가중치가 높다고 생각할 수 있습니다.
Private 평가 기간 중에 모형을 바꾸는 것은 상당히 위험부담이 있지만,
어제, 오늘 개선 폭이 크지 않았고 내일도 개선 폭이 크지 않은 팀들은
앞으로 맑은 날이 많이 있을 것 같다면 맑은 날을 좀 더 잘 예측할 수 있는 모델을 고민해볼 필요가 있습니다.
참고로 저는 6월 16일 날씨가 갑자기 맑아져서 한방 먹었는데요,
제 스코어는 맑은 이틀 덕분에 6월 17일 10.23점에서 오늘 6월 21일 8.74점으로 꽤 좋아졌습니다.
오늘도 날씨가 좋아서 내일은 8.2점 정도까지 좋아지지 않을까 기대하고 있습니다.
이제 1/3이 지났고, 많은 변수들이 남아있기 때문에 포기하지 않고 꾸준히 노력하면
모든 팀들이 충분히 가능성이 있다고 생각합니다.
모두 힘냅시다!!
데이콘(주) | 대표 김국진 | 699-81-01021
통신판매업 신고번호: 제 2021-서울영등포-1704호
서울특별시 영등포구 은행로 3 익스콘벤처타워 901호
이메일 dacon@dacon.io | 전화번호: 070-4102-0545
Copyright ⓒ DACON Inc. All rights reserved