동서발전 태양광 발전량 예측 AI 경진대회

알고리즘 | 정형 | 회귀 | 에너지 | NMAE

  • moneyIcon Prize : 1,600만원
  • 1,543명 마감

 

늦은 장마와 변덕스러운 날씨, 그리고 맑은 날 가중치

2021.06.21 23:01 2,727 Views

안녕하세요, 세아아부지입니다.


Private에 꾸준히 참여하고 계신 팀들이 많지는 않네요.

몇가지 생각을 또 공유해봅니다.



1. 올해는 "늦은 장마", "장마 vs 스콜"


원래 6월 말 시작하는 장마가 7월로 밀려서 올해는 늦은 장마라고 하네요.


장마 기간의 발전량 예측은 상식적으로는 쉽습니다.

하루 종일 흐리고 비가 오면 발전이 안되는 건 당연할텐데요, 변수가 있습니다.

모두가 느끼고 경험한 것처럼 장마기간에 비가 계속 올 때도 있지만 동남아 스콜처럼 쏟아붇고 갑자기 맑아질 때가 많았습니다.

기상청 예보는 "구름 많음", "강수량 00mm"인데 실제 날씨는 맑아서 발전이 잘 될 가능성이 있죠.

물론 대책은 없습니다. 복불복의 영역이라고 생각합니다.


실제 대회가 끝나는 7월초가 장마기간으로 들어가면서 마지막까지 긴장의 끈을 놓을 수 없겠네요.




2. 맑은 날 가중치 > 흐린 날 가중치


그저께나 어제는 날씨가 맑아서 발전소들이 잘 돌아갔네요!

맑은 날은 예측이 쉬운 편이라 대부분의 팀들의 점수가 개선되었는데요,

저를 포함해서 태양의 고도 등을 고려한 것으로 보이는 팀들이 조금 더 많은 개선폭을 보입니다.


그리고 또 이유가 있는데요, 규칙 상 맑은 날이 더 많은 가중치를 갖습니다.

발전 설비 용량의 10%를 넘는 시간의 관측값만 평가 대상에 포함되는데요,

train 데이터를 가지고 대충 계산해보면 6월, 7월 운량이 0~4 인 경우 10~11시간 정도가 평가 대상에 포함되고

운량이 8~10인 경우 앞뒤로 두시간 정도씩은 충분히 발전하지 못해서 약 7시간 정도가 평가 대상에 포함되는 것으로 보입니다.


비율로 따져보면 맑은 날이 완전 흐린 날에 비해 1.5배나 더 가중치가 높다고 생각할 수 있습니다.

Private 평가 기간 중에 모형을 바꾸는 것은 상당히 위험부담이 있지만,


어제, 오늘 개선 폭이 크지 않았고 내일도 개선 폭이 크지 않은 팀들은

앞으로 맑은 날이 많이 있을 것 같다면 맑은 날을 좀 더 잘 예측할 수 있는 모델을 고민해볼 필요가 있습니다.


참고로 저는 6월 16일 날씨가 갑자기 맑아져서 한방 먹었는데요,

제 스코어는 맑은 이틀 덕분에 6월 17일 10.23점에서 오늘 6월 21일 8.74점으로 꽤 좋아졌습니다.

오늘도 날씨가 좋아서 내일은 8.2점 정도까지 좋아지지 않을까 기대하고 있습니다.




이제 1/3이 지났고, 많은 변수들이 남아있기 때문에 포기하지 않고 꾸준히 노력하면

모든 팀들이 충분히 가능성이 있다고 생각합니다.


모두 힘냅시다!!