전력사용량 예측 AI 경진대회

시계열 | SMAPE | 한국에너지공단 | 전력

  • moneyIcon Prize : 1,800만원
  • 2,548명 마감

 

Doge | public 1st, private 3rd

2021.07.01 09:06 5,452 Views language

3가지 핵심으로 볼 수 있습니다.

 - data cleaning

 - 분산을 줄이기 위해서, 다양한 모델을 만들어서 앙상블 하는것에 포커싱

 - 과소/과대추정되는 건물들에 한해서 post processing을 진행

Code
로그인이 필요합니다
0 / 1000
와퍼세트
2021.07.15 15:00

코드 보면서 천천히 이해하면서 배우고 있습니다. 
코드에서 target_process는 어떤 기준으로 조정하신건지 혹시 알 수 있을까요?

코드 유목민
2021.07.15 15:18

최근에 바빠서 부연설명을 충분하게 달지 못한점 죄송합니다ㅜㅜ
후처리의 경우에는 train data의 마지막주를 test data 로 holdout set을 구축한 다음, 
위의 학습/예측 프로세스를 모두 진행한 후 제 예측값과 실측값의 비율로 조정하였습니다.

와퍼세트
2021.07.16 10:28

하나 또 배워갑니다. 감사합니다 holdout 기법에 대해서 공부해봐야겠네요

영앤치치
2022.02.10 01:25

안녕하세요! 시계열 머신러닝을 공부하기 위해 코드를 보며 이해하고 있습니다.
위의 댓글에 이어지는 질문인데, target_process가 holdout set을 구축하는 작업으로 이해할 수 있을까요? 
그렇다면 target_process에서 일부 값을 np.nan으로 만든 뒤 interpolation을 수행하셨던데, 이 작업이 혹시 어떤 것을 의미하는지 알 수 있을까요?
비록 끝난지 시간이 좀 되었지만 궁금해서 이렇게 댓글 남깁니다.