전력사용량 예측 AI 경진대회

시계열 | SMAPE | 한국에너지공단 | 전력

상금 : 1,800만원
2,551명 마감

연습

대회안내 데이터 코드 공유 토크 리더보드

제출

Doge | public 1st, private 3rd

코드 유목민

2021.07.01 09:06 5,474 조회 language

3가지 핵심으로 볼 수 있습니다.

- data cleaning

- 분산을 줄이기 위해서, 다양한 모델을 만들어서 앙상블 하는것에 포커싱

- 과소/과대추정되는 건물들에 한해서 post processing을 진행

코드

댓글 4개

로그인이 필요합니다

comment

0 / 1000

와퍼세트

2021.07.15 15:00

코드 보면서 천천히 이해하면서 배우고 있습니다.
코드에서 target_process는 어떤 기준으로 조정하신건지 혹시 알 수 있을까요?

코드 유목민

2021.07.15 15:18

최근에 바빠서 부연설명을 충분하게 달지 못한점 죄송합니다ㅜㅜ
후처리의 경우에는 train data의 마지막주를 test data 로 holdout set을 구축한 다음,
위의 학습/예측 프로세스를 모두 진행한 후 제 예측값과 실측값의 비율로 조정하였습니다.

와퍼세트

2021.07.16 10:28

하나 또 배워갑니다. 감사합니다 holdout 기법에 대해서 공부해봐야겠네요

영앤치치

2022.02.10 01:25

안녕하세요! 시계열 머신러닝을 공부하기 위해 코드를 보며 이해하고 있습니다.
위의 댓글에 이어지는 질문인데, target_process가 holdout set을 구축하는 작업으로 이해할 수 있을까요?
그렇다면 target_process에서 일부 값을 np.nan으로 만든 뒤 interpolation을 수행하셨던데, 이 작업이 혹시 어떤 것을 의미하는지 알 수 있을까요?
비록 끝난지 시간이 좀 되었지만 궁금해서 이렇게 댓글 남깁니다.

📣 댓글 작성 창의 위치가 댓글 리스트 상단으로 이동하였습니다!

목록으로

taegu private 8위 5.24453

대회 - 전력사용량 예측 AI 경진대회

3년 전

현재 글

Doge | public 1st, private 3rd

대회 - 전력사용량 예측 AI 경진대회

3년 전

j_sean팀 | Private 1위(5.0293) | XGBoost 단일 모형

대회 - 전력사용량 예측 AI 경진대회

3년 전