2023 전력사용량 예측 AI 경진대회

알고리즘 | 정형 | 시계열 | 에너지 | SMAPE

  • moneyIcon 상금 : 2,000만원
  • 2,844명 마감

 

Private 119, pycaret with XGBoost

2023.08.30 20:34 858 조회 language

초보입니다. 많이 부족한 코드이지만 올려봅니다!
이전 대회의 코드들을 많이 참고하였습니다.
[https://dacon.io/competitions/official/235736/codeshare/2877?page=1&dtype=recent]
[https://dacon.io/competitions/official/235736/codeshare/2743?page=1&dtype=recent]

PyCaret을 사용했고, colab 환경에서 진행했습니다.

파생변수.
요일, 시간 feature에 대해서는 Target Encoding, 혹은 Mean Encoding을 주로 진행했습니다.
이때 Target의 평균값 외에도, Std, 사분위 값, 최대, 최소값 들을 활용해봤습니다.
기후 관련 feature의 경우, 이전 대회를 참고했습니다. (불쾌지수, 냉방도일) [https://dacon.io/competitions/official/235736/codeshare/2743?page=1&dtype=recent]
그 외에도 열지수(Heat Index, HI), 습구온도, 체감온도를 추가했습니다.

모델.
모델의 경우, 건물 별로 총 100개의 XGBoost 모델을 만들어 진행했습니다. 
이 때 과소추정 방지를 위해 목적함수에 가중치를 주었습니다. [https://dacon.io/competitions/official/235736/codeshare/2877?page=1&dtype=recent]
CV의 경우, 6월1일 부터 일주일 간격으로 끊을 경우 대략 12주 정도로 구간을 나눌 수 있습니다.
그리고 12 주차에 대해 각각 {1, 2, 3, 4} {1, 2, 3, 4} {1, 2, 3, 4} 로 총 4개의  fold로 나누어 CV를 진행했습니다.

Public : 6.04581 (135), Private : 7.63843 (119)

감사합니다.

코드