2023 전력사용량 예측 AI 경진대회

알고리즘 | 정형 | 시계열 | 에너지 | SMAPE

  • moneyIcon Prize : 2,000만원
  • 2,844명 마감

 

private 79 mljar + feature engineering

공동작성자

stroke
2023.08.28 16:30 934 Views language

파일이 많아서 먼저 git을 공유해드립니다.
https://github.com/JINAILAB/power-predict/tree/main/EDA
중요했던 작업은 다음과 같습니다.
1. feature engineer
1-1. holiday
대부분 주말에 쉬는 반면 할인마트나 백화점은 쉬는 주기가 다릅니다. 찾아보니 백화점은 한달에 랜덤하게 쉬고 할인마트도 조금씩 다르다는 것을 알았습니다.
일 최대값을 활용해 극솟값을 찾아 휴일을 찾아주고 test에는 백화점같은 경우 휴일이 없고 할인마트는 해당하는 휴일에 넣어줬습니다.

1-2. weekday
대부분 매주 쉬지만 첫째 주 셋째주 둘째주 넷째주 쉬는 회사들이 있는 것 같습니다. 위를 구분하기 위해서 첫째주 셋째주는 0, 둘째주, 넷째주는 1로 묶어줬습니다.
(조사 중 첫째주의 기준이 3일이상이어야 첫째주로 친다는 것을 알았지만 EDA상 1일이상이면 진행하는게 좋은 것 같아서 무시하고 진행했습니다.)

1-3. temprature와 최대 전력소모량의 관계
이 부분이 중요하지 않았나 생각합니다. 일평균 온도와 일평균 전력소모량은 즉각적인 반응을 보입니다. 
하지만 최대온도가 나타나는 시간과 최대 전력소모량이 나타나는 시간이 굉장히 다른 모습을 보여줍니다. 아마도 최대전력소모량이 나타는 시간을 미리 예측하고 진행했으면 성능이 올라가지 않았을까하는 생각이 듭니다.

2. 이상치 처리
isloation forest를 이용하여 이상치를 처리해줬습니다.

3. mljar loss건드리기
mljar github를 다운받아서 mljar의 loss를 바꿔주었습니다.

다들 고생하셨습니다.

Code