분석시각화 대회 코드 공유 게시물은
내용 확인 후
좋아요(투표) 가능합니다.
private 12, light gbm + optuna
1. Objective function
Main object가 SMAPE를 최소화 하는것이기 때문에 loss landscape가 비슷한 log1p mae를 objective function으로 사용했습니다. 전력량을 log1p space로 mapping한후 MAE를 objective function으로 사용했습니다.
2. 휴일
백화점은 매달 월요일마다 휴무일이 있으며, 마트의 경우 2번째와 4번째 주 일요일이 휴무일입니다. 따라서 'holiday' column을 추가하였습니다.
3. Outliers
휴일이 아닌 날의 월평균 전력량에서 크게 벗어난 값을 제거하였습니다.
4. Heat correlation
전력량과 날씨의 'correlation'이 높은 건물에 대하여 1시간 전과 2시간 전의 온도 정보 값을 추가하였습니다.
5. CV전략
총 5주를 validation set로 사용했습니다. test data set의 distribution이 7월과 8월에 포함될 것으로 예상되기 때문에, 6월을 제외하고 7월과 8월만을 validation set로 사용하였습니다.
DACON Co.,Ltd | CEO Kookjin Kim | 699-81-01021
Mail-order-sales Registration Number: 2021-서울영등포-1704
Business Providing Employment Information Number: J1204020250004
#901, Eunhaeng-ro 3, Yeongdeungpo-gu, Seoul 07237
E-mail dacon@dacon.io |
Tel. 070-4102-0545
Copyright ⓒ DACON Inc. All rights reserved