분석시각화 대회 코드 공유 게시물은
내용 확인 후
좋아요(투표) 가능합니다.
Private 119, pycaret with XGBoost
초보입니다. 많이 부족한 코드이지만 올려봅니다!
이전 대회의 코드들을 많이 참고하였습니다.
[https://dacon.io/competitions/official/235736/codeshare/2877?page=1&dtype=recent]
[https://dacon.io/competitions/official/235736/codeshare/2743?page=1&dtype=recent]
PyCaret을 사용했고, colab 환경에서 진행했습니다.
파생변수.
요일, 시간 feature에 대해서는 Target Encoding, 혹은 Mean Encoding을 주로 진행했습니다.
이때 Target의 평균값 외에도, Std, 사분위 값, 최대, 최소값 들을 활용해봤습니다.
기후 관련 feature의 경우, 이전 대회를 참고했습니다. (불쾌지수, 냉방도일) [https://dacon.io/competitions/official/235736/codeshare/2743?page=1&dtype=recent]
그 외에도 열지수(Heat Index, HI), 습구온도, 체감온도를 추가했습니다.
모델.
모델의 경우, 건물 별로 총 100개의 XGBoost 모델을 만들어 진행했습니다.
이 때 과소추정 방지를 위해 목적함수에 가중치를 주었습니다. [https://dacon.io/competitions/official/235736/codeshare/2877?page=1&dtype=recent]
CV의 경우, 6월1일 부터 일주일 간격으로 끊을 경우 대략 12주 정도로 구간을 나눌 수 있습니다.
그리고 12 주차에 대해 각각 {1, 2, 3, 4} {1, 2, 3, 4} {1, 2, 3, 4} 로 총 4개의 fold로 나누어 CV를 진행했습니다.
Public : 6.04581 (135), Private : 7.63843 (119)
감사합니다.
데이콘(주) | 대표 김국진 | 699-81-01021
통신판매업 신고번호: 제 2021-서울영등포-1704호
서울특별시 영등포구 은행로 3 익스콘벤처타워 901호
이메일 dacon@dacon.io | 전화번호: 070-4102-0545
Copyright ⓒ DACON Inc. All rights reserved