분석시각화 대회 코드 공유 게시물은
내용 확인 후
좋아요(투표) 가능합니다.
[Private 6등 - RMSE 0.29243] Auto-sklearn
Auto-sklearn을 이용했습니다.
윈도우 환경에선 설치가 안 돼 VSCode에 docker를 연동해서 리눅스 환경에서 했습니다. 그다지 절차가 어렵진 않으니 구글 검색하시고 따라하시면 금방 될것같습니다.
전처리엔 standard scaling, 베이스라인에 있던 label encoder, 알고리즘 내부의 polynomial feature만 이용했고 파일 분할은 5-fold로 했습니다.
그 외에 이상치 탐지를 위해 Isolation Forest, Z-score로 제거. 차원축소를 위해 PCA, 다중공선성 확인. 학습 알고리즘으론 XGB와 LGBM도 사용해봤으나 전부 쳐내고 결과적으론 이 모델이 가장 단순하고 RMSE값이 가장 낮게 나왔기 때문에 이걸로 제출했습니다.
DACON Co.,Ltd | CEO Kookjin Kim | 699-81-01021
Mail-order-sales Registration Number: 2021-서울영등포-1704
Business Providing Employment Information Number: J1204020250004
#901, Eunhaeng-ro 3, Yeongdeungpo-gu, Seoul 07237
E-mail dacon@dacon.io |
Tel. 070-4102-0545
Copyright ⓒ DACON Inc. All rights reserved