[신규 오픈 기념] 데이스쿨 최대 40% 할인 🎁
분석시각화 대회 코드 공유 게시물은
내용 확인 후
좋아요(투표) 가능합니다.
[Private 6등 - RMSE 0.29243] Auto-sklearn
Auto-sklearn을 이용했습니다.
윈도우 환경에선 설치가 안 돼 VSCode에 docker를 연동해서 리눅스 환경에서 했습니다. 그다지 절차가 어렵진 않으니 구글 검색하시고 따라하시면 금방 될것같습니다.
전처리엔 standard scaling, 베이스라인에 있던 label encoder, 알고리즘 내부의 polynomial feature만 이용했고 파일 분할은 5-fold로 했습니다.
그 외에 이상치 탐지를 위해 Isolation Forest, Z-score로 제거. 차원축소를 위해 PCA, 다중공선성 확인. 학습 알고리즘으론 XGB와 LGBM도 사용해봤으나 전부 쳐내고 결과적으론 이 모델이 가장 단순하고 RMSE값이 가장 낮게 나왔기 때문에 이걸로 제출했습니다.
데이콘(주) | 대표 김국진 | 699-81-01021
통신판매업 신고번호: 제 2021-서울영등포-1704호
서울특별시 영등포구 은행로 3 익스콘벤처타워 901호
이메일 dacon@dacon.io | 전화번호: 070-4102-0545
Copyright ⓒ DACON Inc. All rights reserved