Burned Calories Prediction AI Hackathon

Algorithm | Tabular | Regression | Health | RMSE

 

[Private 6등 - RMSE 0.29243] Auto-sklearn

2023.04.25 12:39 2,051 Views language

Auto-sklearn을 이용했습니다. 
윈도우 환경에선 설치가 안 돼 VSCode에 docker를 연동해서 리눅스 환경에서 했습니다. 그다지 절차가 어렵진 않으니 구글 검색하시고 따라하시면 금방 될것같습니다.
전처리엔 standard scaling, 베이스라인에 있던 label encoder, 알고리즘 내부의 polynomial feature만 이용했고 파일 분할은 5-fold로 했습니다.
그 외에 이상치 탐지를 위해 Isolation Forest, Z-score로 제거. 차원축소를 위해 PCA, 다중공선성 확인. 학습 알고리즘으론 XGB와 LGBM도 사용해봤으나 전부 쳐내고 결과적으론 이 모델이 가장 단순하고 RMSE값이 가장 낮게 나왔기 때문에 이걸로 제출했습니다.

Code