칼로리 소모량 예측 AI 해커톤

알고리즘 | 정형 | 회귀 | 헬스 | RMSE

  • moneyIcon 상금 : 인증서
  • 670명 마감

 

[Private 6등 - RMSE 0.29243] Auto-sklearn

2023.04.25 12:39 876 조회 language

Auto-sklearn을 이용했습니다. 
윈도우 환경에선 설치가 안 돼 VSCode에 docker를 연동해서 리눅스 환경에서 했습니다. 그다지 절차가 어렵진 않으니 구글 검색하시고 따라하시면 금방 될것같습니다.
전처리엔 standard scaling, 베이스라인에 있던 label encoder, 알고리즘 내부의 polynomial feature만 이용했고 파일 분할은 5-fold로 했습니다.
그 외에 이상치 탐지를 위해 Isolation Forest, Z-score로 제거. 차원축소를 위해 PCA, 다중공선성 확인. 학습 알고리즘으론 XGB와 LGBM도 사용해봤으나 전부 쳐내고 결과적으론 이 모델이 가장 단순하고 RMSE값이 가장 낮게 나왔기 때문에 이걸로 제출했습니다.

코드