분석시각화 대회 코드 공유 게시물은
내용 확인 후
좋아요(투표) 가능합니다.
[Private 5위 3.27893] Optuna + KFold 5 +Catboost + Ensemble
1) 최초 접근법 (한계)
- AutoML 전체 적용 해봄 (pycaret, H2O -> 대부분 : rmse 3.4 까지 나옴)
2) 피처 엔지니어링 실행
- 데이터 전처리 및 범주화 실행 (Year-Of-Publication, Age, Location)
3) 모델링 최적화
- AutoML (pycaret) 통해서 찾은 최적 모델 catboost 선택 - Optuna 최적화 실행
- StratifiedKFold 5 적용 모델 5개 평균 Rating prediction
- PostProcessing 적용 -1, 11 예측 -> Rating 0, 10 치환
4) 앙상블(Submit)
- rmse 제일 낮은 2개 catboost 모델 6:4 비율로 제출
(최종 : Public LB: 3.26368, Private LB : 3.27893)
데이콘(주) | 대표 김국진 | 699-81-01021
통신판매업 신고번호: 제 2021-서울영등포-1704호
서울특별시 영등포구 은행로 3 익스콘벤처타워 901호
이메일 dacon@dacon.io | 전화번호: 070-4102-0545
Copyright ⓒ DACON Inc. All rights reserved