분석시각화 대회 코드 공유 게시물은
내용 확인 후
좋아요(투표) 가능합니다.
[Private 14]Stacking Ensemble
[주요 전략]
1. 베이스 모델: Optuna로 최적화된 CatBoost와 LightGBM을 사용하여 1차 예측을 수행합니다.
2. 메타 모델: RidgeCV를 메타 모델(Final Estimator)로 사용하여, 두 베이스 모델의
예측 결과를 최적으로 조합하는 방법을 학습하고 최종 예측을 수행합니다.
3. 피처 엔지니어링: 혈압 변동성(bp_variability), 혈압 비율(bp_ratio) 등
생리학적 지표를 포함한 다양한 파생 변수를 생성하여 모델의 성능을 향상시킵니다.
4. 재현성: 모든 과정은 SEED 고정을 통해 Private Score 복원이 가능하도록 설계되었습니다.
[코드 구조]
코드는 크게 전처리, 학습, 추론 및 결과 저장 단계로 구성되어 있습니다.
- 전처리: FeatureEngineeringTransformer 및 전처리 파이프라인
- 학습: Optuna를 이용한 베이스 모델 최적화 및 최종 스태킹 모델 학습
- 추론: 학습된 최종 파이프라인을 이용한 테스트 데이터 예측
데이콘(주) | 대표 김국진 | 699-81-01021
통신판매업 신고번호: 제 2021-서울영등포-1704호
직업정보제공사업 신고번호: J1204020250004
서울특별시 영등포구 은행로 3 익스콘벤처타워 901호
이메일 dacon@dacon.io |
전화번호: 070-4102-0545
Copyright ⓒ DACON Inc. All rights reserved