분석시각화 대회 코드 공유 게시물은
내용 확인 후
좋아요(투표) 가능합니다.
[Private 14]Stacking Ensemble
[주요 전략]
1. 베이스 모델: Optuna로 최적화된 CatBoost와 LightGBM을 사용하여 1차 예측을 수행합니다.
2. 메타 모델: RidgeCV를 메타 모델(Final Estimator)로 사용하여, 두 베이스 모델의
예측 결과를 최적으로 조합하는 방법을 학습하고 최종 예측을 수행합니다.
3. 피처 엔지니어링: 혈압 변동성(bp_variability), 혈압 비율(bp_ratio) 등
생리학적 지표를 포함한 다양한 파생 변수를 생성하여 모델의 성능을 향상시킵니다.
4. 재현성: 모든 과정은 SEED 고정을 통해 Private Score 복원이 가능하도록 설계되었습니다.
[코드 구조]
코드는 크게 전처리, 학습, 추론 및 결과 저장 단계로 구성되어 있습니다.
- 전처리: FeatureEngineeringTransformer 및 전처리 파이프라인
- 학습: Optuna를 이용한 베이스 모델 최적화 및 최종 스태킹 모델 학습
- 추론: 학습된 최종 파이프라인을 이용한 테스트 데이터 예측
DACON Co.,Ltd | CEO Kookjin Kim | 699-81-01021
Mail-order-sales Registration Number: 2021-서울영등포-1704
Business Providing Employment Information Number: J1204020250004
#901, Eunhaeng-ro 3, Yeongdeungpo-gu, Seoul 07237
E-mail dacon@dacon.io |
Tel. 070-4102-0545
Copyright ⓒ DACON Inc. All rights reserved