데이콘 Basic 스트레스 지수 예측 : 건강 데이터로 마음의 균형을 찾아라!

데이콘 해커톤 | 알고리즘 | 입문 | 정형 | 회귀 | MAE

  • moneyIcon 상금 : 데이스쿨 프로 구독권
  • 610명 마감

 

[Private 14]Stacking Ensemble

2025.09.03 00:45 89 조회 language

[주요 전략]
1. 베이스 모델: Optuna로 최적화된 CatBoost와 LightGBM을 사용하여 1차 예측을 수행합니다.
2. 메타 모델: RidgeCV를 메타 모델(Final Estimator)로 사용하여, 두 베이스 모델의
    예측 결과를 최적으로 조합하는 방법을 학습하고 최종 예측을 수행합니다.
3. 피처 엔지니어링: 혈압 변동성(bp_variability), 혈압 비율(bp_ratio) 등
   생리학적 지표를 포함한 다양한 파생 변수를 생성하여 모델의 성능을 향상시킵니다.
4. 재현성: 모든 과정은 SEED 고정을 통해 Private Score 복원이 가능하도록 설계되었습니다.

[코드 구조]
코드는 크게 전처리, 학습, 추론 및 결과 저장 단계로 구성되어 있습니다.
  - 전처리: FeatureEngineeringTransformer 및 전처리 파이프라인
  - 학습: Optuna를 이용한 베이스 모델 최적화 및 최종 스태킹 모델 학습
  - 추론: 학습된 최종 파이프라인을 이용한 테스트 데이터 예측

코드