신용카드 고객 세그먼트 분류 AI 경진대회

알고리즘 | 월간 데이콘 | 정형 | 금융 | 분류 | F1 Score

  • moneyIcon 상금 : 데이스쿨 프로 구독권
  • 2025.03.10 ~ 2025.04.30 09:59 + Google Calendar
  • 1,535명 마감

 

[Private 3th] XGB+ LightGBM + CatBoost(soft voting ensemble)

공동작성자
2025.05.06 20:08 596 조회 language

이번 대회에서 제공된 데이터는 컬럼 수가 많고 데이터 크기도 상당히 커서, 사전에 전처리한 후 모델링 작업을 진행했습니다. 전처리부터 모델링까지의 과정은 PDF 파일과 코드에서 참고하실 수 있습니다.
참고로, seed를 고정했다고는 했지만, 코드 내 일부 함수에서 seed가 고정되지 않는 부분이 존재하는 것같아 score 차이가 미세하게 차이가 발생하는 점 양해 부탁드립니다.
대회에 참가하신 모든 분들, 고생 많으셨습니다. 
감사합니다.

[전처리 및 모델링 과정]
1.데이터 병합
2. 단일 값을 가진 컬럼 제거 후 저장.
3. Null 값을 가진 컬럼 제거
4. Label Encoding
5. 클래스 가중치 부여
6. Stratified Group 5-fold 교차검증
7. XGBoost, LightGBM, CatBoost 모델의 소프트 보팅 앙상블 예측
8. 예측 후에 ID별 다수결 집계 후 최종 Label 예측
9. Optuna를 이용한 하이퍼파라미터 최적화 후 성능 개선

PDF
코드
로그인이 필요합니다
0 / 1000
과적합방지위원회
2025.05.07 15:22

score의 재현성을 잡는 부분이 가장 힘든거 같아요. 수고 많으셨습니다!