고객 대출등급 분류 AI 해커톤

알고리즘 | 정형 | 분류 | 금융 | Macro F1 Score

  • moneyIcon 상금 : 인증서
  • 1,665명 마감

 

[Private 9위] 파생변수, VotingClassifier

2024.02.08 10:14 458 조회 language

> 시도정리

1. 전처리 거의 안 한 데이터로 모델 학습 => macro f1 : 0.78
2. 파생변수 생성 (대출금액_대비_총상환원금_비율, 대출금액_대비_총상환이자_비율, 그 외 여러 파생변수 생성 시도) => 0.91 (크게 오름)
3. 중요도 높았던 변수만 선택 (대출기간, 대출금액_대비_총상환원금_비율, 대출금액_대비_총상환이자_비율)=> 0.949
4. 성능이 가장 좋았던 세가지 모델을 (rf, dt, gbc) 모델별 가중치 다르게 설정하고 votingclassifier 모델 학습 => 0.9549
5. 최종 public macro f1 : 0.9549

그 외, 이상치제거, 정규화/표준화, 대출금액 변수 구간화, 오버샘플링, 여러가지 파생변수 생성 등을 시도했으나 점수에 큰 효과는 없었습니다.

코드