고객 대출등급 분류 AI 해커톤

알고리즘 | 정형 | 분류 | 금융 | Macro F1 Score

  • moneyIcon 상금 : 인증서
  • 1,665명 마감

 

[Private 3위] RandomForest, Stratified K-fold, optuna

2024.02.08 22:34 767 조회 language

다른 분들이 EDA부분을 너무 잘 설명해주셔서 그 부분은 제외하고 업로드했습니다.
간략하게 코드를 설명하면 다음과 같습니다.

1. 파생변수 생성
- EDA와 feature_importance를 통해 여러 파생변수를 생성하며 스코어를 확인해봤습니다.
- 대출금액을 이용한 파생변수 생성 후 점수가 대폭 올라간 것을 확인했습니다.

2. 모델 선택
- 여러 모델 중 가장 성능이 좋았던 랜덤포레스트를 선택했습니다.

3. 클래스 불균형
- 해소하기 위해 Stratified K-fold와 class_weight를 사용했습니다.

4. 하이퍼파라미터 튜닝(optuna)

이번 대회에 참여하면서 모르는 정보를 찾아보고 배울 수 있는 시간이 돼서 좋았습니다.
감사합니다.

코드