고객 대출등급 분류 AI 해커톤

알고리즘 | 정형 | 분류 | 금융 | Macro F1 Score

상금 : 인증서
1,665명 마감

연습

대회안내 데이터 코드 공유 토크 리더보드

제출

[Private 6위] RandomForest + StratifiedKFold

와샌즈

2024.02.06 11:56 671 조회 language

EDA로는 A,B,C가 차지하는 범위가 컸고, 주택소유상태에는 'ANY'가 있었고, 연간소득 금액이 0원인 행을 발견하고 제거하였습니다.
또한 금융 데이터라서 관련 있는 피처끼리 사칙연산으로 무작정 피처 개수를 늘리는데 신경을 썼습니다.
그러다가 점수가 오르지 않아서 Feature importance로 제일 점수 낮은 피처부터 차츰 정리했습니다.
맨 처음 시도했던 'ANY', 연간소득 0 값의 데이터도 포함하는 게 좋겠다고 생각되어 제거하지 않는 방향으로 다시 바꿨습니다.
마지막으로 Optuna와 제일 점수 높은 Seed를 골라 StratifiedKFold - 10으로 마무리 하였습니다.
Optuna 같은 경우는 depth와 estimator 만으로 하다가 시간이 너무 오래걸려서 depth만 놓고 돌렸습니다.

코드