고객 대출등급 분류 AI 해커톤

알고리즘 | 정형 | 분류 | 금융 | Macro F1 Score

 

Private 17위, 결정트리 모델

2024.02.05 11:48 2,422 조회 language

1. 모델은 Decision Tree Classifier를 이용했습니다. 제가 찬양하는 XGBOOST, LGBM, CATBOOST 전부 사용해보고 모델 블렌딩도 해봤는데 DTC 혼자만으로 제일 높은 점수를 얻을 수 있었습니다.

2. 범주형 데이터는 특이한 몇개의 데이터를 제외하고는 건드리지 않았습니다.

3. 수치형 데이터에 상환액/대출액, 이자/대출액을 추가했는데 두 행 추가 전에는 0.8중반 이었다가 추가후 0.9초중반까지 큰 상승을 할 수 있었습니다.

궁금하신 점은 언제든 댓글로 남겨주세요😁

코드
로그인이 필요합니다
0 / 1000
반둥반둥
2024.02.05 18:06

잘 봤습니다
17등 축하해요!

호머심슨
2024.02.06 09:14

반둥반둥님 감사합니다~~☺️

자강사123
2024.02.06 09:01

파생변수에 대한 생각을 어떻게 하셨는지 궁금했어요.
제가 막상할 때는 연간소득을 나누는것까지는 생각했는데 대출금액을 나눈다는 것을 못한게 너무 아쉽네요.

호머심슨
2024.02.06 09:14

XGBOOST로 돌렸을때 가장 중요한 변수가 부채 대비 소득 비율이더라구요. 거기서 힌트를 얻어서 또 다들 중요한 비율이 뭐가 있을까 고민을 했습니다. 신용등급에 대해 조사를 했는데 대출 금액을 얼마나 잘 갚느냐를 중요하게 본다고 하더라구요. 그래서 얼마나 잘 갚고 있는지를 보여주는 지표를 만들었습니다

자강사123
2024.02.06 18:07

감사합니다.