분석시각화 대회 코드 공유 게시물은
내용 확인 후
좋아요(투표) 가능합니다.
Private 17위, 결정트리 모델
1. 모델은 Decision Tree Classifier를 이용했습니다. 제가 찬양하는 XGBOOST, LGBM, CATBOOST 전부 사용해보고 모델 블렌딩도 해봤는데 DTC 혼자만으로 제일 높은 점수를 얻을 수 있었습니다.
2. 범주형 데이터는 특이한 몇개의 데이터를 제외하고는 건드리지 않았습니다.
3. 수치형 데이터에 상환액/대출액, 이자/대출액을 추가했는데 두 행 추가 전에는 0.8중반 이었다가 추가후 0.9초중반까지 큰 상승을 할 수 있었습니다.
궁금하신 점은 언제든 댓글로 남겨주세요😁
반둥반둥님 감사합니다~~☺️
파생변수에 대한 생각을 어떻게 하셨는지 궁금했어요.
제가 막상할 때는 연간소득을 나누는것까지는 생각했는데 대출금액을 나눈다는 것을 못한게 너무 아쉽네요.
XGBOOST로 돌렸을때 가장 중요한 변수가 부채 대비 소득 비율이더라구요. 거기서 힌트를 얻어서 또 다들 중요한 비율이 뭐가 있을까 고민을 했습니다. 신용등급에 대해 조사를 했는데 대출 금액을 얼마나 잘 갚느냐를 중요하게 본다고 하더라구요. 그래서 얼마나 잘 갚고 있는지를 보여주는 지표를 만들었습니다
감사합니다.
데이콘(주) | 대표 김국진 | 699-81-01021
통신판매업 신고번호: 제 2021-서울영등포-1704호
직업정보제공사업 신고번호: J1204020250004
서울특별시 영등포구 은행로 3 익스콘벤처타워 901호
이메일 dacon@dacon.io |
전화번호: 070-4102-0545
Copyright ⓒ DACON Inc. All rights reserved
잘 봤습니다
17등 축하해요!