분석시각화 대회 코드 공유 게시물은
내용 확인 후
좋아요(투표) 가능합니다.
Private 17위, 결정트리 모델
1. 모델은 Decision Tree Classifier를 이용했습니다. 제가 찬양하는 XGBOOST, LGBM, CATBOOST 전부 사용해보고 모델 블렌딩도 해봤는데 DTC 혼자만으로 제일 높은 점수를 얻을 수 있었습니다.
2. 범주형 데이터는 특이한 몇개의 데이터를 제외하고는 건드리지 않았습니다.
3. 수치형 데이터에 상환액/대출액, 이자/대출액을 추가했는데 두 행 추가 전에는 0.8중반 이었다가 추가후 0.9초중반까지 큰 상승을 할 수 있었습니다.
궁금하신 점은 언제든 댓글로 남겨주세요😁
반둥반둥님 감사합니다~~☺️
파생변수에 대한 생각을 어떻게 하셨는지 궁금했어요.
제가 막상할 때는 연간소득을 나누는것까지는 생각했는데 대출금액을 나눈다는 것을 못한게 너무 아쉽네요.
XGBOOST로 돌렸을때 가장 중요한 변수가 부채 대비 소득 비율이더라구요. 거기서 힌트를 얻어서 또 다들 중요한 비율이 뭐가 있을까 고민을 했습니다. 신용등급에 대해 조사를 했는데 대출 금액을 얼마나 잘 갚느냐를 중요하게 본다고 하더라구요. 그래서 얼마나 잘 갚고 있는지를 보여주는 지표를 만들었습니다
감사합니다.
DACON Co.,Ltd | CEO Kookjin Kim | 699-81-01021
Mail-order-sales Registration Number: 2021-서울영등포-1704
Business Providing Employment Information Number: J1204020250004
#901, Eunhaeng-ro 3, Yeongdeungpo-gu, Seoul 07237
E-mail dacon@dacon.io |
Tel. 070-4102-0545
Copyright ⓒ DACON Inc. All rights reserved
잘 봤습니다
17등 축하해요!