[한양대 ERICA] 신용카드 사용자 연체 예측 AI 경진대회

금융 | 정형 | Logloss

  • moneyIcon 상금 : 총 300만원
  • 57명 마감

 

노익장 소스코드 제출

공동작성자

stroke
2021.11.22 12:09 2,342 조회 language

안녕하세요. 팀 노익장입니다.
데이터 전처리부터 다양하고 많은 시도를 했는데, 가장 좋았던 부분은 optuna를 기반으로 한 catboost 알고리즘, 동일 인의 신용카드 발급내용을 확인할 수 있는 파생변수 이 두 개 라고 생각합니다.
 조금이나마 성능을 올리기 위해 VIF 확인, SSE 기반의 클러스터링, 더 다양한 파생변수 생성 등이 있었으나, 실질적으로 끝까지 유지한건 많지 않았습니다.
 이번 대회를 통해 기존 xgb, lgbm 등을 넘어 catboost를 공부하고, 적용해본 것이 가장 큰 수확으로 생각되고, 한 가지 아쉬운 점을 꼽는다면 시간 문제로 현재 sota 알고리즘으로 통하는 tabnet을 사용하지 못했던 점입니다.
감사합니다.

코드