[한양대 ERICA] 신용카드 사용자 연체 예측 AI 경진대회

금융 | 정형 | Logloss

  • moneyIcon 상금 : 총 300만원
  • 57명 마감

 

불닭볶 소스코드 (재업)

2021.11.21 00:00 2,396 조회 language

대회기간중 코랩을 사용했는데 이상하게 로컬 환경과 결과가 약간 다르게 나와서 코랩환경 파일을 다시 제출하겠습니다.
------------------------------

모두 대회 고생많으셨습니다. 

연속형 변수중에서 상관관계가 뚜렷한 변수를 찾지 못해서 분류형 변수에 집중하였습니다.
catboost를 사용했고, ID변수를 추가하여 동일한 인물이 여러번 카드를 발급한 경우 기존의 타겟변수와의 연관성이 학습에 도움을 줄 것이라고 추측했습니다.
하이퍼 파라미터 코드를 공유해주신 "seoww"님 덕에, 파라미터 튜닝에 어려움을 겪어 디폴트 값만 사용하던 차에 큰 도움을 받았습니다, 감사합니다.
다만, 디폴트 파라미터가 더 높은 점수를 반환하여 기존 디폴트 값을 그대로 사용하였습니다.

막바지에 모델의 early stopping round 파라미터를 상승시켜 점수를 조금이나마 높여보았습니다만, 
이 파라미터를 너무 높일 경우 트레이닝 데이터셋에 overfitting 될 가능성이 높아 불안했던 차에, 해당 파라미터 값을 높인 것과 기존(100)으로 둔것을 
두개 결과물로 제출하였습니다.

마지막으로 정말 많은 곳에서 많은 도움을 받았기에 자유게시판에 올리게 될 인사이트 보고서에 그 출처를 밝히도록 하겠습니다.

감사합니다.

코드