채무 불이행 여부 예측 해커톤: 불이행의 징후를 찾아라!

데이콘 해커톤 | 알고리즘 | 정형 | 분류 | 금융 | ROC-AUC

  • moneyIcon 상금 : 데이스쿨 프로 구독권
  • 2025.02.03 ~ 2025.03.31 09:59 + Google Calendar
  • 1,066명 마감

 

[Private 5위, 0.65469] Logistic Regression 모델, 파생변수 생성

2025.03.31 22:29 588 조회 language

로지스틱 회귀 모델을 사용하였습니다.
범주형 데이터 중 대출 목적과 주거 형태는 유사한 카테고리끼리 묶어 축소하였습니다. 또한 기존 컬럼을 조합하여 4개의 파생변수를 생성함으로써 설명령을 높이고자 하였습니다.
모델 개발 과정에서 statsmodels.api 활용해 변수 별 p-value를 기반으로 유의미하지 않다고 판단되는 변수를 제거하였습니다.

코드