채무 불이행 여부 예측 해커톤: 불이행의 징후를 찾아라!

데이콘 해커톤 | 알고리즘 | 정형 | 분류 | 금융 | ROC-AUC

  • moneyIcon 상금 : 데이스쿨 프로 구독권
  • 2025.02.03 ~ 2025.03.31 09:59 + Google Calendar
  • 1,070명 마감

 

[Private 19th] CatboostClassifier + optuna

2025.04.11 00:01 653 조회 language

1. 이상치 제거
- 이상치를 제거할 때 y  label을 이용해서 제거하였는데 직접 조건을 설정하여 제거하였는데, 지금 생각해보니 data leakage 혹은 편향을 유발한거같네요..
2. 파생변수 생성 
3. 금융 도메인 지식 + feature importance를 통한 column drop, feature selection
4. 범주형 변수에 대해서 LabelEncoding
5. 클래스 불균형 해결을 위한 scale_pos_weight 적용
6. optuna를 통한 하이퍼파라미터 최적화

다른 분들에게 제 코드가 도움이 되었으면 좋겠네요

코드
이전 글
이전 글이 존재하지 않습니다.
현재 글
[Private 19th] CatboostClassifier + optuna
대회 - 채무 불이행 여부 예측 해커톤: 불이행의 징후를 찾아라!
좋아요 7
조회 653
댓글 0
3달 전
다음 글
[Private 70th] 로지스틱 회귀 +SMOTEENN 사용
대회 - 채무 불이행 여부 예측 해커톤: 불이행의 징후를 찾아라!
좋아요 8
조회 821
댓글 0
3달 전