분석시각화 대회 코드 공유 게시물은
내용 확인 후
좋아요(투표) 가능합니다.
[Private 19th] CatboostClassifier + optuna
1. 이상치 제거
- 이상치를 제거할 때 y label을 이용해서 제거하였는데 직접 조건을 설정하여 제거하였는데, 지금 생각해보니 data leakage 혹은 편향을 유발한거같네요..
2. 파생변수 생성
3. 금융 도메인 지식 + feature importance를 통한 column drop, feature selection
4. 범주형 변수에 대해서 LabelEncoding
5. 클래스 불균형 해결을 위한 scale_pos_weight 적용
6. optuna를 통한 하이퍼파라미터 최적화
다른 분들에게 제 코드가 도움이 되었으면 좋겠네요
DACON Co.,Ltd | CEO Kookjin Kim | 699-81-01021
Mail-order-sales Registration Number: 2021-서울영등포-1704
Business Providing Employment Information Number: J1204020250004
#901, Eunhaeng-ro 3, Yeongdeungpo-gu, Seoul 07237
E-mail dacon@dacon.io |
Tel. 070-4102-0545
Copyright ⓒ DACON Inc. All rights reserved