분석시각화 대회 코드 공유 게시물은
내용 확인 후
좋아요(투표) 가능합니다.
[Private 19th] CatboostClassifier + optuna
1. 이상치 제거
- 이상치를 제거할 때 y label을 이용해서 제거하였는데 직접 조건을 설정하여 제거하였는데, 지금 생각해보니 data leakage 혹은 편향을 유발한거같네요..
2. 파생변수 생성
3. 금융 도메인 지식 + feature importance를 통한 column drop, feature selection
4. 범주형 변수에 대해서 LabelEncoding
5. 클래스 불균형 해결을 위한 scale_pos_weight 적용
6. optuna를 통한 하이퍼파라미터 최적화
다른 분들에게 제 코드가 도움이 되었으면 좋겠네요
데이콘(주) | 대표 김국진 | 699-81-01021
통신판매업 신고번호: 제 2021-서울영등포-1704호
직업정보제공사업 신고번호: J1204020250004
서울특별시 영등포구 은행로 3 익스콘벤처타워 901호
이메일 dacon@dacon.io |
전화번호: 070-4102-0545
Copyright ⓒ DACON Inc. All rights reserved