[신규 오픈 기념] 데이스쿨 최대 40% 할인 🎁
분석시각화 대회 코드 공유 게시물은
내용 확인 후
좋아요(투표) 가능합니다.
[Private 3위] RandomForest, Stratified K-fold, optuna
다른 분들이 EDA부분을 너무 잘 설명해주셔서 그 부분은 제외하고 업로드했습니다.
간략하게 코드를 설명하면 다음과 같습니다.
1. 파생변수 생성
- EDA와 feature_importance를 통해 여러 파생변수를 생성하며 스코어를 확인해봤습니다.
- 대출금액을 이용한 파생변수 생성 후 점수가 대폭 올라간 것을 확인했습니다.
2. 모델 선택
- 여러 모델 중 가장 성능이 좋았던 랜덤포레스트를 선택했습니다.
3. 클래스 불균형
- 해소하기 위해 Stratified K-fold와 class_weight를 사용했습니다.
4. 하이퍼파라미터 튜닝(optuna)
이번 대회에 참여하면서 모르는 정보를 찾아보고 배울 수 있는 시간이 돼서 좋았습니다.
감사합니다.
데이콘(주) | 대표 김국진 | 699-81-01021
통신판매업 신고번호: 제 2021-서울영등포-1704호
서울특별시 영등포구 은행로 3 익스콘벤처타워 901호
이메일 dacon@dacon.io | 전화번호: 070-4102-0545
Copyright ⓒ DACON Inc. All rights reserved