분석시각화 대회 코드 공유 게시물은
내용 확인 후
좋아요(투표) 가능합니다.
[Private 3위] RandomForest, Stratified K-fold, optuna
다른 분들이 EDA부분을 너무 잘 설명해주셔서 그 부분은 제외하고 업로드했습니다.
간략하게 코드를 설명하면 다음과 같습니다.
1. 파생변수 생성
- EDA와 feature_importance를 통해 여러 파생변수를 생성하며 스코어를 확인해봤습니다.
- 대출금액을 이용한 파생변수 생성 후 점수가 대폭 올라간 것을 확인했습니다.
2. 모델 선택
- 여러 모델 중 가장 성능이 좋았던 랜덤포레스트를 선택했습니다.
3. 클래스 불균형
- 해소하기 위해 Stratified K-fold와 class_weight를 사용했습니다.
4. 하이퍼파라미터 튜닝(optuna)
이번 대회에 참여하면서 모르는 정보를 찾아보고 배울 수 있는 시간이 돼서 좋았습니다.
감사합니다.
DACON Co.,Ltd | CEO Kookjin Kim | 699-81-01021
Mail-order-sales Registration Number: 2021-서울영등포-1704
Business Providing Employment Information Number: J1204020250004
#901, Eunhaeng-ro 3, Yeongdeungpo-gu, Seoul 07237
E-mail dacon@dacon.io |
Tel. 070-4102-0545
Copyright ⓒ DACON Inc. All rights reserved