[신규 오픈 기념] 데이스쿨 최대 40% 할인 🎁
분석시각화 대회 코드 공유 게시물은
내용 확인 후
좋아요(투표) 가능합니다.
[Private 9위] 파생변수, VotingClassifier
> 시도정리
1. 전처리 거의 안 한 데이터로 모델 학습 => macro f1 : 0.78
2. 파생변수 생성 (대출금액_대비_총상환원금_비율, 대출금액_대비_총상환이자_비율, 그 외 여러 파생변수 생성 시도) => 0.91 (크게 오름)
3. 중요도 높았던 변수만 선택 (대출기간, 대출금액_대비_총상환원금_비율, 대출금액_대비_총상환이자_비율)=> 0.949
4. 성능이 가장 좋았던 세가지 모델을 (rf, dt, gbc) 모델별 가중치 다르게 설정하고 votingclassifier 모델 학습 => 0.9549
5. 최종 public macro f1 : 0.9549
그 외, 이상치제거, 정규화/표준화, 대출금액 변수 구간화, 오버샘플링, 여러가지 파생변수 생성 등을 시도했으나 점수에 큰 효과는 없었습니다.
데이콘(주) | 대표 김국진 | 699-81-01021
통신판매업 신고번호: 제 2021-서울영등포-1704호
서울특별시 영등포구 은행로 3 익스콘벤처타워 901호
이메일 dacon@dacon.io | 전화번호: 070-4102-0545
Copyright ⓒ DACON Inc. All rights reserved