분석시각화 대회 코드 공유 게시물은
내용 확인 후
좋아요(투표) 가능합니다.
Private 0.92156 (#1) 코드 공유
시간이 없어 급하게 기본만 하고 제출한 모델이 1위를 하여 당황스러우나,
데이터가 깔끔하며 결측이 없고 수가 적어 기본 이상의 작업을 하면 오버피팅이 되는 것 같습니다.
- 모델은 Logistic, RandomForest, Adaboost를 사용해 보았으며 최종적으로 가장 스코어가 높았던 RandomForest를 선택했습니다.
- 변수는 R에서 stepwise selection으로 선택된 변수들만 사용해도 보았으나, 결과적으로는 모든 변수를 다 사용한 모델이 가장 성능이 좋았습니다.
- 전처리의 경우 StandardScaler를 사용한 numerical 변수들의 scaling / binary 변수들의 one-hot encoding 이외의 다른 전처리는 추가적으로 하지 않았습니다.
감사합니다 :)
1등 축하드립니다~~ 수고많으셨어요 ㅎㅎ
감사합니다 :)
DACON Co.,Ltd | CEO Kookjin Kim | 699-81-01021
Mail-order-sales Registration Number: 2021-서울영등포-1704
Business Providing Employment Information Number: J1204020250004
#901, Eunhaeng-ro 3, Yeongdeungpo-gu, Seoul 07237
E-mail dacon@dacon.io |
Tel. 070-4102-0545
Copyright ⓒ DACON Inc. All rights reserved
좋은 분석입니다! 감사합니다 :)