분석시각화 대회 코드 공유 게시물은
내용 확인 후
좋아요(투표) 가능합니다.
Private 0.92156 (#1) 코드 공유
시간이 없어 급하게 기본만 하고 제출한 모델이 1위를 하여 당황스러우나,
데이터가 깔끔하며 결측이 없고 수가 적어 기본 이상의 작업을 하면 오버피팅이 되는 것 같습니다.
- 모델은 Logistic, RandomForest, Adaboost를 사용해 보았으며 최종적으로 가장 스코어가 높았던 RandomForest를 선택했습니다.
- 변수는 R에서 stepwise selection으로 선택된 변수들만 사용해도 보았으나, 결과적으로는 모든 변수를 다 사용한 모델이 가장 성능이 좋았습니다.
- 전처리의 경우 StandardScaler를 사용한 numerical 변수들의 scaling / binary 변수들의 one-hot encoding 이외의 다른 전처리는 추가적으로 하지 않았습니다.
감사합니다 :)
1등 축하드립니다~~ 수고많으셨어요 ㅎㅎ
감사합니다 :)
데이콘(주) | 대표 김국진 | 699-81-01021
통신판매업 신고번호: 제 2021-서울영등포-1704호
서울특별시 영등포구 은행로 3 익스콘벤처타워 901호
이메일 dacon@dacon.io | 전화번호: 070-4102-0545
Copyright ⓒ DACON Inc. All rights reserved
좋은 분석입니다! 감사합니다 :)