분석시각화 대회 코드 공유 게시물은
내용 확인 후
좋아요(투표) 가능합니다.
리더보드는 AutoML로 오버피팅 하는게 나은것같습니다. 이 걸로 제출하면 아마 2.1 ~ 2.2나올것같습니다.
LGBM이나 XGBOOST로 AutoML 돌려놓으면 1.93~5 나오는것같습니다. 이 대회 핵심은 데이터분석을 통한 파생변수 생성이라고 생각됩니다. 제가 테스트해봤는데 이거 그냥 값 똑같은걸로 그대로 넣어도 2.2나오네요..? 위 모델은 샘플코드라서 학습도 안된 것 같습니다.
와 저랑 생각이 똑같네요!!!
딱 데이터 보자마자 EDA 빡세게 해야겠다는 생각이 들더라고요
저는 모든 컬럼에 대해서 이상치 제거후 (데이터29000개 제거되더라고요 ㅠㅜ)다중회귀 돌렸는데
성능이 2.2 나옵니다ㅠㅠ....
Optuna, pycaret으로 AutoML 돌리고 내일 일어나면 1.9는 나오더라구요. 저도 지금 돌리고 있어서 마감 7일전에 성능 보려고합니다. 이 게시판에 AutoML로 글 작성하시분 계셔서 그분꺼 보시면 될거같아요.
H2o로 AutoML을 돌려보고 싶은데 구글링을 아무리 해봐도 코드를 못찾았는데 혹시 H2o AutoML 코드 공유 가능하신가요?
모두 train의 평균값을 test에 그대로 넣으면 얼마나 나올까 궁금했었는데 이미 해보셨군요? ㅋㅋ
참고로 저는 h2o로 AutoML만 돌리고 있습니다. 어제까지의 최고성능은 1.94449이구요. h2o 강력 추천합니다. ^^
데이콘(주) | 대표 김국진 | 699-81-01021
통신판매업 신고번호: 제 2021-서울영등포-1704호
서울특별시 영등포구 은행로 3 익스콘벤처타워 901호
이메일 dacon@dacon.io | 전화번호: 070-4102-0545
Copyright ⓒ DACON Inc. All rights reserved
정말 고생하셨네요!
혹시... 리더보드 성능이 잘 나오나요?