서두르세요! "데이스쿨 40% 할인" 12월 2일까지!
분석시각화 대회 코드 공유 게시물은
내용 확인 후
좋아요(투표) 가능합니다.
선형회귀+변수선택(public:277.00518/private:316.02571)
EDA 결과 선형모형으로 충분한 성능을 보일 것으로 예상했습니다.
또한 훈련데이터가 적었기 때문에 과적합의 우려가 있었기 때문에 최대한 단순한 모형을 고려하고자 했습니다.
그리고 EDA 결과를 보고 임의로 변수를 선택하여 모델링을 진행했습니다.
해당 코드에는 포함되어 있지 않지만, elasticnet이나 모든 변수를 조합한 모형의 성능을 비교했는데 제 검증 결과와 데이콘 제출 결과가 상이해서 혼란스러웠습니다...
데이터 수가 적어서 그런건지, 혹시 이쪽에 대해 이유를 아시는 분은 댓글 남겨주시면 감사하겠습니다.
고생하셨습니다~
데이콘(주) | 대표 김국진 | 699-81-01021
통신판매업 신고번호: 제 2021-서울영등포-1704호
서울특별시 영등포구 은행로 3 익스콘벤처타워 901호
이메일 dacon@dacon.io | 전화번호: 070-4102-0545
Copyright ⓒ DACON Inc. All rights reserved