분석시각화 대회 코드 공유 게시물은
내용 확인 후
좋아요(투표) 가능합니다.
선형회귀+변수선택(public:277.00518/private:316.02571)
EDA 결과 선형모형으로 충분한 성능을 보일 것으로 예상했습니다.
또한 훈련데이터가 적었기 때문에 과적합의 우려가 있었기 때문에 최대한 단순한 모형을 고려하고자 했습니다.
그리고 EDA 결과를 보고 임의로 변수를 선택하여 모델링을 진행했습니다.
해당 코드에는 포함되어 있지 않지만, elasticnet이나 모든 변수를 조합한 모형의 성능을 비교했는데 제 검증 결과와 데이콘 제출 결과가 상이해서 혼란스러웠습니다...
데이터 수가 적어서 그런건지, 혹시 이쪽에 대해 이유를 아시는 분은 댓글 남겨주시면 감사하겠습니다.
고생하셨습니다~
DACON Co.,Ltd | CEO Kookjin Kim | 699-81-01021
Mail-order-sales Registration Number: 2021-서울영등포-1704
Business Providing Employment Information Number: J1204020250004
#901, Eunhaeng-ro 3, Yeongdeungpo-gu, Seoul 07237
E-mail dacon@dacon.io |
Tel. 070-4102-0545
Copyright ⓒ DACON Inc. All rights reserved