펭귄 몸무게 예측 AI 해커톤

정형 | RMSE

  • moneyIcon Prize : 참가시 최소 50 XP, 특별상 데이콘 후드
  • 859명 마감

 

선형회귀+변수선택(public:277.00518/private:316.02571)

2022.01.08 18:29 2,749 Views language

EDA 결과 선형모형으로 충분한 성능을 보일 것으로 예상했습니다. 
또한 훈련데이터가 적었기 때문에 과적합의 우려가 있었기 때문에 최대한 단순한 모형을 고려하고자 했습니다.
그리고 EDA 결과를 보고 임의로 변수를 선택하여 모델링을 진행했습니다.

해당 코드에는 포함되어 있지 않지만, elasticnet이나 모든 변수를 조합한 모형의 성능을 비교했는데 제 검증 결과와 데이콘 제출 결과가 상이해서 혼란스러웠습니다...
데이터 수가 적어서 그런건지, 혹시 이쪽에 대해 이유를 아시는 분은 댓글 남겨주시면 감사하겠습니다.
고생하셨습니다~

Code