전기차 가격 예측 해커톤: 데이터로 EV를 읽다!

데이콘 해커톤 | 알고리즘 | 정형 | 회귀 | EV | RMSE

  • moneyIcon 상금 : 데이스쿨 프로 구독권
  • 1,310명 마감

 

public: 1.05983 / 최적 머신러닝 모델 앙상블을 활용한 전기차 가격 예측

2025.01.20 11:11 1,046 조회 language

설명
이 코드는 다양한 머신러닝 및 딥러닝 기법을 활용하여 전기차 가격 예측 문제를 해결하는 데 초점을 맞춘 프로젝트입니다. 아래와 같은 과정을 거쳐 역대 최저 점수를 달성하였습니다:
1. 데이터 전처리 및 파생 변수 생성:
• 결측치 처리 및 주요 특징(배터리 용량, 주행거리 등)을 활용한 추가 변수 생성.
• 원-핫 인코딩을 통해 범주형 데이터를 모델 학습에 활용 가능하도록 변환.
2. 다양한 모델 적용:
• 선형 회귀부터 트리 기반 모델(XGBoost, CatBoost, LightGBM), 앙상블 모델(Random Forest, Gradient Boosting), 비선형 모델(SVR, KNN)까지 폭넓은 모델 사용.
• 각 모델의 성능(RMSE) 비교를 통해 최적의 조합 선정.
3. 최적 가중치 앙상블:
• scipy.optimize.minimize를 활용하여 각 모델의 가중치를 최적화.
• Validation RMSE를 최소화하는 가중치 기반 앙상블 구성.
4. 결과 제출:
• 테스트 데이터에 대한 예측 수행 및 제출 파일 생성.
5. 주요 성과:
• Validation RMSE 기준 역대 최저 점수 기록.
• NN(딥러닝 모델)이 최적화에 기여하지 않음을 발견하고, 머신러닝 모델 중심의 접근법이 더욱 효과적임을 확인.

코드