월간 데이콘 2020 D CUP Google Analytics 데이터 경진대회

알고리즘 | 정형 | 회귀 | 행태심리 | RMSE

  • moneyIcon Prize : 총 100만원 + 데이콘 기념품
  • 595명 마감
Closed

 

Private 4위, Private 4.6182점, XGBoost와 Ridge

2021.01.24 22:17 5,969 Views language

모델링 과정에서 생각했던 점
1. ridge와 xgboost의 앙상블을 통해서 트리 모델이 잘 학습할 수 없는 부분을 학습하려고 했고
2. 주어진 추가 데이터를 여러가지 방식으로 처리해서 그중에 정확도에 도움되는 것들을 추가했다.
3. 정답 컬럼 마다 데이터를 다르게 설정했다.

목차
1  데이터 불러오기
2  데이터 수정(전처리)
3  정답 컬럼 데이터셋 분할
4  모델 학습 및 예측
5  submission 채우기와 제출 파일 만들기

잘 배웠습니다 감사합니다.

Code