월간 데이콘 2020 D CUP Google Analytics 데이터 경진대회

알고리즘 | 정형 | 회귀 | 행태심리 | RMSE

  • moneyIcon Prize : 총 100만원 + 데이콘 기념품
  • 595명 마감
Closed

 

Private 1위, Private 점수 1.60023점, Linear Regression

2021.01.25 01:31 7,327 Views language

competition, login, user, submission 데이터로부터 일별 Feature를 생성하여 Linear Regression 모델에 사용했습니다.
prophet, ARIMA 등 시계열 기법, 머신러닝 등 다양한 방법을 시도했고 결과적으로는 생성 feature에 회귀모델을 사용했을 때가 가장 성능이 높았습니다.
추가적으로 feature에 대한 더욱 깊은 고민과 시계열 모델의 성능 향상 후 앙상블 등을 하면 더욱 높은 성능을 낼 수 있을 것 같습니다.

Code
로그인이 필요합니다
0 / 1000
jjcks
2021.02.10 21:19

feature생성과 heatmap을 이용한 상관관계 분석 부분 인상 깊게 봤습니다.

DelayD
2021.02.19 16:46

인상깊네요