월간 데이콘 2020 D CUP Google Analytics 데이터 경진대회

알고리즘 | 정형 | 회귀 | 행태심리 | RMSE

  • moneyIcon Prize : 총 100만원 + 데이콘 기념품
  • 595명 마감
Closed

 

Private 11위, Private 점수: 5.3178, XGBoost

2021.01.25 10:09 6,453 Views language

[목차]
1. library 불러오기
2. 데이터 불러오기
2.1  Feature enginnering / EDA
     -  train, holiday를 이용한 날짜 관련 feature 생성 
2.2 Feature engineering /EDA II
- info_cpt, info_login 이용한 feature 생성 
3 모델 생성 및 예측
4 제출

- 주말과 평일에 유입하는 사용자 수의 차이가 존재하여 요일 변수 생성하였습니다.
- 외부데이터는 공휴일 데이터를 사용하였고, 외부 csv를 불러오는 대신 공휴일이 아닌 경우 0 공휴일인 경우 1로 array를 만들어 사용하였습니다.
- 사람들의 흥미를 끌만한 경진대회에 텍스트 처리 등을 통해 가산점을 부여하는 변수를 생성하였습니다.
- 유저의 활동 정보에 따라  active/ beginner 로 나누고, 이들의 로그인횟수를 변수로 생성하였습니다.

Code
로그인이 필요합니다
0 / 1000
DACON.edu
2021.02.27 00:10

수고하셨습니다~