분석시각화 대회 코드 공유 게시물은
내용 확인 후
좋아요(투표) 가능합니다.
Private 14위, Private 5.47387점, LGBM
안녕하세요.
저희팀은 user, competition 데이터로부터 feature을 생성하여 LGBM 모델에 적용하였습니다.
모든 분석은 Jupyter notebook에서 실행하였고 2차 데이터를 활용하는 것 보다 1차 데이터로만 분석하였을 때 더 잘 예측되어 1차 데이터만 사용하였습니다.
XGB, RandomForest, ExtraTree, DNN, LSTM 등 다양한 방법을 시도하였고 그 중 LGBM에 적용하였을때가 가장 성능이 높았습니다.
코드에 대한 추가 설명은 주석과 마크다운을 통해 작성하였습니다.
시계열 분석은 처음이었는데 이번 대회를 통해 많이 배울 수 있었습니다.
감사합니다.
[목차]
1. library 불러오기
2. Data 불러오기
2.1 train 범위 수정
2.2 lag feature 생성
2.3 info_user feature 생성
2.4 info_competition feature 생성
2.5 Data 나누기
2.6 Data 스케일링
3. model 생성 및 학습
4. 가중치
5. 예측파일 저장
DACON Co.,Ltd | CEO Kookjin Kim | 699-81-01021
Mail-order-sales Registration Number: 2021-서울영등포-1704
Business Providing Employment Information Number: J1204020250004
#901, Eunhaeng-ro 3, Yeongdeungpo-gu, Seoul 07237
E-mail dacon@dacon.io |
Tel. 070-4102-0545
Copyright ⓒ DACON Inc. All rights reserved