제주 신용카드 빅데이터 경진대회

알고리즘 | 정형 | 회귀 | 금융 | RMSLE

  • moneyIcon 상금 : 600만원
  • 1,914명 마감

 

제주 빅데이터 경진대회 베이스라인 코드 LGBM

2020.07.03 15:44 10,218 조회 language

rmse score와 dacon score가 비례한다는 사실을 알아냈습니다.
lgbm 모델로 가신다면 사전에 rmse score를 체크함으로써 submit 횟수를 아낄 수 있을 것이라고 예상됩니다.

--

얼마전 kaggle에서 5년간의 데이터를 사용하여 추후 한달 마트 수익을 예측하는 'm5' 대회를 진행했었는데,
많은 참가자들이 submission score 에만 집중한 나머지 오버피팅으로 인해 최종 결과에서 엄청난 shake up이 발생했습니다.

이 대회는 4월까지의 데이터로 7월을 예측하는 대회이기 때문에, 더욱더 오버피팅의 위험성이 큽니다.
따라서 최종 submission score이 높은 모델보다 벨런스 있는 모델을 구축하는 것이 중요하고 생각합니다.

코드
로그인이 필요합니다
0 / 1000
당쇠
2020.07.05 23:29

수고하셨습니다.

matjib
2020.07.06 14:58

코드 잘 봤습니다! 궁금한게 있는데 
'objective': 'tweedie'
트위디 분포를 사용한 이유가 궁금합니다!

import.위드
2020.07.06 18:08

Poisson보다 결과값이 좋아서 선택했습니다.

'objective': 'poisson'
[1000] valid_0's rmse: 1.51574

윤기석
2020.07.15 10:17

실력이 많이 부족한지라 제출파일 생성에서 애먹고 있었는데, 좋은 자료 참고할수 있게 해주셔서 감사합니다!