분석시각화 대회 코드 공유 게시물은
내용 확인 후
좋아요(투표) 가능합니다.
제주 빅데이터 경진대회 베이스라인 코드 LGBM
rmse score와 dacon score가 비례한다는 사실을 알아냈습니다.
lgbm 모델로 가신다면 사전에 rmse score를 체크함으로써 submit 횟수를 아낄 수 있을 것이라고 예상됩니다.
--
얼마전 kaggle에서 5년간의 데이터를 사용하여 추후 한달 마트 수익을 예측하는 'm5' 대회를 진행했었는데,
많은 참가자들이 submission score 에만 집중한 나머지 오버피팅으로 인해 최종 결과에서 엄청난 shake up이 발생했습니다.
이 대회는 4월까지의 데이터로 7월을 예측하는 대회이기 때문에, 더욱더 오버피팅의 위험성이 큽니다.
따라서 최종 submission score이 높은 모델보다 벨런스 있는 모델을 구축하는 것이 중요하고 생각합니다.
코드 잘 봤습니다! 궁금한게 있는데
'objective': 'tweedie'
트위디 분포를 사용한 이유가 궁금합니다!
Poisson보다 결과값이 좋아서 선택했습니다.
'objective': 'poisson'
[1000] valid_0's rmse: 1.51574
실력이 많이 부족한지라 제출파일 생성에서 애먹고 있었는데, 좋은 자료 참고할수 있게 해주셔서 감사합니다!
데이콘(주) | 대표 김국진 | 699-81-01021
통신판매업 신고번호: 제 2021-서울영등포-1704호
서울특별시 영등포구 은행로 3 익스콘벤처타워 901호
이메일 dacon@dacon.io | 전화번호: 070-4102-0545
Copyright ⓒ DACON Inc. All rights reserved
수고하셨습니다.