물류 유통량 예측 경진대회

알고리즘 | 정형 | 회귀 | 운송량 | RMSE

  • moneyIcon Prize : 총 100만원
  • 1,398명 마감

 

비참한 인생 private 60, 격자공간을 활용한 catboost

2021.12.23 23:02 1,253 Views language

격자공간을 최대한 활용하는 방법으로 코드를 짰습니다. 많은 외부 공공데이터를 사용했습니다.
https://www.bigdata-region.kr/#/dataset/b4efcdfe-9311-4c94-ad7d-e1a62222a7cc 에서 
격자100m 단위 정보를 다운받고
 추가적으로 http://map.ngii.go.kr/ms/map/NlipMap.do에서 제공하는 외부데이터를 다운 받았습니다.
LB점수는 60위지만 개인적인 validation에서 성능향상이 있었습니다.
폴더 공유입니다.
https://drive.google.com/drive/folders/1CBj6crIt4BkOpHUZk_MtDGuDfr6fpXCI?usp=sharing
평균 0.05~0.1정도의 향상을 기대해 볼 수 있는 것으로 판단되어집니다. 외부데이터 대부분 공란을 차지하고 점수 영향을 크게
안 주는 것으로 추측하고 있습니다. 그리고 택배보내는 사람과 받는 사람이 train과 test가 다르기에 cv마다 좋은 모델이 달라졌습니다.
감사합니다.

Code