분석시각화 대회 코드 공유 게시물은
내용 확인 후
좋아요(투표) 가능합니다.
비참한 인생 private 60, 격자공간을 활용한 catboost
격자공간을 최대한 활용하는 방법으로 코드를 짰습니다. 많은 외부 공공데이터를 사용했습니다.
https://www.bigdata-region.kr/#/dataset/b4efcdfe-9311-4c94-ad7d-e1a62222a7cc 에서
격자100m 단위 정보를 다운받고
추가적으로 http://map.ngii.go.kr/ms/map/NlipMap.do에서 제공하는 외부데이터를 다운 받았습니다.
LB점수는 60위지만 개인적인 validation에서 성능향상이 있었습니다.
폴더 공유입니다.
https://drive.google.com/drive/folders/1CBj6crIt4BkOpHUZk_MtDGuDfr6fpXCI?usp=sharing
평균 0.05~0.1정도의 향상을 기대해 볼 수 있는 것으로 판단되어집니다. 외부데이터 대부분 공란을 차지하고 점수 영향을 크게
안 주는 것으로 추측하고 있습니다. 그리고 택배보내는 사람과 받는 사람이 train과 test가 다르기에 cv마다 좋은 모델이 달라졌습니다.
감사합니다.
데이콘(주) | 대표 김국진 | 699-81-01021
통신판매업 신고번호: 제 2021-서울영등포-1704호
서울특별시 영등포구 은행로 3 익스콘벤처타워 901호
이메일 dacon@dacon.io | 전화번호: 070-4102-0545
Copyright ⓒ DACON Inc. All rights reserved