Parking Demand Prediction

정형 | 한국토지주택공사 | 주차수요 | MAE

  • Prize : 총 1,300만원
  • 1,543명
  • 마감
Join Competition

 

주차수요 예측 EDA & Catboost Baseline

Follower 1 Following 2
2021.06.15 22:58 4,542 Views language

하나의 단지코드에 여러행의 데이터 존재합니다.
평가 데이터가 단지코드 별로 되어 있기 때문에 단지코드별로 데이터를 집계하여 사용하는 방향으로 접근했습니다.
우선 단지코드별로 값이 유일하게 부여되어 있는 변수들만 사용하여 Catboost Baseline을 만들어 보았습니다.

[20210622 업데이트] 단지코드별로 둘 이상의 값이 있는 범주형 변수들에 대한 전처리 추가

Code
함께하는우리
2021.06.28 14:49

요즘 catboost가 대세인가요 ?? 많이보이더라구요😮👍

psystat
2021.06.28 16:54

범주형 변수 인코딩을 해주는 내부 로직이 있어서 그런것 같아요.

작은거인
2021.07.04 22:09

감사합니다

jongkwon.jo
2021.07.06 16:56

EDA 하는 중인데 많은 참고가 되었습니다!

호찌민
2021.07.15 20:58

EDA 중 많은 참고가 되었습니다. 감사합니다 !

Jay Hong
2021.07.22 06:06

파베르님, 좋은 코드 공유 감사드립니다 :) 

혹시 공유해주신 Code의 Feature Engineering을 기반으로, 새로운 글을 작성해도 괜찮을까요?

psystat
2021.07.22 22:03

네네 요즘 이 대회는 못보고 있는데 더 좋은 글 써주시면 감사하죠 ㅎㅎ

로그인이 필요합니다
0 / 1000