주차수요 예측 AI 경진대회

알고리즘 | 정형 | 회귀 | 교통 | MAE

  • moneyIcon Prize : 총 1,300만원
  • 2,217명 마감

 

주차수요 예측 EDA & Catboost Baseline

2021.06.15 22:58 10,423 Views language

하나의 단지코드에 여러행의 데이터 존재합니다.
평가 데이터가 단지코드 별로 되어 있기 때문에 단지코드별로 데이터를 집계하여 사용하는 방향으로 접근했습니다.
우선 단지코드별로 값이 유일하게 부여되어 있는 변수들만 사용하여 Catboost Baseline을 만들어 보았습니다.

[20210622 업데이트] 단지코드별로 둘 이상의 값이 있는 범주형 변수들에 대한 전처리 추가

Code
로그인이 필요합니다
0 / 1000
함께하는우리
2021.06.28 14:49

요즘 catboost가 대세인가요 ?? 많이보이더라구요😮👍

psystat
2021.06.28 16:54

범주형 변수 인코딩을 해주는 내부 로직이 있어서 그런것 같아요.

작은거인
2021.07.04 22:09

감사합니다

jongkwon.jo
2021.07.06 16:56

EDA 하는 중인데 많은 참고가 되었습니다!

호찌민
2021.07.15 20:58

EDA 중 많은 참고가 되었습니다. 감사합니다 !

Jay Hong
2021.07.22 06:06

파베르님, 좋은 코드 공유 감사드립니다 :) 

혹시 공유해주신 Code의 Feature Engineering을 기반으로, 새로운 글을 작성해도 괜찮을까요?

psystat
2021.07.22 22:03

네네 요즘 이 대회는 못보고 있는데 더 좋은 글 써주시면 감사하죠 ㅎㅎ

리콜너마저
2022.07.21 00:21

공부하는데 참고하겠습니다 분석에 대해서 좀 더 알아가는 시간이었습니다

Data_analyLee
2023.07.20 17:00

분석 공부하는 데 도움이 많이 되었습니다! 궁금한 게 있어서 질문을 남깁니다. 
임대보증금, 임대료, 버스정류장 수, 지하철 수의 결측치를 0으로 대체한 이유가 궁금합니다!!