분석시각화 대회 코드 공유 게시물은
내용 확인 후
좋아요(투표) 가능합니다.
주차수요 예측 EDA & Catboost Baseline
하나의 단지코드에 여러행의 데이터 존재합니다.
평가 데이터가 단지코드 별로 되어 있기 때문에 단지코드별로 데이터를 집계하여 사용하는 방향으로 접근했습니다.
우선 단지코드별로 값이 유일하게 부여되어 있는 변수들만 사용하여 Catboost Baseline을 만들어 보았습니다.
[20210622 업데이트] 단지코드별로 둘 이상의 값이 있는 범주형 변수들에 대한 전처리 추가
범주형 변수 인코딩을 해주는 내부 로직이 있어서 그런것 같아요.
감사합니다
EDA 하는 중인데 많은 참고가 되었습니다!
EDA 중 많은 참고가 되었습니다. 감사합니다 !
파베르님, 좋은 코드 공유 감사드립니다 :)
혹시 공유해주신 Code의 Feature Engineering을 기반으로, 새로운 글을 작성해도 괜찮을까요?
네네 요즘 이 대회는 못보고 있는데 더 좋은 글 써주시면 감사하죠 ㅎㅎ
공부하는데 참고하겠습니다 분석에 대해서 좀 더 알아가는 시간이었습니다
분석 공부하는 데 도움이 많이 되었습니다! 궁금한 게 있어서 질문을 남깁니다.
임대보증금, 임대료, 버스정류장 수, 지하철 수의 결측치를 0으로 대체한 이유가 궁금합니다!!
데이콘(주) | 대표 김국진 | 699-81-01021
통신판매업 신고번호: 제 2021-서울영등포-1704호
서울특별시 영등포구 은행로 3 익스콘벤처타워 901호
이메일 dacon@dacon.io | 전화번호: 070-4102-0545
Copyright ⓒ DACON Inc. All rights reserved
요즘 catboost가 대세인가요 ?? 많이보이더라구요😮👍