분석시각화 대회 코드 공유 게시물은
내용 확인 후
좋아요(투표) 가능합니다.
퇴근시간 버스승차인원 예측 AI 경진대회
예측에 활용할 데이터 범위나 data leakage 등 제약이 있는지 궁금합니다.
예측에 활용할 데이터 범위나 data leakage 등 제약이 있는지 궁금합니다.
데이콘(주) | 대표 김국진 | 699-81-01021
통신판매업 신고번호: 제 2021-서울영등포-1704호
서울특별시 영등포구 은행로 3 익스콘벤처타워 901호
이메일 dacon@dacon.io | 전화번호: 070-4102-0545
Copyright ⓒ DACON Inc. All rights reserved
외부데이터의 경우, 공공 데이터 및 법적인 제약이 없는 데이터가 사용이 가능하며,
크롤링을 하셨을 경우에는 크롤링 코드와 공공데이터 다운로드의 경우 링크를 게시해 주셔야됩니다.
(11월 20일자 수정 사항 추가됨)
예측에 활용할 데이터 범위나 data leakage의 경우, train data의 시점과 test data의 시점이 모두 과거인 시점이기때문에
train.csv 파일에서는 해당 train.csv파일의 기간인 9월까지의 데이터만 활용이 가능하며,
test.csv의 경우, 당일 오전 시간대의 경우, 주최측에서 원하던 사항이 오전 시간대의 정보를 알 경우, 퇴근 시간대의 승차인원이 어떻게 되는지이기 때문에,
당일 오전 시간대의 경우, 외부데이터 사용이 가능하지만 당일 18~20시의 경우, 외부 데이터 사용이 제한됩니다.