퇴근시간 버스승차인원 예측 AI 경진대회

예측에 활용할 데이터 범위나 data leakage 등 제약이 있는지 궁금합니다.

2019.11.12 12:46 3,608 조회

예측에 활용할 데이터 범위나 data leakage 등 제약이 있는지 궁금합니다.

로그인이 필요합니다
0 / 1000
송근구ㅡㄴ
2022.02.14 16:20

외부데이터의 경우, 공공 데이터 및 법적인 제약이 없는 데이터가 사용이 가능하며,

크롤링을 하셨을 경우에는 크롤링 코드와 공공데이터 다운로드의 경우 링크를 게시해 주셔야됩니다.

 

(11월 20일자 수정 사항 추가됨)

예측에 활용할 데이터 범위나 data leakage의 경우, train data의 시점과 test data의 시점이 모두 과거인 시점이기때문에

train.csv 파일에서는 해당 train.csv파일의 기간인 9월까지의 데이터만 활용이 가능하며,

test.csv의 경우, 당일 오전 시간대의 경우, 주최측에서 원하던 사항이 오전 시간대의 정보를 알 경우, 퇴근 시간대의 승차인원이 어떻게 되는지이기 때문에,

당일 오전 시간대의 경우, 외부데이터 사용이 가능하지만 당일 18~20시의 경우, 외부 데이터 사용이 제한됩니다.