분석시각화 대회 코드 공유 게시물은
내용 확인 후
좋아요(투표) 가능합니다.
퇴근시간 버스승차인원 예측 AI 경진대회
예보 데이터 질문드립니다. 예보 데이터는 예보의 시점이 있는데 실황분석자료는 예보더라도 10분 단위로 갱...
예보 데이터 질문드립니다.
예보 데이터는 예보의 시점이 있는데
실황분석자료는 예보더라도 10분 단위로 갱신되는 데이터이며, 초단기예보는 1~4시간 후를 예측, 단기예보는 4시간부터 58~67시간 후를 예측한다고 합니다.
지금 12시 이전 데이터를 사용하도록 권고하고 있는데, 실황분석자료나 초단기예보 데이터를 사용하면 12시 이후 데이터를 사용하게 되므로 data leak으로 보여집니다.
예보데이터를 사용하더라도 예보의 시점이 해당일 12시 전이어야 할 것 같은데 답변부탁드립니다.
아래 예시를 들어보았습니다.
예보시점: 2019/09/01 14:00 -> +4시간 예보시간: 2019/09/01 18:00 / 사용불가
예보시점: 2019/09/01 11:00 -> +7시간 예보시간: 2019/09/01 18:00 / 사용가능
좋은 대회 개최해주셔서 감사합니다.
데이콘(주) | 대표 김국진 | 699-81-01021
통신판매업 신고번호: 제 2021-서울영등포-1704호
서울특별시 영등포구 은행로 3 익스콘벤처타워 901호
이메일 dacon@dacon.io | 전화번호: 070-4102-0545
Copyright ⓒ DACON Inc. All rights reserved
안녕하세요, 데이콘입니다.
일단 해당 예보 데이터에 대해서 좋은 정보를 제공해주셔서 감사드립니다.
현재 말씀해주신 내용이 무엇인지는 정확히 이해를 하였지만, 데이콘 측에서 참가자분들이 사용하는 외부데이터를
대회 중에 일일히 확인하여 예시를 들 수 없기 때문에 대략적인 예시를 들어드린 것입니다.
현재 말씀해주신 초단기예보의 경우, 과거의 시점이기때문에 예보시점: 2019/09/01 14:00을 통해서 18:00의 예보데이터를 획득하는 경우가 나올수 있지만
저희가 제시해드린 상황에서는 12:00이 되는 즉시, 퇴근시간대의 승차 인원수 예측 수행을 하기 때문에,
실제로는 해당 시점에서의 데이터를 획득할 수 조차 없습니다.
해당 예시를 들어주신 예시데이터의 링크를 첨부해주신다면, 전체 참가자분들에게 해당 예시를 통해서 설명을 드릴 수 있겠지만
현재로서는 저희가 드린 상황 속에서 참가자분들이 data leakage로 의심되는 상황에서는 dacon측에 문의를 주시거나