퇴근시간 버스승차인원 예측 AI 경진대회

예보 데이터 질문드립니다. 예보 데이터는 예보의 시점이 있는데 실황분석자료는 예보더라도 10분 단위로 갱...

2019.12.02 03:05 5,448 조회

예보 데이터 질문드립니다.

예보 데이터는 예보의 시점이 있는데

실황분석자료는 예보더라도 10분 단위로 갱신되는 데이터이며, 초단기예보는 1~4시간 후를 예측, 단기예보는 4시간부터 58~67시간 후를 예측한다고 합니다.

지금 12시 이전 데이터를 사용하도록 권고하고 있는데, 실황분석자료나 초단기예보 데이터를 사용하면 12시 이후 데이터를 사용하게 되므로 data leak으로 보여집니다. 

 

예보데이터를 사용하더라도 예보의 시점이 해당일 12시 전이어야 할 것 같은데 답변부탁드립니다.

아래 예시를 들어보았습니다.

예보시점: 2019/09/01 14:00 -> +4시간 예보시간: 2019/09/01 18:00 / 사용불가

예보시점: 2019/09/01 11:00 -> +7시간 예보시간: 2019/09/01 18:00 / 사용가능

 

좋은 대회 개최해주셔서 감사합니다.

로그인이 필요합니다
0 / 1000
송근구ㅡㄴ
2022.02.14 16:20

안녕하세요, 데이콘입니다.

일단 해당 예보 데이터에 대해서 좋은 정보를 제공해주셔서 감사드립니다.

현재 말씀해주신 내용이 무엇인지는 정확히 이해를 하였지만, 데이콘 측에서 참가자분들이 사용하는 외부데이터를

대회 중에 일일히 확인하여 예시를 들 수 없기 때문에 대략적인 예시를 들어드린 것입니다.

 

현재 말씀해주신 초단기예보의 경우, 과거의 시점이기때문에 예보시점: 2019/09/01 14:00을 통해서 18:00의 예보데이터를 획득하는 경우가 나올수 있지만

저희가 제시해드린 상황에서는 12:00이 되는 즉시, 퇴근시간대의 승차 인원수 예측 수행을 하기 때문에, 

실제로는 해당 시점에서의 데이터를 획득할 수 조차 없습니다.

 

해당 예시를 들어주신 예시데이터의 링크를 첨부해주신다면, 전체 참가자분들에게 해당 예시를 통해서 설명을 드릴 수 있겠지만

현재로서는 저희가 드린 상황 속에서 참가자분들이 data leakage로 의심되는 상황에서는 dacon측에 문의를 주시거나