주차수요 예측 AI 경진대회

알고리즘 | 정형 | 회귀 | 교통 | MAE

  • moneyIcon Prize : 총 1,300만원
  • 2,218명 마감

 

Data Leakage(공공데이터 누설관련 질문)

2021.07.29 23:47 1,371 Views

공공데이터의 경우 법적 제약이 없으며 모두에게 공개된 데이터라면 사용이 가능하다고 이전에 답변을 받았었습니다.

그렇지만 데이터 누설이 발생하는 경우에도 이번 대회에서 제약없이 공공데이터 사용이 가능한지 여쭙고 싶습니다.

이 때 데이터 누설과 관련해 토크에 글이 올라온 것을 참고해보면, 예측 시점에 얻을 수 없는 데이터를 누설이라고 판단할 수 있을 것 같습니다.

모두에게 공개된 공공데이터는 제약이 없다고 하셔서 질문합니다.


+) 많은 참가자들이 데이터 누설에 대한 판단을 함에 있어 어려움을 겪고 있는 것 같습니다. 그럼에도 불구하고 명확한 기준이 없어 참가자들간 논의나 토크에만 의존하고 있는 상황입니다. 대회 종료가 임박한 만큼, 주최 측의 빠르고 명확한 입장표명 바랍니다.

로그인이 필요합니다
0 / 1000
DACONIO
2021.07.30 10:00

삭제된 댓글입니다

DACONIO
2021.12.21 17:09

안녕하세요. Duck님

본 주차수요 예측 AI 경진대회는 시점은 제공되지 않으며 추론 시점은 현재로 취급합니다.
외부데이터 공개 시점으로 발생하는 data leakage는 없으며
train, test 데이터셋 사이 또는 test 데이터들 사이 data leakage 여부만을 확인하고 있습니다.

감사합니다.
데이콘 드림.