분석시각화 대회 코드 공유 게시물은
내용 확인 후
좋아요(투표) 가능합니다.
Data Leakage(공공데이터 누설관련 질문)
공공데이터의 경우 법적 제약이 없으며 모두에게 공개된 데이터라면 사용이 가능하다고 이전에 답변을 받았었습니다.
그렇지만 데이터 누설이 발생하는 경우에도 이번 대회에서 제약없이 공공데이터 사용이 가능한지 여쭙고 싶습니다.
이 때 데이터 누설과 관련해 토크에 글이 올라온 것을 참고해보면, 예측 시점에 얻을 수 없는 데이터를 누설이라고 판단할 수 있을 것 같습니다.
모두에게 공개된 공공데이터는 제약이 없다고 하셔서 질문합니다.
+) 많은 참가자들이 데이터 누설에 대한 판단을 함에 있어 어려움을 겪고 있는 것 같습니다. 그럼에도 불구하고 명확한 기준이 없어 참가자들간 논의나 토크에만 의존하고 있는 상황입니다. 대회 종료가 임박한 만큼, 주최 측의 빠르고 명확한 입장표명 바랍니다.
안녕하세요. Duck님
본 주차수요 예측 AI 경진대회는 시점은 제공되지 않으며 추론 시점은 현재로 취급합니다.
외부데이터 공개 시점으로 발생하는 data leakage는 없으며
train, test 데이터셋 사이 또는 test 데이터들 사이 data leakage 여부만을 확인하고 있습니다.
감사합니다.
데이콘 드림.
데이콘(주) | 대표 김국진 | 699-81-01021
통신판매업 신고번호: 제 2021-서울영등포-1704호
서울특별시 영등포구 은행로 3 익스콘벤처타워 901호
이메일 dacon@dacon.io | 전화번호: 070-4102-0545
Copyright ⓒ DACON Inc. All rights reserved
삭제된 댓글입니다