분석시각화 대회 코드 공유 게시물은
내용 확인 후
좋아요(투표) 가능합니다.
테스트기한에 해당하는 2019년도의 날씨데이터 이용해도 되나요??
본 대회는 날씨데이터 등 외부데이터가 사용가능하다고 명시되어 있습니다.
그런데 test 기한에 해당하는 2019년도(1.1~3.31)의 외부데이터도 사용가능한가요??
시계열분석대회의 특성상 해당경우가 data leakage가 아닌가 의구심이 듭니다..
data leakage 여부를 확실히 알고 싶습니다!
안녕하세요.
데이터 사용이 불가하다는 것이 모델을 학습할 때에만 해당되는게 맞나요?
외부데이터를 구해서 Train날짜 범위에 해당하는 데이터만 모델학습에 활용하고,
Test날짜 범위에 해당하는 데이터는 만든 모델에 넣어서 예측값 산출을 위해서만 사용하면 문제없는게 아닌지 질문드립니다.
삭제된 댓글입니다
안녕하세요. seunghunii님
Test 날짜 범위에 해당하는 데이터도 사용시 data leakage에 해당합니다.
본 대회는 Test 기간 수요량을 한번에 예측하는 과제로 Test 기간 전에 습득한 데이터만 활용 가능합니다.
감사합니다.
데이콘 드림
데이콘(주) | 대표 김국진 | 699-81-01021
통신판매업 신고번호: 제 2021-서울영등포-1704호
직업정보제공사업 신고번호: J1204020250004
서울특별시 영등포구 은행로 3 익스콘벤처타워 901호
이메일 dacon@dacon.io |
전화번호: 070-4102-0545
Copyright ⓒ DACON Inc. All rights reserved
안녕하세요. 작성자님.
2018년 12월 31일까지 획득 가능한 데이터만 활용이 가능합니다.
2019년 기상데이터를 사용할 경우 data leakage에 해당하여 사용이 불가능합니다.
감사합니다.
데이콘 드림.