데이스쿨! 가을맞이 특별할인
분석시각화 대회 코드 공유 게시물은
내용 확인 후
좋아요(투표) 가능합니다.
외부데이터 사용 문의드립니다.
안녕하세요!
data leakage 관련해서, 학습은 2018/12/31 이전의 데이터로만 학습을 하고,
학습된 모델을 이용해서 추론 시에는 2018/12/31 이후의 데이터를 feature 값으로 사용해도 되는지 궁금합니다.
감사합니다!
안녕하세요.
그럼 혹시 일기예보 데이터는 사용가능할까요?
데이콘(주) | 대표 김국진 | 699-81-01021
통신판매업 신고번호: 제 2021-서울영등포-1704호
직업정보제공사업 신고번호: J1204020250004
서울특별시 영등포구 은행로 3 익스콘벤처타워 901호
이메일 dacon@dacon.io |
전화번호: 070-4102-0545
Copyright ⓒ DACON Inc. All rights reserved
밑의 글을 읽어본바로 안된다고 합니다.
실제 모델을 사용하여 제품을 만들때 미래의 기후데이터 또한 알 수 없기 때문에 예측해야 하는 대상 (2019년 데이터)의 외부 데이터를 사용하는 것은 치팅인것같습니다. 외부 데이터를 조금만 사용하여 train data 내에서 cross validation을 진행하였을 떄 거이 100%에 가까운 정확도를 확인하여서 저도 이것을 활용할 방법을 찾고있습니다