[신규 오픈 기념] 데이스쿨 최대 40% 할인 🎁
분석시각화 대회 코드 공유 게시물은
내용 확인 후
좋아요(투표) 가능합니다.
Data Leakage 문의
안녕하세요.
대회 규칙 중에 다음과 같은 부분이 있는데,
저는 이 문장을 test_x_df를 모델 훈련하는데 사용하지 않는 것으로 이해했는데,
베이스라인이나 우승 코드에 있는 prophet이나 arima(저는 이 모델에 대한 배경지식이 없습니다) 코드 중
'test 데이터 학습하고 추론하기' 부분에서 model.fit을 사용하던데 제가 제대로 저 문장을 이해한게 아닌거 같아서요.
혹시 <모델 학습에서 검증 혹은 평가 데이터셋 활용시 실격> 이 부분을 어떻게 이해하면 될까요?
데이콘(주) | 대표 김국진 | 699-81-01021
통신판매업 신고번호: 제 2021-서울영등포-1704호
서울특별시 영등포구 은행로 3 익스콘벤처타워 901호
이메일 dacon@dacon.io | 전화번호: 070-4102-0545
Copyright ⓒ DACON Inc. All rights reserved
안녕하세요. 작성자님
본 대회에서는 추론할 sample_id의 test_x 값은 학습 및 추론에 사용이 가능하지만,
다른 sample_id의 test_x 값은 학습 및 추론에 사용할 수 없습니다.
베이스라인과 우승자 코드 모두 이러한 사실에 기반하여 동일한 sample_id의 x값만을 학습과 추론에 사용하였습니다.
토론 공지사항에 올라온 연간 데이콘 대회 및 데이터 설명 ppt를 참고해 주시기 바랍니다.
https://dacon.io/competitions/official/235712/talkboard/402666?page=1&dtype=recent
감사합니다.
데이콘 드림