분석시각화 대회 코드 공유 게시물은
내용 확인 후
좋아요(투표) 가능합니다.
데이터·AI를 활용한 물가 예측 경진대회 : 농산물 가격을 중심으로
data-leakage 관련 질문.
안녕하세요.
평가 데이터는 추론 시점 T가 비식별화된 2022년의 순 단위의 데이터가 주어집니다.
데이터 구조상 비식별화된 시점을 식별할 수 있는 것 같은데,
TEST_NN을 예측할때, 다른 TEST_MM을 사용하지 않는다면, 시점을 구하는 것은 무관한가요?
무슨 말씀인지 알것 같습니다.
"일반적으로 Test Dataset은 '아예 볼 수 없다' 라고 가정하고 진행해야하며 코드 역시 이를 반영해야합니다."
DACON Co.,Ltd | CEO Kookjin Kim | 699-81-01021
Mail-order-sales Registration Number: 2021-서울영등포-1704
Business Providing Employment Information Number: J1204020250004
#901, Eunhaeng-ro 3, Yeongdeungpo-gu, Seoul 07237
E-mail dacon@dacon.io |
Tel. 070-4102-0545
Copyright ⓒ DACON Inc. All rights reserved
정확한 답변을 드리기 위해서라면 구체적인 방법론을 기재해주셔야 합니다.
가급적 해당 방법은 Data Leakage의 위험이 높아보이므로 권장드리지 않습니다.