데이터·AI를 활용한 물가 예측 경진대회 : 농산물 가격을 중심으로

data-leakage 관련 질문.

2024.10.05 15:25 1,164 Views

안녕하세요.


평가 데이터는 추론 시점 T가 비식별화된 2022년의 순 단위의 데이터가 주어집니다.


데이터 구조상 비식별화된 시점을 식별할 수 있는 것 같은데,

TEST_NN을 예측할때, 다른 TEST_MM을 사용하지 않는다면, 시점을 구하는 것은 무관한가요?


Login Required
0 / 1000
DACON.GM
2024.10.07 09:08

정확한 답변을 드리기 위해서라면 구체적인 방법론을 기재해주셔야 합니다.
가급적 해당 방법은 Data Leakage의 위험이 높아보이므로 권장드리지 않습니다.

jackmappotion
2024.10.08 09:13

무슨 말씀인지 알것 같습니다.

"일반적으로 Test Dataset은 '아예 볼 수 없다' 라고 가정하고 진행해야하며 코드 역시 이를 반영해야합니다."