2022 AI 대학원 챌린지

검증 데이터셋 구축 전략

2022.07.29 11:39 1,900 조회

안녕하세요,

평가 기준 중에 검증 데이터셋 구축 전략이 무엇을 의미하는지 자세히 알 수 있을까요?

로그인이 필요합니다
0 / 1000
DACONIO
2022.07.29 12:01

안녕하세요 수리과학부님,
대회 데이터는 참가자분들이 학습하실 수 있는 Train 데이터와 Public / Private 평가를 위해 추론할 수 있는 Test 데이터로 구성되어 있습니다.
따라서 Test 데이터는 일반적으로 '아예 볼 수 없다' 라는 조건에서 진행을 해야 하기 때문에, 
검증 데이터셋 구축 전략은 제공드린 Train 데이터셋 내에서 Validation 데이터셋를 구축하여 자체적으로 모델을 검증하고 평가하는 과정을 의미합니다.
또한 Validation 데이터셋을 어떤 기준으로 어떻게 구성하였는 지도 포함됩니다.
감사합니다.