2025 Samsung Collegiate Programming Challenge : AI 챌린지

Training과 Test 데이터셋의 차이로 인한 추가 학습용 샘플 요청

2025.07.09 14:04 477 Views

안녕하세요.

진행하던 중, 고의는 아니었으나 본 웹페이지의 '데이터' 탭에서 우연히 test 입력 데이터의 CSV 파일의 일부를 보게 되었습니다.

그 과정에서 확인한 바로는, test 데이터의 Question과 Answer 양식이 training 데이터와 비교해 질문과 답변의 길이 등에서 다소 큰 차이가 있는 것으로 보였습니다.

이에 따라, 실제 test 데이터와 유사한 형식의 train/evaluation용 샘플 데이터를 20개 이상으로 추가로 제공해주실 수 있을지 문의드립니다.

감사합니다.

Login Required
0 / 1000
DACON.GM
2025.07.09 16:45

별도 추가 데이터는 제공 계획이 없으며, 직접 외부 데이터셋을 수집하실 수 있습니다.
Test 데이터의 Data Leakage 규칙에 유의하여 진행하시길 바랍니다.

jwwoo
2025.07.11 00:44

Deleted Comment