제2회 AI 신약개발 경진대회

train set과 test set은 random split 된 것인가요?

2024.08.06 00:09 1,928 Views

train set과 test set은 하나의 dataset 에서 random split 된 것인가요?


아니면 서로 다른 데이터셋인가요?

Login Required
0 / 1000
DACON.GM
2024.08.07 09:12

Test 데이터는 데이터 제공 제약사의 한 곳에서 실험한 동일 assay system에서 얻은 결과 입니다. 

john_park
2024.08.13 07:24

충분한 답변이 되지 못한 것같습니다.
Test 데이터 와 Train 데이터 간에 experimental batch 가 있는지 확인 하고 싶습니다.
assay system 은 동일 할 지라도, 실험한 회사 와 실험자가 다름으로서도 결과의 차이가 있을 수 있습니다.
Test data 와 Train data 는 동일한 제약사에서 모두 제공됬는지요?
아니면, Train data 내에는 다른 제약사에서 생산된 데이터 (ex. public data) 등이 섞여 있어 batch 존재가 있을 수 있나요?

오경석
2024.08.14 13:06

Train 데이터는 Public Data 이고 Test 데이터는 데이터 제공 제약사의 데이터임으로, Test 데이터 와 Train 데이터 간에 experimental batch 가 있을 수 있습니다.