분석시각화 대회 코드 공유 게시물은
내용 확인 후
좋아요(투표) 가능합니다.
제2회 AI 신약개발 경진대회
train set과 test set은 random split 된 것인가요?
train set과 test set은 하나의 dataset 에서 random split 된 것인가요?
아니면 서로 다른 데이터셋인가요?
충분한 답변이 되지 못한 것같습니다.
Test 데이터 와 Train 데이터 간에 experimental batch 가 있는지 확인 하고 싶습니다.
assay system 은 동일 할 지라도, 실험한 회사 와 실험자가 다름으로서도 결과의 차이가 있을 수 있습니다.
Test data 와 Train data 는 동일한 제약사에서 모두 제공됬는지요?
아니면, Train data 내에는 다른 제약사에서 생산된 데이터 (ex. public data) 등이 섞여 있어 batch 존재가 있을 수 있나요?
Train 데이터는 Public Data 이고 Test 데이터는 데이터 제공 제약사의 데이터임으로, Test 데이터 와 Train 데이터 간에 experimental batch 가 있을 수 있습니다.
DACON Co.,Ltd | CEO Kookjin Kim | 699-81-01021
Mail-order-sales Registration Number: 2021-서울영등포-1704
Business Providing Employment Information Number: J1204020250004
#901, Eunhaeng-ro 3, Yeongdeungpo-gu, Seoul 07237
E-mail dacon@dacon.io |
Tel. 070-4102-0545
Copyright ⓒ DACON Inc. All rights reserved
Test 데이터는 데이터 제공 제약사의 한 곳에서 실험한 동일 assay system에서 얻은 결과 입니다.