분석시각화 대회 코드 공유 게시물은
내용 확인 후
좋아요(투표) 가능합니다.
제2회 AI 신약개발 경진대회
train set과 test set은 random split 된 것인가요?
train set과 test set은 하나의 dataset 에서 random split 된 것인가요?
아니면 서로 다른 데이터셋인가요?
충분한 답변이 되지 못한 것같습니다.
Test 데이터 와 Train 데이터 간에 experimental batch 가 있는지 확인 하고 싶습니다.
assay system 은 동일 할 지라도, 실험한 회사 와 실험자가 다름으로서도 결과의 차이가 있을 수 있습니다.
Test data 와 Train data 는 동일한 제약사에서 모두 제공됬는지요?
아니면, Train data 내에는 다른 제약사에서 생산된 데이터 (ex. public data) 등이 섞여 있어 batch 존재가 있을 수 있나요?
Train 데이터는 Public Data 이고 Test 데이터는 데이터 제공 제약사의 데이터임으로, Test 데이터 와 Train 데이터 간에 experimental batch 가 있을 수 있습니다.
데이콘(주) | 대표 김국진 | 699-81-01021
통신판매업 신고번호: 제 2021-서울영등포-1704호
직업정보제공사업 신고번호: J1204020250004
서울특별시 영등포구 은행로 3 익스콘벤처타워 901호
이메일 dacon@dacon.io |
전화번호: 070-4102-0545
Copyright ⓒ DACON Inc. All rights reserved
Test 데이터는 데이터 제공 제약사의 한 곳에서 실험한 동일 assay system에서 얻은 결과 입니다.