분자구조 이미지 SMILES 변환 AI 경진대회

학습용 데이터 생성 시 test set을 포함하게 되는 문제

2020.09.25 16:50 5,532 조회

외부에서 다운받은 SMILES 데이터로 학습용 이미지 생성시


생성된 이미지가 공개/비공개 테스트셋 일부를 포함하게 되는 경우는 주최측에서 어떻게 구분해내는지 궁금합니다


감사합니다



로그인이 필요합니다
0 / 1000
DACONIO
2020.09.25 17:07

안녕하세요, 데이콘입니다.
관련 내용도 평가에 반영됩니다. 세부 사항은 안내 드리기 어려울 것 같습니다.

김동석
2020.10.12 14:52

포함되지 않더라도
Smilarity가 1이라면 Train시 제외하는게 원칙이 아닌가 생각됩니다.
더욱이 비공개 데이터셋에 대해서는 정보가 아예없으므로 평가하기에 
Train시 제외하기가 불가능하므로 애로사항이 있을수밖에 없다고 판단됩니다.
대회는 끝났지만 학습데이터셋은 주최측에서 제한을 두었어야 하지 않았나 생각이 듭니다.
수고하셨습니다.