Samsung AI Challenge for Scientific Discovery

알고리즘 | NLP | 회귀 | 물성 | MAE

 

train sdf의 sanity check 문제

작성자 비공개
2021.08.09 12:02 1,444 조회

다음 10개 분자에 대한 sdf 파일이 'Valence of atom {} is {} which bigger than allowed max 4 . Stopping' 등의 문자열만 포함할 뿐, 유효하지 않은 정보를 담고 있습니다.

train_1050

train_1688

train_6171

train_14782

train_15481

train_27330

train_27589

train_27714

train_28906

train_29068


이를 sanitize하여 training에 사용할지 않을지 결정하는 것도 대회 출제 의도에 포함되는지 문의드립니다.

로그인이 필요합니다
0 / 1000
DACONIO
2021.12.21 15:19

안녕하세요. 작성자님

train_1688, train_14782, train_28906, train_29068 제외한 데이터를 보충하여 테스트셋과 함께 재배포 하겠습니다.
train_1688, train_14782, train_28906, train_29068의 sdf 포맷으로 표현이 문제가 있어 제공이 불가합니다.

감사합니다.
데이콘 드림