제1회 신약개발 AI 경진대회

사전학습 모델 문의(dacon 답변요청)

2023.09.10 15:29 1,055 Views
  • 사용에 법적 제약이 없으며, 누구나 변경, 재배포할 수 있는 공개된 외부 데이터 사용 가능
  • 법적 제약이 없으며 논문으로 공개된 베이스의 사전 학습 모델(Pre-trained Model) 사용 가능
  • 단, 한국화합물은행에서 제공된 데이터 셋 사용 및 데이터 셋으로 사전학습된 모델은 사용 금지

※ 2차 평가 선정자는 외부 데이터 및 사전학습 모델 사용한 경우 인용 정보 기재 필수

라고 적여주셨는데, 여기서 한국화합물 은행 제공 데이터셋으로 만들어진 사전학습 모델의 범위가 한국화합물 은행에서 가지고있는 화합물로 만든 모델에 한정되는지, deepchem과 같은 오픈소스 모델이 한국화합물은행의 데이터를 포함할 가능성이 있어도 사용이 불가능한지 문의 남깁니다.

로그인이 필요합니다
0 / 1000
DACON.SeungYoon
2023.09.12 14:17

안녕하세요, 우어엉 님
규칙에서 말하는 규칙위반 사유에 해당하는 사전학습 모델의 범위에는
한국화합물은행의 데이터가 일부 포함되어 학습된 모델도 포함됩니다.
(Test 데이터가 포함되었을 가능성이 있어 Data Leakage에 해당하기 때문입니다.)
다만, 주최측 문의 결과 한국화합물은행에서 만든 데이터셋은 국내 연구자들에게만 제공되어 
오픈소스 모델이 해당 데이터로 학습되었을 가능성은 거의 없습니다.
그래서 오픈소스 모델은 자유롭게 사용하실 수 있을 것 같으나,
그래도 확인을 원하실 경우 dacon@dacon.io로 문의 주시면 검토 후 답변 드리겠습니다.
감사합니다.

zl존표도
2023.09.12 14:24

감사합니다!