분석시각화 대회 코드 공유 게시물은
내용 확인 후
좋아요(투표) 가능합니다.
재정정보 생성 AI 활용 검색 알고리즘 경진대회
사전학습 모델 문의
안녕하세요, 사전학습 모델 관련 질문이 있어서 문의드립니다.
현재 대회 규칙에는 제공된 훈련 데이터 외에 다른 데이터를 일체 사용할 수 없다고 되어 있는데,
공개된 사전학습 모델(huggingface)에는 다양한 외부 데이터로 학습된 모델들(예를 들어 ~~model-instruct 등)이 존재하는데 이런 모델을 사용하는 것은 괜찮은지, 혹은 완전히 사전학습만 거친 Base 모델만 사용을 해야하는지 문의드립니다.
"공식 공개 사전 학습 모델 사용 가능: 가중치 파일이 공식적으로 공개되고 사용에 법적 제약이 없는 사전 학습 모델은 사용할 수 있습니다."
모델은 누구나 공식적으로 공개 가능합니다. (특정 빅테크가 공개한 것만 공식이라고 할 수 없잖아요. 개인도 가능하죠)
따라서 누구나 외부 데이터를 훈련 시킨 후,
이렇게 만든 사전 모델을 가지고 대회 마감 하루전에 허깅페이스에 공개하는 방법으로 편법을 취할 수 있습니다.
규정 문구 추가해 주세요. 대회 시작날짜 이전에 공개된 사전 훈련 모델은 사용 가능하다는 식으로 말이죠.
대회에서 공식적으로 사용 가능한 사전 학습 모델은 가중치 파일이 공식적으로 공개되고 사용에 법적 제약이 없는 모델로 한정됩니다.
단, 말씀주신 것과 같은 편법을 사용한 모델을 사용하거나 의심 정황이 있는 경우 코드 검증 단계에서 해당 모델에 대한 검증을 요구하며 이에 대한 검증 절차를 통과하지 못하는 경우 최대 실격에 이르는 불이익이 주어질 수 있습니다.
네 답변 감사합니다.
DACON Co.,Ltd | CEO Kookjin Kim | 699-81-01021
Mail-order-sales Registration Number: 2021-서울영등포-1704
Business Providing Employment Information Number: J1204020250004
#901, Eunhaeng-ro 3, Yeongdeungpo-gu, Seoul 07237
E-mail dacon@dacon.io |
Tel. 070-4102-0545
Copyright ⓒ DACON Inc. All rights reserved
"공식 공개 사전 학습 모델 사용 가능: 가중치 파일이 공식적으로 공개되고 사용에 법적 제약이 없는 사전 학습 모델은 사용할 수 있습니다." 에 부합한 모델이라면 사용 가능합니다.