분석시각화 대회 코드 공유 게시물은
내용 확인 후
좋아요(투표) 가능합니다.
도배 하자 질의 응답 처리 : 한솔데코 시즌2 AI 경진대회
[답변요청] LLM 대회 관련 질문드립니다.
안녕하세요, 대회 진행 중 문의사항 남깁니다.
1. Inference 속도 또한 평가에 포함되는지 궁금합니다.
2. Pre-triained된 모델의 기준이 어떻게 되나요?
규칙을 보면 "사용에 법적 제약이 없으며, 오픈소스로 공개된 사전 학습 모델(Pre-trained Model) 사용 가능"이라고 적혀있습니다.
LDCC나 Solar-Instruct은 경우 Solar Pre-trained된 모델이 파인튜닝된 모델이며, 파인튜닝 된 모델까지 허용가능한 Pre-trained된 모델인지 궁금합니다.
3. 외부 데이터 사용의 경우 모든 출처를 밝혀야 하는지 궁금합니다.
ex) 크롤링 된 데이터 주소, 블로그 주소, sns 등...
4. 평가 기준 중 모델서빙이 의미하는 게 구체적으로 무엇인지 궁금합니다.
답변 감사합니다!
추가적으로 4번 항목의 경우 실제 서비스하기 위해서 수행해야하는 프로세스라고 했는데, 프로세스가 데이터 전처리, 모델 학습, 모델 인퍼런스, 답변 출력의 범위만을 의미하는지 아니면 모델 배포 등 MLOps 전반의 과정을 의미하는지 궁금합니다..!
모델 배포 등 MLOps 전반의 과정입니다.
관련하여 이전 한솔데코 시즌1 경진대회의 경우에도, 동일한 평가 항목이 있었으며 [https://dacon.io/competitions/official/236082/codeshare] 에서 참고하실 수 있습니다.
데이콘(주) | 대표 김국진 | 699-81-01021
통신판매업 신고번호: 제 2021-서울영등포-1704호
서울특별시 영등포구 은행로 3 익스콘벤처타워 901호
이메일 dacon@dacon.io | 전화번호: 070-4102-0545
Copyright ⓒ DACON Inc. All rights reserved
1. Inference 속도를 직접적이고 정량적으로 평가하는 항목은 없으나, 적용 가능성 - '서빙 프로세스 제안' 항목 내에 얽혀있는 부분이므로 간접적으로 평가될 수 있습니다.
2. 파인튜닝된 모델의 사용 여부는 기본적으로 원본 사전 학습 모델의 라이센스와 조건을 따릅니다. 만약 원본 모델이 법적 제약 없이 오픈소스로 공개되었으며, 해당 모델을 기반으로 한 파인튜닝 작업이 동일한 또는 호환되는 라이센스 하에 이루어졌다면, 파인튜닝된 모델 역시 사용이 가능할 수 있습니다.
3. 외부 데이터 사용의 경우, 모든 출처를 밝혀야합니다. 크롤링을 활용하였을 경우에는 크롤링 코드를 포함하여 제출해야 합니다.
4. 해당 평가 항목은 본인 팀의 모델을 실제 서비스하기 위해서 수행해야하는 프로세스를 제안하는 것입니다. 즉 제안한 프로세스를 바탕으로 '실제 서빙이 가능한 모델/솔루션인지 정성 평가' 하는 항목이라고 이해해주시면 되겠습니다.