분석시각화 대회 코드 공유 게시물은
내용 확인 후
좋아요(투표) 가능합니다.
거대 모델의 성능 저하 없이 크기를 줄이는 방법 : 2025 Samsung AI Challenge
본선 제출 파일 관련해서 질문있습니다
안녕하세요. 본선 제출 파일 관련해서 질문있습니다.
1. 전문가 가지치기 및 병합을 구현하기 위해 vllm 코드를 수정하였습니다. '해당 모델을 재현할 수 있는 가이드 문서를 포함한 전체 코드 파일'을 제출 해야 한다고 되어있는데, vllm 라이브러리 파일 전체를 제출해야 하나요? 아니면 conda와 같은 가상 환경과 Github를 사용하여 해당 코드를 재현할 수 있도록 가이드 문서만 작성해도 될까요?
2. '전문가 가지치기 및 병합이 완료된 허깅 페이스 형식의 모델'을 제출 해야 한다고 되어있는데, '수정되지 않은 Qwen3 30B-A3B 모델'을 가지고 일부 파라미터(혹은 그 조합)만 메모리에 로드하도록 하는 방식은 허용되지 않는 걸까요? 아니면, 단 하나의 '전문가 가지치기 및 병합이 완료된 허깅 페이스 형식의 모델 파일'을 제출해야 하는 건가요?
2-1. 위 질문에서 만약 '수정되지 않은 Qwen3 30B-A3B 모델'을 사용 해도 된다면, 가이드 문서에 모델 다운로드를 위한 코드를 넣어야 할까요? 아니면 '수정되지 않은 Qwen3 30B-A3B 모델' 파일을 같이 보내야 할까요?
감사합니다.
데이콘(주) | 대표 김국진 | 699-81-01021
통신판매업 신고번호: 제 2021-서울영등포-1704호
직업정보제공사업 신고번호: J1204020250004
서울특별시 영등포구 은행로 3 익스콘벤처타워 901호
이메일 dacon@dacon.io |
전화번호: 070-4102-0545
Copyright ⓒ DACON Inc. All rights reserved
1. vLLM에 코드 수정이 있는 경우, 전체 코드를 제출해주셔야 합니다. 코드 수정이 없을 경우, vLLM 전체를 제출할 필요는 없으며, 재현 가능한 코드와 가이드 문서를 작성해주시면 됩니다.
2. 제출물은 전문가 가지치기 및 병합이 완료된 허깅페이스 형식의 모델 전체 파일이어야 합니다.