거대 모델의 성능 저하 없이 크기를 줄이는 방법 : 2025 Samsung AI Challenge

본선 제출 파일 관련해서 질문있습니다

2025.09.09 11:18 329 조회

안녕하세요. 본선 제출 파일 관련해서 질문있습니다.


1. 전문가 가지치기 및 병합을 구현하기 위해 vllm 코드를 수정하였습니다. '해당 모델을 재현할 수 있는 가이드 문서를 포함한 전체 코드 파일'을 제출 해야 한다고 되어있는데, vllm 라이브러리 파일 전체를 제출해야 하나요? 아니면 conda와 같은 가상 환경과 Github를 사용하여 해당 코드를 재현할 수 있도록 가이드 문서만 작성해도 될까요?


2. '전문가 가지치기 및 병합이 완료된 허깅 페이스 형식의 모델'을 제출 해야 한다고 되어있는데, '수정되지 않은 Qwen3 30B-A3B 모델'을 가지고 일부 파라미터(혹은 그 조합)만 메모리에 로드하도록 하는 방식은 허용되지 않는 걸까요? 아니면, 단 하나의 '전문가 가지치기 및 병합이 완료된 허깅 페이스 형식의 모델 파일'을 제출해야 하는 건가요?


2-1. 위 질문에서 만약 '수정되지 않은 Qwen3 30B-A3B 모델'을 사용 해도 된다면, 가이드 문서에 모델 다운로드를 위한 코드를 넣어야 할까요? 아니면 '수정되지 않은 Qwen3 30B-A3B 모델' 파일을 같이 보내야 할까요?


감사합니다.

로그인이 필요합니다
0 / 1000
DACON.PSH
2025.09.10 14:08

1. vLLM에 코드 수정이 있는 경우, 전체 코드를 제출해주셔야 합니다. 코드 수정이 없을 경우, vLLM 전체를 제출할 필요는 없으며, 재현 가능한 코드와 가이드 문서를 작성해주시면 됩니다. 
2. 제출물은 전문가 가지치기 및 병합이 완료된 허깅페이스 형식의 모델 전체 파일이어야 합니다.