vllm serving 관련하여 pruning을 진행했을 때 에러가 발생할지 문의드립니다. - DACON

line-coupon

데이스쿨 할인 리턴즈

line-coupon-mobile

데이스쿨 할인 리턴즈

Aimers 8기 : 모델 경량화 온라인 해커톤

vllm serving 관련하여 pruning을 진행했을 때 에러가 발생할지 문의드립니다.

2026.02.10 22:30 1,254 조회

structure pruning 을 진행하여 레이어 별로 헤드 개수를 다르게 제거해줬을 때, 예를들어

model.layers[0].self_attn.num_attention_heads 는 5개이고, model.layers[4].self_attn.num_attention_heads는 12개로 줄여줬을때 모델의 레이어마다 attention 헤드 개수가 달라지는데 vLLM은 "모든 레이어의 Head 개수는 config.num_atention_heads로 동일하다"라는 제약사항이 있는것으로 확인이 되어 커스텀 config 를 따로 만들어서 헤드 개수를 관리해도 평가되는 서버에서 vLLM을 사용한다면 제출 에러가 발생할까요?

로그인이 필요합니다

comment

0 / 1000

DACON.PSH

2026.02.11 10:09

본 대회 제출물은 고정된 평가 서버 환경에서 정상 작동해야 하며, 온라인 해커톤(Phase2)에서는 vLLM 수정은 허용되지 않습니다.
config.json 파일은 수정가능하나, 규칙 위반 혹은 악용 사례가 발견되는 경우에는 불이익이 주어질 수 있습니다.

📣 댓글 작성 창의 위치가 댓글 리스트 상단으로 이동했습니다!

to_list

submission server에서 발생하는 오류를 해결할 방법을 찾고 싶습니다.

대회 - Aimers 8기 : 모델 경량화 온라인 해커톤

현재 글

vllm serving 관련하여 pruning을 진행했을 때 에러가 발생할지 문의드립니다.

대회 - Aimers 8기 : 모델 경량화 온라인 해커톤

좋아요 5

조회 1,254

댓글 1

4달 전

같은 파일 다른 점수

대회 - Aimers 8기 : 모델 경량화 온라인 해커톤