분석시각화 대회 코드 공유 게시물은
내용 확인 후
좋아요(투표) 가능합니다.
[Q] Submission Server에서 발생하는 "제출 오류"와 관련하여 질문이 있습니다.
안녕하세요, submission server에서 발생하는 "Time Out (20분 후 제출 오류)" error에 관련하여 질문이 있습니다.
에러 메세지를 확인할 수 없지만 여러 차례 테스트해본 결과, root cause는 "conpressed-tensor" 라이브러리 포맷으로 생성되지 않은 체크포인트에서 의존성 문제라는 결론을 얻었습니다. "compressed-tensor" 기반으로 양자화되지 않은 경우 해당 (e.g., gptqmodel) 라이브러리를 설치하기 위해 빌드 휠이 돌아가고, 이로 인해서 시간이 소모되면서 평가를 할 수 없다는 것으로 추측 됩니다.
여기서 생기는 의문점은, "그렇다면 양자화를 하기 위해서 "compressed-tensor (llm-compressor)" 라이브러리만 사용해야 하는가?" 입니다. 저는 이로 인해서 포기하는 이점들이 굉장히 많다고 생각하며, submission server와 동일한 환경에서 실험한 `vllm serve`, `lm-eval` 결과 지표들도 이를 반증하고 있습니다.
"llm-compressor"를 의존성으로 설계하신 이유는 추측컨데, 부정 행위 방지 또는모델의 사전 검증 등의 이유가 예상됩니다. 그렇지만 이는 참가자들이 사용할 수 있는 오픈소스의 범위를 극도로 제한하고, 이로 인해서 더 나은 경량화 전략을 설계하기 어렵도록 하고 있습니다. 보다 다양한 오픈소스들을 활용할 수 있는 방법이 없을지, 운영진 분들의 의견을 여쭙고 싶습니다.
데이콘(주) | 대표 김국진 | 699-81-01021
통신판매업 신고번호: 제 2021-서울영등포-1704호
직업정보제공사업 신고번호: J1204020250004
서울특별시 영등포구 은행로 3 익스콘벤처타워 901호
이메일 dacon@dacon.io |
전화번호: 070-4102-0545
Copyright ⓒ DACON Inc. All rights reserved
Phase 2에서는 제출물이 추가 설치/빌드 없이, 운영진이 제공하는 고정된 환경에서 즉시 실행 가능해야 합니다. 모든 참가자가 동일한 조건에서 평가받는 구간인 만큼, 주어진 고정 환경 내에서 최적화를 설계하고 구현하는 것 자체도 중요한 평가 요소입니다.
또한, 더 다양한 방식/전략(vLLM 커스터마이징 등)은 Phase 3(오프라인)에서 보다 폭넓게 적용할 수 있도록 할 예정입니다.