분석시각화 대회 코드 공유 게시물은
내용 확인 후
좋아요(투표) 가능합니다.
Aimers 8기 : 모델 경량화 온라인 해커톤
submission server에서 발생하는 오류를 해결할 방법을 찾고 싶습니다.
안녕하세요, submission server에서 발생하는 오류를 해결할 방법을 찾고 싶어 질문합니다.
현재 GPTQModel 라이브러리를 사용하고 있으며, 대회 주최측에서 제공해주신 "LG AI연구원 해커톤 문제소개" 강의 교안 p.13, p.16 코드를 성공적으로 reproduce 가능한 상태입니다.
- HF Checkpoint (0.95B): https://huggingface.co/namgyu-youn/exaone-1.2b-gptq-w4-v2
- vLLM log (ref: p.13): https://huggingface.co/namgyu-youn/exaone-1.2b-gptq-w4-v2/blob/main/vllm_gptq.txt
- lm-eval log (ref: p.16): https://huggingface.co/namgyu-youn/exaone-1.2b-gptq-w4-v2/blob/main/lm_eval_log.txt
그런데 문제점은, 실제 대회 제출을 위해서 모델을 제출하면 서버에서 오류가 발생하면서 제출이 불가능하다는 점입니다. 초기에는 FAQ에 있는 경로 문제, vLLM incompatible issue 등을 의심했지만 확인 결과 문제는 없었습니다. Submission server에 접근할 수 없는 것은 이해하지만, 구체적인 디버깅을 위해서 에러 로그 파일이라도 제공받을 수 있을까요? 참가자 입장에서는 아래 에러 메세지밖에 확인할 수가 없어 대회 참여에 어려움을 겪고 있습니다.

답변 감사합니다, 메모리 관련 오류는 OOM 이슈가 발생했다는 뜻으로 이해하면 될까요?
문의 주신 메모리 관련 오류는 GPU OOM을 의미한다기보다, 모델 로딩 단계에서 MemoryError가 발생한 것으로 확인됩니다.
DACON Co.,Ltd | CEO Kookjin Kim | 699-81-01021
Mail-order-sales Registration Number: 2021-서울영등포-1704
Business Providing Employment Information Number: J1204020250004
#901, Eunhaeng-ro 3, Yeongdeungpo-gu, Seoul 07237
E-mail dacon@dacon.io |
Tel. 070-4102-0545
Copyright ⓒ DACON Inc. All rights reserved
본 대회는 에러 로그를 활용한 악용 등 치팅 가능성을 방지하기 위해, 개별 제출물에 대한 상세 에러 로그를 제공하지 않고 있습니다.
다만, 제출하신 모델의 경우 평가 서버에서 실행 중 메모리 관련 오류가 발생하여 평가 스크립트가 정상적으로 완료되지 않은 것으로 확인되었습니다.
모델 제출 시에는 대회 페이지의 [대회안내]- [평가] 탭에 안내된 모델 서빙 스펙 및 평가 서버 관련 사양을 반드시 확인하시고,
「코드 공유」탭에 제공된 베이스라인 코드 예시를 참고하여 진행해 주시기 바랍니다.