분석시각화 대회 코드 공유 게시물은
내용 확인 후
좋아요(투표) 가능합니다.
건설공사 사고 예방 및 대응책 생성 : 한솔데코 시즌3 생성 AI 경진대회
학습 추론 시간 관련 질문
안녕하세요
이번에 대회를 참가하면서 finetuning하고 추론하는 과정에서 시간이 너무 많이 걸려서 문의 드립니다.
이전에도 LLM 파인튜닝을 해봤지만, 13B에도 이렇게까지 오래 걸리진 않은 것 같은데 이상하네요...
8bit로 양자화 했을 때 2000 step 학습하는데 45시간, 학습한 모델로 추론하는 경우 약 60시간 정도 걸리는데, 다른 분들도 저랑 비슷하게 걸리는지 궁금합니다.
감사합니다
저는 로컬에서 돌리고 있습니다. 약 8시간 정도 걸리는 것 같습니다
아.. 길게 썻는데 로그인 때문에 날라갔네요.
짧게 쓰겠습니다. 배치사이즈 확인해보세요.
Deleted Comment
DACON Co.,Ltd | CEO Kookjin Kim | 699-81-01021
Mail-order-sales Registration Number: 2021-서울영등포-1704
Business Providing Employment Information Number: J1204020250004
#901, Eunhaeng-ro 3, Yeongdeungpo-gu, Seoul 07237
E-mail dacon@dacon.io |
Tel. 070-4102-0545
Copyright ⓒ DACON Inc. All rights reserved
안녕하세요! 혹시 Baseline을 돌려보셨나요?
inference하는데 얼마나 걸리셨는지 알 수 있을까요?