분석시각화 대회 코드 공유 게시물은
내용 확인 후
좋아요(투표) 가능합니다.
학습 추론 시간 관련 질문
안녕하세요
이번에 대회를 참가하면서 finetuning하고 추론하는 과정에서 시간이 너무 많이 걸려서 문의 드립니다.
이전에도 LLM 파인튜닝을 해봤지만, 13B에도 이렇게까지 오래 걸리진 않은 것 같은데 이상하네요...
8bit로 양자화 했을 때 2000 step 학습하는데 45시간, 학습한 모델로 추론하는 경우 약 60시간 정도 걸리는데, 다른 분들도 저랑 비슷하게 걸리는지 궁금합니다.
감사합니다
저는 로컬에서 돌리고 있습니다. 약 8시간 정도 걸리는 것 같습니다
아.. 길게 썻는데 로그인 때문에 날라갔네요.
짧게 쓰겠습니다. 배치사이즈 확인해보세요.
Deleted Comment
DACON Co.,Ltd | CEO Kookjin Kim | 699-81-01021
Mail-order-sales Registration Number: 2021-서울영등포-1704
Business Providing Employment Information Number: J1204020250004
#901, Eunhaeng-ro 3, Yeongdeungpo-gu, Seoul 07237
E-mail dacon@dacon.io |
Tel. 070-4102-0545
Copyright ⓒ DACON Inc. All rights reserved
안녕하세요! 혹시 Baseline을 돌려보셨나요?
inference하는데 얼마나 걸리셨는지 알 수 있을까요?