[1주년 기념] 데이스쿨 최대 40% 할인 🎁
분석시각화 대회 코드 공유 게시물은
내용 확인 후
좋아요(투표) 가능합니다.
Private 10, Shallow팀 코드 공유
공동작성자
성능 개선을 위하여 LLaMA 3.1 405B 모델을 사용하여 추론을 하였습니다. 데이터 증강 및 파인 튜닝 등, 다양한 시도를 하였고, table을 csv로 추출하여 저장하여 성능을 개선하였습니다.
추론 환경 : A100 (80GB) * 4
파인튜닝은 8B 모델을 했고, 컴퓨팅 상 405B 모델의 파인튜닝은 고려하지 못했습니다.
답변 감사합니다. :)
데이콘(주) | 대표 김국진 | 699-81-01021
통신판매업 신고번호: 제 2021-서울영등포-1704호
서울특별시 영등포구 은행로 3 익스콘벤처타워 901호
이메일 dacon@dacon.io | 전화번호: 070-4102-0545
Copyright ⓒ DACON Inc. All rights reserved
코드 공유 매우 감사합니다.
질문 드리겠습니다.
코드상에선 파인튜닝 한 부분은 안보이는데 405B 모델을 파인튜닝하면 성능이 하락 되었는지 궁금합니다.