분석시각화 대회 코드 공유 게시물은
내용 확인 후
좋아요(투표) 가능합니다.
Reasoning model 학습용 데이터 공유
https://drive.google.com/file/d/1O5wKJFqQUqPE2LxNWwjVYGNdseLtpN3n/view?usp=share_link
Reasoning model 학습용 데이터셋이며 형식은 List[str]이며 5513개의 데이터를 포함합니다.
각 항목별로 프롬프트 (RAG 포함), 생각과정 (think 태그), 사고 예방 방법 (prevention 태그)로 이루어져 있습니다.
Instruct 모델 학습용이 아니기 때문에 system, assistant, user 역할을 구분하지 않았습니다.
이 데이터로 학습된 모델을 추론시 </prevention>이 나오면 중단하면 됩니다.
예시는 아래 코드를 참고해주세요.
데이터셋은 오픈소스 모델에 RAG를 적용, 사고 예방 방법을 알려주고 질문에서 예방 방법을 도출할 수 있도록 프롬프팅 진행하여 추출했습니다.
사용한 모델은 다음과 같습니다.
오픈소스 원본: UNIVA-Bllossom/DeepSeek-llama3.3-Bllossom-70B
AWQ 4bit 양자화 버전: riverfog7/DeepSeek-llama3.3-Bllossom-70B-AWQ-4bit
추론은 VLLM openAI 호환 서버와 커스텀 구현한 배치 체인을 활용해 진행했습니다.
데이콘(주) | 대표 김국진 | 699-81-01021
통신판매업 신고번호: 제 2021-서울영등포-1704호
직업정보제공사업 신고번호: J1204020250004
서울특별시 영등포구 은행로 3 익스콘벤처타워 901호
이메일 dacon@dacon.io |
전화번호: 070-4102-0545
Copyright ⓒ DACON Inc. All rights reserved
좋아요1😀