Construction Accident Prevention and Response Generation: Hansol Deco Season 3 Generative AI Competition

Algorithm | NLP | Generate AI | LLM | MLOps | Similarity

 

Reasoning model 학습용 데이터 공유

공동작성자
2025.03.24 12:31 1,047 Views language

https://drive.google.com/file/d/1O5wKJFqQUqPE2LxNWwjVYGNdseLtpN3n/view?usp=share_link

Reasoning model 학습용 데이터셋이며 형식은 List[str]이며 5513개의 데이터를 포함합니다.
각 항목별로 프롬프트 (RAG 포함), 생각과정 (think 태그), 사고 예방 방법 (prevention 태그)로 이루어져 있습니다.
Instruct 모델 학습용이 아니기 때문에 system, assistant, user 역할을 구분하지 않았습니다. 
이 데이터로 학습된 모델을 추론시 </prevention>이 나오면 중단하면 됩니다.

예시는 아래 코드를 참고해주세요.

데이터셋은 오픈소스 모델에 RAG를 적용, 사고 예방 방법을 알려주고 질문에서 예방 방법을 도출할 수 있도록 프롬프팅 진행하여 추출했습니다.
사용한 모델은 다음과 같습니다.
오픈소스 원본: UNIVA-Bllossom/DeepSeek-llama3.3-Bllossom-70B
AWQ 4bit 양자화 버전: riverfog7/DeepSeek-llama3.3-Bllossom-70B-AWQ-4bit

추론은 VLLM openAI 호환 서버와 커스텀 구현한 배치 체인을 활용해 진행했습니다.

Code
Login Required
0 / 1000
도비콘
2025.03.25 09:05

좋아요1😀