건설공사 사고 예방 및 대응책 생성 : 한솔데코 시즌3 AI 경진대회

알고리즘 | NLP | 생성형 AI | LLM | MLOps | 유사도

 

Reasoning model 학습용 데이터 공유

공동작성자
2025.03.24 12:31 916 조회 language

https://drive.google.com/file/d/1O5wKJFqQUqPE2LxNWwjVYGNdseLtpN3n/view?usp=share_link

Reasoning model 학습용 데이터셋이며 형식은 List[str]이며 5513개의 데이터를 포함합니다.
각 항목별로 프롬프트 (RAG 포함), 생각과정 (think 태그), 사고 예방 방법 (prevention 태그)로 이루어져 있습니다.
Instruct 모델 학습용이 아니기 때문에 system, assistant, user 역할을 구분하지 않았습니다. 
이 데이터로 학습된 모델을 추론시 </prevention>이 나오면 중단하면 됩니다.

예시는 아래 코드를 참고해주세요.

데이터셋은 오픈소스 모델에 RAG를 적용, 사고 예방 방법을 알려주고 질문에서 예방 방법을 도출할 수 있도록 프롬프팅 진행하여 추출했습니다.
사용한 모델은 다음과 같습니다.
오픈소스 원본: UNIVA-Bllossom/DeepSeek-llama3.3-Bllossom-70B
AWQ 4bit 양자화 버전: riverfog7/DeepSeek-llama3.3-Bllossom-70B-AWQ-4bit

추론은 VLLM openAI 호환 서버와 커스텀 구현한 배치 체인을 활용해 진행했습니다.

코드
로그인이 필요합니다
0 / 1000
도비콘
2025.03.25 09:05

좋아요1😀