분석시각화 대회 코드 공유 게시물은
내용 확인 후
좋아요(투표) 가능합니다.
헬스케어 RAG기반 증상검색 AI 에이전트
본 코드는 AI 의료 접수 에이전트를 Google Colab 환경에서 실행할 수 있도록 구현한 것으로, GUI 대신 단순한 입력/출력 루프를 통해 사용자와 상호작용합니다. 전체 과정은 (1) 데이터 및 모델 로드 → (2) 대화 및 접수 진행 → (3) RAG 검색 → (4) 최종 리포트 생성 단계로 구성됩니다.
먼저 Colab의 /content 디렉토리를 기준으로 모델과 데이터를 불러오며, CUDA 사용 가능 여부를 확인해 GPU 환경에서 효율적으로 동작합니다. 대화 히스토리는 .npy 파일로 저장·복원할 수 있어 세션 종료 후에도 맥락을 이어갈 수 있습니다.
검색 기반 증강(RAG) 모듈은 SentenceTransformer 임베딩 모델로 사용자의 입력을 벡터화하고, FAISS(HNSW) 인덱스를 통해 관련 문서를 검색합니다. 이후 CrossEncoder 리랭커 모델을 적용해 의미적으로 가장 적합한 결과를 상위 N개 추출하여 응답에 활용합니다.
LLM 추론 모듈은 BitsAndBytes 4bit NF4 양자화를 적용해 Colab GPU 환경에서 대규모 언어모델을 효율적으로 로드합니다. Flash Attention 2로 추론 속도를 높였으며, 입력 토큰 수와 응답 생성 시간을 기록해 성능을 확인할 수 있습니다.
대화 루프에서는 에이전트가 접수 절차에 따라 한 번에 하나의 질문만 던지고, 사용자의 답변을 반영해 다음 단계로 진행합니다. 성별, 나이, 증상 발생 시점, 통증 부위·방식, 원인 추정, 기존 질환, 과거 진료 여부가 순차적으로 수집되며, 모두 완료되면 @[접수종료] 마커가 출력됩니다.
이후 전체 대화 기록과 RAG 검색 결과를 결합하여 최종 건강정보 안내문을 작성합니다. 리포트는 관련 가능 질환 예시, 핵심 증상 요약, 권장 진료과, 응급 경고 신호, 일반적 검사·치료 접근, 문헌 근거 등을 포함하며, 어디까지나 참고용 안내임을 명시하여 의학적 진단이나 처방을 대체하지 않도록 설계되었습니다.
DACON Co.,Ltd | CEO Kookjin Kim | 699-81-01021
Mail-order-sales Registration Number: 2021-서울영등포-1704
Business Providing Employment Information Number: J1204020250004
#901, Eunhaeng-ro 3, Yeongdeungpo-gu, Seoul 07237
E-mail dacon@dacon.io |
Tel. 070-4102-0545
Copyright ⓒ DACON Inc. All rights reserved