분석시각화 대회 코드 공유 게시물은
내용 확인 후
좋아요(투표) 가능합니다.
[이스케이프] e:SCAPE
공동작성자
본 코드는 FastAPI를 기반으로 구축된 백엔드 서버로, LLM과 ChromaDB(Vector DB)를 결합하여 피싱 테스트를 정밀 분석하고, 사용자가 실제 피싱범과 대화해보는 모의체험 환경을 제공
1) 개인정보 비식별화
- 사용자 입력 데이터가 AI에게 전달되기 전, 정규표현식을 통해 민감정보(주민등록번호, 전화번호 등) 사전 차단
2) 자가학습형 RAG
- 기존의 정적인 RAG와 달리 신종 수법을 스스로 학습하여 DB를 확장하는 로직 적용
1. 유사도 거리 계산 : 입력된 텍스트와 ChromaDB 내 과거 사례 간의 거리를 계산
2. 매칭 판별 : 거리가 가까우면 기존 수법으로 판별하고, 과거 사례를 인용하여 강력 경고
3. 신종 수법 학습 : 거리가 멀면 신종 수법으로 판단하여 가공 후 Vector DB에 실시간 적재
3) 안전한 피싱 모의체험
- 사용자가 피싱 상황을 안전하게 체험할 수 있도록 입출력 이중 가드레일 적용
1. 페르소나 주입 : 시스템 프롬프트를 통해 AI에게 피싱 범죄자 역할을 부여하여 실제 상황과 같은 몰입감 제공
2. 입 출력 가드레일 : 범죄 예방 목적과 무관한 키워드가 입력 시 즉시 차단 및 부적절한 답변 검증
4) 코드 구조
- /analyze : mask_privacy_data() 실행 → ChromaDB 검색 → 거리 기반 분기 처리 → 신종일 경우 DB 적재
- /simulate : 입력 가드레일 검사 → 대화 히스토리 및 시나리오 주입 → LLM 답변 생성 → 출력 가드레일 검사
→ 답변
- vector DB : Chromadb를 사용하여 별도의 서버 구축 없이 로컬 메모리상에서 고속 벡터 검색 수행
삭제된 댓글입니다
UI도 깔끔하고 실시간으로 사례를 RAG에 저장하는 거는 좋은 거 같습니다.
근데 궁금한게 KAIST 기반 9단계 전술 매트릭스 분석이 어떤건가요??
질문 감사합니다! eSCAPE가 도입한 'KAIST 9단계 전술 매트릭스'는 단순히 사기 여부를 맞히는 것을 넘어, 범죄자의 의도와 심리적 흐름을 분석하는 핵심 도구입니다.
1. 왜 '맞다/아니다'보다 '9단계 분석'일까요?
기존의 키워드나 신고 번호 기반 탐지는 범죄자가 말투를 바꾸거나 신종 수법을 가져오면 대응하기 어렵습니다. 하지만 범죄의 전술적 목적을 단계별로 구조화하면, 수법이 변해도 그 본질적인 패턴(패턴의 일반화)을 포착할 수 있습니다.
2. KAIST가 정의한 보이스피싱 9단계 전술
저희 eSCAPE는 아래 9가지 전술적 특징을 데이터 분석에 활용합니다.
1) 초기 접촉: 전화·메시지를 통한 첫 접근
2) 신뢰 구축: 검찰 사칭이나 저금리 혜택 제시로 경계심 완화
3) 고립: 주변과 연락을 끊게 하여 심리적으로 장악
4) 탐색: 피해자의 자산 현황 및 금융 정보 수집
5) 행동 통제: 특정 장소 이동이나 메모 지시 등 실시간 제어
6)기기 제어: 악성 앱 설치 유도를 통한 원격 권한 확보
7) 준비-탈취-세탁: 실제 금전 탈취를 위한 최종 단계 실행
3. eSCAPE만의 정밀 프로파일링 기술
eSCAPE는 ChromaDB(Vector DB)**에 축적된 실제 뉴스 기사와 판례 데이터를 이 9가지 전술 단계와 매칭합니다.
이를 통해 단순히 "위험합니다"가 아니라, "현재 범죄자가 '고립' 단계에 진입했으니 외부와 즉시 연락하세요"와 같은 수준 높은 맞춤형 정밀 진단을 제공하는 것이 저희 프로젝트의 가장 큰 차별점입니다.
내용이 꽤 많은데 AI 활용이 잘 된 것 같습니다
잘 봤습니다
관심 가져 주셔서 감사합니다!
FastAPI랑 LLM, Vector DB를 결합해서 신종 수법까지 학습할 수 있게 하는 구조가 인상 깊었습니다!! 모의 체험 기능을 통해서 보이스 피싱을 예방하고 대비할 수 있도록 하신 점도 포인트였던 것 같아요! 수고 하셨습니다 ㅎㅎ
데이콘(주) | 대표 김국진 | 699-81-01021
통신판매업 신고번호: 제 2021-서울영등포-1704호
직업정보제공사업 신고번호: J1204020250004
서울특별시 영등포구 은행로 3 익스콘벤처타워 901호
이메일 dacon@dacon.io |
전화번호: 070-4102-0545
Copyright ⓒ DACON Inc. All rights reserved
[추가 설명]
본 코드는 단순한 스캠 여부 판별을 넘어, 범죄의 전술적 흐름을 추적하는 '지능형 정밀 프로파일링' 시스템입니다. 파편화된 개인의 위협 데이터를
시민 참여형 아카이브로 구축하고, AI 기술을 통해 사회 전체의 방어 시스템으로 환원하는 과정을 담고 있습니다.
🚀 단순 예측이 아닌 '정밀 프로파일링'인 이유
1. KAIST 기반 9단계 전술 매트릭스 분석
- 비정형 데이터의 입체적 해석: 뉴스나 판례에서 나타나는 '탐색(Exploration)', '신뢰 구축 (Trust Building)', '고립(Isolation)' 등 실제 범죄 단계의
특징을 AI가 정밀 분석한다.
- 현재 위기 단계 진단: "이것은 사기입니다"라는 이진 분류가 아니라, "현재 범죄자가 9단계 중 어느 지점에 있는지"를 판별하여 사용자가 처한 상황을
정확히 진단한다
2. 자가 학습형 RAG (Self-Learning RAG)
- 데이터 선순환 구조 : 새로운 수법이 탐지되면 ChromaDB(Vector DB)에 실시간으로 자가 학습시켜, 다음 사용자는 해당 위협으로부터 즉시
보호받는 '시민 참여형 방어 체계'를 가동합니다.
- 고속 벡터 검색 : 수천 건의 사례를 즉각 비교 분석하여 가장 유사한 과거 범죄 전술을 인용합니다.
3. 프라이버시 우선(Privacy-First) 보안 아키텍처
- 실시간 PII 마스킹 : 제보 데이터가 AI에게 전달되기 전, 정규표현식으로 전화번호나 계좌번호를 비식별화하여 시민들이 안심하고 제보할 수 있는 환경을
보장합니다.
- 이중 가드레일 : 실제 범죄자 페르소나를 구현하되, 예방 목적 이외의 유해한 주제는 차단하는 이중 안전장치를 통해 실전 대응력을 높인다.
🔗 프로젝트 링크
GitHub: https://github.com/alsqud/eSCAPE---AI---Security