피싱·스캠 예방을 위한 서비스 개발 경진대회

아이디어 | 사이버 보안 | 피싱·스캠 탐지 | MVP

상금 1,000 만원
644명 마감

마감

대회안내 데이터 코드 공유 토크 리더보드

[이스케이프] e:SCAPE

lionmin

공동작성자

2026.02.11 03:59 475 조회 language

본 코드는 FastAPI를 기반으로 구축된 백엔드 서버로, LLM과 ChromaDB(Vector DB)를 결합하여 피싱 테스트를 정밀 분석하고, 사용자가 실제 피싱범과 대화해보는 모의체험 환경을 제공
  1) 개인정보 비식별화
        - 사용자 입력 데이터가 AI에게 전달되기 전, 정규표현식을 통해 민감정보(주민등록번호, 전화번호 등) 사전 차단
  2) 자가학습형 RAG
        - 기존의 정적인 RAG와 달리 신종 수법을 스스로 학습하여 DB를 확장하는 로직 적용
          1. 유사도 거리 계산 : 입력된 텍스트와 ChromaDB 내 과거 사례 간의 거리를 계산
          2. 매칭 판별 : 거리가 가까우면 기존 수법으로 판별하고, 과거 사례를 인용하여 강력 경고
          3. 신종 수법 학습 : 거리가 멀면 신종 수법으로 판단하여 가공 후 Vector DB에 실시간 적재
  3) 안전한 피싱 모의체험
        - 사용자가 피싱 상황을 안전하게 체험할 수 있도록 입출력 이중 가드레일 적용
          1. 페르소나 주입 : 시스템 프롬프트를 통해 AI에게 피싱 범죄자 역할을 부여하여 실제 상황과 같은 몰입감 제공
          2. 입 출력 가드레일 : 범죄 예방 목적과 무관한 키워드가 입력 시 즉시 차단 및 부적절한 답변 검증
   4) 코드 구조
        -  /analyze : mask_privacy_data() 실행 → ChromaDB 검색 → 거리 기반 분기 처리 → 신종일 경우 DB 적재
        - /simulate : 입력 가드레일 검사 → 대화 히스토리 및 시나리오 주입 → LLM 답변 생성 →  출력 가드레일 검사
                               → 답변
         - vector DB : Chromadb를 사용하여 별도의 서버 구축 없이 로컬 메모리상에서 고속 벡터 검색 수행

PDF

YOUTUBE

코드

댓글 7개

로그인이 필요합니다

comment

0 / 1000

lionmin

2026.02.14 22:41

[추가 설명]
본 코드는 단순한 스캠 여부 판별을 넘어, 범죄의 전술적 흐름을 추적하는 '지능형 정밀 프로파일링' 시스템입니다. 파편화된 개인의 위협 데이터를
시민 참여형 아카이브로 구축하고, AI 기술을 통해 사회 전체의 방어 시스템으로 환원하는 과정을 담고 있습니다.

🚀 단순 예측이 아닌 '정밀 프로파일링'인 이유
1. KAIST 기반 9단계 전술 매트릭스 분석
     - 비정형 데이터의 입체적 해석: 뉴스나 판례에서 나타나는 '탐색(Exploration)', '신뢰 구축  (Trust Building)', '고립(Isolation)' 등 실제 범죄 단계의
       특징을 AI가 정밀 분석한다.
     - 현재 위기 단계 진단: "이것은 사기입니다"라는 이진 분류가 아니라, "현재 범죄자가 9단계 중 어느 지점에 있는지"를 판별하여 사용자가 처한 상황을
       정확히 진단한다

2. 자가 학습형 RAG (Self-Learning RAG)
     -  데이터 선순환 구조 : 새로운 수법이 탐지되면 ChromaDB(Vector DB)에 실시간으로 자가 학습시켜, 다음 사용자는 해당 위협으로부터 즉시
        보호받는 '시민 참여형 방어 체계'를 가동합니다.
     -  고속 벡터 검색 : 수천 건의 사례를 즉각 비교 분석하여 가장 유사한 과거 범죄 전술을 인용합니다.

3. 프라이버시 우선(Privacy-First) 보안 아키텍처
     -  실시간 PII 마스킹 : 제보 데이터가 AI에게 전달되기 전, 정규표현식으로 전화번호나 계좌번호를 비식별화하여 시민들이 안심하고 제보할 수 있는 환경을
       보장합니다.
     -  이중 가드레일 : 실제 범죄자 페르소나를 구현하되, 예방 목적 이외의 유해한 주제는 차단하는 이중 안전장치를 통해 실전 대응력을 높인다.

🔗 프로젝트 링크
GitHub: https://github.com/alsqud/eSCAPE---AI---Security

Koreda

2026.02.14 22:51

삭제된 댓글입니다

Koreda

2026.02.16 13:15

UI도 깔끔하고 실시간으로 사례를 RAG에 저장하는 거는 좋은 거 같습니다.
근데 궁금한게 KAIST 기반 9단계 전술 매트릭스 분석이 어떤건가요??

lionmin

2026.02.16 20:50

질문 감사합니다! eSCAPE가 도입한 'KAIST 9단계 전술 매트릭스'는 단순히 사기 여부를 맞히는 것을 넘어, 범죄자의 의도와 심리적 흐름을 분석하는 핵심 도구입니다.

1. 왜 '맞다/아니다'보다 '9단계 분석'일까요?
기존의 키워드나 신고 번호 기반 탐지는 범죄자가 말투를 바꾸거나 신종 수법을 가져오면 대응하기 어렵습니다. 하지만 범죄의 전술적 목적을 단계별로 구조화하면, 수법이 변해도 그 본질적인 패턴(패턴의 일반화)을 포착할 수 있습니다.

2. KAIST가 정의한 보이스피싱 9단계 전술
저희 eSCAPE는 아래 9가지 전술적 특징을 데이터 분석에 활용합니다.
1) 초기 접촉: 전화·메시지를 통한 첫 접근
2) 신뢰 구축: 검찰 사칭이나 저금리 혜택 제시로 경계심 완화
3) 고립: 주변과 연락을 끊게 하여 심리적으로 장악
4) 탐색: 피해자의 자산 현황 및 금융 정보 수집
5) 행동 통제: 특정 장소 이동이나 메모 지시 등 실시간 제어
6)기기 제어: 악성 앱 설치 유도를 통한 원격 권한 확보
7) 준비-탈취-세탁: 실제 금전 탈취를 위한 최종 단계 실행

3. eSCAPE만의 정밀 프로파일링 기술
eSCAPE는 ChromaDB(Vector DB)**에 축적된 실제 뉴스 기사와 판례 데이터를 이 9가지 전술 단계와 매칭합니다.
이를 통해 단순히 "위험합니다"가 아니라, "현재 범죄자가 '고립' 단계에 진입했으니 외부와 즉시 연락하세요"와 같은 수준 높은 맞춤형 정밀 진단을 제공하는 것이 저희 프로젝트의 가장 큰 차별점입니다.