LLM 탈옥 서비스: 다크웹에서 구독형으로 팔리는 AI 안전장치 우회

무슨 일이 일어났나

2026년 현재, 다크웹에서 AI 안전장치를 우회하는 서비스가 구독형 비즈니스 모델로 성장하고 있습니다. 과거의 WormGPT, FraudGPT처럼 개별 악성 도구를 판매하던 시대에서, 이제는 **Jailbreak-as-a-Service(JaaS)**라는 인프라 생태계로 진화한 것입니다.

Kela의 2025 AI 위협 보고서에 따르면, 다크웹에서 악성 AI 도구와 전술에 대한 언급이 219% 증가했고, ChatGPT 같은 합법적 AI 플랫폼의 탈옥 논의는 52% 증가했습니다. 사이버 범죄자들은 지하 생태계에서 AI 기반 범죄 전용 섹션을 구축하고 있습니다.

Trend Micro의 2026년 분석에 따르면, 범죄용 LLM 시장은 JaaS 제공업체 중심으로 통합되고 있습니다. 독자적인 거대 언어 모델을 처음부터 만드는 대신, 상용 AI(Grok, Gemini, DeepSeek 등)의 안전장치를 우회하는 기법을 서비스로 파는 것이 지배적 모델입니다. Trend Micro는 "범죄자들이 합법적 기업이 투자한 수십억 달러의 R&D를 기생적으로 착취하는 것이 훨씬 효율적"이라고 설명합니다.

대표적 사례로, 2025년 9월경 WormGPT 4가 텔레그램과 DarknetArmy 포럼에서 광고를 시작했습니다. 이 서비스는 xAI의 Grok과 Mistral의 Mixtral 모델 위에 구축되었으며, 월 약 60유로의 구독료를 받습니다. 더 비싼 서비스인 Xanthorox는 월 300달러에 "무검열 LLM 접근"을 표방하지만, Trend Micro의 기술 분석 결과 실제로는 Google Gemini를 난독화된 채널로 중계하는 것으로 드러났습니다.

왜 위험한가

JaaS 생태계의 구조

JaaS는 단순한 프롬프트 트릭이 아닙니다. 범죄자들이 직접 AI를 만들지 않고도 고급 AI 능력을 악용할 수 있게 해주는 중간 인프라 계층입니다.

1층. 상용 AI 플랫폼: OpenAI, Google, xAI, Mistral 등이 수십억 달러를 투자해 만든 고성능 LLM.

2층. JaaS 제공업체: 커스텀 시스템 프롬프트, API 래핑, 미세 조정으로 상용 모델의 안전장치를 우회합니다. WormGPT 4, Xanthorox, KawaiiGPT 등이 여기에 해당합니다.

3층. 최종 범죄자: 기술 지식 없이도 월 구독료만 내면 피싱 이메일 작성, 악성코드 생성, 사기 시나리오 생성이 가능합니다.

진짜 위험은 진입장벽 하락

구분	과거 (2023-2024)	현재 (2025-2026)
필요 기술	프롬프트 엔지니어링 능력	구독 결제만 하면 됨
도구 형태	개별 도구 (WormGPT v1)	구독형 서비스 플랫폼
안정성	탈옥이 수분 내 패치됨	자동 우회 업데이트 제공
가격	개당 수백 달러	월 60~300달러
기반 모델	오픈소스 GPT-J 기반	상용 모델(Grok, Gemini) 기생

특히 KawaiiGPT(2025년 11월 등장)는 GitHub에 무료로 공개된 API 래퍼로, DeepSeek, Gemini, Kimi-K2 등 여러 상용 모델을 활용합니다. 기술적 장벽이 사실상 제로에 가까워진 셈입니다.

사기 속의 사기

흥미로운 현상도 있습니다. 다크웹에서 가짜 악성 AI 도구를 판매하는 스캠이 빈번합니다. 실제로 동작하지 않는 "탈옥 서비스"를 팔아 다른 범죄자를 속이는 사기가, 실제 악성 도구보다 더 많다는 분석도 있습니다. 하지만 이것이 위협이 과장되었다는 의미는 아닙니다. 실제로 작동하는 서비스가 존재하고, 점점 안정화되고 있기 때문입니다.

나에게 어떤 영향이 있는가

JaaS 자체를 직접 사용하지 않더라도, 이 생태계가 만들어내는 공격의 대상이 될 수 있습니다.

이메일 사용자: JaaS로 생성된 피싱 이메일은 문법 오류가 없고, 맞춤형 내용으로 작성됩니다. 기존의 "이상한 한국어" 기반 피싱 판별법이 통하지 않습니다
기업: AI로 자동 생성된 BEC(비즈니스 이메일 사기)가 급증합니다. CEO나 거래처를 사칭한 정교한 이메일 공격에 노출됩니다
AI 서비스 제공업체: 자사 모델이 JaaS 인프라에 악용되면서 평판 리스크와 법적 책임 이슈가 발생합니다
일반 사용자: 소셜 미디어와 메시징 앱에서 AI가 생성한 사기 메시지가 더 정교해집니다

지금 할 수 있는 대응법

개인 사용자

AI 생성 피싱에 대비: 문법이 완벽한 이메일도 의심하세요. 발신자 주소, 링크 URL, 긴급성을 강조하는 톤을 확인합니다.
금전 요청은 별도 채널로 확인: 이메일이나 메시지로 온 송금 요청은 전화 등 다른 경로로 반드시 확인하세요.
AI 탈옥 시도 자제: 합법적 AI 서비스의 안전장치를 우회하려는 시도는 이용약관 위반이며, 법적 위험이 있습니다.
의심스러운 메시지 신고: 사기성 AI 생성 콘텐츠를 발견하면 플랫폼에 신고하세요.

기업 및 보안팀

AI 기반 이메일 필터링 강화: 기존 규칙 기반 필터 외에, AI 생성 텍스트를 탐지하는 솔루션을 추가하세요.
임직원 보안 교육 업데이트: "맞춤법이 이상한 이메일을 조심하라"는 더 이상 유효하지 않습니다. AI 시대에 맞는 새로운 피싱 교육이 필요합니다.
다크웹 모니터링: 자사 브랜드나 임원 이름이 BEC 공격 시나리오에 활용되는지 모니터링하세요.
API 악용 방지: AI 서비스를 제공하는 기업은 API 호출 패턴을 모니터링하여 JaaS 제공업체의 기생적 사용을 탐지하세요.

항목	내용
위협 유형	Jailbreak-as-a-Service (JaaS)
심각도	Warning
다크웹 악성 AI 언급 증가	219% (2024년 기준)
탈옥 논의 증가	52%
WormGPT 4 구독료	월 약 60유로
Xanthorox 구독료	월 300달러
지배적 모델	상용 AI 기생형 JaaS

AI 안전장치 우회가 구독 서비스로 팔리는 시대입니다. 독자적 악성 AI보다 상용 AI를 기생적으로 악용하는 모델이 지배적이며, 이는 방어와 탐지 전략을 근본적으로 바꿔야 함을 의미합니다.

참고