Claude Mythos PreviewAI가 27년 묵은 제로데이를 찾아낸 날
4월 7일, Anthropic이 Claude Mythos Preview를 공개했습니다. 범용 언어 모델이지만, 사이버 보안 영역에서 기존 모델과 격차가 큽니다. 모든 주요 운영체제와 브라우저에서 수천 개의 고위험 제로데이 취약점을 자율적으로 발견했다고 Anthropic은 밝혔습니다. 유사 능력이 통제 없이 확산될 경우의 위험 때문에, 일반 공개 대신 제한적 배포를 택했습니다.
동시에 발표된 것이 Project Glasswing입니다. AWS, Apple, Google, Microsoft, CrowdStrike 등이 참여하는 사이버 보안 연합으로, 방어 진영이 먼저 이 능력을 확보하겠다는 전략입니다.
3월 말 CMS 유출로 존재가 미리 알려졌던 모델입니다. 그러나 공식 발표에 담긴 구체적 수치는 유출 당시 추측과 차이가 있었습니다.
AI가 해커를 이긴 날
Mythos Preview는 보안 전문 모델이 아닙니다. 범용 모델입니다. Anthropic에 따르면, 코드·추론·자율성에 대한 전반적인 성능 향상이 보안 능력으로 자연스럽게 이어진 결과입니다. 별도의 보안 특화 훈련은 없었습니다.
그런데 결과가 극적입니다. 연구진이 격리된 컨테이너에 대상 소프트웨어와 Claude Code를 배치하고 취약점을 찾으라고 지시합니다. 그러면 모델이 스스로 가설을 세우고 실험하고 디버깅 로직을 조정합니다.
최종적으로 PoC(Proof of Concept) 익스플로잇이나 버그 리포트를 작성합니다 — 사람 개입 없이.
발견된 취약점 중에는 수십 년간 인간 코드 리뷰와 자동화 퍼징을 모두 피해 온 것들이 포함되어 있습니다.
Mythos Preview, 뭐가 다른가
숫자로 보겠습니다.
Opus 4.6(현재 Claude 최상위 모델) vs Mythos — Firefox JS 엔진 테스트
Mozilla Firefox 147의 JavaScript 엔진을 대상으로, 발견된 취약점을 셸 익스플로잇으로 전환하는 테스트를 수백 회 실행한 결과입니다.
| 모델 | 작동하는 익스플로잇 | 레지스터 제어 도달 |
|---|---|---|
| Opus 4.6 | 2회 | — |
| Mythos Preview | 181회 | 추가 29회 |
Anthropic이 공개한 OSS-Fuzz 테스트(약 1,000개 프로젝트)에서도 격차는 뚜렷합니다. Mythos Preview는 완전 패치된 타겟 10개에서 전체 제어 흐름 탈취를 달성했고, Opus 4.6은 Tier-3 수준 크래시에 그쳤습니다.
실제 발견 사례
FreeBSD NFS RCE (CVE-2026-4747) — 17년 묵은 취약점입니다. Mythos Preview가 GSS 인증 핸들러의 보호되지 않은 스택 버퍼를 찾아냈습니다. NFSv4 정보 누출로 KASLR을 우회하고, 6개의 연속 RPC 요청에 걸친 20-가젯 ROP 체인을 구성해 인증 없이 원격 루트 접근을 달성했습니다. 초기 프롬프트 이후 사람 개입은 0이었습니다.
OpenBSD TCP SACK — 27년 된 버그입니다. 범위 검증 오류와 부호 있는 정수 오버플로우의 조합으로, TCP 응답을 보내는 모든 OpenBSD 호스트를 크래시시킬 수 있는 취약점이었습니다.
FFmpeg H.264 디코더 — 2003년 코드에서 -1을 미초기화 슬라이스 매핑의 센티널 값으로 사용한 것이 원인입니다. 슬라이스 카운터가 16비트 한계를 초과하면 힙 범위 밖 쓰기가 가능해집니다. 16년간 숨어 있었습니다.
Anthropic은 이 밖에도 TLS·AES-GCM·SSH 구현체에서 인증서 위조와 암호화 통신 복호화가 가능한 취약점, 웹 앱 로그인 인증 완전 우회, Rust VMM의 unsafe 블록 내 포인터 조작 취약점 등을 보고했습니다.
비용
Anthropic이 공개한 캠페인별 비용 추정치입니다.
| 캠페인 | 비용 | 비고 |
|---|---|---|
| OpenBSD 취약점 발견 | ~$20,000 | 1,000회 실행, 수십 건 발견 |
| FFmpeg 스캔 | ~$10,000 | 수백 회 저장소 스캔 |
| Linux 커널 N-day 익스플로잇 | <$2,000/건 | 1일 이내 완료 |
Anthropic 발표 기준, 개별 성공 실행 비용은 건당 $50 미만입니다.
Project Glasswing과 파트너 연합
Anthropic은 Mythos Preview를 일반 공개하지 않기로 했습니다. 대신 Project Glasswing이라는 이름 아래, 핵심 인프라 파트너와 오픈소스 개발자에게만 제한적으로 배포합니다.
참여 기업은 AWS, Apple, Broadcom, Cisco, CrowdStrike, Google, JPMorgan Chase, Linux Foundation, Microsoft, NVIDIA, Palo Alto Networks 등입니다. Anthropic은 최대 1억 달러(약 1,400억 원) 규모의 모델 사용 크레딧을 투입합니다. 오픈소스 보안 단체에 대한 기부금도 별도로 포함됩니다.
VentureBeat에 따르면, Anthropic은 이미 미국 정부 고위 관리들에게 Mythos가 대규모 사이버 공격 가능성을 올해 안에 유의미하게 높인다고 비공개 경고했습니다. Axios는 별도 보도에서, 적대국의 오픈소스 모델이 Mythos급 능력에 도달하기까지 "수년이 아닌 수개월"이라는 전문가 평가를 인용했습니다.
Anthropic은 새로운 안전장치를 적용한 Mythos급 모델을 향후 Claude Opus 라인에 통합할 계획입니다. 보안 전문가 대상 "Cyber Verification Program"도 예고했습니다.
전망 — 필자의 시각
개인적 분석입니다.
이 발표의 핵심은 모델 성능 자체가 아닙니다. 방어자가 먼저 쓸 수 있는 시간을 확보하겠다는 판단입니다. 공개를 미루고, 파트너를 먼저 무장시키고, $100M을 투입하는 구조 전체가 하나의 메시지입니다.
Anthropic 자체적으로도 전환기가 "격동적(tumultuous)"일 수 있다고 인정했습니다. 단기적으로는 공격자가 유리할 수 있다는 것입니다. 그러나 장기적으로는 언어 모델이 배포 전에 취약점을 고치는 세상을 기대한다고 밝혔습니다.
낙관이 조기에 깨질 수도 있습니다. 오픈소스 진영의 추격 속도, 모델 유출 가능성, 패치 사이클이 발견 속도를 따라잡을 수 있는지가 변수입니다. Anthropic 발표에 따르면 지금까지 발견된 취약점 중 완전히 패치된 것은 1% 미만입니다.
확실한 것 하나 — 보안 업계의 게임이 바뀌었습니다. AI가 찾아내는 취약점의 양과 속도에 인간 팀이 대응할 수 있는 조직적 체계를 갖추는 것이 당장의 과제입니다.
참고