본문으로 건너뛰기
HOTAIMODEL

Claude Fable 5 정식 출시: 일반 공개된 첫 Mythos급 모델

7 MIN READBY JJY
#Anthropic#Claude Fable 5#Claude Mythos 5#LLM#에이전틱 AI#SWE-bench#Project Glasswing#AI 모델 출시

핵심 요약

2026년 6월 9일, Anthropic이 Claude Fable 5Claude Mythos 5를 동시에 출시했습니다. 두 모델은 동일한 기반 위에 있지만, 접근 방식이 다릅니다. Fable 5는 일반에 공개된 첫 Mythos급 모델이고, Mythos 5는 방어 사이버보안 전문가를 위한 초대 전용 버전입니다.

관련 글: Claude Opus 4.8: '가장 정직한' 프론티어 모델과 1,000개 서브에이전트의 데뷔

SWE-bench Pro 점수는 80.3%. 12일 전 출시된 Opus 4.8(69.2%)보다 11.1점 높고, GPT-5.5(58.6%)보다 21.7점 앞섭니다. Anthropic이 발표한 공식 비교표 기준입니다. 컨텍스트 창은 1M 토큰, 1회 요청당 최대 출력은 128K 토큰입니다.

가격은 입력 $10, 출력 $50 per million tokens. 프롬프트 캐싱 적용 시 입력 비용의 90%가 절감됩니다. Claude API, Amazon Bedrock, Vertex AI, Microsoft Foundry, GitHub Copilot에서 당일 접근 가능합니다.

두 모델, 하나의 기반: Fable 5와 Mythos 5

3월 유출, 4월 Project Glasswing 프리뷰까지 Mythos는 제한된 파트너에게만 노출된 모델이었습니다. 이번 출시로 그 경계가 나뉩니다.

관련 글: Claude Mythos Preview, AI가 27년 묵은 제로데이를 찾아낸 날

Claude Fable 5는 일반 공개 버전입니다. 사이버보안 익스플로잇 개발, 생물·화학 무기 관련 쿼리, 모델 증류 요청은 자동으로 Claude Opus 4.8로 라우팅됩니다. 이 안전 분류기가 발동하는 비율은 전체 세션의 5% 미만이라고 Anthropic은 밝혔습니다.

Claude Mythos 5는 이 안전 분류기가 일부 해제된 버전입니다. 4월에 출범한 Project Glasswing 파트너에게만 제공됩니다. AWS, Apple, Google, Microsoft, CrowdStrike 등 핵심 인프라 운영사와 미국 정부가 참여하는 초대 전용 프로그램입니다. 방어 사이버보안 목적에 한해 제한이 풀린 모델을 사용할 수 있습니다.

두 모델의 기술 사양은 동일합니다. 1M 토큰 컨텍스트, 128K 출력 한도, $10/$50 per million tokens 가격도 같습니다.

벤치마크: SWE-bench Pro 80.3%가 의미하는 것

SWE-bench Pro는 SWE-bench Verified보다 난이도가 높습니다. Verified는 GitHub 이슈 해결 능력을 측정하지만, Pro는 프로덕션 코드베이스에서 복잡한 멀티파일 변경을 요구합니다.

모델SWE-bench Pro
Claude Fable 580.3%
Claude Opus 4.869.2%
GPT-5.558.6%
Gemini 3.1 Pro54.2%

Opus 4.8은 5월 28일 출시 시점에 SWE-bench Verified 88.6%로 당시 1위였습니다. Fable 5는 Pro 기준으로 Opus 4.8을 11.1점 초과합니다. 더 어려운 테스트에서 더 큰 격차를 벌린 셈입니다.

Anthropic이 기준 벤치마크로 SWE-bench Verified 대신 SWE-bench Pro를 선택한 것도 주목할 지점입니다. 경쟁사들이 Verified 기준으로 높은 점수를 공개해온 상황에서, 더 어려운 기준을 제시하는 방식으로 차별화를 시도한 것으로 보입니다.

소프트웨어 엔지니어링 외에 Anthropic은 지식 업무, 비전, 과학 연구, 컴퓨터 사용, 법률 작업, 자동화, 에이전틱 워크플로에서 SOTA 성능을 달성했다고 밝혔습니다. 각 항목별 구체적 수치는 공식 모델 카드에서 확인할 수 있습니다.

에이전틱 설계: 수일 단위 자율 작업이 가능한 이유

Fable 5의 가장 큰 특징은 장기 에이전틱 작업 능력입니다. Anthropic은 "이전 모델이 수행하지 못했던 수일 단위의 복잡하고 비동기적인 작업"을 처리할 수 있다고 설명합니다.

Claude Code나 Claude Managed Agents 같은 에이전트 하네스에서 실행할 때 동작 방식이 구체화됩니다.

  1. 계획 수립: 장기 작업을 단계별로 분해합니다.
  2. 서브에이전트 위임: 독립적인 하위 작업을 병렬 서브에이전트에게 분배합니다.
  3. 결과 검증: 각 단계의 출력을 스스로 검토합니다.
  4. 최종 전달: 통합된 결과를 사용자에게 반환합니다.

이를 가능하게 하는 기술적 토대가 1M 토큰 컨텍스트 창입니다. 대규모 코드베이스, 긴 문서 체인, 여러 단계의 중간 결과를 단일 컨텍스트 안에 유지하면서 작업할 수 있습니다. 128K 출력 한도는 단일 응답에서 방대한 코드나 문서를 생성할 수 있게 합니다.

Anthropic의 KuCoin 발표 자료에는 "2개월짜리 작업을 하루 만에 완료"라는 표현이 등장합니다. 이 주장에 대한 방법론과 구체적 사례는 공식 모델 카드에서 별도 검토가 필요합니다.

가격과 가용성

항목
입력 가격$10 / 1M tokens
출력 가격$50 / 1M tokens
캐시 할인입력의 90% 절감
컨텍스트 창1,000,000 tokens
최대 출력128,000 tokens

플랫폼 가용성은 출시일부터 전면 지원됩니다. Claude API(claude.ai/code 포함), Amazon Bedrock, Google Vertex AI, Microsoft Foundry, GitHub Copilot 모두 Fable 5를 사용할 수 있습니다.

가격은 Opus 4.8($15/$75 per 1M)보다 낮습니다. 프롬프트 캐싱을 활용하면 입력 비용이 대폭 줄어, 반복적인 컨텍스트를 사용하는 에이전틱 파이프라인에서 실질 비용이 Opus 4.8보다 훨씬 낮아질 수 있습니다.

전망

Opus 4.8이 출시된 지 12일 만에 Fable 5가 그보다 높은 성능으로 일반에 공개됐습니다. 이 속도 자체가 현 경쟁 구도를 단적으로 보여줍니다.

더 중요한 것은 위치 변화입니다. 3월 유출 당시 Mythos는 "Opus보다 상위 티어"의 연구 산물이었습니다. 4월에는 방어 사이버보안 전문가만 쓸 수 있었습니다. 6월 9일부로 그 모델이 API에서 누구나 호출할 수 있게 됐습니다.

Mythos 5의 Project Glasswing 채널은 계속 확장될 것으로 보입니다. Anthropic은 안전성이 충분히 검증된 영역부터 제한을 순차적으로 완화하는 패턴을 택하고 있습니다. 이 구조가 Fable와 Mythos 라인을 별도로 유지하는 이유일 것입니다.

한 가지 불확실한 부분은 코딩 외 벤치마크입니다. SWE-bench Pro 80.3%는 검증됐지만, 범용 추론이나 멀티모달 작업에서 Gemini 3.5 Flash, GPT-5.5 대비 상세 비교 수치는 공식 자료에서 충분히 공개되지 않았습니다. 코딩 에이전트 용도로는 현재 1위가 확실하지만, 범용 성능 전체 그림은 추가 검토가 필요합니다.

참고

Share
JJY
// AUTHORJJY

AI · WEB SECURITY · DEV ENV

GH

새 글 알림 받기

스팸 없이 새 포스트만 전달합니다.

// RELATED

관련 포스트