OpenAI GPT-5.6: Sol·Terra·Luna 3종 패밀리와 미 정부 첫 사전 제한
핵심 요약
OpenAI가 2026년 6월 26일 GPT-5.6 시리즈를 발표했습니다. 플래그십 Sol, 범용 Terra, 경량 Luna 세 모델로 구성된 패밀리입니다. Sol은 Terminal-Bench 2.1에서 91.9%를 기록해 Claude Mythos 5(88.0%)를 넘어섰으며, 서브에이전트를 활용한 Ultra 모드가 새로 도입됐습니다.
이번 출시에는 전례 없는 조건이 붙었습니다. 트럼프 행정부 국가사이버국장실(ONCD)과 과학기술정책실(OSTP)이 사전에 OpenAI에 접근 제한을 요청했고, OpenAI는 이에 응해 약 20개 정부 승인 기업에만 제한적으로 배포했습니다. 미국 정부가 AI 모델 출시를 사전에 제한한 첫 번째 사례입니다.
Sol·Terra·Luna: 세 모델의 포지셔닝
GPT-5.6은 단일 모델이 아니라 서로 다른 용도를 겨냥한 세 모델의 집합입니다.
| 모델 | 특징 | 입력 가격 | 출력 가격 |
|---|---|---|---|
| Sol | 플래그십. Ultra 모드·Max 추론 전용 | $5 / 1M 토큰 | $30 / 1M 토큰 |
| Terra | 범용. GPT-5.5와 동급 성능, 비용 절반 | $2.50 / 1M 토큰 | $15 / 1M 토큰 |
| Luna | 경량. 최저 비용, 빠른 응답 | $1 / 1M 토큰 | $6 / 1M 토큰 |
Terra가 "기본값"에 해당합니다. 일반 ChatGPT Pro·Team 사용과 일상 API 작업에는 Terra를 쓰고, 복잡한 에이전틱 작업에만 Sol을 사용하는 구조를 염두에 둔 설계입니다.
Luna는 OpenAI 최저가 포인트입니다. 빠른 분류, 단순 요약, 대화형 보조 작업에 맞춰진 포지션입니다.
성능: Terminal-Bench 91.9%와 Ultra 모드
GPT-5.6의 핵심 성능 지표는 Terminal-Bench 2.1입니다. 이 벤치마크는 커맨드라인 에이전틱 코딩을 테스트하며, 계획 수립·반복 실행·도구 조율 능력을 측정합니다.
| 모델 | Terminal-Bench 2.1 |
|---|---|
| GPT-5.6 Sol Ultra | 91.9% |
| GPT-5.6 Sol | 88.8% |
| Claude Mythos 5 | 88.0% |
| GPT-5.5 | 83.4% |
| Gemini 3.5 Flash | 76.2% |
| Gemini 3.1 Pro | 70.3% |
Sol Ultra는 Sol의 최고 추론 모드를 활성화한 버전입니다. 동일한 모델에 Max 추론 노력을 허용해 더 많은 연산 예산을 소비하는 방식입니다.
Ultra 모드는 별개입니다. 단일 에이전트 대신 여러 서브에이전트를 병렬로 조율해 복잡한 작업을 처리합니다. OpenAI는 "단일 에이전트의 한계를 넘는다"고 표현했습니다. 긴 코드베이스 분석이나 멀티스텝 리서치처럼 맥락이 분산된 작업에 특화돼 있습니다.
ExploitBench(공격 사이버보안)에서는 Sol이 Mythos 5와 경쟁적인 수준을 보였습니다. 다만 출력 토큰 소비량이 Mythos 5의 3분의 1 수준이었다고 OpenAI는 밝혔습니다. 결과는 비슷하지만 비용은 더 효율적이라는 주장입니다.
과학 추론 벤치마크인 GeneBench v1에서는 GPT-5.5 대비 개선이 확인됐습니다. OpenAI는 이를 근거로 생명과학 연구 지원 능력을 강조했습니다.
왜 정부가 개입했는가
트럼프 행정부의 제한 요청이 공식화된 것은 6월 25일입니다. 백악관 ONCD와 OSTP가 OpenAI에 GPT-5.6의 광범위한 배포를 제한해 달라고 요청했습니다.
정부가 공식으로 밝힌 이유는 두 가지입니다. 첫째는 모델 역량입니다. GPT-5.6 Sol이 "Mythos급 역량"을 갖추고 있어 새로운 평가 체계가 필요하다는 것입니다. 둘째는 프레임워크 구축입니다. 행정부는 이 수준의 모델에 대한 보안 테스트 및 평가 체계를 아직 완성하지 못했으며, 그 체계를 갖출 시간을 원했습니다.
CNN과 TechCrunch 보도에 따르면, 6월 25일 Sam Altman이 내부 Q&A에서 직원들에게 이 상황을 설명했습니다. 그는 정부 요청에 따르기로 결정했다고 밝혔습니다.
결과로 만들어진 체계가 "신뢰 파트너(Trusted Partners)" 프로그램입니다. 약 20개 기업이 정부 승인을 받아 제한적으로 접근 가능합니다. 일반 API나 ChatGPT를 통한 광범위 접근은 아직 열리지 않은 상태입니다.
OpenAI의 입장: 이번은 협력, 하지만 전례는 아니다
OpenAI는 이번 제한에 협력했지만, 공식 입장에서 "이런 방식이 일반적 규범이 돼서는 안 된다"고 명시했습니다. TechCrunch 보도에 따르면 OpenAI는 이번을 예외적 상황으로 규정했습니다.
OpenAI가 강조한 안전 요소도 있습니다. GPT-5.6 Sol은 "역대 가장 강력한 안전 스택"을 탑재했으며, 고위험 활동과 민감한 사이버 요청에 대한 방어가 강화됐다고 밝혔습니다.
이번 사례는 미국 AI 거버넌스 논의에서 중요한 선례가 됩니다. 규제 당국이 "안전하다고 판단하기 전까지" 제한할 수 있는 선례가 생겼기 때문입니다. 동시에 OpenAI가 제한을 수용하면서 자발적 협력의 선례도 만들어졌습니다.
OpenAI에 따르면 GPT-5.6 Sol, Terra, Luna의 일반 배포는 "수 주 내"로 예정되어 있습니다.
전망
GPT-5.6은 두 가지 이유에서 이전 모델과 다릅니다.
기술적으로는 Ultra 모드입니다. 단일 모델이 처리하는 방식에서 에이전트 군집이 협력하는 방식으로의 전환이 처음으로 공식 제품에 반영됐습니다. OpenAI가 에이전틱 프레임워크를 핵심 사용 패턴으로 밀어붙이는 방향이 분명해졌습니다.
정책적으로는 정부 개입입니다. ONCD와 OSTP가 사전에 제한을 요청하고 기업이 이에 응한 구조는, 앞으로 더 강력한 모델이 나올 때마다 반복될 수 있는 절차를 만들어 놓은 것입니다. 의회에서 논의 중인 AI 책임법안들이 이 사례를 근거로 삼을 가능성이 있습니다.
반면 일반 개발자 입장에서 현재 변화는 크지 않습니다. 일반 배포가 몇 주 안에 이뤄질 것으로 예상되는 만큼, 이번 제한의 실질적 효과는 제한적입니다. 그러나 "AI 모델을 정부가 사전 심사하는" 선례 자체는 앞으로 AI 정책의 방향을 가늠하는 기준점이 될 것입니다.
참고