본문으로 건너뛰기
HOTAIMODEL

GPT-5.5 Instant: ChatGPT 기본 모델 교체와 환각 52.5% 감소의 의미

7 MIN READBY JJY
#OpenAI#GPT-5.5 Instant#ChatGPT#LLM#환각 감소#Memory Sources#Gmail 연동#AI 모델

핵심 요약

OpenAI는 2026년 5월 5일 ChatGPT의 기본 모델을 GPT-5.3 Instant에서 GPT-5.5 Instant로 교체했다. 자체 평가 기준 의료·법률·금융 같은 고난도 질문에서 환각 클레임이 52.5% 줄었고, 사용자가 사실 오류로 신고한 대화에서 부정확한 주장이 37.3% 감소했다. 응답 단어 수는 평균 30.2%, 줄 수는 29.2% 짧아졌다.

이번 업데이트는 단순한 모델 스왑이 아니다. 과거 대화·업로드 파일·연결된 Gmail까지 끌어다 쓰는 개인화가 함께 들어왔고, 어떤 컨텍스트가 답변에 사용됐는지 보여주는 Memory Sources 패널이 모든 ChatGPT 모델에 공통으로 깔린다. API에서는 chat-latest로 노출되며, 유료 사용자는 GPT-5.3 Instant를 3개월 동안 모델 설정에서 계속 선택할 수 있다.

무엇이 어떻게 바뀌었나

OpenAI가 직접 공개한 비교 수치는 GPT-5.3 Instant 대비 GPT-5.5 Instant의 변화에 한정된다.

항목GPT-5.3 InstantGPT-5.5 Instant변화
환각 클레임 (고난도 프롬프트)기준52.5% 감소의료·법률·금융
부정확한 주장 (신고 대화)기준37.3% 감소사용자 플래그 기반
응답 단어 수기준30.2% 감소평균
응답 줄 수기준29.2% 감소평균

OpenAI는 이 숫자들이 모두 내부 평가에서 측정됐다고 명시했다. 외부 벤치마크 점수나 LMArena 같은 공개 리더보드 결과는 함께 발표되지 않았다.

응답 톤도 달라졌다. 9to5Mac과 PCWorld 보도에 따르면 GPT-5.5 Instant는 불필요한 이모지, 과한 추가 질문, 형식적 군더더기를 줄이도록 튜닝됐다. "informal, practical, workplace-safe"라는 표현이 OpenAI의 공식 설명에 등장한다.

개인화: Gmail까지 끌어다 쓰는 컨텍스트

GPT-5.5 Instant의 두 번째 축은 개인화다. ChatGPT는 이제 답변을 만들 때 다음 세 가지 소스를 종합적으로 참고할 수 있다.

  • 과거 대화 (Saved Memory + 일반 채팅 히스토리)
  • 사용자가 업로드한 파일
  • 연결된 Gmail 계정의 메일 본문

이 기능은 Plus와 Pro 사용자에게 웹에서 먼저 롤아웃됐다. 모바일은 곧 이어지고, Free/Go/Business/Enterprise 플랜 확장은 "수 주 내(in the coming weeks)"라고만 명시됐다. 정확한 일정은 공개되지 않았다.

Memory Sources: 투명성 패널

모든 ChatGPT 모델에 동시에 들어가는 Memory Sources는 답변 아래의 작은 버튼이다. 누르면 어떤 과거 대화·파일·Gmail 항목이 이번 응답을 개인화하는 데 쓰였는지 목록으로 뜬다. 거기서 직접 삭제하거나 수정할 수 있다.

개인화가 강해질수록 **"AI가 내 메일까지 보고 답하는데, 정확히 뭘 보고 있는지는 모른다"**는 우려가 커졌다. Memory Sources는 그 불투명성에 대한 OpenAI의 공식 답이다. 다만 패널이 보여주는 범위가 실제 모델이 참조한 컨텍스트의 전부인지, 일부 요약인지는 발표 시점에 명시되지 않았다.

API와 모델 라이프사이클

개발자 영향도 적지 않다.

  • chat-latest 엔드포인트가 자동으로 GPT-5.5 Instant로 전환된다. 따로 모델 ID를 지정하지 않은 호출은 5월 5일부터 새 모델을 받는다.
  • GPT-5.3 Instant는 유료 사용자에게 3개월 동안 모델 설정에서 선택지로 남는다. 그 후 은퇴.
  • 무료 사용자는 GPT-5.3 Instant를 별도로 선택할 방법이 없다. 사실상 강제 마이그레이션이다.

chat-latest로 프로덕션에 들어가 있는 서비스가 있다면 응답 길이가 30% 가까이 줄어드는 게 가장 큰 회귀 포인트다. 토큰 비용은 줄겠지만, 짧아진 답변이 기존 UX 가정(예: 일정 길이 이상의 설명을 자르지 않고 보여주는 카드)과 충돌할 수 있다.

시장 맥락: GPT-5.5 vs GPT-5.5 Instant

이번에 풀린 건 정확히 말하면 GPT-5.5 그 자체가 아니라 GPT-5.5 Instant다. OpenAI는 GPT-5.5 라인업을 먼저 공개했고, Instant는 그중 빠르고 저렴한 기본 변형이다. Pro 사용자가 쓰는 추론(thinking) 변형 등은 별도 SKU로 남아 있다.

같은 주에 LMArena에서는 Anthropic의 Claude Opus 4.7이 1위를 유지하고 있다는 보도가 나왔다. 외부 리더보드 점수 없이 출시된 GPT-5.5 Instant는 "정점을 노리는 모델"보다는 "기본값을 견고하게 다지는 모델"에 가깝다는 인상을 준다. 5월 6일 Sierra의 $950M 시리즈 E, 5월 7일 SAP의 €1B Prior Labs/Dremio 인수 같은 인프라 베팅이 같은 주에 겹친 것도 흐름을 보여준다. 프론티어 경쟁이 한 단계 더 끓는 와중에, OpenAI는 가장 많은 사람이 쓰는 한 칸을 조용히 갈아끼웠다.

사용자 입장에서 보는 변화

사용자 유형즉시 변화주의 사항
Free기본 모델이 자동 교체Gmail 개인화는 추후 제공
Plus / Pro기본 + 풀 개인화 + Memory SourcesGmail 연결 여부 확인 필요
Business / Enterprise기본 모델 교체고급 개인화는 수 주 내 단계 적용
API 개발자chat-latest 자동 전환응답 길이 30% 감소, 회귀 점검 권장

필자의 시각

수치만 놓고 보면 환각 52.5% 감소가 가장 화려한 헤드라인이다. 다만 이 숫자는 OpenAI 내부 평가에서 나온 값이고, 측정 방법론은 자세히 공개되지 않았다. 외부 검증이 따라붙기 전까지는 "OpenAI 자체 측정 기준"이라는 단서를 빼고 인용하지 않는 편이 안전하다.

개인적으로 더 흥미로운 건 응답 길이를 30% 줄였다는 부분이다. ChatGPT가 길고 친절한 답변으로 굳어지면서 생긴 "TL;DR 피로"는 실제로 많은 사용자가 호소하던 문제였다. 이걸 모델 단에서 손봤다는 신호는, 향후 다른 프론티어 모델들이 같은 방향으로 따라올 가능성을 시사한다.

가장 조용한 변화지만 가장 깊을 수 있는 건 Gmail 연동이다. AI가 개인 메일을 읽고 답하는 것이 기본 기능으로 자리잡는 순간, 보안·법무·HR 정책의 디폴트가 바뀐다. 기업이라면 이번 주 안에 ChatGPT의 Gmail 연결 권한을 어떻게 통제할지 정해두는 것이 좋다.

참고

Share
JJY
// AUTHORJJY

AI · WEB SECURITY · DEV ENV

GH

새 글 알림 받기

스팸 없이 새 포스트만 전달합니다.

// RELATED

관련 포스트