트랜스포머 설계자 Noam Shazeer, 구글 떠나 OpenAI 합류
핵심 요약
2026년 6월 18일, Noam Shazeer가 자신의 X 계정에 짧은 메시지를 올렸다.
"I'm excited to share that I'll be joining OpenAI and look forward to working with the exceptional team there."
구글 Gemini의 공동 리드이자 부사장, 그리고 현대 AI의 기반이 된 트랜스포머 아키텍처를 설계한 당사자가 OpenAI로 이직한다는 선언이었다. 구글이 2024년 8월 약 $2.7B(한화 약 3.7조 원)짜리 Character.AI 기술 라이선스 딜을 통해 그를 데려온 지 채 22개월 만의 일이다.
OpenAI에서 그의 직책은 **Lead for Architecture Research(아키텍처 연구 수장)**다. 단순한 시니어 엔지니어 채용이 아니라, 차세대 모델을 떠받칠 신경망 구조 자체를 설계하는 자리다.
트랜스포머를 만든 사람
Shazeer를 이해하려면 2017년으로 돌아가야 한다. 그해 구글 브레인 팀이 발표한 논문 "Attention Is All You Need"는 AI 역사의 흐름을 바꾼 8명의 공동저자 중 한 명이 그다. 논문이 제안한 트랜스포머 아키텍처는 이후 GPT, Gemini, Claude, Llama를 포함해 오늘날 존재하는 거의 모든 대형 언어 모델의 뼈대가 됐다.
그가 구글에 처음 입사한 것은 2000년이다. 26년을 합쳐 20년 이상을 구글 안에서 보냈다. 2021년, 그는 동료 Daniel De Freitas와 함께 구글 내부에서 개발하던 챗봇 "LaMDA(Meena)"의 외부 공개를 구글 경영진이 거부하자 스스로 퇴사를 결정했다. 두 사람이 창업한 회사가 Character.AI다. 출시 직후 1억 명이 넘는 MAU를 기록하며 소비자 AI 서비스 1위로 올라섰고, 2023년에는 기업 가치가 $10B을 돌파했다.
$2.7B 귀환과 Gemini 2년
2024년 8월, 구글은 Character.AI의 기술을 라이선스하는 방식으로 약 $2.7B를 지불하고 Shazeer와 De Freitas를 구글로 복귀시켰다. 형식은 기술 라이선스였지만 실질은 인재 영입에 가까웠다. 그는 구글 DeepMind의 부사장으로 임명됐고, Jeff Dean, Oriol Vinyals와 함께 Gemini 모델군의 공동 기술 리드를 맡았다.
복귀 후 그의 손을 거친 첫 결과물이 Gemini 2.0이다. 이전 세대 대비 추론 속도와 코딩 성능을 대폭 끌어올렸다는 평가를 받았다. 그리고 그는 코드명 "Nova"로 불리던 Gemini 3.0 개발을 주도하고 있었다. 그 상태에서 OpenAI 합류를 선택했다.
왜 떠났는지 그는 공식 발언을 하지 않았다. 다만 업계에서는 OpenAI가 제공한 조건과 역할의 규모가 구글 내 역할과 질적으로 달랐을 것이라는 분석이 나온다. 대기업 부서장과 회사 전체 아키텍처 방향을 직접 결정하는 자리는 다르다.
OpenAI가 얻는 것
Lead for Architecture Research는 모델의 "물리적 구조"를 담당하는 자리다. Shazeer의 두 가지 핵심 전문성이 OpenAI에는 즉각적인 가치를 갖는다.
첫째는 **MoE(Mixture of Experts)**다. GPT-4부터 이미 OpenAI 모델에 적용됐지만, 활성 파라미터 수와 라우팅 효율을 더 최적화하면 동일한 추론 품질에서 비용을 크게 낮출 수 있다. ChatGPT와 API 사업이 빠르게 커지는 지금, 토큰당 추론 비용은 OpenAI의 수익성에 직결되는 문제다.
둘째는 **MQA(Multi-Query Attention)**다. Shazeer가 2019년 발표한 이 기법은 KV 캐시 메모리를 대폭 줄여 긴 컨텍스트 처리 비용을 낮춘다. 100만 토큰 이상의 컨텍스트 윈도우가 표준이 되는 지금, MQA 계열 기술의 설계 경험은 희소하다.
| 기술 | 적용 효과 | Shazeer 기여 연도 |
|---|---|---|
| Transformer | 모든 현대 LLM의 기반 아키텍처 | 2017 |
| MQA (Multi-Query Attention) | 추론 메모리 비용 대폭 절감 | 2019 |
| MoE 라우팅 최적화 | 활성 파라미터 효율 향상 | 2021–2026 |
그가 OpenAI에서 설계하는 아키텍처는 GPT-6 이후 세대부터 반영될 가능성이 높다.
구글이 잃은 것
$2.7B를 들여 22개월을 함께했다. 단순 계산으로 월 약 $123M짜리 투자가 아무 비용 회수 없이 종료됐다. 물론 Character.AI의 기술 라이선스 자체는 남아 있다. 그러나 핵심 아키텍처 역량을 가진 사람이 직접 경쟁사로 넘어간 것은 라이선스 자산이 상쇄하기 어려운 손실이다.
Gemini 3.0 "Nova" 개발 일정에도 직접 영향이 있을 수밖에 없다. Jeff Dean과 Oriol Vinyals가 프로젝트를 이어받겠지만, 트랜스포머 아키텍처를 처음 설계했던 사람의 빈 자리는 특정 시니어 엔지니어 한두 명으로 메울 수 있는 종류가 아니다.
구글은 이번 이탈에 대해 공식 입장을 내놓지 않았다. CNBC 등 주요 매체의 질의에도 "코멘트 없음"으로 일관했다.
전망
이 이탈이 단기적으로 Google의 모델 품질에 직접 타격을 준다는 증거는 아직 없다. Gemini 2.0은 이미 출시됐고, 3.0 개발은 진행 중이다. 구글이 보유한 아키텍처 연구 인력의 폭과 깊이는 단 한 명의 이탈로 결정되지 않는다.
그러나 이 이동이 보내는 신호는 다르다. AI 아키텍처 설계 역량의 최상위 인재가 구글보다 OpenAI를 택했다는 사실은, 단순한 보상의 문제가 아닐 수 있다. 연구 문화, 의사결정 속도, 그리고 다음 세대 AI를 만드는 데 얼마나 핵심적인 역할을 할 수 있는가가 인재 이동을 결정하는 시대가 됐다.
AI 아키텍처 경쟁은 지금 이 순간 팀이 아니라 특정 개인의 선택에 의해서도 방향이 달라지는 단계에 있다. Shazeer가 OpenAI에서 어떤 구조를 설계할지, 그 결과가 GPT-6 또는 그 이후 모델에서 어떻게 나타날지는 앞으로 1-2년이 답을 보여줄 것이다.
참고