Nvidia Vera Rubin NVL72Blackwell의 5배, AI 인프라의 다음 단계
CES 2026에서 공개된 차세대 AI 플랫폼
2026년 1월 5일, Jensen Huang이 CES 기조연설에서 Vera Rubin 플랫폼을 발표했습니다. 단일 GPU가 아닙니다. CPU, GPU, 네트워크 스위치, DPU, NIC까지 총 6종의 칩으로 구성된 풀스택 AI 슈퍼컴퓨터 플랫폼입니다.
Nvidia 공식 뉴스룸에 따르면, 핵심 구성은 이렇습니다 — Vera CPU 1개와 Rubin GPU 2개를 하나의 슈퍼칩으로 묶고, 여기에 NVLink 6 스위치, ConnectX-9 SuperNIC, BlueField-4 DPU, Spectrum-6 이더넷 스위치를 결합합니다. Nvidia는 이를 "extreme co-design"이라고 표현했습니다.
놀라운 건 일정입니다. 원래 2026년 하반기 양산 예정이었으나, NVIDIA는 Q1 2026에 이미 풀 프로덕션에 돌입했다고 발표했습니다. 예상보다 거의 두 분기나 앞당겨진 셈입니다.
Blackwell과의 성능 비교
숫자로 보면 세대 차이가 명확합니다.
| 항목 | Rubin GPU | vs Blackwell |
|---|---|---|
| 추론 성능 (NVFP4) | 50 PFLOPS | 5배 |
| 학습 성능 (NVFP4) | 35 PFLOPS | 3.5배 |
| 메모리 대역폭 (HBM4) | 22 TB/s | 2.8배 |
| NVLink 대역폭 | 3.6 TB/s/GPU | 2배 |
| 트랜지스터 수 | 3,360억 개 | 1.6배 |
| GPU당 메모리 | 288 GB HBM4 | — |
Tom's Hardware에 따르면, 추론 성능 5배 향상과 함께 토큰당 비용은 1/10로 낮아집니다. 같은 MoE(Mixture-of-Experts) 모델을 학습할 때 필요한 GPU 수도 Blackwell 대비 1/4로 줄어든다고 합니다.
NVL72 랙: 72개 GPU가 하나처럼
Vera Rubin NVL72는 72개의 Rubin GPU와 36개의 Vera CPU를 하나의 랙에 집적한 구성입니다.
주요 사양을 보면:
- 추론: 3.6 EFLOPS (NVFP4)
- 학습: 2.5 EFLOPS
- 스케일업 대역폭: 260 TB/s (NVLink 6)
- 트레이당 고속 메모리: 2 TB
- 냉각: 완전 수냉 방식
VideoCardz의 상세 분석에 따르면, NVLink 6 스위치가 72개 GPU 간 all-to-all 토폴로지를 구성해서, 랙 전체가 사실상 하나의 거대한 가속기처럼 동작합니다. 트레이당 NVLink 대역폭이 14.4 TB/s에 달합니다.
Vera CPU도 주목할 부분이 있습니다. 88개의 커스텀 Olympus 코어, Spatial Multithreading으로 176 스레드를 지원하고, 메모리 대역폭은 Grace CPU 대비 2.4배인 1.2 TB/s입니다. CPU-GPU 간 NVLink-C2C 코히어런트 대역폭이 1.8 TB/s로, CPU와 GPU가 공유 주소 공간을 사용할 수 있습니다.
누가 사게 될 것인가
Nvidia는 Rubin 플랫폼의 타깃을 명확히 했습니다 — 에이전틱 AI, 고급 추론 모델, MoE 아키텍처. 현재 대형 AI 모델 학습에 수만 개의 GPU를 사용하는 빅테크와 클라우드 프로바이더가 1차 고객입니다.
특히 토큰당 비용 1/10 감소는 추론 서비스 비용 구조를 근본적으로 바꿀 수 있는 수치입니다. OpenAI, Anthropic, Google 같은 API 제공 업체 입장에서는 동일 예산으로 10배 많은 요청을 처리할 수 있다는 뜻이 됩니다.
Jensen Huang은 CES 기조연설에서 "one year cadence"를 강조했습니다. Blackwell에서 Rubin까지 약 1년. 이 속도가 유지된다면, 2027년에는 또 다른 세대가 나올 가능성이 높습니다.
전망
개인적으로 가장 눈에 띄는 부분은 일정입니다. 예상보다 두 분기 앞당겨 프로덕션에 들어갔다는 건, Nvidia가 수요 압박을 그만큼 심각하게 받고 있다는 신호이기도 합니다. AI 인프라 투자가 2026년에도 둔화되지 않을 것이라는 방증입니다.
다만 가격은 아직 공개되지 않았습니다. Blackwell NVL72의 시스템 가격이 약 300만 달러 수준이었던 점을 감안하면, Vera Rubin은 그 이상일 가능성이 있습니다. 성능은 5배지만 가격도 비례해서 오른다면, 실질적인 가성비 향상은 토큰당 비용 기준으로 따져봐야 합니다.
참고