본문으로 건너뛰기
← 블로그로 돌아가기
AI모델NOTABLE

Nvidia Vera Rubin NVL72Blackwell의 5배, AI 인프라의 다음 단계

5분 읽기
#Nvidia#Vera Rubin#AI 인프라#GPU#Blackwell#NVL72#CES 2026#Jensen Huang

CES 2026에서 공개된 차세대 AI 플랫폼

2026년 1월 5일, Jensen Huang이 CES 기조연설에서 Vera Rubin 플랫폼을 발표했습니다. 단일 GPU가 아닙니다. CPU, GPU, 네트워크 스위치, DPU, NIC까지 총 6종의 칩으로 구성된 풀스택 AI 슈퍼컴퓨터 플랫폼입니다.

Nvidia 공식 뉴스룸에 따르면, 핵심 구성은 이렇습니다 — Vera CPU 1개와 Rubin GPU 2개를 하나의 슈퍼칩으로 묶고, 여기에 NVLink 6 스위치, ConnectX-9 SuperNIC, BlueField-4 DPU, Spectrum-6 이더넷 스위치를 결합합니다. Nvidia는 이를 "extreme co-design"이라고 표현했습니다.

놀라운 건 일정입니다. 원래 2026년 하반기 양산 예정이었으나, NVIDIA는 Q1 2026에 이미 풀 프로덕션에 돌입했다고 발표했습니다. 예상보다 거의 두 분기나 앞당겨진 셈입니다.

Blackwell과의 성능 비교

숫자로 보면 세대 차이가 명확합니다.

항목Rubin GPUvs Blackwell
추론 성능 (NVFP4)50 PFLOPS5배
학습 성능 (NVFP4)35 PFLOPS3.5배
메모리 대역폭 (HBM4)22 TB/s2.8배
NVLink 대역폭3.6 TB/s/GPU2배
트랜지스터 수3,360억 개1.6배
GPU당 메모리288 GB HBM4

Tom's Hardware에 따르면, 추론 성능 5배 향상과 함께 토큰당 비용은 1/10로 낮아집니다. 같은 MoE(Mixture-of-Experts) 모델을 학습할 때 필요한 GPU 수도 Blackwell 대비 1/4로 줄어든다고 합니다.

NVL72 랙: 72개 GPU가 하나처럼

Vera Rubin NVL72는 72개의 Rubin GPU와 36개의 Vera CPU를 하나의 랙에 집적한 구성입니다.

주요 사양을 보면:

  • 추론: 3.6 EFLOPS (NVFP4)
  • 학습: 2.5 EFLOPS
  • 스케일업 대역폭: 260 TB/s (NVLink 6)
  • 트레이당 고속 메모리: 2 TB
  • 냉각: 완전 수냉 방식

VideoCardz의 상세 분석에 따르면, NVLink 6 스위치가 72개 GPU 간 all-to-all 토폴로지를 구성해서, 랙 전체가 사실상 하나의 거대한 가속기처럼 동작합니다. 트레이당 NVLink 대역폭이 14.4 TB/s에 달합니다.

Vera CPU도 주목할 부분이 있습니다. 88개의 커스텀 Olympus 코어, Spatial Multithreading으로 176 스레드를 지원하고, 메모리 대역폭은 Grace CPU 대비 2.4배인 1.2 TB/s입니다. CPU-GPU 간 NVLink-C2C 코히어런트 대역폭이 1.8 TB/s로, CPU와 GPU가 공유 주소 공간을 사용할 수 있습니다.

누가 사게 될 것인가

Nvidia는 Rubin 플랫폼의 타깃을 명확히 했습니다 — 에이전틱 AI, 고급 추론 모델, MoE 아키텍처. 현재 대형 AI 모델 학습에 수만 개의 GPU를 사용하는 빅테크와 클라우드 프로바이더가 1차 고객입니다.

특히 토큰당 비용 1/10 감소는 추론 서비스 비용 구조를 근본적으로 바꿀 수 있는 수치입니다. OpenAI, Anthropic, Google 같은 API 제공 업체 입장에서는 동일 예산으로 10배 많은 요청을 처리할 수 있다는 뜻이 됩니다.

Jensen Huang은 CES 기조연설에서 "one year cadence"를 강조했습니다. Blackwell에서 Rubin까지 약 1년. 이 속도가 유지된다면, 2027년에는 또 다른 세대가 나올 가능성이 높습니다.

전망

개인적으로 가장 눈에 띄는 부분은 일정입니다. 예상보다 두 분기 앞당겨 프로덕션에 들어갔다는 건, Nvidia가 수요 압박을 그만큼 심각하게 받고 있다는 신호이기도 합니다. AI 인프라 투자가 2026년에도 둔화되지 않을 것이라는 방증입니다.

다만 가격은 아직 공개되지 않았습니다. Blackwell NVL72의 시스템 가격이 약 300만 달러 수준이었던 점을 감안하면, Vera Rubin은 그 이상일 가능성이 있습니다. 성능은 5배지만 가격도 비례해서 오른다면, 실질적인 가성비 향상은 토큰당 비용 기준으로 따져봐야 합니다.


참고

관련 포스트