Huawei Atlas 950 SuperPodNvidia에 도전하는 8EF AI 플랫폼
핵심 요약
화웨이(Huawei)가 MWC 바르셀로나 2026에서 Atlas 950 SuperPod를 최초로 글로벌 공개했다. Ascend 950 NPU 8,192개를 하나의 컴퓨팅 시스템으로 묶어 FP8 8 EFLOPS, FP16 16 EFLOPS의 연산 성능을 내세우며, Nvidia의 데이터센터 AI 독주 체제에 정면으로 도전장을 내밀었다.
무엇이 공개되었나
2026년 3월 MWC에서 화웨이 컴퓨팅 제품군 사장 Seaway Zhang이 Atlas 950 SuperPod와 TaiShan 950 SuperPod를 동시에 발표했다. Atlas 950은 AI 학습 및 추론에 특화된 플랫폼이며, TaiShan 950은 범용 컴퓨팅에 초점을 맞춘다.
핵심은 UnifiedBus라는 자체 인터커넥트 기술이다. 8,192개의 NPU를 하나의 논리적 컴퓨터로 연결하며, 통합 메모리 주소 지정(unified memory addressing)을 지원한다. 이를 통해 초고대역폭, 초저지연 통신이 가능해진다.
기술 스펙 상세
| 항목 | 수치 |
|---|---|
| NPU 수 | 8,192개 (Ascend 950) |
| FP8 성능 | 8 EFLOPS |
| FP16 성능 | 16 EFLOPS |
| 메모리 | 1,152 TB (1 PB 이상) |
| 인터커넥트 대역폭 | 16.3 PB/s |
| 물리적 규모 | 약 160 캐비닛, ~1,000 m2 |
| 소프트웨어 스택 | CANN (PyTorch, Triton 지원) |
| 출시 예정 | 2026년 4분기 |
CANN(Compute Architecture for Neural Networks)은 화웨이의 오픈소스 AI 컴퓨팅 아키텍처로, Nvidia의 CUDA 생태계에 대한 대안을 제시한다. PyTorch와 Triton 프레임워크를 지원하여 기존 AI 워크로드의 마이그레이션을 용이하게 한다.
Nvidia와 어떻게 비교되나
화웨이는 Atlas 950이 Nvidia의 DGX SuperPOD(NVL144 기반) 대비 다음과 같은 우위를 주장한다.
- NPU 수: 56.8배 (8,192 vs ~144 GPU)
- 컴퓨팅 파워: 6.7배
- 메모리 용량: 15배 (1,152 TB vs ~77 TB)
- 인터커넥트 대역폭: 62배 (16.3 PB/s)
그러나 칩 단위 성능에서는 여전히 Nvidia가 압도적이다. Nvidia의 Rubin 칩은 FP4 기준 50 PFLOPS를 달성하는 반면, Ascend 950은 FP4 기준 약 2 PFLOPS 수준으로 약 25배 차이가 난다. 화웨이도 이를 인정하며 "칩 단위로는 Nvidia에 미치지 못하지만, 클러스터 수준에서 대규모 통합을 통해 뛰어넘겠다"고 밝혔다.
물리적 규모의 차이
Atlas 950 SuperPod는 약 160개 캐비닛이 1,000m2 면적을 차지하는 대규모 시설이다. 반면 Nvidia의 NVL144는 단일 캐비닛에서 3.6 EFLOPS(FP4)를 달성한다. 이는 전력 효율과 공간 효율 면에서 Nvidia가 여전히 앞서 있음을 보여준다.
소프트웨어 생태계: CANN vs CUDA
AI 칩 경쟁에서 하드웨어만큼 중요한 것이 소프트웨어 생태계다.
Nvidia의 CUDA는 15년 이상의 역사를 가진 업계 표준으로, 거의 모든 AI 프레임워크와 라이브러리가 CUDA 최적화를 기본 제공한다. 반면 화웨이의 CANN은 상대적으로 신생 플랫폼이다.
화웨이는 CANN을 오픈소스로 공개하고 PyTorch 및 Triton 호환성을 확보함으로써 개발자 진입 장벽을 낮추려 하고 있다. 하지만 CUDA 기반의 방대한 라이브러리 생태계를 단기간에 따라잡기는 어려울 전망이다.
경쟁 구도와 시장 타이밍
| 제품 | 출시 상태 | 주요 특징 |
|---|---|---|
| Nvidia DGX SuperPOD | 출시 완료 | 검증된 플랫폼, 단일 캐비닛 고효율 |
| Huawei Atlas 950 | 2026 Q4 예정 | 대규모 클러스터, UnifiedBus |
| AMD Instinct MegaPod | 2027년 예정 | MI400 기반, ROCm 생태계 |
Nvidia의 DGX SuperPOD는 이미 시장에 출시되어 검증된 반면, Atlas 950은 2026년 4분기, AMD의 MegaPod는 2027년으로 예정되어 있다. 시장 타이밍에서 Nvidia가 여전히 유리한 위치에 있다.
지정학적 맥락
미국의 대중국 반도체 수출 규제로 인해 화웨이는 자체 칩 개발에 박차를 가하고 있다. Atlas 950은 이러한 제재 환경에서 탄생한 결과물이다. 미국 규제에 영향받지 않는 독자적 AI 인프라를 구축하려는 중국의 전략적 의지가 담겨 있다.
동시에 이는 글로벌 AI 칩 시장의 양극화를 심화시킬 수 있다. Nvidia/CUDA 진영과 Huawei/CANN 진영으로 나뉘는 AI 인프라의 분열(fragmentation)이 현실화되는 시나리오다.
업계 반응
Nvidia의 Jensen Huang CEO는 "경쟁이 부인할 수 없이 도래했다"고 인정하면서도, 칩 단위 성능과 소프트웨어 생태계에서의 우위를 강조했다. 업계 분석가들은 화웨이의 클러스터 수준 성능 주장이 인상적이지만, 실제 워크로드에서의 검증이 필요하다는 입장이다.
TrendForce는 "화웨이가 최초로 해외에서 Atlas 950을 공개한 것은 글로벌 시장 진출 의지를 보여주는 강력한 신호"라고 평가했다.
전망
Atlas 950 SuperPod는 화웨이가 AI 인프라 시장에서 Nvidia의 독점에 도전할 수 있는 유력한 카드다. 특히 미국 제재에 영향받는 중국 기업들과 비동맹 국가들에게 매력적인 대안이 될 수 있다.
단, 성공 여부는 세 가지에 달려 있다.
- 실제 워크로드 성능 검증: 스펙상 수치가 실전에서 재현되는가
- 소프트웨어 생태계 성숙도: CANN이 CUDA 수준의 개발자 경험을 제공할 수 있는가
- 글로벌 고객 확보: 중국 외 시장에서 얼마나 채택되는가
2026년 4분기 정식 출시 이후의 벤치마크 결과와 초기 고객 반응이 AI 칩 전쟁의 향방을 가늠하는 중요한 지표가 될 것이다.