ElevenLabs $500M ARR 돌파: BlackRock·NVIDIA가 선택한 음성 AI
핵심 요약
ElevenLabs가 2026년 5월 5일 $500M ARR 돌파를 공식 발표했다. 2025년 말 $350M이던 ARR이 불과 4개월 만에 43% 성장한 수치다. 동시에 BlackRock, NVIDIA, Wellington Management 등 기관 투자자와 Jamie Foxx, Eva Longoria, 황동혁 감독(오징어 게임)이 Series D 익스텐션에 참여했다. 총 투자액은 $550M을 넘어섰고, 밸류에이션은 2월 Series D 당시와 같은 $11B으로 유지됐다.
음성 AI 플랫폼이 실험에서 기업 인프라로 전환되고 있음을 보여주는 이정표다.
$500M ARR까지: 4개월, 43% 성장
2025년 말 ElevenLabs의 연간 반복 매출(ARR)은 $350M이었다. 그리고 2026년 4월 말 기준으로 $500M을 넘어섰다.
4개월 만에 $150M 성장. 비율로는 43%다. AI 인프라 스타트업 중에서도 이 속도로 ARR을 키운 사례는 드물다.
| 시점 | ARR | 변화 |
|---|---|---|
| 2025년 말 | $350M | 기준점 |
| 2026년 4월 | $500M+ | +43% |
성장을 이끈 주축은 엔터프라이즈 계약이다. TechCrunch는 6~7자리 규모의 기업 계약이 매출 상승의 핵심 동력이라고 보도했다. 소비자용 TTS 구독보다 대형 기업과의 장기 계약이 매출 안정성과 성장률 모두에 기여했다는 분석이다.
투자자로 합류한 NVIDIA, Salesforce Ventures, Santander, Deutsche Telekom은 동시에 ElevenLabs의 고객이기도 하다. 고객이 투자자가 되는 구조는 단순한 자금 유입이 아닌 제품 검증이다.
Series D 익스텐션: 세 종류의 투자자
ElevenLabs는 2026년 2월 Sequoia Capital 주도의 $500M Series D를 마감했다. Andreessen Horowitz와 ICONIQ Capital이 참여한 이 라운드에서 밸류에이션은 $11B으로 책정됐다.
5월 발표는 같은 Series D의 익스텐션이다. Tech.eu에 따르면 이번 추가 투자로 총 Series D 규모는 $550M을 넘어섰다. 새로 합류한 투자자들은 성격이 각기 다르다.
기관 금융자본: BlackRock, Wellington Management, D.E. Shaw, Schroders. 이들은 전통 자산운용사다. AI 스타트업에 대한 기관 자금의 직접 유입을 상징한다. BlackRock의 참여는 특히 주목할 만하다. 세계 최대 자산운용사가 음성 AI 인프라에 베팅한다는 의미이기 때문이다.
전략적 파트너: NVIDIA(NVentures), Salesforce Ventures, Santander, Deutsche Telekom. 이들은 ElevenLabs의 기술을 이미 운영 중인 기업들이다. NVIDIA 입장에서는 음성 AI 워크로드가 자사 GPU 수요를 확장하는 구조다. Salesforce는 CRM과 세일즈 자동화에 음성 에이전트를 통합하고 있다.
유명인 개인 투자자: 배우 Jamie Foxx, Eva Longoria, 황동혁 감독(오징어 게임), Matthew McConaughey(기존 투자자). 이 조합은 단순 마케팅 활용을 넘어 엔터테인먼트 산업의 음성 AI 수요를 반영한다. 영상 콘텐츠의 다국어 더빙, 오디오북, 광고 나레이션이 음성 AI의 새로운 성장 영역이다.
또한 임직원을 위한 $100M 규모의 주식 매입(tender offer)도 함께 진행됐다. 2025년 9월 $6.6B 밸류에이션에서 진행한 첫 매입에 이은 두 번째 라운드로, 핵심 인력 유지를 위한 조치다.
ElevenLabs의 제품 포트폴리오
ElevenLabs는 단일 TTS 서비스를 넘어 음성 AI 플랫폼으로 진화했다.
Text-to-Speech API: 핵심 제품. 다국어 실시간 음성 합성을 제공한다. 감정 표현과 억양 제어 수준이 경쟁 대비 높은 것으로 평가받는다.
Voice Cloning: 목소리 복제 기능. 짧은 샘플 오디오로 특정 인물의 음성을 재현한다. 광고, 오디오북, 교육 콘텐츠 제작사가 주로 사용한다.
Conversational AI Agents: 음성 기반 대화형 에이전트 플랫폼. Vapi, Retell AI와 경쟁하는 영역이다. 분당 $0.08~$0.12 수준으로 과금되며, 고객 지원 센터 자동화 수요가 크다.
ElevenReader: AI 음성으로 문서, 기사, 책을 읽어주는 소비자 앱. 530명의 팀이 50개국에 분산해 이 제품들을 운영 중이다.
고객 사례: 누가, 어디에 쓰는가
공개된 고객 사례를 보면 음성 AI의 기업 침투 범위가 넓어졌음을 알 수 있다.
Santander는 다국어 고객 응대 자동화에 ElevenLabs를 사용한다. 스페인어, 영어, 포르투갈어 등 여러 언어를 단일 파이프라인으로 처리한다. Deutsche Telekom은 콜센터 대화 자동화에 적용했다. KPN(네덜란드 최대 통신사)은 대용량 트래픽 처리에 활용 중이다.
광고 영역에서는 다국어 버전 자동 제작 수요가 크다. 한 번 녹음된 광고 오디오를 수십 개 언어로 변환하는 데 수주가 걸리던 작업이 몇 분으로 줄었다.
경쟁 구도: 위협은 실재한다
음성 AI는 ElevenLabs의 독무대가 아니다.
OpenAI는 TTS API를 GPT-4o와 통합해 제공한다. 실시간 음성 대화 기능은 ChatGPT의 핵심 기능이 됐다. Google은 WaveNet과 Chirp 3를 Workspace와 Google Cloud에 묶어 판매한다. Amazon Polly는 AWS 생태계 내 기본 TTS다.
이들의 공통점은 대형 플랫폼 번들 전략이다. 기존 플랫폼 계약에 음성 기능을 추가하면 별도 서비스 계약 없이 이용 가능하다. 이것이 ElevenLabs 같은 독립 음성 AI 플랫폼에게 구조적 위협이다.
Futurum Research는 이를 "platform wars"라는 키워드로 분석했다. 독립 음성 AI가 살아남으려면 품질과 통합 깊이에서 명확한 우위를 유지해야 한다. 현재는 그 우위가 유효하다는 게 시장의 판단이다. 하지만 경쟁이 빨리 좁혀지는 업계다.
전망
$500M ARR과 BlackRock의 참여는 음성 AI가 실험을 넘어섰다는 신호다. 기관 자금은 가능성이 아닌 현금 흐름을 보고 움직인다.
ElevenLabs가 마주할 다음 질문은 두 가지다. 첫째, 대형 플랫폼이 음성 기능을 번들로 강화할 때 ARR 성장세를 유지할 수 있는가. 둘째, $11B 밸류에이션이 내포하는 미래 기대치를 실적으로 채울 수 있는가.
NVIDIA가 투자자로 들어온 것은 인상적이다. GPU 수요와 음성 AI 워크로드의 연결을 NVIDIA 자신이 인정한 구조다. 이 전략적 정렬이 하드웨어에서 소프트웨어로 이어지는 AI 인프라 생태계의 실질적인 모습이다.
2026년 하반기 Google I/O와 OpenAI의 음성 강화 일정이 ElevenLabs에게 진짜 테스트가 될 것이다. 지금의 $500M ARR 기세가 그 압력을 버텨낼 수 있는지, 연말 수치가 답을 줄 것이다.
참고