본문으로 건너뛰기
HOTAIFUNDING

SAP의 €1B AI 더블 인수: Prior Labs와 Dremio로 표 데이터 시대를 열다

9 MIN READBY JJY
#SAP#Prior Labs#TabPFN#Dremio#tabular foundation models#AI 인수#Apache Iceberg#Frank Hutter

핵심 요약

SAP가 같은 날 두 건의 AI 인수를 발표했습니다. 5월 4일, 독일 프라이부르크의 Prior Labs와 캘리포니아의 Dremio를 동시에 사들인다고 공식화했습니다. Prior Labs에는 향후 4년간 €10억(약 $11.6억) 이상을 투자해 유럽의 프론티어 AI 랩으로 키운다는 그림입니다. Dremio는 Apache Iceberg 기반 데이터 레이크하우스로, SAP Business Data Cloud의 비SAP 데이터 통합을 맡습니다. 두 거래 모두 2026년 3분기 마감 예정입니다.

관련 글: Sierra $950M 시리즈 E, Anthropic 금융 에이전트 10종

표 데이터를 노린 SAP의 더블 인수

SAP는 이번 인수를 "에이전틱 AI 시대를 위한 데이터 플랫폼 완성"이라고 표현했습니다. 두 회사는 하는 일이 정반대로 보이지만, SAP의 그림에서는 한 묶음입니다.

항목Prior LabsDremio
분야표(tabular) 데이터 AI 모델오픈 데이터 레이크하우스
본사독일 프라이부르크미국 캘리포니아 산타클라라
창업2024년 (18개월)2015년
핵심 기술TabPFN 시리즈Apache Iceberg 네이티브 쿼리 엔진
거래 조건€10억+ 4년 투자비공개 (2022년 기준 $20억 가치 평가)
마감 예정Q2~Q3 2026Q3 2026
SAP 내 역할독립 AI 랩 (Frontier Lab)SAP Business Data Cloud 통합

핵심 발상은 이렇습니다. 기업의 가장 가치 있는 데이터는 PDF나 채팅 로그가 아니라 ERP, CRM, 회계 시스템의 행과 열에 있다는 것. 그런데 LLM은 이 영역에서 약합니다. SAP는 표 데이터를 잘 다루는 모델(Prior Labs)과, 그 모델이 SAP 안팎의 데이터를 직접 읽을 수 있는 통로(Dremio)를 동시에 산 셈입니다.

Christian Klein SAP CEO는 발표문에서 "전 세계 비즈니스 트랜잭션의 80%가 SAP 시스템을 거친다"는 점을 다시 한번 강조했습니다. 그 데이터 위에 자체 프론티어 AI를 얹겠다는 의지입니다.

TabPFN: LLM이 못 하는 일을 하는 모델

Prior Labs의 핵심 자산은 TabPFN(Tabular Prior-Data Fitted Network)입니다. Frank Hutter(프라이부르크대 머신러닝 교수, 휴직 중), Noah Hollmann, Sauraj Gambhir가 2024년에 공동 창업했고, 모델 시리즈는 2025년 Nature에 「Accurate predictions on small data with a tabular foundation model」 제목으로 게재됐습니다.

기존 표 데이터에서는 XGBoost, LightGBM 같은 트리 기반 앙상블이 표준이었습니다. TabPFN은 이 자리를 노립니다.

TabPFN의 작동 방식

항목기존 GBDT (XGBoost 등)TabPFN
학습 방식데이터셋마다 처음부터 학습사전학습된 모델로 추론만 수행
사전학습 데이터없음약 1.3억 개 합성 데이터셋
작은 데이터 강점과적합 위험메타학습으로 일반화
추론 시간튜닝 포함 수 시간단일 forward pass
모델 형태트리 앙상블트랜스포머

Nature 논문에 따르면 TabPFN은 1만 샘플 이하 데이터셋에서 4시간 튜닝한 강력한 베이스라인 앙상블을 단 2.8초 만에 능가했습니다. 핵심은 "데이터셋마다 학습"이 아니라 "사전학습된 일반화 알고리즘으로 추론"하는 패러다임 전환입니다.

TabPFN-2.5와 그 이후

Prior Labs는 Nature 발표 이후에도 빠르게 모델을 키웠습니다.

  • TabPFN-2.5: 데이터 셀 기준 v2 대비 20배 확장. 5만 샘플, 2,000 피처까지 처리. AutoGluon 1.4(4시간 튜닝 앙상블)와 정확도 동등.
  • TabPFN-2.6: TabArena 벤치마크 1위(발표 시점 기준).
  • 오픈소스 다운로드: 누적 300만 건 이상.
  • 연구진: Google, Apple, Amazon, Microsoft, G-Research, Jane Street, Goldman Sachs, CERN 등에서 영입.

Balderton Capital의 James Wise 파트너는 이번 거래를 "독일 역사상 가장 큰 벤처 엑시트 중 하나"라고 평가했습니다.

Dremio: Apache Iceberg 레이크하우스

Dremio는 데이터 레이크 위에서 직접 SQL 쿼리를 돌리는 엔진입니다. 2022년 라운드에서 $20억 기업가치를 인정받았고, 이번 거래의 금액은 공개되지 않았습니다.

SAP가 Dremio를 산 이유는 단순합니다. SAP Business Data Cloud(BDC)는 SAP 시스템 데이터를 잘 다루지만, 비SAP 데이터(Salesforce, Snowflake, AWS S3 등)와 결합하려면 ETL 파이프라인을 거쳐야 했습니다. Dremio가 들어오면 BDC가 Apache Iceberg 네이티브 레이크하우스로 변환되고, 비SAP 데이터를 복제 없이 쿼리할 수 있습니다.

Christian Klein은 "에이전틱 AI에는 통합된 데이터 기반이 필요하다"고 표현했습니다. 결국 Prior Labs의 모델이 SAP 안팎의 모든 표 데이터를 직접 읽으려면 Dremio 같은 레이어가 필수라는 계산입니다.

다만 시장에서는 다른 시각도 나옵니다. Gartner의 분석 노트는 "SAP가 SAP 승인 아키텍처(NemoClaw 등)에만 BDC API 접근을 허용하는 정책을 강화하고 있다"는 점을 지적했습니다. 통합과 동시에 폐쇄성이 강해질 수 있다는 우려입니다.

시장 반응과 회의론

SAP 주가는 흔들렸다

발표 직후 SAP 주가는 하락 압력을 받았습니다. 독일 ad-hoc-news 보도에 따르면 €10억 투자 약속과 배당 정책 수정이 겹치면서 단기 EPS 희석 우려가 부각됐습니다. 일부 애널리스트는 "유럽 AI 주권 내러티브로는 좋지만, 즉각적 매출 기여는 제한적"이라고 평가했습니다.

유럽 AI 랩 구도의 재편

이번 인수로 유럽 AI 랩 지형이 다시 그려집니다.

  • Mistral AI (프랑스): LLM 중심, 오픈웨이트 + Le Chat.
  • Aleph Alpha (독일): 엔터프라이즈 LLM에서 데이터 운영 플랫폼으로 전환 중.
  • Prior Labs (독일, SAP 산하): 표 데이터 전용 파운데이션 모델.

세 회사가 노리는 시장이 다르다는 점이 흥미롭습니다. SAP의 베팅은 "LLM 군비 경쟁에 직접 뛰어들지 않고, 옆 시장을 차지한다"는 쪽입니다.

회의적 시선

가장 큰 의문은 독립성입니다. SAP는 Prior Labs를 "독립적 단위로 운영"하겠다고 약속했지만, €10억을 투입하는 모기업이 연구 방향에 영향을 주지 않기는 어렵습니다. Frank Hutter가 학계에서 쌓아온 평판을 SAP의 제품 로드맵에 어디까지 양보할지가 관전 포인트입니다.

또 다른 우려는 GBDT 진영의 반격입니다. XGBoost와 LightGBM은 여전히 산업 표준이고, 큰 데이터셋에서는 TabPFN보다 빠른 경우도 있습니다. 1만~5만 샘플 구간에서의 강점이 100만 행 ERP 테이블에서도 유지될지는 별도 검증이 필요합니다.

전망 (필자의 시각)

이번 인수에서 흥미로운 부분은 SAP가 "또 다른 LLM"을 사지 않았다는 점입니다. Mistral 인수설이 한 차례 돌았지만, 결국 SAP가 고른 카드는 표 데이터에 특화된 작은 회사였습니다.

이 선택이 옳았는지는 두 가지로 갈립니다.

첫째, 엔터프라이즈 데이터의 본진은 정말로 표 안에 있습니다. 재무, 인사, 공급망, CRM. 이 영역에서 LLM은 부정확하거나 과잉 비용이 듭니다. TabPFN 같은 전용 모델이 1만~5만 행 단위에서 4시간 튜닝 앙상블을 초 단위로 따라잡는다면, SAP 고객사 입장에서는 즉각적 가치입니다.

둘째, 그러나 BDC가 충분히 빠르게 통합되지 않으면 이번 인수는 "값비싼 아카데믹 랩 후원"으로 끝날 수 있습니다. Dremio 통합 일정, NemoClaw API 정책, 그리고 Prior Labs의 학계 협업 유지 여부가 향후 18개월의 관전 포인트입니다.

개인적으로는 LLM 경쟁에 지친 엔터프라이즈 시장에서 "표 데이터 AI"라는 카테고리가 처음으로 분명한 정체성을 갖게 됐다는 점이 가장 의미 있다고 봅니다. 2027년 즈음에는 "tabular foundation model"이라는 단어가 표준 용어로 자리 잡을지도 모릅니다.

참고

Share
JJY
// AUTHORJJY

AI · WEB SECURITY · DEV ENV

GH

새 글 알림 받기

스팸 없이 새 포스트만 전달합니다.

// RELATED

관련 포스트