Mistral Forge'우리 데이터로 우리 AI를' 시대가 열린다
Forge란 무엇인가
2026년 3월 17일, Mistral AI는 NVIDIA GTC에서 Forge를 발표했습니다. Forge는 기업이 자사 고유 데이터를 활용해 프론티어급 AI 모델을 직접 훈련할 수 있는 엔드투엔드 플랫폼입니다.
Mistral 공식 블로그에 따르면, Forge가 지원하는 훈련 라이프사이클은 다음과 같습니다.
- 데이터 파이프라인: 데이터 수집, 큐레이션, 합성 데이터 생성
- 사전 훈련(Pre-training): 기초 모델을 자사 도메인 데이터로 처음부터 훈련
- 사후 훈련(Post-training): SFT(지도 미세 조정), DPO(직접 선호 최적화), ODPO(오프라인 DPO) 등 정렬 기법 적용
- 강화학습: 사용자 피드백 기반 보상 모델 훈련
단순히 API를 제공하는 수준이 아닙니다. 모델 훈련의 전체 과정을 기업이 직접 제어할 수 있도록 설계된 플랫폼입니다.
기존 접근과 뭐가 다른가
현재 기업이 AI를 도입하는 방식은 크게 세 가지입니다. OpenAI나 Anthropic의 API를 호출하거나, 제공사의 파인튜닝 서비스를 이용하거나, 자체 팀을 꾸려 처음부터 모델을 만드는 것입니다.
Forge는 이 중간 지점을 정확히 공략합니다. TechCrunch에 따르면, Forge의 핵심 차별점은 포워드 디플로이 엔지니어(forward-deployed engineer) 모델입니다. Mistral의 엔지니어가 고객사에 직접 파견되어 함께 모델을 구축합니다. IBM이나 Palantir가 채택했던 컨설팅-기술 하이브리드 방식과 유사합니다.
VentureBeat는 이 접근이 "데이터 주권"을 중시하는 유럽 및 정부 고객에게 특히 매력적이라고 보도했습니다. 자사 데이터가 제3자 서버를 거치지 않고, 훈련된 모델의 가중치도 고객이 소유하기 때문입니다.
누가 쓰고 있나
Mistral이 공개한 초기 파트너 목록은 다양한 산업을 아우릅니다.
- 통신: Ericsson (5G 네트워크 최적화)
- 우주: 유럽우주국(ESA) (위성 데이터 분석)
- 컨설팅: Reply (이탈리아 IT 컨설팅)
- 국방/공공: 싱가포르 DSO 국방연구소, HTX (내무부 산하 기술청)
Futurum의 분석에 따르면, 이 파트너 구성은 Mistral이 정부, 금융, 제조, 기술 네 가지 수직 시장을 동시에 타겟팅하고 있음을 보여줍니다. 특히 정부 및 국방 고객이 초기 파트너에 포함된 것은, 데이터 주권이 단순한 마케팅 메시지가 아니라 실제 비즈니스 요구사항이라는 점을 시사합니다.
같은 날 Mistral은 Forge와 함께 Mistral Small 4 모델도 공개했습니다. MLQ AI에 따르면, Small 4는 Forge 플랫폼에서 커스터마이징의 베이스 모델로 활용될 수 있습니다.
전망
Forge가 성공하려면 몇 가지 조건이 충족되어야 합니다. 개인적으로는 다음 세 가지가 관건이라고 봅니다.
첫째, 포워드 디플로이 엔지니어의 확장성입니다. 인력 기반 모델은 품질은 높지만 동시에 서비스할 수 있는 고객 수에 한계가 있습니다. 고객이 늘어날 때 품질을 유지할 수 있을지가 과제입니다.
둘째, 비용 정당화입니다. 풀 커스텀 훈련은 API 호출이나 파인튜닝보다 초기 비용이 높습니다. ROI를 명확히 증명할 수 있는 사례가 쌓여야 합니다.
셋째, 오픈소스 경쟁입니다. DeepSeek, Meta Llama 등 강력한 오픈소스 모델이 계속 등장하고 있습니다. 기업이 직접 오픈소스 모델을 훈련하는 것과 Forge를 통해 Mistral 모델을 훈련하는 것 사이의 차이를 납득시켜야 합니다.
Dataconomy는 Forge를 "AI 인프라의 AWS 모먼트"라고 표현했습니다. 과장이 섞인 비유지만, 기업 AI 도입 방식이 API 호출에서 자체 모델 구축으로 이동하는 흐름 자체는 분명합니다. Forge가 그 전환점이 될지는 초기 파트너들의 성과가 결정할 것입니다.
참고