Mistral AI выпустил Voxtral TTS — текстово-речевую модель, которую компания называет «первой качественной открытой моделью для предприятий». Это важно, поскольку предприятия теперь могут полностью контролировать процесс генерации речи, не полагаясь на сторонние API-сервисы.
Конкуренция на рынке голосовых AI
Рынок голосового AI активно растёт: в 2026 году его объём превысит $22 миллиарда, а сегмент голосовых агентов достигнет $47,5 миллиарда к 2034 году. Главное внимание уделяется таким игрокам, как ElevenLabs и IBM. Только на этой неделе IBM объявила о сотрудничестве с ElevenLabs для интеграции голосовых возможностей в платформу WatsonX Orchestrate. В это время Mistral AI с Voxtral TTS делает шаг в сторону, предлагая открытые весы модели, что непременно изменит правила игры.
Инновации Voxtral TTS
Voxtral TTS имеет 3 миллиарда параметров и проектировалась с акцентом на эффективность: она в три раза меньше, чем стандартные решения на рынке. Время генерации первой аудиоформы составляет всего 90 миллисекунд, и модель работает до шести раз быстрее реального времени. Пользователи могут запускать её на любом ноутбуке или даже смартфоне, если учесть, что для работы требуется всего 3 ГБ ОЗУ.
По словам Пьера Стока, вице-президента Mistral, открытость модели — это ответ на запросы клиентов, стремящихся к большему контролю над используемыми технологиями: «Мы видим звук как ключевой интерфейс для всех AI-моделей». Кроме того, модель поддерживает девять языков: английский, французский, немецкий, испанский и другие.
Преимущества для бизнеса
Для российских компаний Voxtral TTS открывает новые горизонты. Высокая скорость и эффективность модели позволяют использовать её в реальном времени, что особенно полезно для тех, кто работает в области разработки голосовых помощников и приложений. Это также может стать дополнительным конкурентным преимуществом для стартапов в сфере AI, где зависимость от сторонних решений становится проблемой.
На горизонте — возможность интеграции Voxtral TTS в мощные AI-стэки. Следующие обновления Mistral могут включать расширение функционала модели, что позволит пользователям экономить время и ресурсы.

