AI И НЕЙРОСЕТИ

Google Gemini 3.1 Pro возглавил бенчмарки, но появился конкурент в 30 раз быстрее

Google Gemini 3.1 Pro снова лучший в тестах, но стартап Taalas создал чип с Llama 3.1 со скоростью 17k токенов/сек против 600 у Groq

✍️ Редакция iTech News | 10.03.2026 | ⏱ 2 мин | 👁 1

Google Gemini 3.1 Pro снова возглавил рейтинги производительности языковых моделей. Модель показывает сильные результаты в задачах логического мышления и создании SVG-графики, но пользователи жалуются на низкую скорость работы.

Особенно популярна модель стала среди фронтенд-разработчиков — когда им удаётся её запустить. Google массово блокирует аккаунты пользователей, которые используют подписку Google AI для работы с Gemini 3.1 Pro через сторонний сервис OpenClaw.

Революция в скорости ИИ

Стартап Taalas, которому всего 2,5 года, представил чип с встроенными весами модели Llama 3.1. Результат — 17 000 токенов в секунду на выходе. Для сравнения: Groq выдаёт ~600 токенов/сек, Cerebras — ~2000 токенов/сек.

Модель на чипе (команда называет её "кремниевая лама") практически неизменяема после производства, но поддерживает настраиваемые размеры контекстного окна и LoRA-дообучение. В тестах качество текста пока уступает оригиналу из-за агрессивного квантования, но главное доказано — любую ИИ-модель можно сделать в 10 раз быстрее и в 20 раз дешевле.

В планах Taalas — релиз версии для задач рассуждения и чипы с передовыми языковыми моделями.

Консалтинг не сдаётся ИИ

OpenAI заключил партнёрства с четырьмя крупнейшими консалтинговыми компаниями — BCG, McKinsey, Accenture и Capgemini. Цель — продвигать новую платформу "Frontier" для создания ИИ-сотрудников в корпорациях.

Ironия в том, что именно консалтинг многие считали первой жертвой ИИ-автоматизации.

Другие обновления

Anthropic обвинила китайских разработчиков в "краже" диалогов Claude для обучения собственных моделей. Это поднимает вопросы о двойных стандартах — ведь сама Anthropic обучала Claude на этих из интернета без согласия авторов.

Claude получил обновления для работы с кодом: поддержку git worktrees для параллельных агентов, предварительный просмотр запущенных приложений в десктопной версии и бета-функцию сканирования безопасности.

Практический вывод: Скорость генерации становится новым полем битвы ИИ-компаний. Если подход Taalas масштабируется, это кардинально изменит экономику применения языковых моделей в продакшене — от чат-ботов до code review.

Taalas планирует представить reasoning-версию своего чипа в ближайшие месяцы.

Поделиться: Telegram X LinkedIn