Google Gemini 3.1 Pro снова возглавил рейтинги производительности языковых моделей. Модель показывает сильные результаты в задачах логического мышления и создании SVG-графики, но пользователи жалуются на низкую скорость работы.
Особенно популярна модель стала среди фронтенд-разработчиков — когда им удаётся её запустить. Google массово блокирует аккаунты пользователей, которые используют подписку Google AI для работы с Gemini 3.1 Pro через сторонний сервис OpenClaw.
Революция в скорости ИИ
Стартап Taalas, которому всего 2,5 года, представил чип с встроенными весами модели Llama 3.1. Результат — 17 000 токенов в секунду на выходе. Для сравнения: Groq выдаёт ~600 токенов/сек, Cerebras — ~2000 токенов/сек.
Модель на чипе (команда называет её "кремниевая лама") практически неизменяема после производства, но поддерживает настраиваемые размеры контекстного окна и LoRA-дообучение. В тестах качество текста пока уступает оригиналу из-за агрессивного квантования, но главное доказано — любую ИИ-модель можно сделать в 10 раз быстрее и в 20 раз дешевле.
В планах Taalas — релиз версии для задач рассуждения и чипы с передовыми языковыми моделями.
Консалтинг не сдаётся ИИ
OpenAI заключил партнёрства с четырьмя крупнейшими консалтинговыми компаниями — BCG, McKinsey, Accenture и Capgemini. Цель — продвигать новую платформу "Frontier" для создания ИИ-сотрудников в корпорациях.
Ironия в том, что именно консалтинг многие считали первой жертвой ИИ-автоматизации.
Другие обновления
Anthropic обвинила китайских разработчиков в "краже" диалогов Claude для обучения собственных моделей. Это поднимает вопросы о двойных стандартах — ведь сама Anthropic обучала Claude на этих из интернета без согласия авторов.
Claude получил обновления для работы с кодом: поддержку git worktrees для параллельных агентов, предварительный просмотр запущенных приложений в десктопной версии и бета-функцию сканирования безопасности.
Практический вывод: Скорость генерации становится новым полем битвы ИИ-компаний. Если подход Taalas масштабируется, это кардинально изменит экономику применения языковых моделей в продакшене — от чат-ботов до code review.
Taalas планирует представить reasoning-версию своего чипа в ближайшие месяцы.