Project Glasswing за первый месяц работы, по данным участников проекта, помог найти более 10 000 high и critical уязвимостей. Для рынка это важный сигнал: ИИ в кибербезопасности перестаёт быть красивой презентацией и начинает менять экономику поиска 0-day, а значит и повседневную работу команд ИБ, разработчиков и владельцев продуктов.
О кейсе сообщает Habr / Карьера со ссылкой на публикацию Валерия Линькова, наставника курсов по ИБ в Яндекс Практикуме. В центре истории две сущности: закрытая модель Claude Mythos Preview и коалиция Project Glasswing, в которую вошли AWS, Apple, Google, Microsoft, CrowdStrike, NVIDIA, Palo Alto Networks, Cisco, Broadcom, JPMorganChase, Linux Foundation и ещё ряд организаций. По описанию Anthropic, модель не стали выпускать в открытый доступ, потому что она способна автономно искать уязвимости в массово используемом ПО, строить цепочки эксплуатации и генерировать рабочие proof-of-concept эксплойты.
Главная причина шума понятна. Обычно разговор об offensive AI быстро уходит в жанр страшилок про «машину, которая сама всех взломает». Но в этой истории важнее не апокалипсис, а цена процесса. Если раньше глубокий поиск memory corruption, use-after-free и сложных RCE был уделом узкой группы дорогих специалистов, то теперь стоимость такого ресёрча, похоже, резко падает. Это и есть неприятный для отрасли сдвиг: не магический суперхакер, а ускорение и удешевление наступательной кибербезопасности.
По заявлениям Anthropic, Mythos умеет делать то, что раньше требовало сложной агентной обвязки: находить RCE, собирать exploit chain и выпускать рабочие PoC после длинной автономной сессии. В статье приводится особенно громкая цифра: на бенчмарке Firefox 147 модель якобы создала 181 рабочий эксплойт, тогда как Claude Opus 4.6 справился только с двумя. Это звучит как скачок масштаба, но здесь нужен холодный душ. Значительная часть данных пока исходит от самой Anthropic и участников Project Glasswing, а независимых сравнений мало. Поэтому воспринимать Mythos как окончательно доказанного «автономного ИИ-пентестера» рано. Зато как индикатор направления, куда движется offensive AI, история выглядит более чем серьёзно.
Первый месяц Project Glasswing участники описывают цифрами, которые сложно игнорировать. Скорость поиска уязвимостей у многих команд выросла более чем в 10 раз. Cloudflare обнаружила около 2 000 багов, включая примерно 400 high и critical. Mozilla закрыла 271 уязвимость в Firefox 150, что более чем в десять раз превышает результат сопоставимого прошлого аудита. Среди находок, перечисленных в статье, фигурируют 27-летний баг в OpenBSD, 17-летняя unauthenticated RCE в FreeBSD и 16-летняя уязвимость в FFmpeg. Это важный нюанс: проблема была не в том, что эти системы никто не смотрел, а в том, что смотреть так глубоко и долго было слишком дорого.
Это не внезапная революция, а накопленный тренд
Project Glasswing выглядит как громкий переломный момент, но у него есть предыстория. В июне 2025 года система XBOW вышла на первое место в рейтинге HackerOne. В августе того же года Google Big Sleep автономно нашёл реальные zero-day в FFmpeg и ImageMagick. Тогда же DARPA AI Cyber Challenge показал поиск десятков уязвимостей в десятках миллионов строк кода за часы вычислений. В ноябре 2025 года Anthropic раскрыла, что китайская APT-группа использовала Claude Code в автономных offensive chain. В феврале 2026 года Trail of Bits заявила, что Claude Opus 4.6 превосходит Buttercup, систему-победителя DARPA-соревнования. На этом фоне апрельский анонс уже не выглядит одиночным фокусом. Скорее это момент, когда рынок перестал делать вид, что всё ещё находится на стадии лабораторных демо.
В статье отдельно выделены три характеристики Mythos, которые, если подтвердятся, действительно меняют правила. Первая — эксплойты без тяжёлого scaffolding: сопоставимый результат якобы достигается не через сложный оркестратор из агентов и инструментов, а значительно проще. Вторая — автоматическая сборка составных exploit chain, что особенно важно для современных браузеров и платформ, где одной уязвимости часто недостаточно. Третья — one-shot capability, то есть способность приблизиться к сценарию «один запрос — и на выходе готовый zero-day». Даже если в реальности всё сложнее и по-прежнему нужны runtime feedback, traces и контекст среды, сама степень автоматизации уже меняет порог входа.
Отсюда и нервная реакция части рынка. Фраза «ИБ умерла» хорошо разлетается по чатам, но плохо объясняет происходящее. Профессия не исчезает, исчезает прежний дефицит на ранней стадии атаки. Узкое место смещается из ручного поиска и анализа в валидацию находок, приоритизацию, выпуск патчей, развёртывание исправлений, управление риском и реагирование на инциденты. Эксплойт сам по себе не закрывает задачу злоумышленника: дальше идут lateral movement, persistence, кража данных, ransomware и много шумной операционной работы, которая оставляет телеметрию. Значит, detection engineering, IR, EDR/XDR, deception-подходы и Zero Trust не теряют смысл, а становятся ещё важнее.
Что это значит для разработчиков и бизнеса
Для русскоязычной IT-аудитории самый практичный вывод лежит не в области хайпа, а в области техдолга. Если описанная динамика сохранится, хуже всего придётся legacy-коду на C и C++, особенно там, где годами живут memory safety проблемы и где аудит откладывали под предлогом «и так работает». Project Glasswing показывает неприятную вещь: старые баги никуда не делись, просто раньше их поиск стоил дорого, а теперь становится дешевле. Для продуктовых команд это означает рост давления на secure SDLC, на инвентаризацию критичных компонентов, на работу с зависимостями и на более жёсткую дисциплину обновлений. Для бизнеса — необходимость считать не только стоимость защиты, но и стоимость медленного исправления того, что уже найдено.
У Anthropic, конечно, есть и PR-мотивация: заявление в духе «мы создали слишком опасную модель для открытого релиза» одновременно работает как маркетинг, как демонстрация ответственности и как заявка на контроль доступа к offensive AI. Но даже если отрезать от истории весь лишний пафос, остаётся неудобный факт: поиск уязвимостей становится быстрее, дешевле и масштабнее. Главный вопрос теперь не в том, заменит ли ИИ безопасников, а в том, какие команды успеют перестроиться раньше — те, кто ищет слабые места, или те, кто всё ещё согласует патчи неделями.