8–9 из 10 планов, которые собирает AI-пайплайн, рассыпаются уже на втором шаге. Именно так автор текста на Habr описывает автоматизацию разработки, которая обещала разгрузить голову, а в итоге превратила рабочий день в бесконечный допрос агентов, проверку допущений и охоту на аккуратно оформленные миражи.
По данным Habr / Карьера, речь не о теоретическом споре про будущее профессии, а о вполне приземлённой практике одного разработчика, который почти перестал писать код руками и передал значительную часть работы агентам в Claude Code и Codex. Его сетап выглядит как мечта любителя делегирования: параллельно работают пять и больше агентов, под задачу собирается мини-команда, в течение дня прокручиваются десятки мелких и средних поручений. На обслуживание этой схемы уходит три подписки по 200 долларов в месяц и ещё несколько дополнительных сервисов. Но обещанного эффекта «нажал кнопку и освободил мозг» не случилось. Узкое место просто переехало: раньше человек упирался в скорость написания кода, теперь упирается в объём внимания, которое требуется, чтобы всё это не уехало в стену с уверенным видом.
Ключевая мысль текста неприятна именно потому, что она слишком узнаваема для рынка. Автоматизация разработки действительно увеличивает пропускную способность, но не избавляет от необходимости разбираться в происходящем. Автор описывает свою работу не как программирование, а как постоянную проверку: откуда агент взял вывод, где именно в коде это подтверждается, почему выбран именно такой путь, а не другой. Делегировать можно почти всё, кроме внимания. Эта формула хорошо бьёт по текущему мифу о том, что AI-ассистенты превращают одиночного разработчика в автономный завод по выпуску фич. На практике они чаще превращают его в менеджера, ревизора и диспетчера сразу в одном лице.
Самые сильные места в исходной истории — цифры и сбои, которые трудно списать на эмоции. Автор пишет, что 8–9 из 10 планов, подготовленных пайплайном, выглядят логично только на бумаге: в основании часто лежит одно непроверенное допущение, а сверху уже выстроена аккуратная башня выводов со ссылками на файлы и шагами внедрения. Был и другой эпизод: «простое» приложение для переписывания собственного текста по шаблону дважды сожгло недельный лимит Claude Max, а на выходе осталось нерабочее решение. Важная оговорка здесь тоже есть: автор не сваливает вину на инструмент, а прямо признаёт, что сам плохо декомпозировал задачу и ждал чуда от расплывчатой постановки. Для тех, кто внедряет AI в разработку, это, пожалуй, главный практический вывод: модель часто ошибается не в локальном рассуждении, а в системе координат, которую ей задал человек.
Ещё показательнее история с автономным прогоном на двое суток. Агент удалил единственную дев-базу, которую внутри проекта по шутке называли продом, а затем зациклился на одном файле и часами полировал тупиковое направление с полной уверенностью, что движется к цели. Формально это тоже не история про «плохой AI». Это история про отсутствие изоляции, резервной копии и нормальных ограничений на автономное выполнение. Но бизнесу и командам от этого не легче. Когда агент без присмотра способен выжечь до 80% недельного лимита, проблема уже не только в стоимости токенов. Хуже другое: к концу такого прогона на столе лежит массив результата, к которому человек не прикасался вниманием. Проверять его приходится почти с нуля, а нить реализации уже потеряна.
Попытка защититься дополнительными слоями контроля тоже не выглядит серебряной пулей. Автор описывает собственную систему скептиков, критиков и аудиторов, которые должны ловить ложные выводы других агентов. В одном из кейсов такой скептик нашёл в спецификации четыре миража и два непроверенных утверждения, а критик оценил документ как REVISE с результатом 16 из 25. Казалось бы, контур самопроверки работает. Проблема в том, что он не гарантирует полноту. В другом эпизоде отдельный агент во время одного ревью трижды подряд уверенно сообщил неверные факты: что в базе нет записей о попытках, что нужный инструмент не подключён, и что проблема находится не там, где она была на самом деле. Для разработчиков здесь нет новой магии, но есть старая инженерная правда в новом интерфейсе: исполнитель не должен проверять сам себя, а проверяющий тоже не застрахован от ошибки. Set-and-forget в этой зоне не получилось.
На этом фоне особенно любопытно звучит не технический, а профессиональный вывод автора. Он пишет, что вырос не как инженер, а как менеджер агентов, и не считает это карьерным повышением. Раньше код проходил через руки и по определению оставался в голове; теперь реализация всё чаще проходит мимо человека, а ему остаётся бегать следом и проверять доказательства. Для русскоязычной IT-аудитории это болезненный, но точный разворот разговора: автоматизация разработки меняет не только стек и процессы, но и саму идентичность специалиста. Если раньше ценностью было умение быстро и качественно писать, то теперь всё чаще решает способность декомпозировать, ограничивать автономию, проверять выводы и не влюбляться в красиво оформленный ответ.
Из этой истории пока не следует, что AI-агенты в разработке переоценены или бесполезны. Следует другое: чем больше команда автоматизирует, тем дороже становится человеческое внимание и тем жёстче нужны дисциплина, изоляция и независимая проверка. Похоже, главный риск ближайших лет не в том, что рынок поверит модели больше, чем инженеру, а в том, что сам инженер устанет сомневаться и начнёт верить ей больше, чем собственной проверке.