Core Loop

AI-first engineering at scale

Тема

Разработка на основе доказательств

Отсутствующая дисциплина в инженерии на основе ИИ

Дэниел Леблон март 2026 г.

Команды внедрили инструменты ИИ-кодирования, наблюдали краткосрочные скачки скорости, а затем платили налог за проверку позже при отладке, регрессиях и производственных инцидентах.

Разрыв не в поколениях. Разрыв тому подтверждение. Разработка, основанная на фактических данных, превращает этот пробел в повторяемый рабочий процесс с явными воротами.

Воспринимаемая скорость по сравнению с фактической скоростью (METR): +24% доверия по сравнению с -19% измеренной реальности.

Петля

Модель проста: определить намерение, доказать наличие пробелов, определить базовый уровень, реализовать, доказать успешность, получить результат и проверить параметры качества перед проверкой.

Критическим ограничением является последовательность. Шаги перед внедрением создают надежность; шаги после реализации создают доверие.

| Фаза | Что происходит | Почему это важно | | --- | --- | --- | | Документ | Напишите, что означает «сделано», перед реализацией. | Предотвращает дрейф требований и расплывчатые критерии успеха. | | Тест: провал | Определите и запустите тесты, которые докажут существование пробела. | Подтверждает, что вы тестируете поведение, а не предположения. | | Захват: До | Запишите исходные результаты, прежде чем приступать к реализации. | Предоставляет неоспоримые доказательства для рецензентов и будущих аудитов. | | Реализация | Примените изменения с помощью ИИ в условиях ограничений. | Исполнение остается быстрым, а планка остается определяемой человеком. | | Тест: Пройден | Запустите целевые тесты и убедитесь, что поведение прошло успешно. | Подтверждает изменение, решает точные критерии приемки. | | Захват: После | Соберите эквивалентные артефакты после изменений. | Включает очистку до/после сравнения. | | Проверить | Аудит безопасности, доступности, производительности, документации и отклонений. | Улавливает только тесты режимов отказа. | | Обзор | Рецензент-человек принимает или отвергает на основании доказательств. | Отчитывается перед инженерами, а не подсказывает. |

:::графическое имя: ImplementationLoopDiagram подпись: Цикл реализации: ограничения, определяемые человеком, выполнение с помощью ИИ. :::

Etap Chto proishodit Pochemu eto vazhno
Document Напишите, что означает «сделано», перед реализацией. Предотвращает дрейф требований и расплывчатые критерии успеха.
Тест: провал Определите и запустите тесты, которые докажут существование пробела. Подтверждает, что вы тестируете поведение, а не предположения.
Захват: До Запишите исходные результаты, прежде чем приступать к реализации. Предоставляет неоспоримые доказательства для рецензентов и будущих аудитов.
Implement Примените изменения с помощью ИИ в условиях ограничений. Исполнение остается быстрым, а планка остается определяемой человеком.
Тест: пройти Запустите целевые тесты и убедитесь, что поведение прошло успешно. Подтверждает изменение, решает точные критерии приемки.
Захват: После Соберите эквивалентные артефакты после изменений. Включает очистку до/после сравнения.
Verify Аудит безопасности, доступности, производительности, документации и отклонений. Улавливает только тесты режимов отказа.
Review Рецензент-человек принимает или отвергает на основании доказательств. Отчитывается перед инженерами, а не подсказывает.
Цикл реализации: ограничения, определяемые человеком, выполнение с помощью ИИ.

Прежде чем доказательства станут необратимыми на практике

Теоретически команды могут восстановить базовый уровень после начала реализации, но почти никто этого не делает. Импульс смещается в сторону движения вперед.

Вот почему отсутствие предшествующего доказательства рассматривается как условие сброса в дисциплинированных циклах.

:::графическое имя: MaturityLadder подпись: Модель зрелости: специальная разработка, проверенная аудитом. :::

Модель зрелости: специальная разработка, проверенная аудитом.

Audit: desyat izmereniy

Izmerenie Chto obnaruzhivaet
Build Компиляция, проверка и целостность пакета
Telemetry Утечки личных данных и небезопасные полезные данные журналирования
Accessibility Ориентиры, порядок клавиатуры, иерархия заголовков
Security Секреты, риск внедрения, недостатки зависимостей
Performance N+1 путей, неограниченные циклы, утечки памяти
Documentation Спецификация и дрейф реализации
Тестовое покрытие Поведение меняется без соответствующих тестов
TODO Долг Пропущенные последующие действия и неразрешенные заполнители
Обработка ошибок Проглоченные ошибки и утечка внутренних компонентов
Многословность ИИ Избыточные комментарии и ненужные абстракции
Позиция аудита до и после проверок на основе фактических данных.

Аудит: десять измерений

| Размерность | Что он ловит | | --- | --- | | Построить | Компиляция, проверка и целостность пакета | | Телеметрия | Утечки личных данных и небезопасные данные журналирования | | Доступность | Ориентиры, порядок клавиатуры, иерархия заголовков | | Безопасность | Секреты, риск внедрения, недостатки зависимостей | | Производительность | N+1 путей, неограниченные циклы, утечки памяти | | Документация | Спецификация и дрейф реализации | | Тестовое покрытие | Поведение меняется без соответствующих тестов | | TODO Долг | Пропущенные последующие действия и неразрешенные заполнители | | Обработка ошибок | Проглоченные ошибки и утечка внутренних компонентов | | Многословность ИИ | Лишние комментарии и ненужные абстракции |

:::графическое имя: AuditRadarChart caption: Состояние аудита до и после проверок на основе фактических данных. :::

Шаблон PR, обеспечивающий наличие наблюдаемых доказательств, результатов аудита и четких планов тестирования.

Primery dokazatelstv po domenam

Domen Do izmeneniy Posle izmeneniy
конечная точка API ответ на завиток с неправильным статусом ответ завитка с ожидаемым статусом и схемой
Миграция базы данных Запрос перед миграцией Запрос, показывающий новые столбцы и заполненные значения
Infrastructure Текущий плановый результат Желаемый план и применение результатов
Performance Базовый показатель Разница в тесте после оптимизации
Патч безопасности Поиск сканера Отчет об очистке сканера
Один и тот же цикл, разные артефакты, один стандарт качества.

Бремя доказательства в запросах на включение

На главную

Источники

  1. Кент Бек (2025) Расширенное кодирование: за пределами флюидов
  2. ThoughtWorks (2025) Разработка с использованием искусственного интеллекта
  3. METR (2025) Инструменты искусственного интеллекта сделали опытных разработчиков на 19% медленнее
  4. Адди Османи (2026) ИИ пишет код быстрее. Ваша задача — доказать, что это работает.
  5. Майкрософт .NET (2026) Десять месяцев с агентом кодирования Copilot в dotnet/runtime