Пишу про AI Coding, помогаю разработчикам освоить AI, внедряю AI в бизнес, провожу консультации.

О канале https://t.me/the_ai_architect/2

Связь: @yatimur | Визитка: timurkhakhalev.t.me
Я тут попробовал agent team от Claude Code

Что это?

Это режим, в котором Claude выступает в роли оркестратора и создаёт агентов под ваши задачи – они общаются между собой, а оркестратор выступает их тим лидом.

Я дал им задачку: написать очень небольшой сервис из tg mini app и трёх бэкендов на nodejs, в сумме около 1.7k строк. Управлял балом Opus 4.6

Итог – они не справились(

Проблемы были типичные – бэкенд с фронтендом не стыковались, контракты расходятся, часть инструкций пропущено.

Для меня это было удивительно, потому что codex 5.3 в одно лицо и без субагентов справился с этим замечательно, хоть и пропустил парочку нюансов.

От agent team у меня вообще были ожидания, что теперь нам не придётся составлять ТЗ, планы, и оркестратор сам сообразит опросить пользователя, составить себе план, декомпозировать на задачи и раздать своим сотрудникам-агентам.
Но сейчас оно не справляется даже с подготовленным ТЗ.

Поэтому, осознанный процесс подготовки плана, декомпозиции на задачи и верификации выполненных задач всё ещё актуален, поэтому я об этом так много пишу и поэтому у меня есть целая двухчасовая лекция об этом, называется Plan & Act – Разбор работающего Workflow.

Тут я объясняю философию того, как нужно подходить к выполнению задач в условиях ai coding: прототипирование, планирование, декомпозиция, передача в работу, проверка.

Помимо этого, в этой лекции очень много концетрированной информации о моём опыте в ai coding.

Вам не обязательно применять этот подход 1 в 1 на практике, но это станет отличным стартом для организации своего собственного подхода к программированию с ИИ.

Посмотреть можно здесь.

#ai_coding@the_ai_architect

Лайк, репост,
✔️ Тимур Хахалев про AI Coding, подписывайтесь!
Переход к agentic software development

Грег Брокман, ко-фаундер OpenAI, заявил, что с 31 марта 2026, они в OpenAI переходят к agentic software development (агентной разработке ПО) и стремятся к следующему:
1) Для любой технической задачи инструментом первой необходимости для человека становится взаимодействие с агентом, а не использование редактора кода или терминала.
2) Стандартный способ использования агентов людьми явно оценивается как безопасный, но при этом достаточно продуктивный, чтобы для большинства рабочих процессов не требовались дополнительные разрешения.

Чтобы этого достичь, вот 6 рекомендаций команде от Грега

1️⃣ Найдите время, чтобы опробовать инструменты.
Многие люди останавливаются на размышлениях "А сможет ли агент справиться с этой задачей?" вместо того чтобы просто попробовать
• Назначьте "капитана по агентам" в вашей команде — человека, ответственного за продумывание того, как агенты могут быть внедрены в рабочий процесс команды.
• Делитесь опытом или вопросами в специально отведенных внутренних каналах.
• Выделите день для общекорпоративного хакатона по Codex.

2️⃣ Создавайте skills и файлы AGENTS[.md].
Для любого проекта, над которым работаете.
• обновляйте AGENTS[.md] всякий раз, когда агент делает что-то не так или испытывает трудности с задачей.
• прописывайте skills для всего, что вы поручаете агенту, и сохраняйте их в репозитории.

3️⃣ Проведите инвентаризацию и сделайте доступными любые внутренние инструменты.
• Ведите список инструментов, от которых зависит ваша команда, и убедитесь, что кто-то отвечает за обеспечение доступа к ним для агентов (например, через CLI или сервер MCP).

4️⃣ Структурируйте кодовые базы по принципу agent-first
• Пишите тесты, которые быстро запускаются, и создавайте качественные интерфейсы между компонентами.

5️⃣ Скажите нет slop`у.
Управление кодом, сгенерированным ИИ, в больших масштабах — это новая проблема, которая потребует новых процессов и соглашений для поддержания высокого качества кода.
• Убедитесь, что за любой код, попадающий в прод, несет ответственность конкретный человек.
• Как ревьюер кода, поддерживайте как минимум ту же планку качества, что и для кода, написанного человеком, и убедитесь, что автор понимает, что именно он отправляет.

6️⃣ Работайте над базовой инфраструктурой.
obsevrability, loggin, monitoring

Основные инструменты становятся намного лучше и удобнее, но существует множество инфраструктурных вещей вокруг инструментов, которых пока не хватает: observability, отслеживание не только закоммиченного кода, но и лог действий агента, которые к нему привели, а также централизованное управление инструментами, которые могут использовать агенты.

Внедрение таких инструментов, как Codex – это не только техническое, но и глубокое культурное изменение со множеством последствий, с которыми ещё предстоит разобраться.

#ai_coding@the_ai_architect

Лайк, репост,
✔️ Тимур Хахалев про AI Coding, подписывайтесь!
Главный поклонник моделей openai в моем окружении, Макс Этихлид, наконец-то выложил пост со сравнением работы трёх актуальных sota моделей

● GPT-5.3 Codex - кодер, повседневный инструмент инженера
Шустрый, технически прошаренный, дотошный в исполнении выданных инструкций, но это именно исполнитель

● Opus 4.6 - вайб-генералист
Быстро что-то сделать с нуля, добавить не самую критичную фичу в существующий проект, но нужно держать в узде, если требуется внимательность и точные изменения

● GPT-5.2 - инженер
С ним надёжнее всего планировать, обсуждать варианты решений сложных проблем, и в целом держать проект под строгим контролем


Читать подробнее: часть 1, часть 2

#ai_coding@the_ai_architect

Лайк, репост,
✔️ Тимур Хахалев про AI Coding, подписывайтесь!
«Из 40 разработчиков оставили 10»: как российские компании режут косты и перестраивают разработку под AI

Я тут некоторое время назад провёл интервью со своим подписчиком. Он – CTO российского финтеха и технический партнёр в российском интеграторе.

Мы поговорили с ним о том, как будет выглядеть будущее IT сектора в России с приходом вайбкодинга.
По этому случаю я написал статью на Хабр, и это лишь первая часть, а будет ещё вторая.

В первой части про:
- ускорились в 15 раз с AI кодингом
- 30% кода в финтехе пишется с AI
- уволили 75% команды в интеграторе
- уволили 1500 айтишников в финтехе
- про безопасность
- про будущее разработки

Подробнее читайте здесь:

https://habr.com/ru/articles/994218/

Поддержите статью лайком, плиз!

Лайк, репост,
✔️ Тимур Хахалев про AI Coding, подписывайтесь! «Из 40 разработчиков оставили 10»: как российские компании режут косты и перестраивают разработку под AI
Opus 4.6 и Codex 5.3

Вчера с разницей в 10-15 минут OpenAI и Anthropic зарелизили свои новые модели.

Сильно в технические детали я погружаться не буду, об этом вы уже наверняка знаете из других источников, но вот что интересного могу сказать.

Opus 4.6 наконец получил 1M context window: тут мы с вами помним, что важен не размер, а умение им пользоваться. Антропики заявляют, что в тесте, где нужно найти ответы на 8 вопросов из огромного текста (256k и 1m tokens), opus 4.6 набирает 93/100 и 76/100 соответственно.

Неплохо!

Для сравнения, Sonnet 4.5 в этом же тесте набирает 10/100 и 18/100.
Gemini 3 Pro набирает 45/100 и 24/100 в этом же тесте.

Ещё один бенчмарк, который победил Claude Opus 4.6, стал Terminal-bench 2.0 – этот бенчмарк показывает, насколько хорошо агенты выполняют задачи в терминалах: от администрирования систем и отладки кода до научных вычислений и конфигурации устаревшего ПО.
Прошлым лидером был GPT 5.2 Codex, набрав 64.7/100, теперь Opus 4.6 его обогнал и набрал 65.4/100!

Ура! Новый мировой лидер!

Теперь, про Codex 5.3

Примерно через 10-15 минут после релиза Opus 4.6, ребята из OpenAI релизят новую модель для кодинга - GPT-5.3-Codex.

Результаты в Terminal-bench 2.0 - 77.3/100.

Да, вы всё правильно поняли.

Новый Claude Opus 4.6 побыл примерно 10-15 минут мировым лидером в этом бенчмарке.

Помимо этого, Codex 5.3 теперь тратит ещё меньше токенов, набирает ещё больше баллов в бенчмарках, работает примерно на ~50% быстрее своих собратьев.

Кодекса сделали ещё более умным и более болтливым – он теперь комментирует каждый свой шаг (ранее он просто делал всё молча).

---

Помимо обновлений модели, в Claude Code ещё завезли новую фичу – agent team. Это что-то вроде симуляции работы в команде – есть тим лид и есть подчинённые, со всеми вытекающими ("агент X почему то не выполнил работу.. надо выяснить почему", "не удалось заставить агента Y выполнить работу, сделаю её сам")

Зачем?

Чтобы выполнять работу ещё быстрее, потому что Claude сам будет оркестрировать агентов и параллелить задачи на них, а вы будете тратить ещё больше токенов за минуту времени))

Я решил провести тест новых моделей и фичи agent team

У меня есть один очень небольшой проект (примерно 2k loc), который состоит из 3-х бэкендов на nodejs и одного telegram mini app. Я попросил GPT-5.2 High описать проект в виде обычной ТЗшки, а затем, дать её в работу агентам и потом с помощью этого же gpt провести ревью и дать импровизированную оценку по 10-ти балльной шкале

1. gpt-5.3-codex high в codex app – выполнил задачу за 9 мин, по мнению GPT-5.2 High набрал 8/10. Из минусов - упустил пару моментов из ТЗ, но не сильно критичных. Не продумал безопасность (из ТЗ это было упущено).
Написал 1.7k строк кода

2. claude code с agent team под управлением opus 4.6 – выполнили задачу за 9 мин, по мнению нашего ревьювера набрали 5/10)) Допустили несколько критичных ошибок – расхождение в контрактах, упустили несколько нюансов из ТЗ.
Написали 1.6k строк кода

3. claude code с opus 4.6 без агентов – выполнил задачу за 7 минут, получил оценку 5/10)) Но я бы ещё балл от себя накинул, потому что прям критичных проблем было меньше, по сравнению с командой балбесов

Вот такие результаты!

Я думал, Ant'ы уже пощёлкали проблему с оркестратором, но оказывается что нет! Мой plan&act, оказывается, работает надёжнее. Надеюсь, agent team ещё допилят. Ну и жду теперь ответку на оркестратор от OpenAI.

А вы уже попробовали обновления? Что понравилось больше? Рассказывайте!

#ai_coding@the_ai_architect

Лайк, репост,
✔️ Тимур Хахалев про AI Coding, подписывайтесь!
Топ полезных постов канала за последнее время

▪️ Промпт для агента от самого создателя Claude Code, Бориса Черного — Code Simplifier

▪️ На 40% меньше токенов на E2E тесты — Agent Browser

▪️ Codex планирует, Claude Code пишет. Видео с практикой — Plan & Act

▪️ Skill от Vercel находит косяки в React-коде после вайбкодинга — React Best Practices

▪️ Из «так себе» в «красиво» за один промпт — Frontend Design Skill

▪️ Запускаем агента из агента через headless режим — Делегирование

▪️ Обёртка для тестов, которая не засоряет контекст выводом PASSED — Tests Output Suppress

▪️ 5 слов для старта — Как начать с субагентами

▪️ 10 советов по использованию Claude Code — от Бориса Черного, создателя Claude Code

Лайк, репост,
✔️ Тимур Хахалев про AI Coding, подписывайтесь!
Granola MCP

У лучшего meetings summary инструмента наконец-то появился mcp.

Позволяет подключить Granola к вашему любимому ai-чатику.

Кто не знает – Granola это инструмент для записи любых встреч (онлайн и оффлайн), с возможностью потом початиться с этим саммари, вытащить "следующие шаги" по встрече, собрать инсайты, пообщаться с предыдущими записями звонка (этого же собеседника) и тд

Можно подключать как к ChatGPT, Claude Desktop через коннекторы, так и к Claude Code и другим агентам (к codex у меня подключить не вышло).

Какие инструменты доступны?

1. query_granola_meetings
Natural language поиск по встречам
- Принимает запрос на естественном языке
- Ищет по контенту встреч (обсуждения, решения, action items)
- Возвращает ответ с цитатами-ссылками на заметки
- Лучший выбор для открытых вопросов типа "что обсуждали про X?"

2. list_meetings
Список встреч за период

3. get_meetings
Детали конкретных встреч по ID
- Возвращает:
- Приватные заметки
- AI-саммари
- Участники
- Полные метаданные

Ограничения:
- Нет доступа к папкам напрямую (поиск по папкам — через query)
- Нет доступа к календарю/будущим событиям
- Нет возможности редактировать заметки


Подключить в Claude Code


claude mcp add --transport http granola https://mcp.granola.ai/mcp


Пройти авторизацию:
1. Запустить Claude Code
2. /mcp
3. Зайти в granola mcp
4. Authenticate
5. Готово

Лайк, репост,
✔️ Тимур Хахалев про AI Coding, подписывайтесь!
Тимур Хахалев про AI Coding
Жгите все токены которые можете! Потому что дальше будет дороже Помните, как появился Uber, Яндекс Такси, сервисы доставки еды? По-началу, они демпинговали ценами, работали в убыток, но у них была одна цель - захватить рынок. Когда рынок уже захватили (спустя…
В комментах развернулось горячее обсуждение, так что ещё важно проговорить дисклеймер – братья, трогать траву не забывайте.

Я уже много мнений видел, что вайбкодинг вызывает зависимость, быстрый дофамин и вот это всё – по себе знаю.

Хочется всё успеть, но в сутках 24 часа, а важно ещё уделить внимание и своему здоровью и своей семье, так что не уходите с головой в это.

Для психологов открывается новая ниша – научи вайбкодера трогать траву 🙂
Жгите все токены которые можете!

Потому что дальше будет дороже

Помните, как появился Uber, Яндекс Такси, сервисы доставки еды? По-началу, они демпинговали ценами, работали в убыток, но у них была одна цель - захватить рынок. Когда рынок уже захватили (спустя 5-8 лет), цены подняли и начали зарабатывать, но нам (пользователям) это уже не очень приятно.

Так будет и с компаниями провайдерами AI. Сейчас они все работают себе в убыток.

Так что, пока у нас есть дешевые токены, я советую их использовать по-максимуму.

Экспериментируйте, учитесь, изучайте новое, чтобы понимать, как это работает и применять AI для решения своих задач, а когда цены поднимут, будем думать над оптимизацией.

Кстати, если кто не знает, "подписочные" программы очень сильно субсидируются провайдерами - я говорю про подписки Claude Code, Codex.
Так, например, тут выяснили, что подписка на CC за $100/месяц экономит от x10 до x37 в пересчёте на API-based usage.

На днях ещё OpenAI выпустили Codex desktop приложение (пока только для macos) и в честь этого ещё и увеличили лимиты на всех тарифах в 2 раза на 2 месяца, и открыли доступ для тарифов Free и Go ($8).

А Anthropic сегодня должны выпустить модель Claude Sonnet 5 и я ожидаю что выпустят ещё новый тариф. Думаю, что это будет тариф за $2000/месяц, т. к. Anthropic не любит компромиссы.

Поэтому, успейте всё это попробовать и сжечь все токены провайдеров!)

#ai_coding@the_ai_architect

Лайк, репост,
✔️ Тимур Хахалев про AI Coding, подписывайтесь!
Сегодня отмечается 1 год вайбкодингу.

Ровно год назад Andrej Karpathy опубликовал тот самый твит про вайбкодинг
(в моей локали твиттер показывает 3 февраля, но вестерны уже начали отмечать)

Так что поздравляю вас с годом вайбкодинга!

Я за этот год определил для себя нишу для своего канала и начал писать до 100% кода с ИИ.

Расскажите, что у вас поменялось за этот год в разработке и около?

#ai_coding@the_ai_architect
Карпати выдал базу. Полугодовалой давности

На прошлой неделе Andrej Karpathy опять накатал большой пост про AI coding. Я кратко разберу тезисы и дополню своим мнением

◾️ Андрей пишет, что он перешёл от 20% генерации кода агентами и 80% написания кода руками в ноябре, до обратной пропорциональности в декабре.
Да, этот человек в 3 февраля 2025 декларировал термин "вайбкодинг" (завтра отмечаем день рождения вайбкодинга, приходите на тортик)

Когда вы адаптируетесь, настроите всё под себя, научитесь этим пользоваться и осознаете, что модель может, а что — нет, вы сможете уже уверенно использовать AI coding, говорит Карпати.

◾️ IDE всё ещё нужен для контроля за работой агентов

Он упомянул самую частую категорию ошибок: модели делают за вас неверные предположения и просто продолжают работу на их основе без проверки.

Они также не умеют справляться со своим замешательством, не просят уточнений, не подсвечивают противоречия, не предлагают компромиссные варианты (tradeoffs), не возражают, когда следует, и всё ещё слишком подобострастны.

В моём опыте это решается предварительным планированием задачи с исследованием трейдоффов, а потом имплементацией кода.

◾️ Агенты никогда не устают, у них не падает моральный дух, они просто продолжают пробовать варианты там, где человек уже давно бы сдался, чтобы вернуться к задаче завтра.

Мы теперь понимаем, что выносливость — это ключевое "узкое горлышко" в работе человеков, и с появлением LLM оно была решено.


◾️
С AI мы можем решать задачи, за которые раньше никогда бы не взялись


Чаще всего это quality of life улучшения.

Например, я уже несколько таких задач закрыл, вот одна из них

◾️ Андрей советует не говорить агентам, что именно делать.

Просто дайте им definition of done, тесты, браузерные инструменты (например, agent-browser) в руки и дождитесь результата.


Смените подход с императивного на декларативный


◾️ С агентами, программирование стало более весёлым, потому что уходит много рутины, а остается творческая часть.

AI coding разделил инженеров на тех, кто любит писать код и тех, кто любит создавать продукты.


Я отношусь ко второму типу.

◾️ Карпати говорит о том, что у него уже понемногу начинает атрофироваться способность писать код вручную (у меня тоже).
Написание и чтение кода – это разные способности мозга


◾️ В 2026 году готовимся к "slopacolypse" по всем Github, Substack, arXiv, X, Instagram и всем соц. медиа.

Недавний хайп на clawd тому подтверждение.

В конце, Андрей задает несколько вопросов

1) Что станет с «10X инженером» — соотношением продуктивности между средним и топовым инженером? Вполне возможно, что этот разрыв вырастет очень сильно.

2) Вооружившись AI, станут ли генералисты всё чаще превосходить узких специалистов? AI намного лучше справляются с «заполнением пробелов» (микро-уровень), чем с глобальной стратегией (макро-уровень).

3) На что будет похож AI coding в будущем? Это как играть в StarCraft? В Factorio? Или как играть музыку?

4) Какая часть общества упирается в ограничения цифрового интеллектуального труда?


---

Если вы погружены в AI coding и находитесь в коммьюнити последние месяцев 6, то вряд ли что то из этого будет для вас открытием, но тем не менее, спасибо маэстро за то что подтвердил наш опыт.

#ai_coding@the_ai_architect

Лайк, репост,
✔️ Тимур Хахалев про AI Coding, подписывайтесь!
Кулинарные советы от создателя Claude Code, Бориса Черного

Он рассказывает, как его разрабы используют Claude Code

1️⃣ Делайте больше параллельно.
- 3–5 git worktrees одновременно, в каждом из них своя сессия Claude Code.
- коллеги также называют свои рабочие деревья и настраивают алиасы в терминале (`za`, zb, `zc`), чтобы переключаться между ними одним нажатием клавиши.

2️⃣ Plan mode
- один Claude Code (CC) пишет план, а затем второй в роли Staff-инженера проверяет его.
- как только что то идёт не так, ребята из команды сразу возвращаются в режим планирования и переделывают всё заново
- просите CC зайти в plan mode для этапов проверки кода

3️⃣ Инвестируйте в свой `CLAUDE.md`.
- «обнови свой CLAUDE.md, чтобы не повторять эту ошибку снова» после каждого исправления
- редактируйте CLAUDE.md со временем
- один инженер просит Claude вести папку с заметками для каждой задачи/проекта, обновляя её после каждого PR. Затем они просто ссылаются на неё в CLAUDE.md.

4️⃣ Создавайте свои skills и фиксируйте их в git.
— если вы делаете что-то чаще одного раза в день, превратите это в навык или команду.
— создайте команду /techdebt и запускайте её в конце каждой сессии, чтобы найти и вычистить дублирующийся код.
— настройте команду, которая синхронизирует данные из Slack, GDrive, Asana и GitHub за 7 дней в один дамп контекста.
— создавайте агентов в стиле «аналитика данных», которые пишут dbt-модели, проводят ревью кода и тестируют изменения.

5️⃣ Claude сам исправляет большинство багов.
– включите Slack MCP, вставьте тред с багом из Slack в Claude и просто скажите «fix». Переключение контекста больше не требуется.
- «иди исправь упавшие тесты CI»
– натравливайте Claude на логи Docker для поиска проблем в распределенных системах — он на удивление хорош в этом.

6️⃣ Прокачивайте промптинг.
- «погоняй меня по этим изменениям и не делай PR, пока я не пройду твой тест». Пусть Claude будет вашим ревьюером.
– «докажи мне, что это работает», и пусть Claude сравнит поведение основной ветки (`main`) и вашей ветки с фичей.
– после посредственного исправления скажите: «Зная всё, что ты знаешь сейчас, выбрось это и внедри по-настоящему элегантное решение».
– пишите подробные спецификации и убирайте двусмысленность перед передачей работы. Чем конкретнее вы будете, тем лучше будет результат.

7️⃣ Настройка терминала и окружения.
- команда использует ghostty
- используйте /statusline, чтобы настроить статус-бар: пусть он всегда показывает загрузку контекста и текущую ветку git.
- используйте голосовой ввод

8️⃣ Используйте субагентов.
– передавайте отдельные задачи субагентам, чтобы контекстное окно вашего основного агента оставалось чистым и сфокусированным.
- направляйте запросы на разрешения (permissions) к Opus 4.5 через хук — пусть он сканирует их на предмет атак и автоматически одобряет безопасные.

9️⃣ Используйте Claude для данных и аналитики.
bq CLI для получения и анализа метрик «на лету».
У команды есть skill для BigQuery, и все используют его для аналитических запросов прямо внутри Claude Code. Это работает для любой базы данных, у которой есть CLI, MCP или API.

1️⃣0️⃣ Обучение с Claude.
– включите стиль вывода «Explanatory» или «Learning» в /config, чтобы Claude объяснял причины своих изменений.
– попросите Claude создать визуальную HTML-презентацию, объясняющую незнакомый код.
– просите Claude рисовать ASCII-диаграммы новых протоколов и кодовых баз, чтобы помочь вам их понять.
– создайте навык для обучения по методу интервальных повторений: вы объясняете свое понимание, Claude задает уточняющие вопросы, чтобы заполнить пробелы, и сохраняет результат.

#ai_coding@the_ai_architect

Лайк, репост,
✔️ Тимур Хахалев про AI Coding, подписывайтесь!
Тимур Хахалев про AI Coding
Поначалу Codex кажется *гораздо* более медленным, но когда речь идет о качестве уровня production, он делает всё правильно и по высоким стандартам с первого раза — что в итоге экономит время. Конечно, от него получаешь КУДА меньше дофамина, потому что он…
Мои последние посты с упоминанием codex cli могут выглядеть как прогрев на новый воркшоп, но это не так. Я искрене восхищаюсь этим потрясающим симбиозом модели GPT 5.2 в своей родной упряжке codex cli и тем, насколько сложные задачи оно решает эффективно.

При этом, есть люди, которые пробовали модели GPT 5.2, но не заметили никакой эффективной отдачи от модели. (На скриншоте один из таких отзывов)

В 99% причина одна – они пользовались этой моделью через Cursor.

Я не знаю как авторам Cursor удается так поганить качество моделей, но они в этом профессионалы.

Вот, например, спустя 4 месяца после релиза, ребята прочитали методичку от OpenAI по тому, как правильно использовать модель GPT 5 Codex.

Но, судя по тому, как ужасно работает GPT 5.2 в Cursor, они ещё не дочитали эту методичку до конца.

При этом, я вижу, что люди всё же пробуют codex cli и потом понимают, что мы, свидетели этой секты, имели ввиду.

Вот вам типичный пример:

1. Стадия отрицания

меня не отпускает ощущение, что хвальбы Codex 5.2 в куче около-ИИ чатов - это какой-то пранк
да, модель сильная, но по шизофазии и рядом не стояла с Anthropic.


2. Спустя 16 дней, стадия принятия

я был не прав, когда говорил, что Opus > gpt-5.2. прям очень не прав. разница между ними как между Sonnet 4 (не 4.5) и Opus 4.5


3. Стадия преисполнения

gpt-5.2-codex заставляет меня верить в возможность фактически бесконечной разработки проекта только через ИИ-кодинг и без заглядывания в код


——

Ну, и отвечая на вопрос со скриншота о том, какие проекты пишутся с нейронками, скажу вот что.

Я на этой неделе провел интервью с одним своим подписчиком, он рассказывал про свой опыт работы с AI Coding в его компаниях и вот пример проекта, который они с командой написали с нейронками.

Расчет равновесия Нэша: Высоконагруженный алгоритм, переписанный с Python/C++ на Rust с прямым взаимодействием с CUDA (минуя L3 кэш и RAM). Достигнута производительность ~500 млн операций/сек.
Написано с помощью Claude Code (потрачено ~3 млрд токенов), поддерживается с Codex cli.

Интервью (текстовое) ожидайте на следующей неделе, там очень много мяса, вам точно будет интересно.

#ai_coding@the_ai_architect

Лайк, репост,
✔️ Тимур Хахалев про AI Coding, подписывайтесь!
Тут за последние пару месяцев тот самый Дядюшка Боб попробовал AI coding и рассказал об этом в своём X

Я на днях отследил его путь и по этому поводу написал статью на Хабр:

https://habr.com/ru/articles/990934/
(плюсаните статью, кто может, плиз)

TLDR: попробовал grok cli, сейчас на claude code.

Теперь я жду, когда он всё поймёт и попробует codex cli. Думаю, ему понравится.

#ai_coding@the_ai_architect

Лайк, репост,
✔️ Тимур Хахалев про AI Coding, подписывайтесь!
Топ-5 инсайтов по внедрению AI-разработки из личной практики

1️⃣ Гигиена контекста и субагенты
Качество Claude Sonnet критически падает после 70–80k токенов: начинаются пропуски логики и галлюцинации.

Решение: Субагенты. Выноси задачи в изолированные инстансы.
Метрика: Лимит задачи — 3-4 часа работы мидла (выходит, что одна задача занимает ~50-70k токенов).

2️⃣ Инфраструктура «Memory Bank»
AGENTS.md и системный промпт не подходят для всей базы знаний проекта.

Архитектура: Папка .memory-bank/ для правил кода и паттернов.
Эффект: Агент знает, куда пойти за необходимой информацией по проекту. Экономит контекст.

3️⃣ Детерминированный Feedback Loop
Никакого доверия модели. Агент должен проверять себя детерминированными инструментами.

Инструменты: Линтеры, Type-check, тесты.
Пайплайн: Код -> Линтер (ошибка) -> Авто-фикс агентом. Без этого — генерация неработающего кода.

4️⃣ Приоритет планирования (90/10)
Генерация кода без плана — сжигание бюджета.

Правило: 2-3 часа на архитектуру с рассуждающими моделями (GPT-5.* High).
ROI: Плохой план утраивает расход токенов на правки. Исправлять галлюцинации дороже, чем планировать.

5️⃣ Специализация моделей
Используй сильные стороны разных LLM:

Codex / GPT-5.*: Планирование, структура, следование инструкциям.
Claude (Sonnet): Написание кода, реализация ("рабочие руки").
z.ai GLM-4.7: Рутина и задачи с четким ТЗ (экономия бюджета).

#ai_coding@the_ai_architect

Лайк, репост,
✔️ Тимур Хахалев про AI Coding, подписывайтесь!
Какие задачи AI ускоряет и на сколько?

Anthropic пару недель назад выпустили новый экономический рисерч, и вот что мне показалось интересным

▪️ Чем выше уровень образования, требуемый для задачи, тем сильнее AI ускоряет работу. Задачи уровня средней школы ускоряются в 9 раз, а уровня колледжа — в 12 раз. Это подтверждает, что выгоду от AI получают в основном высококвалифицированные специалисты.

▪️ С ростом сложности надежность падает, но незначительно (с 70% для простых задач до 66% для сложных), поэтому общий эффект ускорения остается положительным.

▪️ Пользователи Claude выполняют задачи, требующие гораздо больше времени, чем предполагают синтетические бенчмарки

Тут разберём чуть подробнее

Бенчмарк METR показывает, что Sonnet 4.5 достигает успеха в 50% в задачах, которые занимают 2 часа у человека.

Исследователи Anthropic взяли данные своих пользователей, которые используют их API (в основном, это enterprise пользователи) и Claude.ai (пользователи продуктов Claude Desktop и Claude Code) и вот, что они обнаружили.

▪️ Enterprise пользователи достигают успеха в 50% задачах, которые занимают около 3.5 часов
▪️ Пользователи Claude.ai (Claude Code) достигают успеха в 50% задачах, которые занимают около 19 часов

Различие с данными бенчмарка METR исследователи объясняют разными методологиями подсчёта результатов.

В их сэмплах пользователи декомпозируют сложные задачи на маленькие шаги, создают feedback loop, который направляет Claude на нужный курс. А так же, исследователи говорят, что сэмплы содержат selection bias - юзеры дают Claude задачки, в которых уверены, что Claude их решит.

Но нам важно другое, здесь стоит обратить внимание именно на подход - декомпозируем задачи и даём feedback loop.
Это действительно повышает эффективность работы в AI coding, я об этом говорил весь прошлый год, и в том числе в моей лекции про подход Plan&Act.

Декомпозиция позволит проще оценивать и делегировать задачи, а feedback loop даст возможность проверять эти задачи сразу же, получать фидбек от системы и исправлять ошибки.

Если вы всё ещё не внедрили это у себя, то пора это сделать.

#ai_coding@the_ai_architect

Лайк, репост,
✔️ Тимур Хахалев про AI Coding, подписывайтесь!
Обновил template repository для тех, кто купил доступ к Claude Code Deep Dive и Plan & Act Разбор

- Улучшил работоспособность Stop hook для Claude Code
- Сделал раздел со скиллами более удобным, собрал там скиллы которые я использую сам, про которые писал на канале, а так же про те, которые не писал

Этот темплейт планирую и в будущем обновлять, так что можно заходить туда раз в неделю за новыми апдейтами
Продолжение мысли про кодинг агентов.

Когда говорят "агенты будут писать код", большинство слышит "агенты заменят разработчиков". Но правильное прочтение другое: работа смещается.

Десятилетиями основная работа в разработке была в переводе. PM формулирует что нужно → дизайнер переводит в макеты → разработчик переводит в код. Каждый этап перевода съедал время и создавал потери. Кто работал в больших командах, знает сколько всего теряется между "что имел в виду PM" и "что в итоге написал разработчик".

Сейчас этап перевода в код схлопывается. Агент берёт задачу, контекст, критерии — и выдаёт работающий код. Но работа никуда не исчезает. Она перетекает на края.

На один край — в начало. Что именно нужно сделать. Какую проблему решаем. Какие ограничения. Как поймём что получилось. Формирование задачи становится важнее, потому что агент действует напрямую из того, что ты ему дал.

На другой край — в конец. Ревью, тестирование, проверка что результат соответствует задаче. Когда агенты выдают много кода быстро, нагрузка на финальную проверку растёт.

И тут интересно посмотреть, кто реально под ударом. Все ждут, что AI ударит по технарям. Но под ударом оказываются конкретные типы людей во всех ролях.

Со стороны продактов — те, у кого всё в голове и всё через личные коммуникации. Они могут быть очень эффективны. Делиеврят хорошо, команда их любит, результаты есть. Но цифрового следа не оставляют.

Чтобы агенты помогали, всё должно быть оцифровано. Задачи, критерии приёмки, контекст, связь с фидбеком от пользователей. Не "я разрабу на созвоне объяснил", не "цели со стейкхолдерами на словах согласовал", не "ожидаемые метрики у меня в голове". Агент не может залезть тебе в голову. Агент не был на том созвоне. Агент видит только то, что записано. Если там ребус — он и сделает ребус.

Со стороны разработчиков — те, кто был чистым кодером. Получил спеку, написал код, закрыл тикет. Не вникал в задачу, не понимал зачем это пользователю, не думал о контексте. Просто переводил требования в синтаксис.

Именно этот перевод теперь делает агент. Быстрее и дешевле.

А вот разработчики, которые умеют разбираться в задаче, понимать бизнес-контекст, ревьюить чужой код (включая код агента), находить edge cases, тестировать — становятся ценнее. Потому что именно туда смещается работа.

Получается симметрия. Продакт, который умеет формулировать задачи письменно и оставлять контекст — ценнее того, кто договаривается голосом. Разработчик, который понимает что и зачем он делает — ценнее того, кто просто писал код по спеке.

Навыки, которые раньше считались "мягкими" или "бюрократией", становятся конкурентным преимуществом. А чисто технический навык перевода — обесценивается.

Работа не исчезает. Она требует других навыков. И это касается всех ролей в команде.
Хорошие мысли про то, кем теперь станут разработчики
Back to Top