Сергей Андриянов — наш CTO в AlpinaGPT. Рассказал про четыре уровня сложности ИИ-систем и где проходит граница разумного.
Есть правило от Anthropic (создатели Claude): один агент с пятью инструментами работает лучше пяти отдельных. Каждый лишний уровень — плюс к задержке, стоимости и риску отказа.
И тут фундаментальная проблема, о которой мало говорят. Если каждый шаг в цепочке работает с точностью 90% — вроде отлично, да? Но после нескольких шагов точность падает до 78-80%. Ещё пять шагов — до 50%. Каждая попытка это исправить увеличивает стоимость. Вот это меня зацепило — красиво на бумаге, дорого в реальности.
Задача: пользователь редактирует изображение и хочет откатиться на пару шагов назад. Очевидное решение — передавать всю историю — не работает: картинки быстро забивают контекст.
Решение — три агента с чётким разделением. Один анализирует, что хочет пользователь (новая картинка, редактирование, откат). Второй превращает короткий запрос в детальное описание. Третий генерирует. Каждый видит только то, что ему нужно. Проблема переполнения решена, память сохранена.
Жёсткий: планировщик → копирайтер → редактор → арт-директор → арт-критик. Предсказуемо. Гибкий: один центральный агент сам решает, кого подключить. Менее предсказуемо, зато можно общаться. Жёсткий — когда нужен конвейер. Гибкий — когда нужен диалог.
Начали с одного агента на 20+ инструментов — быстро проверили идею. Упёрлись в стену: галлюцинации, 10 попыток на простую задачу. Перестроили: три агента параллельно собирают контекст (задачи, документация, код), потом один ревьюер с полной картиной. Результат: скорость ×3, минус 40% техдолга, 50-80 часов в месяц экономии, минус 15% багов. Проект выиграл грант, летом 2026 — публичный запуск.
—
В чате Сергей ответил на всё. Спросили, один агент или много — он дал три вопроса для самопроверки: процесс предсказуемый? сколько разных ролей? какова цена ошибки? Начинать с минимума.
Вопрос из чата — на каком языке писать промпты? Для топовых моделей русский работает наравне с английским. Для картинок — английский лучше.
Про локальные модели — если совмещать с облачными, отставание минимальное. Полностью закрытый контур отстаёт, но правильная архитектура компенсирует. Это ровно то, что мы делаем в AlpinaGPT для корпоративных клиентов — облако или on-premise, обучение команды, настройка ассистентов под задачи конкретных отделов.
Запись • Транскрипт • Саммари • Презентация
🔥 — полезно ❤️ — уже знал
➡️ Готовим ИИшницу ⬅️
#ИИТрансформация #мультиагенты #RAG
Оригинал: пост в Telegram · подписаться на «Готовим ИИшницу»