Как создать ИИ-агента с нуля для бизнеса: разбор каждого слоя
Чтобы собрать ИИ-агента с нуля для бизнеса, вы проходите шесть слоёв подряд: выбираете модель под бюджет и приватность, пишете системный промпт с ролью, подключаете инструменты через вызов функций или протокол MCP, ставите человека в контуре на сверку важных шагов, гоняете тест на ваших реальных данных и выводите связку в работу. Каждый слой собирается отдельно, и сложность прячется именно в стыках между ними.
Из каких слоёв собирается агент
Когда руководитель слышит слово «агент», он представляет умную коробку, которая сама всё понимает и сама всё делает. Внутри картина честнее и скучнее. Агент — это языковая модель, которой вы выдали роль текстом, дали несколько инструментов и право действовать в цикле, пока задача останется закрытой. Модель рассуждает, промпт держит её в границах, инструменты дают ей руки, цикл превращает один ответ в цепочку шагов, человек страхует на важных решениях. Разберём каждый слой так, чтобы вы видели, где сосредоточена ваша работа, и где модель справляется сама.
Эта статья идёт глубже быстрой сборки агента под одну задачу. Там вы за день делаете узкий помощник под один вход и один выход. Здесь вы собираете полноценную связку и разбираете каждый слой по отдельности: чем модели отличаются между собой, как роль в промпте меняет поведение, чем вызов функций отличается от протокола MCP, как устроена сверка с человеком и как понять, что агент готов к реальной работе. Узкий помощник вы потом соберёте из этих же слоёв за несколько часов, потому что будете понимать каждый из них.
| Слой | За что отвечает | Где ваша работа |
|---|---|---|
| Модель (LLM) | Рассуждение, понимание текста | Выбрать под бюджет и приватность |
| Системный промпт | Роль, границы, тон, формат ответа | Описать роль и правила чётко |
| Инструменты | Действия во внешнем мире | Подключить минимум нужных функций |
| Цикл рассуждения | План → действие → проверка | Задать условие остановки |
| Человек в контуре | Контроль важных шагов | Решить, что требует подтверждения |
| Наблюдение | Видимость того, что агент делает | Включить логи с первого запуска |
Слой первый: выбор модели
Модель — это мотор агента. От неё зависит, насколько умно агент рассуждает, как держит длинный контекст и сколько стоит каждый запуск. Готовых моделей хватает: Claude от Anthropic, GPT от OpenAI, открытые модели через провайдеров наподобие Groq или Together, российские GigaChat и YandexGPT для случаев, где данные обязаны оставаться внутри страны. Выбор сводится к трём вопросам, и каждый из них вы решаете до первой строчки промпта.
Один касается задачи. Для рассуждения над текстом, разбора документов и работы с инструментами сильные закрытые модели дают заметно более стабильный результат, потому что они аккуратнее следуют формату и реже придумывают вызовы функций, которых нет. Другой — данных. Если агент работает с персональными данными клиентов или внутренними договорами, вы либо берёте модель с понятной политикой хранения, либо ставите открытую модель в своём контуре, чтобы текст вообще покидал ваши серверы. Третий — стоимость. Стоимость считается по токенам на входе и выходе, и агент с длинным контекстом и десятком шагов в цикле сжигает их быстрее, чем разовый чат.
| Что вам важнее | Куда смотреть | Почему |
|---|---|---|
| Качество рассуждения | Сильная закрытая модель (Claude, GPT) | Аккуратнее следуют формату и вызову инструментов |
| Данные внутри страны | GigaChat, YandexGPT или своя модель | Текст останется в вашем контуре |
| Низкая цена за объём | Открытая модель через провайдера | Дешевле на токен при простых шагах |
| Скорость ответа | Провайдер с быстрым инференсом | Меньше задержка на каждом шаге цикла |
Слой второй и третий: промпт и инструменты
Системный промпт — это должностная инструкция агента. В нём вы пишете, кто этот агент, какую задачу он закрывает, по каким правилам действует, чего касаться ему нельзя и в каком виде он отдаёт результат. Чем уже роль, тем стабильнее агент: «ты разбираешь входящие заявки и раскладываешь их по трём категориям с черновиком ответа» работает лучше, чем «ты умный помощник по всем вопросам». В промпт же идут правила безопасности через ограничители: какие действия агент выполняет сам, а какие отправляет человеку на подтверждение.
Инструменты превращают болтающую модель в работающего агента. Технически инструмент — это функция с описанием: что она делает, какие принимает параметры, что возвращает. Модель читает описание и сама решает, когда вызвать функцию и с какими аргументами. Есть два пути подключения. Вызов функций вы описываете руками под конкретную модель: пишете схему параметров, обрабатываете ответ, возвращаете результат обратно в цикл. Протокол MCP даёт готовый стандарт подключения, и инструмент, собранный под него, работает с любым клиентом, который этот протокол поддерживает. Для разовой узкой задачи быстрее вызов функций; для связки, которую вы будете расширять и переиспользовать, выгоднее MCP.
- Опишите роль агента одним абзацем: кто он, какую задачу закрывает, какими правилами связан.
- Задайте формат ответа явно: категория, черновик, запись в таблицу — модель должна знать, что отдавать.
- Добавьте первый инструмент и проверьте, что модель вызывает его с верными параметрами на реальном примере.
- Добавляйте следующий инструмент только после того, как предыдущий отработал чисто.
- Пропишите в промпте, какие вызовы агент делает сам, а какие отправляет человеку через человека в контуре.
- Вызов функций — точечный контроль, описание под конкретную модель, быстро для одной задачи.
- Протокол MCP — единый стандарт, инструмент переиспользуется между агентами и клиентами.
- Минимум инструментов — каждый лишний расширяет поле ошибок и удлиняет отладку.
Слой четвёртый и пятый: человек в контуре и тест
Человек в контуре через человека в контуре — это рубильник между «агент предложил» и «агент сделал». Вы решаете, какие действия требуют подтверждения, а какие агент выполняет сам. Разложить заявки по категориям он делает сам, потому что цена ошибки терпима, человек поправит за минуту. Отправить письмо клиенту, изменить запись в системе, потратить деньги — здесь агент готовит черновик и ждёт вашего «да». По мере того как агент набирает точность на ваших данных, вы постепенно снимаете подтверждения с тех действий, где он стабильно прав.
Тест на реальных данных отделяет демонстрацию от рабочей связки. Агент, который красиво отвечает на придуманные примеры, разваливается на ваших настоящих заявках с опечатками, вложениями и формулировками, которые сочинить заранее нельзя. Поэтому первый прогон вы делаете на живой выборке: возьмите полсотни настоящих случаев из вашей работы, прогоните через агента и руками сверьте каждый результат. Ошибки покажут, где промпт молчит, какого инструмента нехватает и где модель придумывает то, чего в данных нет.
Слой шестой: вывод в работу и обучение команды
Агент прошёл тест на ваших данных, метрики устроили — теперь он выходит в работу. Этот шаг руководители недооценивают сильнее всего. Связка, которая живёт на ноутбуке одного человека, умирает в день, когда он уходит в отпуск. Поэтому вывод в работу держится на трёх вещах: наблюдение за тем, что агент делает каждый день, доступ к логам у того, кто отвечает за результат, и понятный маршрут, куда смотреть, когда агент ошибся.
В работе с фаундерами я часто вижу одну и ту же историю. Команда собирает рабочего агента, радуется первым результатам, а через месяц связка тихо ломается, потому что её устройство осталось загадкой для всей команды. Все ждали готовое решение под ключ, и теперь некому его чинить. Поэтому я ставлю агента изнутри команды и обучаю людей понимать каждый слой, чтобы через несколько недель они вели связку сами, без подрядчика над душой. Это и отличает обучение от внедрения чужими руками: после обучения у команды остаётся и сам агент, и способность его развивать. На программе мы проходим эти шесть слоёв на вашем реальном процессе и доводим первого агента до рабочего состояния, а дальше команда расширяет связку без внешней опоры.
Частые вопросы
Сколько времени занимает сборка агента с нуля?
Узкий агент под один вход и один выход собирается за рабочий день, если вы понимаете все шесть слоёв. Первая ваша сборка займёт дольше, потому что время уходит на знакомство с моделью, вызовом инструментов и циклом. Полноценная связка с несколькими инструментами и человеком в контуре растягивается на несколько подходов: день на каркас, дальше прогоны на реальных данных и доводка промпта.
Нужно ли уметь программировать, чтобы собрать агента?
Базовый агент собирается через готовые конструкторы и среды наподобие Claude Code, где вы описываете задачу текстом, а код пишет сама модель. Глубокое программирование требуется там, где вы подключаете сложные инструменты или ставите модель в своём контуре. Для большинства задач бизнеса хватает понимания того, как устроены слои, и умения чётко формулировать роль и правила.
Чем вызов функций отличается от протокола MCP?
Вызов функций вы описываете руками под конкретную модель: пишете схему параметров, обрабатываете ответ и возвращаете результат обратно в цикл. Протокол MCP даёт готовый стандарт подключения, и инструмент, собранный под него, работает с любым клиентом, который этот протокол поддерживает. Для разовой узкой задачи быстрее вызов функций. Для связки, которую вы расширяете и переиспользуете, выгоднее MCP.
Какую модель выбрать для первого агента?
Соберите первую версию на сильной закрытые модели наподобие Claude или GPT: они аккуратнее следуют формату и вызову инструментов, поэтому вы отделите ошибки логики от ограничений модели. Если данные обязаны оставаться внутри страны, берите GigaChat, YandexGPT или открытую модель в своём контуре. Дешёвую модель подбирайте позже, на простых шагах, когда каркас уже работает.
Зачем нужен человек в контуре, если агент работает сам?
Человек в контуре — это рубильник между «агент предложил» и «агент сделал». Действия с терпимой ценой ошибки агент выполняет сам, а действия с высокой ценой — отправка письма клиенту, изменение записи, трата денег — он готовит и ждёт вашего подтверждения. По мере того как агент набирает точность на ваших данных, вы снимаете подтверждения с тех шагов, где он стабильно прав.
Как понять, что агент готов к реальной работе?
Прогоните агента на живой выборке из вашей работы — полсотни настоящих случаев с опечатками и вложениями — и посчитайте две метрики. Первая: доля случаев, где агент справился сам без правок, показывает пользу. Вторая: доля случаев, где он ошибся молча, без сигнала о сомнении, показывает риск. Агент готов, когда первая метрика устраивает, а вторая близка к нулю.
Разберём вашу ситуацию на Discovery-созвоне
Один час на Discovery-созвоне — и вы увидите, какие задачи в вашем случае отдать ИИ, какие оставить команде.
Прийти на Discovery-созвон →