Как создать ИИ-агента с нуля для бизнеса: разбор каждого слоя

Чтобы собрать ИИ-агента с нуля для бизнеса, вы проходите шесть слоёв подряд: выбираете модель под бюджет и приватность, пишете системный промпт с ролью, подключаете инструменты через вызов функций или протокол MCP, ставите человека в контуре на сверку важных шагов, гоняете тест на ваших реальных данных и выводите связку в работу. Каждый слой собирается отдельно, и сложность прячется именно в стыках между ними.

Из каких слоёв собирается агент

Когда руководитель слышит слово «агент», он представляет умную коробку, которая сама всё понимает и сама всё делает. Внутри картина честнее и скучнее. Агент — это языковая модель, которой вы выдали роль текстом, дали несколько инструментов и право действовать в цикле, пока задача останется закрытой. Модель рассуждает, промпт держит её в границах, инструменты дают ей руки, цикл превращает один ответ в цепочку шагов, человек страхует на важных решениях. Разберём каждый слой так, чтобы вы видели, где сосредоточена ваша работа, и где модель справляется сама.

Эта статья идёт глубже быстрой сборки агента под одну задачу. Там вы за день делаете узкий помощник под один вход и один выход. Здесь вы собираете полноценную связку и разбираете каждый слой по отдельности: чем модели отличаются между собой, как роль в промпте меняет поведение, чем вызов функций отличается от протокола MCP, как устроена сверка с человеком и как понять, что агент готов к реальной работе. Узкий помощник вы потом соберёте из этих же слоёв за несколько часов, потому что будете понимать каждый из них.

СлойЗа что отвечаетГде ваша работа
Модель (LLM)Рассуждение, понимание текстаВыбрать под бюджет и приватность
Системный промптРоль, границы, тон, формат ответаОписать роль и правила чётко
ИнструментыДействия во внешнем миреПодключить минимум нужных функций
Цикл рассужденияПлан → действие → проверкаЗадать условие остановки
Человек в контуреКонтроль важных шаговРешить, что требует подтверждения
НаблюдениеВидимость того, что агент делаетВключить логи с первого запуска

Слой первый: выбор модели

Модель — это мотор агента. От неё зависит, насколько умно агент рассуждает, как держит длинный контекст и сколько стоит каждый запуск. Готовых моделей хватает: Claude от Anthropic, GPT от OpenAI, открытые модели через провайдеров наподобие Groq или Together, российские GigaChat и YandexGPT для случаев, где данные обязаны оставаться внутри страны. Выбор сводится к трём вопросам, и каждый из них вы решаете до первой строчки промпта.

Один касается задачи. Для рассуждения над текстом, разбора документов и работы с инструментами сильные закрытые модели дают заметно более стабильный результат, потому что они аккуратнее следуют формату и реже придумывают вызовы функций, которых нет. Другой — данных. Если агент работает с персональными данными клиентов или внутренними договорами, вы либо берёте модель с понятной политикой хранения, либо ставите открытую модель в своём контуре, чтобы текст вообще покидал ваши серверы. Третий — стоимость. Стоимость считается по токенам на входе и выходе, и агент с длинным контекстом и десятком шагов в цикле сжигает их быстрее, чем разовый чат.

Что вам важнееКуда смотретьПочему
Качество рассужденияСильная закрытая модель (Claude, GPT)Аккуратнее следуют формату и вызову инструментов
Данные внутри страныGigaChat, YandexGPT или своя модельТекст останется в вашем контуре
Низкая цена за объёмОткрытая модель через провайдераДешевле на токен при простых шагах
Скорость ответаПровайдер с быстрым инференсомМеньше задержка на каждом шаге цикла

Слой второй и третий: промпт и инструменты

Системный промпт — это должностная инструкция агента. В нём вы пишете, кто этот агент, какую задачу он закрывает, по каким правилам действует, чего касаться ему нельзя и в каком виде он отдаёт результат. Чем уже роль, тем стабильнее агент: «ты разбираешь входящие заявки и раскладываешь их по трём категориям с черновиком ответа» работает лучше, чем «ты умный помощник по всем вопросам». В промпт же идут правила безопасности через ограничители: какие действия агент выполняет сам, а какие отправляет человеку на подтверждение.

Инструменты превращают болтающую модель в работающего агента. Технически инструмент — это функция с описанием: что она делает, какие принимает параметры, что возвращает. Модель читает описание и сама решает, когда вызвать функцию и с какими аргументами. Есть два пути подключения. Вызов функций вы описываете руками под конкретную модель: пишете схему параметров, обрабатываете ответ, возвращаете результат обратно в цикл. Протокол MCP даёт готовый стандарт подключения, и инструмент, собранный под него, работает с любым клиентом, который этот протокол поддерживает. Для разовой узкой задачи быстрее вызов функций; для связки, которую вы будете расширять и переиспользовать, выгоднее MCP.

  1. Опишите роль агента одним абзацем: кто он, какую задачу закрывает, какими правилами связан.
  2. Задайте формат ответа явно: категория, черновик, запись в таблицу — модель должна знать, что отдавать.
  3. Добавьте первый инструмент и проверьте, что модель вызывает его с верными параметрами на реальном примере.
  4. Добавляйте следующий инструмент только после того, как предыдущий отработал чисто.
  5. Пропишите в промпте, какие вызовы агент делает сам, а какие отправляет человеку через человека в контуре.
  • Вызов функций — точечный контроль, описание под конкретную модель, быстро для одной задачи.
  • Протокол MCP — единый стандарт, инструмент переиспользуется между агентами и клиентами.
  • Минимум инструментов — каждый лишний расширяет поле ошибок и удлиняет отладку.

Слой четвёртый и пятый: человек в контуре и тест

Человек в контуре через человека в контуре — это рубильник между «агент предложил» и «агент сделал». Вы решаете, какие действия требуют подтверждения, а какие агент выполняет сам. Разложить заявки по категориям он делает сам, потому что цена ошибки терпима, человек поправит за минуту. Отправить письмо клиенту, изменить запись в системе, потратить деньги — здесь агент готовит черновик и ждёт вашего «да». По мере того как агент набирает точность на ваших данных, вы постепенно снимаете подтверждения с тех действий, где он стабильно прав.

Тест на реальных данных отделяет демонстрацию от рабочей связки. Агент, который красиво отвечает на придуманные примеры, разваливается на ваших настоящих заявках с опечатками, вложениями и формулировками, которые сочинить заранее нельзя. Поэтому первый прогон вы делаете на живой выборке: возьмите полсотни настоящих случаев из вашей работы, прогоните через агента и руками сверьте каждый результат. Ошибки покажут, где промпт молчит, какого инструмента нехватает и где модель придумывает то, чего в данных нет.

Слой шестой: вывод в работу и обучение команды

Агент прошёл тест на ваших данных, метрики устроили — теперь он выходит в работу. Этот шаг руководители недооценивают сильнее всего. Связка, которая живёт на ноутбуке одного человека, умирает в день, когда он уходит в отпуск. Поэтому вывод в работу держится на трёх вещах: наблюдение за тем, что агент делает каждый день, доступ к логам у того, кто отвечает за результат, и понятный маршрут, куда смотреть, когда агент ошибся.

В работе с фаундерами я часто вижу одну и ту же историю. Команда собирает рабочего агента, радуется первым результатам, а через месяц связка тихо ломается, потому что её устройство осталось загадкой для всей команды. Все ждали готовое решение под ключ, и теперь некому его чинить. Поэтому я ставлю агента изнутри команды и обучаю людей понимать каждый слой, чтобы через несколько недель они вели связку сами, без подрядчика над душой. Это и отличает обучение от внедрения чужими руками: после обучения у команды остаётся и сам агент, и способность его развивать. На программе мы проходим эти шесть слоёв на вашем реальном процессе и доводим первого агента до рабочего состояния, а дальше команда расширяет связку без внешней опоры.

Частые вопросы

Сколько времени занимает сборка агента с нуля?

Узкий агент под один вход и один выход собирается за рабочий день, если вы понимаете все шесть слоёв. Первая ваша сборка займёт дольше, потому что время уходит на знакомство с моделью, вызовом инструментов и циклом. Полноценная связка с несколькими инструментами и человеком в контуре растягивается на несколько подходов: день на каркас, дальше прогоны на реальных данных и доводка промпта.

Нужно ли уметь программировать, чтобы собрать агента?

Базовый агент собирается через готовые конструкторы и среды наподобие Claude Code, где вы описываете задачу текстом, а код пишет сама модель. Глубокое программирование требуется там, где вы подключаете сложные инструменты или ставите модель в своём контуре. Для большинства задач бизнеса хватает понимания того, как устроены слои, и умения чётко формулировать роль и правила.

Чем вызов функций отличается от протокола MCP?

Вызов функций вы описываете руками под конкретную модель: пишете схему параметров, обрабатываете ответ и возвращаете результат обратно в цикл. Протокол MCP даёт готовый стандарт подключения, и инструмент, собранный под него, работает с любым клиентом, который этот протокол поддерживает. Для разовой узкой задачи быстрее вызов функций. Для связки, которую вы расширяете и переиспользуете, выгоднее MCP.

Какую модель выбрать для первого агента?

Соберите первую версию на сильной закрытые модели наподобие Claude или GPT: они аккуратнее следуют формату и вызову инструментов, поэтому вы отделите ошибки логики от ограничений модели. Если данные обязаны оставаться внутри страны, берите GigaChat, YandexGPT или открытую модель в своём контуре. Дешёвую модель подбирайте позже, на простых шагах, когда каркас уже работает.

Зачем нужен человек в контуре, если агент работает сам?

Человек в контуре — это рубильник между «агент предложил» и «агент сделал». Действия с терпимой ценой ошибки агент выполняет сам, а действия с высокой ценой — отправка письма клиенту, изменение записи, трата денег — он готовит и ждёт вашего подтверждения. По мере того как агент набирает точность на ваших данных, вы снимаете подтверждения с тех шагов, где он стабильно прав.

Как понять, что агент готов к реальной работе?

Прогоните агента на живой выборке из вашей работы — полсотни настоящих случаев с опечатками и вложениями — и посчитайте две метрики. Первая: доля случаев, где агент справился сам без правок, показывает пользу. Вторая: доля случаев, где он ошибся молча, без сигнала о сомнении, показывает риск. Агент готов, когда первая метрика устраивает, а вторая близка к нулю.

Разберём вашу ситуацию на Discovery-созвоне

Один час на Discovery-созвоне — и вы увидите, какие задачи в вашем случае отдать ИИ, какие оставить команде.

Прийти на Discovery-созвон →

← Все статьи