● Риск / Уровень: средний / Q2 · 2026 / 42 из 93

Guardrails.

ограничители для AI-агента

Короткий
ответ ↳

Guardrails — это слой ограничителей вокруг LLM: фильтры контента, детекторы PII, защита от prompt injection, контроль формата вывода. Обязательны для любого LLM в проде с реальными пользователями.

01 Типы guardrails

Input guardrails. Что нельзя присылать модели — PII, jailbreak-паттерны, токсичный контент.
Output guardrails. Что модель не должна возвращать — токсичный контент, факты не из RAG, секреты.
Behavioral. Allow-list инструментов, лимиты вызовов, ограничения по доменам.
Topical. Модель не должна выходить за рамки темы (например, поддержка не должна обсуждать политику).

02 Инструменты

Llama Guard 3 — open-source классификатор от Meta для фильтра токсичности.
Guardrails AI — Python библиотека с готовыми правилами.
NeMo Guardrails — от NVIDIA, мощный фреймворк.
Microsoft Presidio — для PII redaction.
Anthropic Constitutional AI — встроено в Claude.

03 Архитектура

Стандартный pipeline:

Input → guardrails check → LLM (если pass) или reject (если fail).
LLM → output guardrails → пользователь (если pass) или fallback (если fail).
Логирование всех reject — для аудита и улучшения.

04 Compliance

EU AI Act, OWASP LLM Top 10, NIST AI RMF — все требуют наличия guardrails-слоя для production-AI с реальными пользователями. В 2026 — стандарт enterprise-сертификаций.

// 05 · от практики

Как мы применяем Guardrails в работе с клиентами

В практике «Зинин × Штурбин» мы закрываем Guardrails на вашем проекте — это часть формата стратегический совет. На реальных задачах это Llama Guard, NeMo Guardrails и подобное. Рядом разбираем Prompt injection — термины в словаре связаны так же, как в работе.

Не консультируем абстрактно: команда уходит с навыком и рабочим процессом, который применяет сама. Посмотреть программы и цены →

// 07

Частые вопросы

01 Замедляют ли guardrails систему?

Да, на 100-500мс. Это плата за безопасность.

02 Все ли guardrails нужны?

Для прода с реальными пользователями — input + output + PII обязательны. Topical — по необходимости.

Понимаем — учим
работать с Guardrails
внутри команды.

Час бесплатной диагностики: разбираем 2–3 ваших процесса и говорим прямо, где AI окупится за квартал, а где брать рано. Знания остаются у вашей команды.

Discovery call · 1 час @Aleksei_Shturbin