База знаний · 2026 89 терминов · 7 категорий

словарь ИИ для
бизнеса.

// 001 — концепции

Базовые концепции AI

27 терминов
// 001

LLM

Large Language Model — большая языковая модель. Базовый компонент любого AI-агента: понимает запросы и генерирует ответы.

Концепция
// 002

AI-агент

Программа на основе LLM, автономно решающая задачи: понимает запрос, разбивает на шаги, использует инструменты, доводит до результата.

Концепция
// 003

Мультиагентные системы

Архитектура из специализированных AI-агентов, работающих через оркестратор. Каждый агент решает свою подзадачу.

Архитектура
// 004

RAG

Retrieval Augmented Generation — добавление поиска по корпоративным документам к генерации LLM. База знаний компании в диалоге.

Архитектура
// 005

Промпт-инжиниринг

Методология формулировки запросов к LLM для стабильных предсказуемых результатов. Применяется при настройке агентов.

Методология
// 006

HITL

Human-in-the-Loop — паттерн, где AI делает черновик, а человек подтверждает или правит перед финальным действием.

Методология
// 007

Контекстное окно

Объём текста, который модель удерживает за один запрос. У Claude 4.7 — до 1М токенов, у Gemini Pro — до 2М.

Концепция
// 008

Эмбеддинги

Векторное представление текста для семантического поиска. Близкие по смыслу тексты дают близкие векторы. Основа RAG.

Архитектура
// 009

Fine-tuning

Дообучение готовой модели на узких корпоративных данных — стиль, терминология, специфические задачи.

Методология
// 010

Tool use

Способность модели вызывать функции и API через структурированный JSON. Превращает LLM в полноценного агента.

Концепция
// 011

Токены

Кусочки текста, по которым LLM считает цену и контекст. 1 русское слово ≈ 2-3 токена. Биллинг и оптимизация.

Концепция
// 012

Инференс

Процесс генерации ответа моделью. Скорость в токенах/сек влияет на UX. Латентность критична для real-time.

Концепция
// 013

Chain-of-Thought

Техника промптинга: модель рассуждает шаг за шагом перед ответом. Прирост качества на сложных задачах 20-40%.

Концепция
// 014

Few-shot / Zero-shot

Два режима работы LLM: без примеров и с примерами в промпте. Базовый рычаг качества классификации и форматирования.

Методология
// 015

Галлюцинации LLM

Модель уверенно выдаёт правдоподобный, но фактически ложный ответ. Главный источник риска в продакшне.

Риск
// 016

Temperature

Параметр случайности генерации 0-2. 0 — детерминированно, 1 — креативно, 2 — иногда бред. Базовая настройка LLM.

Концепция
// 017

Reasoning-модели

LLM, которые «думают» перед ответом. Claude thinking, o1/o3, Gemini deep-think. В 5-15 раз дороже, экспертное качество.

Архитектура
// 018

Мультимодальность

LLM, которая принимает текст, изображения, аудио, видео в одном запросе. Стандарт у Claude 4.7, GPT-5, Gemini.

Концепция
// 019

Vision-модели

Подкласс мультимодальных: чтение скриншотов, анализ фото, разбор сканов, оценка дизайна. Стандарт у топ-LLM.

Архитектура
// 020

Distillation

Обучение маленькой быстрой модели на ответах большой. 80% качества за 5% цены — для типовых задач рабочий компромисс.

Методология
// 021

RLHF

Reinforcement Learning from Human Feedback. Метод, благодаря которому LLM научились следовать инструкциям. Основа ChatGPT и Claude.

Методология
// 022

MoE (Mixture of Experts)

Архитектура, где активируется только часть модели на запрос. Триллион параметров с инференсом как у 70B. Mixtral, DeepSeek, GPT-5.

Архитектура
// 023

Quantization

Сжатие весов модели (INT8, INT4) — экономия памяти в 4-8 раз с падением качества 1-5%. Базовая техника self-host.

Методология
// 024

LoRA

Low-Rank Adaptation. Метод дешёвого fine-tuning: обучаются только маленькие адаптеры рядом с весами. Стоимость падает в 1000 раз.

Методология
// 025

Prompt caching

Закешированные токены стоят 10-50% от обычного input. Экономия 60-80% бюджета для агентных систем.

Оптимизация
// 026

Function calling

LLM возвращает структурированный JSON с именем функции и аргументами вместо текста. Основа агентов.

Концепция
// 027

Structured output

Режим LLM, гарантирующий ответ строго по JSON-схеме. Решает 5% багов с поломанным JSON в продакшне.

Концепция
// 002 — инструменты

Инструменты и Harness

20 терминов
// 013

MCP-протокол

Model Context Protocol от Anthropic — стандарт интеграции LLM с внешними системами через единый интерфейс.

Протокол
// 014

Claude Code

CLI-инструмент Anthropic для работы с Claude в командной строке. Доступ к файлам, командам, MCP-серверам.

Harness
// 015

Codex CLI

CLI OpenAI для работы с кодом через GPT-5. Альтернатива Claude Code: те же возможности, модель от OpenAI.

Harness
// 016

Cursor

IDE на основе VS Code с глубокой AI-интеграцией. Tab-completion, chat с проектом, агентский режим.

IDE
// 017

Cline

Open-source AI-extension для VS Code. Bring your own key, поддержка Claude, GPT-4, локальных моделей.

Extension
// 018

Continue.dev

Open-source extension для VS Code и JetBrains. Альтернатива GitHub Copilot с конфигом через YAML.

Extension
// 019

Windsurf

AI-first IDE от Codeium (после покупки OpenAI). Cascade-агент с multi-file правками. Конкурент Cursor.

IDE
// 020

Zed Editor

Молниеносный редактор на Rust от авторов Atom. Встроенный AI-чат, MCP-поддержка, multiplayer.

IDE
// 021

mm CLI

Claude Code-совместимый CLI на MiniMax M2.7. Дешевле и быстрее Anthropic для рутинных задач.

Harness
// 022

n8n

Self-hostable визуальный оркестратор workflow для бизнес-автоматизации. Низкий порог, работа с LLM-API.

Инструмент
// 028

GitHub Copilot

Пионер AI-кодинга от GitHub и OpenAI. С 2021 года стандарт индустрии: автодополнение, чат, агент. От $10/мес.

Инструмент
// 029

Aider

Open-source CLI для парного программирования с LLM. Bring your own key, git-aware, минимализм. Любимец индустрии.

Harness
// 030

Devin

Первый коммерческий полностью автономный AI-инженер от Cognition. $500/мес. Идея — сильнее реальности 2026.

Harness
// 031

Replit Agent

AI-агент внутри облачной IDE Replit: full-stack приложения из чата. От идеи до URL за 30-90 минут.

Harness
// 032

v0

UI-генератор от Vercel. Описание → React/Next.js код с превью. Лучший инструмент для лендингов и форм.

Harness
// 033

Bolt.new

Full-stack приложения в браузере через WebContainers от StackBlitz. Конкурент Replit Agent.

Harness
// 034

Lovable

Шведский full-stack по описанию: Supabase backend, Stripe-оплата. Production-ready SaaS из чата.

Harness
// 035

LangChain

Самый известный Python/JS фреймворк для LLM-приложений. Любим за быстрый старт, критикуем за абстракции.

Фреймворк
// 036

LangGraph

Графовый фреймворк для агентов: явные состояния, переходы, checkpoints. От тех же авторов, что LangChain.

Фреймворк
// 037

CrewAI

Python-фреймворк мультиагентных команд: каждая роль — отдельный агент с инструментами. Декларативный синтаксис.

Фреймворк
// 003 — компании, мир

Международные AI-компании

13 терминов
// 023

Anthropic

AI-лаборатория из США, разработчик семейства Claude и протокола MCP. Один из трёх ведущих поставщиков LLM.

Компания
// 024

OpenAI

Создатель ChatGPT и серии GPT-4/GPT-5. Один из трёх ведущих поставщиков LLM на рынке.

Компания
// 025

Google DeepMind

AI-подразделение Google. Создатели Gemini (контекст до 2М токенов), AlphaFold, AlphaGo.

Компания
// 026

Mistral AI

Французская AI-компания. Open-source модели (Mixtral) и enterprise API. Европейская альтернатива US-игрокам.

Компания
// 027

Meta AI

AI-подразделение Meta. Открытая серия Llama — двигатель open-source AI индустрии.

Компания
// 028

xAI

Компания Илона Маска. Модель Grok через X Premium и API. Кластер Colossus с 200К H100.

Компания
// 029

Cohere

Канадская enterprise-first AI-компания. Модели Command и Embed, private deployment в инфраструктуре клиента.

Компания
// 030

AI21 Labs

Израильская AI-лаборатория. Jurassic и Jamba (гибрид Transformer + Mamba, контекст 256К).

Компания
// 004 — компании, Россия

Российские AI-компании

5 терминов
// 031

YandexGPT

Линейка LLM Яндекса. Доступна через Yandex Cloud. Compliance с РФ-регулированием. Сильна на русском.

Компания · RU
// 032

GigaChat

Линейка моделей Сбера (GigaChat Pro/Max/Lite, GigaCode). Глубокая интеграция со Sберовской экосистемой.

Компания · RU
// 033

T-Bank AI

AI Т-Банка: голосовой Олег, anti-fraud модели, open-source T-lite/T-pro для русскоязычной разработки.

Компания · RU
// 034

MTS AI

AI-подразделение МТС: MWS GPT, voice AI для контакт-центров, B2B-платформы.

Компания · RU
// 035

VK AI

VK Cloud + GenericGPT + AI-features в продуктах VK. Облачные GPU и интеграция с VK-экосистемой.

Компания · RU
// 005 — инфраструктура

Инфраструктура AI-проектов

5 терминов
// 036

VPS

Virtual Private Server. Основа self-hosted AI: боты, n8n, базы, LLM-инференс. От $5/мес на Contabo.

Инфра
// 037

Docker

Контейнеры для упаковки приложений. De-facto стандарт деплоя AI-сервисов: ботов, n8n, моделей.

Инфра
// 038

API

Application Programming Interface. Все LLM, инструменты и сервисы работают через REST или WebSocket API.

Инфра
// 039

Webhook

HTTP-уведомления о событиях. Основа реактивной AI-автоматизации: событие → webhook → AI-обработка.

Инфра
// 040

Облачные провайдеры

AWS, GCP, Azure, Yandex Cloud, SberCloud, VK Cloud, Selectel. Compute, storage, AI-сервисы.

Инфра
// 006 — бизнес-контекст и observability

Бизнес-контекст и observability

9 терминов
// 041

P&L

Отчёт о прибылях и убытках. Первая таблица, которую мы открываем с фаундером, прежде чем обсуждать ИИ.

Бизнес
// 042

ФОТ

Фонд оплаты труда. Главная статья, которую освобождают AI-агенты при правильном внедрении.

Бизнес
// 043

AI-roadmap

План поэтапного внедрения ИИ на горизонтах 30/90/180 дней. Строится от P&L конкретной компании.

Бизнес
// 044

Langfuse

Open-source observability для LLM: трейсинг запросов, оценка качества, мониторинг стоимости токенов.

Observability
// 053

ROI AI-внедрения

Метрика возврата инвестиций для AI-проекта. Формула простая, сложность — учесть четыре источника выгоды.

Бизнес
// 054

Cost per token

Базовая метрика юнит-экономики AI: сколько стоит один запрос. Без отслеживания AI-стартап быстро убыточен.

Бизнес
// 055

Latency p95

Задержка для 95% пользователей AI-сервиса. Не средняя, а перцентиль 95. Влияет на retention.

Метрика
// 056

Prompt injection

Атака на LLM через входные данные. Главный класс уязвимостей AI-систем, аналог SQL-injection.

Безопасность
// 057

PII redaction

Автоматическое маскирование персональных данных перед отправкой в LLM. Базовое требование 152-ФЗ и GDPR.

Безопасность
// 007 — архитектура RAG, агентов и multimodal

Архитектура RAG, агентов и multimodal

10 терминов
// 058

Vector database

Специализированная СУБД для эмбеддингов. Основа RAG: релевантные документы за миллисекунды среди миллионов.

Архитектура
// 059

Reranker

Вторая модель в RAG-пайплайне: пересортирует топ-50 кандидатов по релевантности. Качество поиска +50-100%.

Архитектура
// 060

Chunking

Разбиение документов на фрагменты для индексации. От стратегии напрямую зависит качество RAG.

Методология
// 061

Whisper

Open-source ASR от OpenAI. Распознавание речи 99 языков. Через Groq — быстрее реального времени.

Инструмент
// 062

TTS

Text-to-Speech: ElevenLabs, OpenAI tts-1, Sesame. Современные модели почти неотличимы от живого диктора.

Инструмент
// 063

Computer Use

AI управляет компьютером: видит экран, двигает мышью, заполняет формы. От Anthropic с октября 2024.

Концепция
// 064

Voice agent

Композиция Whisper + LLM + TTS + телефония. Голосовой агент, заменяющий телефонного оператора.

Архитектура
// 065

Agentic search

LLM с веб-поиском, читает страницы, переформулирует запрос. Основа Perplexity, ChatGPT Search.

Архитектура
// 066

Evals

Автоматическая оценка качества LLM-ответов. LLM-as-judge. Без evals продакшн-AI работает вслепую.

Методология
// 067

Guardrails

Защитные правила для LLM: фильтры тем, проверки PII, защита от prompt injection. Гигиена продакшна.

Безопасность