LLM
Large Language Model — большая языковая модель. Базовый компонент любого AI-агента: понимает запросы и генерирует ответы.
КонцепцияLarge Language Model — большая языковая модель. Базовый компонент любого AI-агента: понимает запросы и генерирует ответы.
КонцепцияПрограмма на основе LLM, автономно решающая задачи: понимает запрос, разбивает на шаги, использует инструменты, доводит до результата.
КонцепцияАрхитектура из специализированных AI-агентов, работающих через оркестратор. Каждый агент решает свою подзадачу.
АрхитектураRetrieval Augmented Generation — добавление поиска по корпоративным документам к генерации LLM. База знаний компании в диалоге.
АрхитектураМетодология формулировки запросов к LLM для стабильных предсказуемых результатов. Применяется при настройке агентов.
МетодологияHuman-in-the-Loop — паттерн, где AI делает черновик, а человек подтверждает или правит перед финальным действием.
МетодологияОбъём текста, который модель удерживает за один запрос. У Claude 4.7 — до 1М токенов, у Gemini Pro — до 2М.
КонцепцияВекторное представление текста для семантического поиска. Близкие по смыслу тексты дают близкие векторы. Основа RAG.
АрхитектураДообучение готовой модели на узких корпоративных данных — стиль, терминология, специфические задачи.
МетодологияСпособность модели вызывать функции и API через структурированный JSON. Превращает LLM в полноценного агента.
КонцепцияКусочки текста, по которым LLM считает цену и контекст. 1 русское слово ≈ 2-3 токена. Биллинг и оптимизация.
КонцепцияПроцесс генерации ответа моделью. Скорость в токенах/сек влияет на UX. Латентность критична для real-time.
КонцепцияТехника промптинга: модель рассуждает шаг за шагом перед ответом. Прирост качества на сложных задачах 20-40%.
КонцепцияДва режима работы LLM: без примеров и с примерами в промпте. Базовый рычаг качества классификации и форматирования.
МетодологияМодель уверенно выдаёт правдоподобный, но фактически ложный ответ. Главный источник риска в продакшне.
РискПараметр случайности генерации 0-2. 0 — детерминированно, 1 — креативно, 2 — иногда бред. Базовая настройка LLM.
КонцепцияLLM, которые «думают» перед ответом. Claude thinking, o1/o3, Gemini deep-think. В 5-15 раз дороже, экспертное качество.
АрхитектураLLM, которая принимает текст, изображения, аудио, видео в одном запросе. Стандарт у Claude 4.7, GPT-5, Gemini.
КонцепцияПодкласс мультимодальных: чтение скриншотов, анализ фото, разбор сканов, оценка дизайна. Стандарт у топ-LLM.
АрхитектураОбучение маленькой быстрой модели на ответах большой. 80% качества за 5% цены — для типовых задач рабочий компромисс.
МетодологияReinforcement Learning from Human Feedback. Метод, благодаря которому LLM научились следовать инструкциям. Основа ChatGPT и Claude.
МетодологияАрхитектура, где активируется только часть модели на запрос. Триллион параметров с инференсом как у 70B. Mixtral, DeepSeek, GPT-5.
АрхитектураСжатие весов модели (INT8, INT4) — экономия памяти в 4-8 раз с падением качества 1-5%. Базовая техника self-host.
МетодологияLow-Rank Adaptation. Метод дешёвого fine-tuning: обучаются только маленькие адаптеры рядом с весами. Стоимость падает в 1000 раз.
МетодологияЗакешированные токены стоят 10-50% от обычного input. Экономия 60-80% бюджета для агентных систем.
ОптимизацияLLM возвращает структурированный JSON с именем функции и аргументами вместо текста. Основа агентов.
КонцепцияРежим LLM, гарантирующий ответ строго по JSON-схеме. Решает 5% багов с поломанным JSON в продакшне.
КонцепцияModel Context Protocol от Anthropic — стандарт интеграции LLM с внешними системами через единый интерфейс.
ПротоколCLI-инструмент Anthropic для работы с Claude в командной строке. Доступ к файлам, командам, MCP-серверам.
HarnessCLI OpenAI для работы с кодом через GPT-5. Альтернатива Claude Code: те же возможности, модель от OpenAI.
HarnessIDE на основе VS Code с глубокой AI-интеграцией. Tab-completion, chat с проектом, агентский режим.
IDEOpen-source AI-extension для VS Code. Bring your own key, поддержка Claude, GPT-4, локальных моделей.
ExtensionOpen-source extension для VS Code и JetBrains. Альтернатива GitHub Copilot с конфигом через YAML.
ExtensionAI-first IDE от Codeium (после покупки OpenAI). Cascade-агент с multi-file правками. Конкурент Cursor.
IDEМолниеносный редактор на Rust от авторов Atom. Встроенный AI-чат, MCP-поддержка, multiplayer.
IDEClaude Code-совместимый CLI на MiniMax M2.7. Дешевле и быстрее Anthropic для рутинных задач.
HarnessSelf-hostable визуальный оркестратор workflow для бизнес-автоматизации. Низкий порог, работа с LLM-API.
ИнструментПионер AI-кодинга от GitHub и OpenAI. С 2021 года стандарт индустрии: автодополнение, чат, агент. От $10/мес.
ИнструментOpen-source CLI для парного программирования с LLM. Bring your own key, git-aware, минимализм. Любимец индустрии.
HarnessПервый коммерческий полностью автономный AI-инженер от Cognition. $500/мес. Идея — сильнее реальности 2026.
HarnessAI-агент внутри облачной IDE Replit: full-stack приложения из чата. От идеи до URL за 30-90 минут.
HarnessUI-генератор от Vercel. Описание → React/Next.js код с превью. Лучший инструмент для лендингов и форм.
HarnessFull-stack приложения в браузере через WebContainers от StackBlitz. Конкурент Replit Agent.
HarnessШведский full-stack по описанию: Supabase backend, Stripe-оплата. Production-ready SaaS из чата.
HarnessСамый известный Python/JS фреймворк для LLM-приложений. Любим за быстрый старт, критикуем за абстракции.
ФреймворкГрафовый фреймворк для агентов: явные состояния, переходы, checkpoints. От тех же авторов, что LangChain.
ФреймворкPython-фреймворк мультиагентных команд: каждая роль — отдельный агент с инструментами. Декларативный синтаксис.
ФреймворкAI-лаборатория из США, разработчик семейства Claude и протокола MCP. Один из трёх ведущих поставщиков LLM.
КомпанияСоздатель ChatGPT и серии GPT-4/GPT-5. Один из трёх ведущих поставщиков LLM на рынке.
КомпанияAI-подразделение Google. Создатели Gemini (контекст до 2М токенов), AlphaFold, AlphaGo.
КомпанияФранцузская AI-компания. Open-source модели (Mixtral) и enterprise API. Европейская альтернатива US-игрокам.
КомпанияКанадская enterprise-first AI-компания. Модели Command и Embed, private deployment в инфраструктуре клиента.
КомпанияИзраильская AI-лаборатория. Jurassic и Jamba (гибрид Transformer + Mamba, контекст 256К).
КомпанияЛинейка LLM Яндекса. Доступна через Yandex Cloud. Compliance с РФ-регулированием. Сильна на русском.
Компания · RUЛинейка моделей Сбера (GigaChat Pro/Max/Lite, GigaCode). Глубокая интеграция со Sберовской экосистемой.
Компания · RUAI Т-Банка: голосовой Олег, anti-fraud модели, open-source T-lite/T-pro для русскоязычной разработки.
Компания · RUVK Cloud + GenericGPT + AI-features в продуктах VK. Облачные GPU и интеграция с VK-экосистемой.
Компания · RUVirtual Private Server. Основа self-hosted AI: боты, n8n, базы, LLM-инференс. От $5/мес на Contabo.
ИнфраКонтейнеры для упаковки приложений. De-facto стандарт деплоя AI-сервисов: ботов, n8n, моделей.
ИнфраApplication Programming Interface. Все LLM, инструменты и сервисы работают через REST или WebSocket API.
ИнфраHTTP-уведомления о событиях. Основа реактивной AI-автоматизации: событие → webhook → AI-обработка.
ИнфраAWS, GCP, Azure, Yandex Cloud, SberCloud, VK Cloud, Selectel. Compute, storage, AI-сервисы.
ИнфраОтчёт о прибылях и убытках. Первая таблица, которую мы открываем с фаундером, прежде чем обсуждать ИИ.
БизнесФонд оплаты труда. Главная статья, которую освобождают AI-агенты при правильном внедрении.
БизнесПлан поэтапного внедрения ИИ на горизонтах 30/90/180 дней. Строится от P&L конкретной компании.
БизнесOpen-source observability для LLM: трейсинг запросов, оценка качества, мониторинг стоимости токенов.
ObservabilityМетрика возврата инвестиций для AI-проекта. Формула простая, сложность — учесть четыре источника выгоды.
БизнесБазовая метрика юнит-экономики AI: сколько стоит один запрос. Без отслеживания AI-стартап быстро убыточен.
БизнесЗадержка для 95% пользователей AI-сервиса. Не средняя, а перцентиль 95. Влияет на retention.
МетрикаАтака на LLM через входные данные. Главный класс уязвимостей AI-систем, аналог SQL-injection.
БезопасностьАвтоматическое маскирование персональных данных перед отправкой в LLM. Базовое требование 152-ФЗ и GDPR.
БезопасностьСпециализированная СУБД для эмбеддингов. Основа RAG: релевантные документы за миллисекунды среди миллионов.
АрхитектураВторая модель в RAG-пайплайне: пересортирует топ-50 кандидатов по релевантности. Качество поиска +50-100%.
АрхитектураРазбиение документов на фрагменты для индексации. От стратегии напрямую зависит качество RAG.
МетодологияOpen-source ASR от OpenAI. Распознавание речи 99 языков. Через Groq — быстрее реального времени.
ИнструментText-to-Speech: ElevenLabs, OpenAI tts-1, Sesame. Современные модели почти неотличимы от живого диктора.
ИнструментAI управляет компьютером: видит экран, двигает мышью, заполняет формы. От Anthropic с октября 2024.
КонцепцияКомпозиция Whisper + LLM + TTS + телефония. Голосовой агент, заменяющий телефонного оператора.
АрхитектураLLM с веб-поиском, читает страницы, переформулирует запрос. Основа Perplexity, ChatGPT Search.
АрхитектураАвтоматическая оценка качества LLM-ответов. LLM-as-judge. Без evals продакшн-AI работает вслепую.
МетодологияЗащитные правила для LLM: фильтры тем, проверки PII, защита от prompt injection. Гигиена продакшна.
Безопасность