ИИ-стек 2026 для компании 100+ человек — что реально работает
Каждую неделю выходит десяток новых ИИ-инструментов с громкими заявлениями. У фаундера компании на 100-300 человек нет ни времени, ни смысла гоняться за всеми. В этой статье — мой рабочий ИИ-стек 2026 года: что реально использую сам, чему учу фаундеров в программе Personal, что развёрнуто в продакшне у клиентов.
Принцип выбора инструментов
Для компании 100+ человек я выбираю инструменты по трём критериям. Первое — наличие у инструмента production-grade SLA и стабильности API. Эксперименты в режиме «вчера работало, сегодня нет» допустимы для одного фрилансера, но не для команды 200 человек. Второе — открытый стандарт или открытый исходный код. Если завтра вендор удвоит цены или закроется, переход на альтернативу не должен стоить миллионы. Третье — наличие активного сообщества и документации на русском или хотя бы понятном английском.
LLM-провайдеры: Anthropic, OpenAI, MiniMax
Anthropic Claude. Основной провайдер в моей практике. Семейство моделей Claude 4 — лучшее на рынке для большинства корпоративных задач: чтение длинных документов, написание текстов, code generation, multi-step reasoning. Качество ответов на русском заметно выше конкурентов. Цена: средняя по рынку. Используется в Claude Code, через API, через MCP-серверы.
OpenAI ChatGPT / API. Резервный провайдер и инструмент для специфических задач. Лучший в Function Calling, Vision (анализ изображений), Realtime API для голоса. У OpenAI традиционно сильная линейка дешёвых моделей нижнего сегмента (актуальную mini/nano-вариацию смотри в их официальном прайсинге — поколение быстро обновляется), часто использую для массовых задач типа классификации. Используется параллельно с Anthropic.
MiniMax. Китайский провайдер, который в 2025-2026 стал серьёзным конкурентом OpenAI и Anthropic в нескольких нишах. Лучший в генерации видео (HailuoAI), генерации голоса, и при этом значительно дешевле западных аналогов. Используется в моей практике для контент-pipeline.
В программе Personal я учу фаундеров выбирать провайдера под конкретную задачу. Это не «один лучше всех», а «у каждого свои сильные стороны».
CLI и оркестрация: Claude Code + MCP
Claude Code — CLI-инструмент Anthropic, через который я работаю каждый день. Это не просто чат, а полноценная среда для ИИ-разработки. См. отдельную статью «Claude Code за 30 минут для тех, кто не пишет код».
MCP (Model Context Protocol) — стандарт от Anthropic для интеграции Claude с внешними системами. На середину 2026 года есть готовые MCP-серверы для Gmail, Google Drive, GitHub, Notion, Slack, PostgreSQL, MySQL, веб-поиска, файловой системы. Развёрнуть MCP в продакшне — несколько часов работы, не недели.
Workflow-оркестрация: n8n
Когда ИИ-агент должен запускаться по расписанию, в ответ на событие в CRM или Telegram — я использую n8n. Это self-hostable визуальный конструктор workflow с готовыми интеграциями для сотен сервисов. Лицензия — fair-code (Sustainable Use License): код открыт, использование внутри своей компании бесплатное, ограничения касаются только коммерческой перепродажи как услуги. n8n умеет вызывать Anthropic, OpenAI, MiniMax API нативно. Развёртывается на собственном сервере или в облаке.
Альтернативы — Zapier и Make.com — закрытые SaaS-сервисы с понятной ценой за вызов. Для небольших объёмов подходят, для серьёзных нагрузок self-hosted n8n окупается за несколько месяцев.
CRM и интеграции
В программах для компаний 100+ человек обычно фаундер уже использует одну из CRM: HubSpot, AmoCRM, Bitrix24 для России, или open-source Twenty. Все они интегрируются с ИИ-агентами через n8n или MCP. Я не диктую выбор CRM — работаю с тем, что уже стоит у клиента.
Для совсем новых внедрений рекомендую Twenty — open-source CRM с современным интерфейсом и хорошей API. Размещение на собственном сервере = полный контроль над данными, что важно для compliance.
Наблюдаемость: Langfuse
Без observability запускать ИИ-агента в продакшн опасно. Промпты могут регрессировать, модель — давать неожиданные ответы, токены — внезапно подскочить в три раза. Langfuse — open-source инструмент, который трекает каждый вызов модели, считает деньги, ловит галлюцинации, даёт дашборды качества.
Альтернатива — LangSmith от LangChain. Тоже хороший, но проприетарный и платный. Langfuse я предпочитаю за открытость и возможность self-hosting.
Аналитика для бизнеса: Umami
Umami — open-source аналитика для сайтов и продуктов, замена Google Analytics. На каждой моей странице стоит Umami, через неё я вижу источники трафика, поведение пользователей, конверсии. Лёгкий, GDPR-compliant, self-hosted. Не ИИ-инструмент сам по себе, но входит в стек, потому что без аналитики невозможно мерить эффект внедрения ИИ.
Голосовые модели и аватары
Для контент-pipeline в 2026 году актуально: HeyGen или Synthesia для ИИ-аватаров (генерация видео с цифровой версией спикера), MiniMax T2A или ElevenLabs для синтеза голоса, Suno или MiniMax Music для генерации музыки. Эти инструменты позволяют команде маркетинга производить контент кратно быстрее без потери качества.
Безопасность и compliance
Для компаний с чувствительными данными — медицина, финансы, юридические услуги — отдельная история с self-hosted моделями. Llama 3 от Meta и Qwen от Alibaba — open-source модели уровня GPT-4o, которые можно развернуть на собственных серверах. Качество ниже флагманского Claude или ChatGPT, но данные не покидают периметр компании.
Я не сторонник self-hosted моделей для большинства задач — overhead на инфраструктуру и поддержку обычно перевешивает выгоду от приватности. Но для конкретных compliance-сценариев это рабочее решение.
Чего я НЕ использую
Несколько категорий инструментов, от которых я в 2026 году отказался. AutoGPT и его клоны — слишком нестабильны, дают непредсказуемые результаты. Большинство no-code ИИ-конструкторов на маркетплейсах — производят красивые демо, но не масштабируются на реальные задачи бизнеса. LangChain без Langfuse — высокий уровень абстракций без observability, как лететь без приборов.
Как начать
Для фаундера компании 100+ человек минимальный стартовый стек: Claude Code на личной машине + 2-3 MCP-сервера под ваши задачи + Langfuse для observability. Инвестиции: несколько часов на настройку + 50-100 тыс ₽/мес на API. Этого хватает, чтобы за месяц получить первые рабочие ИИ-агенты в продакшне.
В программе Personal мы проходим этот путь вместе. За 4 сессии — рабочий стек, первый агент, понимание экономики. Связаться бесплатно, 30 минут — разберём вашу конкретную ситуацию.