● Риск / Уровень: средний / Q2 · 2026 / 32 из 90

PII redaction.

вырезание персональных данных перед LLM
Короткий
ответ
PII redaction — это удаление персональных данных из текста до отправки в LLM. Паспорта, СНИЛС, телефоны, email — заменяются на токены-плейсхолдеры. Обязательно для российского рынка по 152-ФЗ и для compliance в EU (GDPR) и US (HIPAA, CCPA).

01 Зачем нужно

Облачные LLM (Claude, OpenAI) — это передача данных в США. С точки зрения 152-ФЗ — трансграничная передача ПДн. Без редактирования или явного согласия — нарушение.

Аналогично GDPR в EU и HIPAA в США для медицинских данных. PII redaction — это слой compliance перед использованием облачных LLM.

02 Что редактировать

  • ФИО.
  • Номера документов (паспорт, ИНН, СНИЛС, водительское).
  • Контакты (телефон, email, мессенджеры).
  • Адреса.
  • Банковские реквизиты, карты.
  • Медицинские данные.
  • Биометрия.

03 Как реализовать

  1. Регулярки для очевидного — паспорт, телефон, email, банковские карты.
  2. Локальная NER-модель для имён и адресов (например, Stanza, spaCy, Natasha для русского).
  3. Замена на токены: [NAME_1], [PHONE_2], [EMAIL_3].
  4. Сохранение mapping «токен → оригинал» локально.
  5. После ответа LLM — обратная подстановка для пользователя.

04 Альтернативы

  • On-prem LLM — Llama / GigaChat / YandexGPT. Данные не уходят.
  • EU/RU residency — Vertex AI EU, Azure OpenAI EU, Yandex Cloud.
  • DPA с провайдером — заключаете договор обработки персональных данных.
// 07

Частые вопросы

01 Можно ли отправлять ПДн в Claude напрямую?

Только с явным согласием пользователя в политике конфиденциальности и желательно через GDPR-compliant провайдер (Vertex AI с EU residency).

02 Готовые библиотеки?

Microsoft Presidio — лидер open-source для PII detection. Для русского — Natasha + кастомные regex.

Понимаем — учим
работать с PII redaction
внутри команды.

Час бесплатной диагностики: разбираем 2–3 ваших процесса и говорим прямо, где AI окупится за квартал, а где брать рано. Знания остаются у вашей команды.

Готовы поговорить?
@Aleksei_Shturbin Бот →