Медицинские данные пациентов в нейросеть: закон

Медицинские данные пациента — это особая категория персональных данных, и закон относится к ним строже всего. Загрузка диагнозов и историй болезни в обычный чат с зарубежной языковой моделью почти всегда означает передачу особой категории данных за рубеж без законного основания. Это создаёт реальные риски штрафов и претензий. При этом сама нейросеть клинике полезна — вопрос в том, какие данные она видит и где они обрабатываются.

Почему особая категория

TL;DR

Данные о здоровье пациента закон относит к особой категории персональных данных с самым строгим режимом обработки. Загрузка диагнозов и историй болезни в публичный чат с моделью обычно означает их трансграничную передачу без законного основания и согласия пациента. Безопасный путь для клиники — обезличивать данные перед обработкой либо использовать локальные решения, откуда данные никуда уходят.

Персональные данные закон делит на категории, и данные о состоянии здоровья стоят в самом строгом ряду — особая категория. К ней же относятся сведения о диагнозах, результатах обследований, назначениях. Обрабатывать такие данные можно лишь при узком наборе оснований, и обычное «пациент когда-то подписал согласие на лечение» сюда автоматически выпадает из числа таких оснований. Под обработкой закон понимает любое действие с данными, включая передачу их стороннему сервису.

Когда сотрудник клиники копирует историю болезни в чат с зарубежной моделью, происходит сразу несколько событий с точки зрения закона. Данные особой категории передаются третьему лицу — владельцу сервиса. Эта передача чаще всего трансграничная, потому что серверы модели расположены за рубежом. И всё это — без отдельного законного основания именно на такую обработку. Каждое из этих событий по отдельности уже создаёт риск.

Важно понимать, где рождается риск. Его создаёт попадание в нейросеть идентифицируемых данных пациента. Сама по себе работа с моделью остаётся безопасной, пока в неё уходят лишь обезличенные сведения. Закон защищает связку «конкретный человек плюс сведения о его здоровье». Если из текста невозможно понять, о ком идёт речь, эта связка разрывается, и режим особой категории к обезличенному фрагменту уже теряет прежнюю строгость. Отсюда растут все безопасные сценарии работы клиники с ИИ.

Чем это грозит

Последствия лежат в нескольких плоскостях, и финансовый штраф здесь — лишь одна из проблем, причём редко главная. Разберём, что именно стоит на кону, чтобы решение принималось трезво, помимо интуиции «вроде все так делают».

Административная ответственность за нарушение порядка обработки персональных данных особой категории
Отдельные санкции за трансграничную передачу данных без соблюдения требований закона
Претензии и иски от пациента, чьи данные о здоровье ушли третьему лицу без основания
Репутационный удар: утечка медицинских сведений разрушает доверие к клинике быстрее любого штрафа
Риск, что данные осядут на стороне сервиса и используются для обучения будущих версий модели

// Опасное заблуждение

«Мы же без фамилии, значит всё чисто». Идентифицировать пациента можно по связке косвенных признаков: редкий диагноз, дата приёма, возраст, район, место работы. Если по тексту реально понять, о ком речь, данные считаются персональными, даже без прямого имени. Обезличивание — это работа, а одной вычеркнутой строкой с фамилией тут дело обходится.

Отдельно стоит риск, который владельцы клиник недооценивают: судьба данных после отправки. Публичные сервисы в своих условиях нередко оставляют за собой право использовать введённые данные для улучшения моделей. Это означает, что фрагмент истории болезни может пройти дальше разовой обработки и осесть в системе провайдера. Для особой категории данных такой исход — отдельное и серьёзное нарушение.

Безопасные сценарии

Запрет на бездумную загрузку оставляет место для ИИ в клинике. Большая часть полезных сценариев обходится без того, чтобы модель видела идентифицируемого пациента. Вот рабочая логика выбора: чем чувствительнее данные, тем ближе к контуру клиники они должны обрабатываться.

Сценарий	Какие данные нужны модели	Безопасный путь
Ответы на частые вопросы пациентов	Только услуги, цены, расписание — без диагнозов	Обычный чат-бот, личные данные ему остаются недоступны
Черновики типовых медицинских текстов	Обезличенный шаблон без привязки к пациенту	Публичная модель по обезличенному фрагменту
Разбор историй болезни и диагнозов	Идентифицируемые данные особой категории	Локальная модель внутри контура клиники
Сводки и аналитика по приёмам	Агрегированные обезличенные данные	Обезличивание до обработки, без привязки к лицу

Первый рубеж защиты — обезличивание. Перед тем как отдать текст модели, из него убирают всё, что позволяет узнать пациента: имя, контакты, точные даты, редкие детали. Делать это вручную по сотням документов тяжело, поэтому обезличивание стоит встроить в процесс отдельным шагом, который контролирует человек. Это та самая работа, ради которой и стоит звать специалиста по внедрению вместо опоры на интуицию сотрудника.

Второй рубеж для самых чувствительных задач — локальное решение. Модель разворачивают на серверах клиники или в доверенном контуре, и данные физически остаются внутри периметра. Это дороже публичного чата и требует настройки, зато снимает вопрос трансграничной передачи целиком. Подробнее об этом пути стоит говорить отдельно, когда понятно, какие именно задачи требуют доступа к идентифицируемым данным.

● Discovery · 1 час · бесплатно

Если в вашей клинике уже используют нейросети или вы только планируете, я помогу разложить сценарии по уровню риска и закрыть те, что нарушают закон. Разберём это на бесплатном часовом созвоне.

Прийти на Discovery →

Как внедрять

Правильный порядок внедрения снимает большую часть рисков ещё до запуска. Принцип простой: сначала разделить данные по чувствительности, потом подбирать инструмент под каждый уровень. Обратный путь — взять модель и думать, что бы ей скормить — как раз и приводит к нарушениям.

Опишите, какие задачи в клинике реально хотите ускорить нейросетью
Для каждой задачи определите, нужны ли модели идентифицируемые данные пациента
Задачи без таких данных запускайте на обычном чате: ответы, расписание, типовые тексты
Для обезличиваемых задач встройте отдельный шаг очистки текста под контролем человека
Задачи с доступом к диагнозам выносите в локальное решение внутри контура клиники
Закрепите письменное правило для сотрудников: что и куда загружать запрещено

// Самый дешёвый шаг защиты

Письменный регламент для сотрудников. Большинство утечек случается из-за того, что врач или администратор по привычке вставил историю болезни в публичный чат, а вовсе по вине хакеров. Понятное правило «диагнозы и фамилии в эти сервисы загружать запрещено» закрывает основную долю риска и стоит копейки.

Что в итоге

Закон оставляет клинике право пользоваться нейросетями — он лишь запрещает бесконтрольно отдавать данные особой категории третьим лицам и за рубеж без основания. Эти две вещи легко путают, и из-за путаницы клиники либо отказываются от полезного инструмента совсем, либо нарушают закон по незнанию. Правильная позиция посередине: разделить данные по чувствительности и подобрать безопасный путь под каждый уровень.

Большую часть пользы от ИИ клиника получает на задачах, где идентифицируемый пациент модели вообще лишний: ответы на частые вопросы, расписание, типовые тексты, обезличенная аналитика. Эти сценарии запускаются быстро и почти без юридического риска. Чувствительные задачи с доступом к диагнозам решаются дольше и через локальные решения, но и они решаемы.

Главная ошибка — действовать на интуиции «вроде ничего страшного» или, наоборот, бояться технологии целиком. И то, и другое дорого обходится. На разборе процессов мы вместе раскладываем ваши задачи по уровню риска и определяем, что можно запускать сразу, что после обезличивания, а что требует локального контура.

Частые вопросы

Можно ли вообще загружать медицинские данные пациентов в нейросеть?

Идентифицируемые данные о здоровье в публичный чат с зарубежной моделью загружать опасно: это передача особой категории персональных данных третьему лицу и за рубеж без законного основания. Безопасны два пути: обезличить текст до обработки либо использовать локальное решение внутри контура клиники, где данные остаются внутри периметра.

Достаточно ли убрать фамилию, чтобы данные перестали быть персональными?

Одной фамилии мало. Пациента идентифицируют по связке косвенных признаков: редкий диагноз, дата приёма, возраст, район, место работы. Если по тексту реально понять, о ком речь, данные остаются персональными. Обезличивание — это отдельная работа по удалению всех таких признаков, а вычёркивание одной строки.

Чем грозит клинике загрузка диагнозов в чат с моделью?

Сразу несколькими рисками: административная ответственность за обработку особой категории данных, отдельные санкции за трансграничную передачу, иски от пациента и репутационный удар от утечки. Плюс данные могут осесть на стороне сервиса и попасть в обучение будущих версий модели. Для медицинских сведений это серьёзное нарушение.

Какие задачи клиника может отдать нейросети безопасно?

Те, где модели хватает обезличенных сведений: ответы на частые вопросы про услуги и расписание, черновики типовых текстов по обезличенному шаблону, агрегированная аналитика без привязки к лицу. Эти сценарии запускаются быстро и почти без юридического риска, потому что модель тут работает лишь с обезличенными данными.

Что такое локальное решение и зачем оно клинике?

Это модель, развёрнутая на серверах клиники или в доверенном контуре, откуда данные физически никуда уходят. Локальное решение нужно для задач, где модели всё же требуется доступ к диагнозам и историям болезни. Оно дороже публичного чата и требует настройки, зато снимает вопрос трансграничной передачи целиком.

С чего начать клинике, чтобы остаться в рамках закона?

С письменного регламента для сотрудников: понятное правило, что диагнозы и фамилии в публичные сервисы загружать запрещено. Большинство утечек случается из-за привычки врача вставить историю болезни в чат, а из-за хакеров. Регламент стоит копейки и закрывает основную долю риска ещё до настройки инструментов.