Как проверить, использовали ли ваши фотографии для обучения распознавания лиц

В наше время распознавание лиц вышло за пределы фильмов про шпионов: им пользуются для входа в смартфоны и проверки паспортов в аэропортах. Технология упростила проверку личности, но одновременно вызвала тревогу у людей, которые не хотят, чтобы их фотографии использовались без согласия.
Если вы пользователь Flickr или публиковали фотографии в других общедоступных местах, появился инструмент, который помогает узнать, попали ли ваши изображения в учебные наборы для алгоритмов распознавания лиц. Ниже — как это проверить, что с этим можно сделать и какие ограничения есть у юридических и технических путей защиты.
Почему мои фотографии могут использоваться для обучения распознавания лиц
Разработчикам и исследователям нужны большие и разнообразные наборы лиц, чтобы обучить и тестировать алгоритмы. Часто в качестве источника берут уже опубликованные в интернете фото.
Распознавание лиц учится на образцах: важны пол, цвет кожи, возраст, выражение лица и прочие вариации. Платформы с миллионами изображений, например Flickr, логично привлекают внимание исследователей и компаний, которые собирают данные для обучения.
В 2019 году широко обсуждался случай, когда фотографии с Flickr использовались в датасетах для тренировок без уведомления авторов и изображённых людей. Многие фотографы узнали об этом только после публикаций в СМИ.
«Никто из людей, которых я фотографировал, не подозревал, что их изображения используются таким образом. Это кажется сомнительным — IBM может использовать эти фото, не сообщив никому», — сказал один из фотографов в интервью.
Проблемы и риски распознавания лиц
Ключевые проблемы:
- Системы могут отражать и усиливать расовые и гендерные предубеждения, если датасеты несбалансированы. Наблюдались случаи, когда точность для тёмнокожих женщин была ниже.
- Технология может использоваться для массового наблюдения и слежки без юридических ограничений.
- Публичные изображения, лицензированные свободно, позволяют компаниям легально использовать фото, даже если люди на них не давали явного согласия.
В 2020 году компания IBM публично объявила о выходе из рынка коммерческих решений по распознаванию лиц и призвала к общественному диалогу о правовом регулировании таких технологий. В письме тогдашний руководитель отметил опасения по поводу злоупотреблений и необходимости прозрачности.
Как проверить, использовали ли ваши фотографии
Если у вас есть аккаунт Flickr, проще всего начать с инструмента exposing.ai.

Exposing.ai сканирует несколько общедоступных датасетов (более трёх миллионов фотографий в нескольких наборах) и позволяет искать совпадения по трём типам запросов:
- имя пользователя Flickr
- хэштег
- URL конкретной фотографии

Инструкция по проверке:
- Перейдите на сайт exposing.ai.
- Введите ваш Flickr username, хэштег или URL фотографии в поле поиска на главной странице.
- Нажмите Search и посмотрите результаты: сервис покажет, присутствует ли изображение в сканируемых наборах и какие метаданные сопутствуют (лицензия, источник).

Результат появится за секунды — вы увидите, попала ли фотография в один из проиндексированных датасетов, и сможете оценить источник.
Что можно сделать, если ваше фото оказалось в датасете
Короткий ответ: удалить уже опубликованный датасет обычно нельзя. Наборы данных часто копируются и распространяются, поэтому один запрос об удалении не гарантирует полного исчезновения. Тем не менее есть практические шаги, которые стоит рассмотреть:
- Проверьте лицензию фотографии. Если снимок был опубликован по открытой лицензии (например, Creative Commons), его использование могло быть легальным в рамках этой лицензии.
- Удалите исходник или измените настройки доступа / лицензию на платформе (при возможности). Это поможет предотвратить дальнейшее попадание в новые датасеты.
- Свяжитесь с владельцами датасета или платформой, на которой он размещён, и отправьте запрос на удаление (если вы считаете, что права нарушены). Реакция зависит от юрисдикции и правил площадки.
- Для жителей ЕС и некоторых других юрисдикций можно попробовать воспользоваться положениями о защите персональных данных (например, запрос на удаление персональных данных по GDPR). Это не гарантирует удаление из уже скачанных копий, но иногда помогает удалить данные с сервера организации.
- Публично заявить о нарушении и привлечь внимание сообщества или медиа в случаях явных злоупотреблений.
Важно: если фотография была в свободном публичном датасете на условиях открытой лицензии, законные пути блокировки уже разошедшихся копий ограничены.
Практическая пошаговая методика для пользователей
- Соберите исходные данные: ссылки на ваши фотографии, имена пользователей и хэштеги.
- Проверьте exposing.ai и аналогичные инструменты (по мере появления новых проектов).
- Оцените лицензию каждой найденной фотографии.
- При необходимости измените доступ или лицензию на исходной платформе.
- Отправьте запросы на удаление владельцам датасета/площадки и при необходимости используйте правовые механизмы в вашей стране.
- Документируйте переписку и шаги — это пригодится при эскалации.
Чек-лист по ролям
Для обычного пользователя:
- Проверить настройки приватности в аккаунтах.
- Избегать публикации фото с лицами, которые вы не хотите распространять.
- Проверить лицензию перед публикацией.
Для фотографа и автора контента:
- Указывать явные условия использования и лицензию для своих изображений.
- Рассматривать продажу прав или использование водяных знаков, если важно ограничить повторное использование.
Для администратора площадки:
- Предоставлять понятную информацию о лицензиях и способах удаления контента.
- Обеспечивать инструменты для запроса удаления персональных данных.
Для исследователя или разработчика ИИ:
- Предпочитать наборы данных с явным согласием участников.
- Документировать происхождение изображений и лицензионные ограничения.
Когда инструмент может ошибаться или не дать результата
- Если изображение было модифицировано (кадрирование, сильная ретушь, изменение цвета), совпадение может не обнаружиться.
- Если фото хранится в приватных или корпоративных датасетах, exposing.ai не сможет его индексировать.
- Если автор изменил лицензию или удалил изображение с оригинальной площадки до индексации, данные могут быть неполными.
Альтернативные подходы и дополнительные инструменты
- Обратный поиск по изображению (Google Images, TinEye) помогает найти копии фото в сети, но не показывает принадлежность к специализированным наборам данных для распознавания лиц.
- Мониторинг своих аккаунтов и периодические экспорты метаданных помогают отслеживать историю публикаций.
- Пользоваться услугами профессиональных юристов по защите данных при серьёзных нарушениях.
Соображения по приватности и законы о защите данных
Законодательство в области данных различается по странам. Например, в ЕС GDPR даёт механизмы для запросов на удаление персональных данных, но применение зависит от конкретного случая и баланса прав. В других юрисдикциях права пользователя могут быть ограничены для контента, опубликованного по открытой лицензии.
Если вы сомневаетесь, проконсультируйтесь с юристом по защите данных в вашей стране — особенно при возможных злоупотреблениях или угрозе вашей безопасности.
Важно: юридические механизмы работают по-разному. Нельзя гарантировать мгновенное или полное удаление данных из всех копий датасета.
Практические рекомендации перед публикацией фотографий
- Оценивайте, нужна ли публикация снимков с лицами в открытом доступе.
- Используйте приватные альбомы или ограниченный доступ, если публикация необходима, но вы не хотите широкой дистрибуции.
- Указывайте лицензию и предупреждайте субъектов съёмки о возможном использовании кадра.
- По возможности просите письменное согласие тех, кто запечатлён на фото.
Короткие сценарии и примеры решений
Сценарий 1 — Фото с открытой лицензией оказалось в датасете:
- Действие: проверить лицензию, удалить исходник (если возможно), отправить запрос на удаление и документировать ответы.
- Ожидание: полное удаление из всех копий маловероятно.
Сценарий 2 — Фото в приватном профиле попало в датасет:
- Действие: запрос к владельцу датасета и платформе об удалении, возможна подача жалобы о нарушении приватности.
Сценарий 3 — Вы исследователь и хотите избежать проблем с этикой:
- Действие: использовать наборы данных с явным согласием и прозрачной лицензией; документировать источники и процесс согласования.
Часто задаваемые вопросы
Как работает exposing.ai и что он ищет?
Exposing.ai индексирует несколько общедоступных наборов фотографий и позволяет искать совпадения по имени пользователя, хэштегу или URL. Он показывает, присутствует ли изображение в проиндексированных датасетах и какие метаданные доступны.
Могу ли я потребовать удалить своё лицо из датасета?
Можно отправить запрос на удаление владельцам датасета и площадкам, но полностью остановить распространение уже скачанных копий сложно. В некоторых юрисдикциях можно воспользоваться механизмами защиты персональных данных.
Что делать, чтобы избежать использования моих фото в будущем?
Публикуйте меньше фото с явными лицами, используйте приватные альбомы, проверяйте лицензии и просите согласие у людей на съёмку и публикацию.
Итог
Технологии распознавания лиц требуют прозрачности и этики при сборе данных. Exposing.ai и похожие инструменты помогают понять масштабы использования ваших изображений, но они не всегда решают проблему полностью. Лучшие практики — контролировать настройки приватности, управлять лицензиями и, при необходимости, использовать юридические механизмы вашей юрисдикции.
Заметки:
- Если вы живёте в юрисдикции с законом о защите персональных данных, проверьте свои права на доступ и удаление данных.
- Документируйте все запросы на удаление — это поможет при эскалации.
Краткое резюме в конце: если вы публикуете изображения в открытом доступе, есть реальный риск, что они попадут в тренировочные наборы для распознавания. Профилактика и осмотрительное управление лицензиями — лучшие способы снизить этот риск.
Похожие материалы
Несколько аккаунтов Skype: Multi Skype Launcher
Журнал для работы: повысить продуктивность
Персональные звуки уведомлений на Android
Скачивание шоу Hulu для офлайн‑просмотра
Microsoft Start: персонализированная новостная лента