Гид по технологиям

Как извлечь текст из изображения в Chrome

5 min read Руководства Обновлено 20 Dec 2025
Извлечь текст из изображения в Chrome
Извлечь текст из изображения в Chrome

Краткое введение

Обычно для извлечения текста из изображения используют OCR (оптическое распознавание символов). Начиная с Chrome 76, появился способ использовать встроенную экспериментальную функцию браузера — Shape Detection API — чтобы получать текст из изображений без дополнительного ПО. Эта функция использует аппаратное ускорение на устройстве, где она запущена, и может работать быстрее и экономнее по ресурсам.

Что такое Shape Detection API

Shape Detection API — это набор веб-интерфейсов, которые позволяют браузеру обнаруживать штрих‑коды (включая QR), лица и текст в изображениях с помощью аппаратных возможностей устройства. Коротко: Text Detection = попытка найти текстовые блоки на изображении и вернуть их в виде структурированных данных.

Важно: это экспериментальная возможность. Её реализация и поведение зависят от устройства, драйверов и версии Chrome.

Кому и когда это полезно

  • Быстрый перенос печатного текста из скриншота в заметку без установки OCR-приложений.
  • Локальная обработка конфиденциальных изображений, когда не хочется отправлять данные в облако.
  • Быстрая проверка качества распознавания при разработке фич, связанных с изображениями.

Когда это не сработает (примеры отказов)

  • Нечёткие, смазанные или очень маленькие шрифты.
  • Рукописный текст (ручное письмо распознаётся плохо или не распознаётся вовсе).
  • Сложные макеты, наложенный текст поверх насыщенного фона.
  • Языки/шрифты без поддержки в текущей реализации API.

Шаг за шагом: включение и использование в Chrome

  1. Откройте Chrome.
  2. В адресной строке введите:
chrome://flags
  1. В строке поиска флагов введите “Experimental web platform”. Либо вставьте прямо:
chrome://flags/#enable-experimental-web-platform-features
  1. Рядом с флагом «Experimental Web Platform» выберите “Enabled” (Включено).

Поле поиска флагов с запросом «Experimental web platform».

  1. Нажмите синюю кнопку «Relaunch Now» (Перезапустить сейчас) внизу, чтобы перезапустить Chrome и применить изменения.

Выбор «Enabled» в выпадающем меню для включения флага.

  1. Откройте сайт https://copy-image-text.glitch.me/ — он выполняет распознавание локально и может работать офлайн после первой загрузки ресурсов.

  2. Нажмите «Choose File» (Выбрать файл) и откройте изображение с текстом.

Кнопка «Choose File» на сайте copy-image-text.

  1. Выберите файл и нажмите «Open» в системном диалоге.

Диалог выбора файла с кнопкой «Open».

  1. После загрузки нажмите «Submit» — страница перезагрузится с результатами распознавания.

Кнопка «Submit» на сайте copy-image-text.

  1. Скопируйте распознанный текст с веб‑страницы и вставьте в текстовый редактор.

Результат: распознанный текст на странице copy-image-text.

Важно: сайт работает локально после кеширования, но сам механизм распознавания остаётся экспериментальным. На некоторых изображениях результат может быть неполным или ошибочным.

Пример кода (базовая проверка поддержки и вызов детектора текста)

Этот фрагмент показывает простую проверку наличия TextDetector и вызов detect на ImageBitmap. Это минимальный пример, не учитывающий получение ImageBitmap из или файла.

if ('TextDetector' in window) {
  const detector = new TextDetector();
  // imageBitmap — предварительно созданный ImageBitmap из файла или canvas
  detector.detect(imageBitmap).then(detections => {
    console.log('detections', detections);
  }).catch(err => console.error(err));
} else {
  console.log('TextDetector не поддерживается в этом окружении');
}

Альтернативные подходы

  • Локальные OCR-библиотеки: Tesseract (в виде npm-пакета или нативных сборок). Подходит для пакетной обработки и кастомных настроек.
  • Облачные OCR-сервисы: Google Cloud Vision, AWS Textract, Azure Cognitive Services. Надёжны, но требуют отправки изображений в облако и могут стоить денег.
  • Мобильные инструменты: Google Lens, встроенный OCR в Google Photos, приложения типа Text Scanner. Удобно для смартфона.
  • Десктоп: OneNote и некоторые PDF-конвертеры умеют извлекать текст из изображений.

Контроль качества и критерии приёмки

  • Точность извлечения: не менее 95% символов для печатного текста стандартного размера (для приемочных тестов использовать заранее размеченные эталонные изображения).
  • Устойчивость: корректный ответ для 10 разных изображений со стандартным контрастом.
  • Безопасность: данные не отправляются на внешние сервисы (если это требование).

Тестовые кейсы:

  • Чёткий печатный текст на белом фоне.
  • Нечёткий / размытый текст.
  • Текст на разноцветном фоне.
  • Рукописный текст.
  • Несколько строк и столбцов текста.

Чек-листы по ролям

  • Разработчик:
    • Проверить поддержку TextDetector в целевых браузерах.
    • Добавить graceful fallback (сообщение или альтернативный OCR).
    • Обработать ошибки и тайм‑аута.
  • Продвинутый пользователь:
    • Включить флаг, перезапустить браузер, протестировать на нескольких изображениях.
    • Сохранять резервные копии оригиналов.
  • Специалист по конфиденциальности:
    • Убедиться, что сайт/приложение не отправляет изображения в облако.
    • Проверить кеширование и локальное хранение данных.

Резюме и рекомендации

  • Shape Detection API в Chrome — быстрый и удобный способ извлечения текста без установки OCR‑ПО. Подходит для быстрых задач и экспериментов.
  • Для критичных и массовых задач используйте проверенные OCR-решения (Tesseract или облачные сервисы) и проверяйте качество на контрольных наборах изображений.

Важно: поскольку функция экспериментальная, поведение может меняться с релизами Chrome. Оставляйте обратные пути и альтернативы в пользовательском интерфейсе.

Частые вопросы

Q: Нужно ли подключение к интернету для работы copy-image-text?

A: Первый заход может загрузить ресурсы, но распознавание выполняется локально; сайт может работать офлайн после кеширования.

Q: Поддерживает ли API рукописный текст?

A: Как правило, рукописный текст распознаётся хуже или не поддерживается; для рукописного распознавания лучше использовать специализированные сервисы.

Q: Это безопасно для конфиденциальных документов?

A: Если вы используете локальное распознавание (как на copy-image-text после кеша) и не отправляете изображения на серверы, это безопаснее, чем облачные сервисы. Тем не менее, проверяйте сетевую активность и политику сайта.


Ключевые выводы:

  • Включите флаг «Experimental Web Platform», перезапустите Chrome и используйте copy-image-text.glitch.me.
  • Метод быстрый, локальный и экспериментальный; для производственных задач выбирайте устойчивые OCR-решения.
  • Тестируйте на нескольких образцах и подготовьте откатный план.
Поделиться: X/Twitter Facebook LinkedIn Telegram
Автор
Редакция

Похожие материалы

Как смотреть HBO из Европы — VPN и подарочные карты
Стриминг

Как смотреть HBO из Европы — VPN и подарочные карты

Удаление аккаунта SoundCloud — инструкция
Музыка

Удаление аккаунта SoundCloud — инструкция

Лучшие приложения для отслеживания сериалов
Entertainment

Лучшие приложения для отслеживания сериалов

Подключение Xbox One контроллера к Mac
Гайды

Подключение Xbox One контроллера к Mac

Где смотреть «Дом дракона»
Стриминг

Где смотреть «Дом дракона»

Переадресация звонков в Google Voice — настройка
Связь

Переадресация звонков в Google Voice — настройка