TextSnatcher: копировать текст из изображений

Что такое TextSnatcher?

TextSnatcher — лёгкая и интуитивная оболочка для движка распознавания текста Tesseract. Одним предложением: это GUI-инструмент, который упрощает процесс получения текста из изображений — скриншотов, фотографий и картинок в файлах.

Ключевые возможности:

Работает поверх Tesseract: использует его точность и скорость распознавания.
Поддержка нескольких языков: английский, китайский, японский, испанский, французский, немецкий, арабский.
Три способа подачи изображения: скриншот, файл, буфер обмена.
Быстрая вставка результатов в буфер обмена для последующего использования.

Краткое определение: OCR — Optical Character Recognition, технология для преобразования изображённого текста в машинно-читаемый.

Установка TextSnatcher на Linux

TextSnatcher доступен для большинства дистрибутивов Linux. Ниже — три варианта установки: через Flatpak (рекомендуется для большинства пользователей), через AppCenter (elementary OS) и сборка из исходников.

Установка через Flatpak (универсально)

Убедитесь, что Flatpak установлен в системе. В терминале выполните:

flatpak --version

Если команда вернула версию — Flatpak установлен. Если нет, установите Flatpak через пакетный менеджер вашего дистрибутива (например, apt, dnf).
Установите TextSnatcher из Flathub:

flatpak install flathub com.github.rajsolai.textsnatcher

Запустите приложение через меню приложений или командой:

flatpak run com.github.rajsolai.textsnatcher

Важно: Flatpak запускает приложения в «песочнице» (sandbox). Если TextSnatcher не видит файлы или буфер обмена, проверьте разрешения Flatpak.

AppCenter (elementary OS)

Для пользователей elementary OS: TextSnatcher доступен в AppCenter. Откройте AppCenter, найдите TextSnatcher и установите как обычное приложение.

Download: TextSnatcher

Сборка из исходников (для продвинутых пользователей)

Если нужен конкретный релиз или патч — можно собрать приложение из исходников. Потребуются зависимости:

granite
gtk+-3.0
gobject-2.0
gdk-pixbuf-2.0
libhandy-1
libportal-0.5

Команды для клонирования и сборки (пример):

git clone https://github.com/RajSolai/TextSnatcher.git TextSnatcher
cd TextSnatcher
meson build --prefix=/usr
cd build
sudo ninja install && com.github.rajsolai.textsnatcher

Примечание: перед сборкой убедитесь, что установлены Meson, Ninja и dev-пакеты перечисленных библиотек.

Как пользоваться TextSnatcher

После установки найдите TextSnatcher в меню приложений и запустите его. Окно приложения компактное — его удобно расположить рядом с источником текста.

Копирование текста с изображения с помощью TextSnatcher

Выберите язык распознавания: нажмите на иконку флага и выберите предпочтительный язык.

Главное окно TextSnatcher

Нажмите «Snatch Now» (или аналогичную кнопку) — откроется меню с тремя способами подачи изображения.

Выбор языка распознавания TextSnatcher

Три режима ввода изображения

TextSnatcher принимает изображение тремя способами:

Take Screenshot — сделать скриншот выбранной области экрана;
Choose File — загрузить изображение из файла;
Get from Clipboard — взять изображение из буфера обмена.

Вариант 1: Take Screenshot

Нажмите «Take Screenshot», после чего TextSnatcher вызовет утилиту scrot и предложит выделить область. Выделите область с текстом с помощью курсора, дождитесь обработки — распознанный текст попадёт в буфер обмена.

TextSnatcher: распознавание со скриншота

Советы:

Выделяйте область ровно по краям текста; больше пустого фона может ухудшить точность.
Для длинных блоков текста удобнее делать несколько снимков и склеивать результаты в заметке.

Вариант 2: Choose File

Нажмите «Choose File», выберите изображение в файловом менеджере и откройте его — TextSnatcher выполнит распознавание и скопирует результат в буфер обмена.

Распознавание текста из файла в TextSnatcher

Поддерживаемые форматы зависят от библиотек GDK/GTK в системе (обычно PNG, JPEG, BMP).

Вариант 3: Get from Clipboard

Скопируйте изображение в системный буфер обмена, затем в TextSnatcher выберите «Get from Clipboard». Учтите, что эта опция может работать нестабильно в X11-сессиях; в Wayland и при корректной поддержке буфера — чаще работает как ожидается.

TextSnatcher: загрузка из буфера обмена

Если получаете ошибку — попробуйте временно сохранить изображение в файл и открыть его через Choose File.

Как улучшить качество распознавания

Распознавание зависит от исходного изображения. Небольшие приёмы могут заметно повысить точность:

Контраст и резкость: увеличьте контраст, уберите лишние шумы.
DPI: для снимков текста полезно увеличить ширину изображения (масштабирование) перед OCR.
Поворот: исправьте наклон текста — искажения ухудшают результат.
Предобработка: ImageMagick или other tools помогают очистить фон и сгладить текст.

Пример команд ImageMagick для подготовки изображения:

# увеличить размер для улучшения распознавания
convert input.png -resize 200% -colorspace Gray -sharpen 0x1 prepped.png

# удалить шумы и повысить контраст
convert prepped.png -morphology Convolve DoG:0,1,2 cleaned.png

Совет: иногда полезно вручную обрезать изображение по границам текста перед обработкой.

Отладка и частые проблемы

Типичные проблемы и как их решать:

Буфер обмена не получает результат: проверьте политику Flatpak (доступ к clipboard) и окружение (X11 vs Wayland).
scrot не найден: установите scrot (например, через apt или dnf):

sudo apt install scrot    # Debian/Ubuntu
sudo dnf install scrot    # Fedora

Tesseract не установлен: хотя TextSnatcher использует Tesseract через свои зависимости, на некоторых дистрибутивах требуется установить tesseract-ocr и языковые пакеты:

sudo apt install tesseract-ocr tesseract-ocr-eng

Плохая точность для специфических шрифтов или рукописного текста: Tesseract слабее для рукописей и декоративных шрифтов; для таких случаев лучше использовать специализированные сервисы или обучать модель.
Проблемы с правами на файловую систему в Flatpak: используйте Flatseal для управления разрешениями или запускайте приложение как нативный пакет.

Альтернативы и сравнение

Если TextSnatcher по каким-то причинам не подходит, рассмотрите эти решения:

gImageReader — графическая оболочка для Tesseract с расширенными возможностями редактирования и пакетной обработкой.
OCRmyPDF — автоматическая интеграция OCR в PDF-файлы; полезно для оцифровки документов.
Онлайн-сервисы OCR — работают без установки, но могут требовать загрузки файлов на сторонний сервер (вопрос приватности).

Сравнительная таблица (вкратце):

Инструмент	GUI	Подходит для	Приватность

Важно: выбор зависит от требований к приватности, объёму и формату исходных материалов.

Критерии приёмки

Перед тем как считать установку и настройку завершённой, проверьте:

Приложение успешно запускается и доступно в меню приложений.
Распознавание с использованием скриншота/файла/буфера обмена возвращает ожидаемый текст для тестового примера.
Буфер обмена получает результат корректно и текст вставляется в текстовый редактор.
Для Flatpak-пакета подтверждена политика разрешений на доступ к файлам и буферу обмена.

Практическая методология использования (mini-methodology)

Откройте текстовый редактор, чтобы сразу вставить результат.
В TextSnatcher выберите язык распознавания.
Снимите скриншот или откройте файл; при необходимости подготовьте изображение заранее (обрезка, увеличение контраста).
Запустите распознавание, вставьте результат из буфера обмена и быстро проверьте на ошибки.
Если нужно массово обработать документы, используйте gImageReader или OCRmyPDF.

Когда TextSnatcher не подойдёт

Для пакетной обработки больших объёмов документов удобнее использовать OCRmyPDF или скрипты с Tesseract напрямую.
Для рукописного ввода и плохо читаемых шрифтов точность будет низкой — нужны специальные модели.
Если требуется интеграция в серверный конвейер — GUI-инструмент не лучший выбор.

Безопасность и приватность

TextSnatcher выполняет распознавание локально через Tesseract, если все зависимости установлены локально. Если вы используете онлайн-сервисы вместо локальной установки, помните про передачу файлов третьим сторонам.

Итог и выводы

TextSnatcher — удобный инструмент для быстрых операций «скриншот → текст» в Linux. Он не заменит серверные решения для массовой обработки, но отлично подходит для ежедневных задач: выписывания цитат, записи сообщений об ошибках, копирования текста с изображений и заметок.

Ключевые преимущества:

Быстрый рабочий цикл: выделил область — получил текст в буфере обмена.
Простая установка через Flatpak.
Поддержка нескольких языков.

Если вам нужно больше автоматизации — рассмотрите gImageReader или OCRmyPDF.

Ниже приведена краткая памятка для быстрого старта:

Установите Flatpak и TextSnatcher: flatpak install flathub com.github.rajsolai.textsnatcher
Установите scrot и tesseract-ocr через пакетный менеджер при необходимости.
Выберите язык, снимите область или откройте файл, вставьте результат из буфера обмена.

Счастливого распознавания!

TextSnatcher — копирование текста из изображений в Linux