TextSnatcher — копирование текста из изображений в Linux
Что такое TextSnatcher?
TextSnatcher — лёгкая и интуитивная оболочка для движка распознавания текста Tesseract. Одним предложением: это GUI-инструмент, который упрощает процесс получения текста из изображений — скриншотов, фотографий и картинок в файлах.
Ключевые возможности:
- Работает поверх Tesseract: использует его точность и скорость распознавания.
- Поддержка нескольких языков: английский, китайский, японский, испанский, французский, немецкий, арабский.
- Три способа подачи изображения: скриншот, файл, буфер обмена.
- Быстрая вставка результатов в буфер обмена для последующего использования.
Краткое определение: OCR — Optical Character Recognition, технология для преобразования изображённого текста в машинно-читаемый.
Установка TextSnatcher на Linux
TextSnatcher доступен для большинства дистрибутивов Linux. Ниже — три варианта установки: через Flatpak (рекомендуется для большинства пользователей), через AppCenter (elementary OS) и сборка из исходников.
Установка через Flatpak (универсально)
- Убедитесь, что Flatpak установлен в системе. В терминале выполните:
flatpak --versionЕсли команда вернула версию — Flatpak установлен. Если нет, установите Flatpak через пакетный менеджер вашего дистрибутива (например, apt, dnf).
Установите TextSnatcher из Flathub:
flatpak install flathub com.github.rajsolai.textsnatcher- Запустите приложение через меню приложений или командой:
flatpak run com.github.rajsolai.textsnatcherВажно: Flatpak запускает приложения в «песочнице» (sandbox). Если TextSnatcher не видит файлы или буфер обмена, проверьте разрешения Flatpak.
AppCenter (elementary OS)
Для пользователей elementary OS: TextSnatcher доступен в AppCenter. Откройте AppCenter, найдите TextSnatcher и установите как обычное приложение.
Download: TextSnatcher
Сборка из исходников (для продвинутых пользователей)
Если нужен конкретный релиз или патч — можно собрать приложение из исходников. Потребуются зависимости:
- granite
- gtk+-3.0
- gobject-2.0
- gdk-pixbuf-2.0
- libhandy-1
- libportal-0.5
Команды для клонирования и сборки (пример):
git clone https://github.com/RajSolai/TextSnatcher.git TextSnatcher
cd TextSnatcher
meson build --prefix=/usr
cd build
sudo ninja install && com.github.rajsolai.textsnatcherПримечание: перед сборкой убедитесь, что установлены Meson, Ninja и dev-пакеты перечисленных библиотек.
Как пользоваться TextSnatcher
После установки найдите TextSnatcher в меню приложений и запустите его. Окно приложения компактное — его удобно расположить рядом с источником текста.

- Выберите язык распознавания: нажмите на иконку флага и выберите предпочтительный язык.
- Нажмите «Snatch Now» (или аналогичную кнопку) — откроется меню с тремя способами подачи изображения.
Три режима ввода изображения
TextSnatcher принимает изображение тремя способами:
- Take Screenshot — сделать скриншот выбранной области экрана;
- Choose File — загрузить изображение из файла;
- Get from Clipboard — взять изображение из буфера обмена.
Вариант 1: Take Screenshot
Нажмите «Take Screenshot», после чего TextSnatcher вызовет утилиту scrot и предложит выделить область. Выделите область с текстом с помощью курсора, дождитесь обработки — распознанный текст попадёт в буфер обмена.
Советы:
- Выделяйте область ровно по краям текста; больше пустого фона может ухудшить точность.
- Для длинных блоков текста удобнее делать несколько снимков и склеивать результаты в заметке.
Вариант 2: Choose File
Нажмите «Choose File», выберите изображение в файловом менеджере и откройте его — TextSnatcher выполнит распознавание и скопирует результат в буфер обмена.
Поддерживаемые форматы зависят от библиотек GDK/GTK в системе (обычно PNG, JPEG, BMP).
Вариант 3: Get from Clipboard
Скопируйте изображение в системный буфер обмена, затем в TextSnatcher выберите «Get from Clipboard». Учтите, что эта опция может работать нестабильно в X11-сессиях; в Wayland и при корректной поддержке буфера — чаще работает как ожидается.
Если получаете ошибку — попробуйте временно сохранить изображение в файл и открыть его через Choose File.
Как улучшить качество распознавания
Распознавание зависит от исходного изображения. Небольшие приёмы могут заметно повысить точность:
- Контраст и резкость: увеличьте контраст, уберите лишние шумы.
- DPI: для снимков текста полезно увеличить ширину изображения (масштабирование) перед OCR.
- Поворот: исправьте наклон текста — искажения ухудшают результат.
- Предобработка: ImageMagick или other tools помогают очистить фон и сгладить текст.
Пример команд ImageMagick для подготовки изображения:
# увеличить размер для улучшения распознавания
convert input.png -resize 200% -colorspace Gray -sharpen 0x1 prepped.png
# удалить шумы и повысить контраст
convert prepped.png -morphology Convolve DoG:0,1,2 cleaned.pngСовет: иногда полезно вручную обрезать изображение по границам текста перед обработкой.
Отладка и частые проблемы
Типичные проблемы и как их решать:
- Буфер обмена не получает результат: проверьте политику Flatpak (доступ к clipboard) и окружение (X11 vs Wayland).
- scrot не найден: установите scrot (например, через apt или dnf):
sudo apt install scrot # Debian/Ubuntu
sudo dnf install scrot # Fedora- Tesseract не установлен: хотя TextSnatcher использует Tesseract через свои зависимости, на некоторых дистрибутивах требуется установить tesseract-ocr и языковые пакеты:
sudo apt install tesseract-ocr tesseract-ocr-engПлохая точность для специфических шрифтов или рукописного текста: Tesseract слабее для рукописей и декоративных шрифтов; для таких случаев лучше использовать специализированные сервисы или обучать модель.
Проблемы с правами на файловую систему в Flatpak: используйте Flatseal для управления разрешениями или запускайте приложение как нативный пакет.
Альтернативы и сравнение
Если TextSnatcher по каким-то причинам не подходит, рассмотрите эти решения:
- gImageReader — графическая оболочка для Tesseract с расширенными возможностями редактирования и пакетной обработкой.
- OCRmyPDF — автоматическая интеграция OCR в PDF-файлы; полезно для оцифровки документов.
- Онлайн-сервисы OCR — работают без установки, но могут требовать загрузки файлов на сторонний сервер (вопрос приватности).
Сравнительная таблица (вкратце):
| Инструмент | GUI | Подходит для | Приватность |
|---|
| TextSnatcher | Да | Быстрое извлечение из скриншотов | Локально (если установлен локально) | gImageReader | Да | Редактирование результатов, пакетная обработка | Локально | OCRmyPDF | CLI | Обработка PDF, редактирование слоёв | Локально | Онлайн OCR | Веб | Разовое удобство, сложные форматы | Отправка на сервер
Важно: выбор зависит от требований к приватности, объёму и формату исходных материалов.
Рекомендации для администратора и разработчика
Чек-лист для разных ролей:
Пользователь:
- Установить Flatpak и TextSnatcher.
- Убедиться, что scrot установлен для скриншотов.
- Выбрать корректный язык распознавания перед началом.
Системный администратор:
- Управлять разрешениями Flatpak (файлы, clipboard).
- Предоставить tesseract-ocr и языковые пакеты через репозитории.
- Обеспечить наличие необходимых библиотек GUI.
Разработчик/интегратор:
- Автоматизировать предобработку изображений (ImageMagick).
- Интегрировать TextSnatcher в рабочие процессы (фиксированные горячие клавиши, скрипты).
Критерии приёмки
Перед тем как считать установку и настройку завершённой, проверьте:
- Приложение успешно запускается и доступно в меню приложений.
- Распознавание с использованием скриншота/файла/буфера обмена возвращает ожидаемый текст для тестового примера.
- Буфер обмена получает результат корректно и текст вставляется в текстовый редактор.
- Для Flatpak-пакета подтверждена политика разрешений на доступ к файлам и буферу обмена.
Практическая методология использования (mini-methodology)
- Откройте текстовый редактор, чтобы сразу вставить результат.
- В TextSnatcher выберите язык распознавания.
- Снимите скриншот или откройте файл; при необходимости подготовьте изображение заранее (обрезка, увеличение контраста).
- Запустите распознавание, вставьте результат из буфера обмена и быстро проверьте на ошибки.
- Если нужно массово обработать документы, используйте gImageReader или OCRmyPDF.
Когда TextSnatcher не подойдёт
- Для пакетной обработки больших объёмов документов удобнее использовать OCRmyPDF или скрипты с Tesseract напрямую.
- Для рукописного ввода и плохо читаемых шрифтов точность будет низкой — нужны специальные модели.
- Если требуется интеграция в серверный конвейер — GUI-инструмент не лучший выбор.
Безопасность и приватность
TextSnatcher выполняет распознавание локально через Tesseract, если все зависимости установлены локально. Если вы используете онлайн-сервисы вместо локальной установки, помните про передачу файлов третьим сторонам.
Итог и выводы
TextSnatcher — удобный инструмент для быстрых операций «скриншот → текст» в Linux. Он не заменит серверные решения для массовой обработки, но отлично подходит для ежедневных задач: выписывания цитат, записи сообщений об ошибках, копирования текста с изображений и заметок.
Ключевые преимущества:
- Быстрый рабочий цикл: выделил область — получил текст в буфере обмена.
- Простая установка через Flatpak.
- Поддержка нескольких языков.
Если вам нужно больше автоматизации — рассмотрите gImageReader или OCRmyPDF.
Ниже приведена краткая памятка для быстрого старта:
- Установите Flatpak и TextSnatcher: flatpak install flathub com.github.rajsolai.textsnatcher
- Установите scrot и tesseract-ocr через пакетный менеджер при необходимости.
- Выберите язык, снимите область или откройте файл, вставьте результат из буфера обмена.
Счастливого распознавания!
Похожие материалы
Snapseed: полное руководство по мобильному редактированию
Как выпустить музыку на Spotify и Apple Music
VPN для PS4: настройка и советы
Google Home: настройка и устранение проблем
Стоит ли обновлять macOS Monterey?