Гид по технологиям

Linux OCR

gImageReader: извлечение текста из изображений и PDF
Linux OCR 7 min read

gImageReader: извлечение текста из изображений и PDF

gImageReader — простой графический интерфейс для движка Tesseract OCR на Linux. Он позволяет быстро распознавать текст в изображениях и PDF, обрабатывать пакеты файлов, корректировать изображение перед распознаванием и экспортировать результат в текст или PDF. Следуйте пошаговой инструкции по установке и использованию, а также руководствам по повышению качества распознавания и устранению проблем.

Tesseract OCR на Linux — инструкция
Linux OCR 7 min read

Tesseract OCR на Linux — инструкция

Tesseract — бесплатный OCR‑движок для Linux, который позволяет извлекать редактируемый текст из изображений и PDF. В статье показаны установка, примеры команд, работа с языками и советы по предобработке.