Гид по технологиям

Конвертация PDF в изображения на Linux с помощью pdftoppm

6 min read Linux Обновлено 05 Jan 2026
pdftoppm: конвертация PDF в изображения на Linux
pdftoppm: конвертация PDF в изображения на Linux

Иллюстрация: конвертация PDF в изображения с помощью pdftoppm

Что такое pdftoppm?

pdftoppm — это консольная утилита на Linux для преобразования страниц PDF в растровые изображения. Она входит в пакет poppler-utils и позволяет управлять форматом выходных файлов, разрешением (DPI) и цветовыми фильтрами (градации серого, монохром и т. п.).

Определение в одну строку: pdftoppm превращает страницы PDF в файлы изображений и хорошо подходит для пакетной обработки прямо из терминала.

Важно: pdftoppm не выполняет OCR — если у вас отсканированный документ и нужна распознаваемая текстовая версия, используйте OCR-инструменты отдельно.

Установка

Установите poppler-utils (включая pdftoppm) для вашей дистрибуции:

  • Debian / Ubuntu:
sudo apt install poppler-utils
  • Arch Linux:
sudo pacman -S poppler
  • Fedora / CentOS (dnf / yum):
sudo dnf install poppler-utils
sudo yum install poppler-utils
  • openSUSE:
sudo zypper install poppler-tools

После установки команда pdftoppm должна быть доступна в PATH. Если получаете “command not found”, откройте новую сессию терминала или проверьте, что пакет установлен.

Базовый синтаксис

pdftoppm -<формат> [опции] <путь_к_pdf> <имя_выходного_файла>
  • <формат> — png, jpeg, tiff, gray, mono и т. д.; если формат не указан, по умолчанию будет PPM.
  • <путь_к_pdf> — путь к исходному PDF-файлу.
  • <имявыходногофайла> — базовое имя выходных файлов; к нему pdftoppm добавляет суффиксы с номерами страниц.

Пример базовой команды в исходном стиле:

pdftoppm -png test-document.pdf output-images

Эта команда создаст файлы output-images-1.png, output-images-2.png и т. д.

Примеры использования

Конвертировать весь PDF в изображения

pdftoppm -png test-document.pdf output-images

При многополосном документе pdftoppm добавляет к имени номера страниц: output-images-1.png, output-images-2.png и т. д.

Пример конвертации PDF в изображения с помощью pdftoppm

Совет: если хотите другой разделитель между именем и числом, используйте опцию -sep. Пример с вопросительным знаком как разделителем:

pdftoppm -png -sep ? test-document.pdf output-images

Изменить расширение выходных файлов

Чтобы получить JPEG вместо PNG, укажите -jpeg:

pdftoppm -jpeg test-document.pdf output-images

Поддерживаемые форматы (типичный набор): PNG, JPEG, JPEGCMYK, JPEGOPT, TIFF. По умолчанию — PPM.

Конвертировать конкретный диапазон страниц

Для выборочной конвертации используйте ключи -f и -l (first и last):

pdftoppm -png -f 4 -l 7 test-document.pdf output-images

Это создаст изображения только для страниц с 4 по 7 включительно. Для одной страницы укажите -f 1 -l 1.

Управление разрешением (DPI)

DPI (dots per inch, точек на дюйм) определяет плотность точек и влияет на качество/размер файла. По умолчанию pdftoppm генерирует изображения с DPI ≈ 150.

Для настройки используйте флаги -rx и -ry (горизонтальное/вертикальное разрешение):

pdftoppm -png -rx 200 -ry 200 test-document.pdf output-images

Увеличьте значения для более высокого качества (и большего размера файлов); уменьшите для экономии места.

Цветовые режимы

  • Градации серого:
pdftoppm -gray test-document.pdf output-images

Это даст файлы с расширением PGM.

  • Монохром (чёрно-белое):
pdftoppm -mono test-document.pdf output-images

Моно-режим подходит для факсимильных копий и резкого уменьшения размера при простых документах.

Конвертация защищённых паролем PDF

Если PDF защищён паролем, укажите пароль владельца или пользователя:

pdftoppm -png -opw owner-password protected-document.pdf output-images
pdftoppm -png -upw user-password protected-document.pdf output-images

Важно по безопасности: передача пароля в командной строке может быть видна другим пользователям через ps/процессы. На многопользовательских системах избегайте передачи чувствительных паролей в открытом виде.

Быстрый чеклист перед запуском (роль-ориентированно)

  • Для администратора/DevOps:

    • Установите poppler-utils и проверьте версию.
    • Запустите конвертацию в скрипте и управляйте правами доступа к результатам.
  • Для дизайнера/верстальщика:

    • Установите нужный DPI и формат (PNG для прозрачности, JPEG для фото).
    • Проверьте цвета конвертацией нескольких страниц.
  • Для архивиста/библиотекаря:

    • Используйте monochrome/gray для экономии места при текстовых документах.
    • Проверяйте файлы на читаемость и целостность.

Когда pdftoppm не подходит и альтернативы

Counterexamples / когда не сработает:

  • PDF содержит редкие шрифты или специфические векторные эффекты; рендер может отличаться от ожидаемого.
  • Нужна OCR для распознанного текста — pdftoppm не выполняет распознавание.
  • Требуется сложная постобработка (композиция нескольких страниц в одно изображение, водяные знаки) — лучше использовать ImageMagick.

Альтернативы:

  • pdftocairo — часть poppler, может давать другой рендер и поддерживает SVG/PNG/PDF выводы.
  • ImageMagick (convert) — хорош для цепочек обработки, но может потребовать настройки и использовать Ghostscript под капотом.
  • Ghostscript (gs) — гибкая альтернатива для тонкой настройки рендеринга и цветопередачи.
  • mutool (из mupdf) — быстрый и компактный рендерер для некоторых типов PDF.

Краткая матрица выбора:

  • Нужен быстрый, простой экспорт страниц → pdftoppm
  • Нужна векторная конверсия в SVG → pdftocairo
  • Нужна цепочка обработки изображений → ImageMagick
  • Большие библиотеки и пакетная обработка → скрипт с pdftoppm или gs

Мини-методология: как конвертировать безопасно и повторяемо

  1. Создайте рабочую директорию и положите туда исходный PDF.
  2. Выполните команду конвертации с тестовым диапазоном (например, -f 1 -l 2).
  3. Откройте полученные файлы и проверьте цвета, DPI и читаемость.
  4. Подстройте -rx/-ry, формат и цветовой режим.
  5. Запустите массовую конвертацию и проверьте контрольные страницы.
  6. Удалите временные файлы и зафиксируйте команду в скрипте для повторного использования.

Критерии приёмки

  • Все ожидаемые страницы PDF успешно созданы как изображения.
  • Разрешение (DPI) соответствует требованию качества.
  • Формат файлов соответствует требованиям (PNG/JPEG/TIFF).
  • Имена файлов следуют принятой нотации и не конфликтуют с существующими.
  • Для защищённых файлов проверено, что пароль не оставляет следов в журналах или историях.

Устранение проблем и советы

  • “Пустые” или “неполные” изображения: проверьте, правильно ли отображается PDF в другом просмотрщике. Возможно, PDF использует нестандартные шрифты или прозрачности.
  • Большие размеры файлов при высоком DPI: уменьшите -rx/-ry или используйте JPEG с приемлемым уровнем сжатия.
  • Видимые артефакты при конвертации в JPEG: используйте PNG для качественных скриншотов страниц или TIFF для архивов.
  • Пароль в командной строке: если это чувствительный секрет, запускайте на изолированной машине или временно меняйте права доступа к сессии; удаляйте команды из истории (например, history -d). Будьте внимательны к безопасности.

Примеры тестов и приёмки

  • Тест 1: конвертировать первые 2 страницы в PNG с 300 DPI. Ожидание: два файла, читаемый текст, корректная верстка.
pdftoppm -png -f 1 -l 2 -rx 300 -ry 300 file.pdf testpage
  • Тест 2: конвертировать целый документ в JPEG для веб-галереи. Ожидание: серия файлов с приемлемым размером.
pdftoppm -jpeg file.pdf web-images
  • Тест 3: конвертация защищённого файла с user-паролем. Ожидание: корректные изображения без ошибок авторизации.
pdftoppm -png -upw mypassword protected.pdf out

Безопасность и конфиденциальность

  • Командная строка видна другим пользователям на системе — избегайте передачи секретов в аргументах на общих серверах.
  • Удаляйте историю команд, если требуется конфиденциальность (history -d и закрытие сессии).
  • Храните полученные изображения в защищённых каталогах при работе с чувствительными документами.

Краткое резюме

pdftoppm — простой и эффективный инструмент для экспорта страниц PDF в растровые изображения прямо из терминала. Он подходит для большинства типичных задач: пакетная конвертация, управление DPI, выбор формата и цветового режима. Для специфичных случаев используйте pdftocairo, ImageMagick или Ghostscript.

Important: тестируйте параметры на нескольких страницах перед массовой обработкой и соблюдайте осторожность при работе с паролями.

Основные выводы

  • pdftoppm быстро конвертирует PDF в PNG/JPEG/TIFF.
  • Управление диапазоном страниц и DPI даёт точный контроль качества.
  • Для OCR или сложной постобработки нужны дополнительные инструменты.
  • Не передавайте пароли в открытом виде на общих системах.
Поделиться: X/Twitter Facebook LinkedIn Telegram
Автор
Редакция

Похожие материалы

Резервное копирование проектов REAPER
Аудио

Резервное копирование проектов REAPER

Как пригласить друзей в Instagram — простые способы
Социальные сети

Как пригласить друзей в Instagram — простые способы

Nano Stores в Astro: управление состоянием
Веб-разработка

Nano Stores в Astro: управление состоянием

Сканирование QR‑кодов на Samsung — быстрый гид
Мобильные устройства

Сканирование QR‑кодов на Samsung — быстрый гид

Идеальный фон для LinkedIn — руководство
Личный бренд

Идеальный фон для LinkedIn — руководство

Распознать музыку в TikTok на iPhone
Музыка

Распознать музыку в TikTok на iPhone