Гид по технологиям

Как конвертировать PDF в изображения в Linux с помощью pdftoppm

5 min read Linux утилиты Обновлено 01 Jan 2026
Конвертация PDF в изображения в Linux — pdftoppm
Конвертация PDF в изображения в Linux — pdftoppm

Миниатюра иконки преобразования PDF в изображения

Что такое pdftoppm

pdftoppm — это командная утилита из набора poppler-utils. Она переводит страницы PDF в изображения в форматах PPM/PNG/JPEG/TIFF и пр. Утилита подходит, когда нужно быстро получить изображения страниц для предпросмотра, публикации в вебе или для дальнейшей обработки в графическом редакторе.

Коротко: pdftoppm берет PDF и выводит растровые файлы, по одному файлу на страницу (если не указано иначе).

Важно: pdftoppm не выполняет OCR, не редактирует PDF и не извлекает встроенные в PDF растровые изображения без перекодировки — для этого есть другие инструменты.

Установка

На Debian/Ubuntu:

sudo apt install poppler-utils

На Arch Linux:

sudo pacman -S poppler

На CentOS/Fedora (yum или dnf):

sudo yum install poppler-utils
sudo dnf install poppler-utils

После установки команда pdftoppm станет доступна в терминале.

Базовый синтаксис

Общий формат команды:

pdftoppm [опции] документ.pdf имя_выхода

Пример, где указываем формат вывода:

pdftoppm -png document.pdf output-name

Если исходный PDF содержит несколько страниц, pdftoppm добавит суффикс с номером страницы: output-name-1.png, output-name-2.png и т. д.

Примеры использования

Конвертировать весь PDF в PNG:

pdftoppm -png test-document.pdf output-images

Изменить разделитель между именем и номером страницы (-sep):

pdftoppm -png -sep ? test-document.pdf output-images

Конвертировать в JPEG:

pdftoppm -jpeg test-document.pdf output-images

Поддерживаемые форматы вывода: PNG, JPEG, JPEGCMYK, JPEGOPT, TIFF. По умолчанию без явного формата создаются файлы с расширением .ppm.

Конвертировать диапазон страниц (4–7):

pdftoppm -png -f 4 -l 7 test-document.pdf output-images

Конвертировать только первую страницу:

pdftoppm -png -f 1 -l 1 test-document.pdf output-images

Настроить качество/разрешение (DPI). По умолчанию pdftoppm использует 150 DPI:

pdftoppm -png -rx 200 -ry 200 test-document.pdf output-images

Применить фильтр “градации серого”:

pdftoppm -gray test-document.pdf output-images

Создать монохромное (1-бит) изображение:

pdftoppm -mono test-document.pdf output-images

Конвертация защищённого PDF (пароль владельца или пользователя):

pdftoppm -png -opw ownerpassword protected-document.pdf output-images
pdftoppm -png -upw userpassword protected-document.pdf output-images

Не забудьте заменить ownerpassword/userpassword на реальный пароль.

Скриншот процесса конвертации PDF в изображения с помощью pdftoppm

Частые задачи и советы

  • Быстрая проверка одной страницы: используйте -f и -l с одним и тем же номером.
  • Экспорт для веба: PNG при 150–200 DPI или JPEG с мягкой компрессией.
  • Высокое качество для печати: 300–600 DPI, но файлы будут крупные.
  • Сохраняйте имена без пробелов или используйте кавычки, если пробелы нужны.

Команда-справка (cheat sheet)

# Весь документ в PNG
pdftoppm -png file.pdf out

# Только страницы 2-3 в JPEG с 300 DPI
pdftoppm -jpeg -f 2 -l 3 -rx 300 -ry 300 file.pdf out

# Градации серого
pdftoppm -gray file.pdf out

# Монохром
pdftoppm -mono file.pdf out

# Использовать нестандартный разделитель
pdftoppm -png -sep _ file.pdf out

# Защищённый файл (user/owner password)
pdftoppm -png -upw secret file.pdf out

Когда pdftoppm не подходит (примеры)

  • Нужно извлечь встроенные растровые изображения без перекодирования — используйте pdfimages (также из poppler).
  • Требуется векторный экспорт (SVG) с сохранением объектов — pdftoppm рендерит в растровый формат; для векторного вывода используйте pdftocairo с опцией svg.
  • Нужен OCR (распознавание текста) — pdftoppm даст картинку, но не текст; используйте tesseract после конвертации в изображение или инструменты типа OCRmyPDF.
  • Необходима пакетная постобработка (сжатие, сравнение, наложение) — сочетайте pdftoppm с ImageMagick или специальными скриптами.

Альтернативы и когда их выбрать

  • pdfimages — извлекает встроенные растровые изображения без перекодирования (быстрее, без потерь).
  • pdftocairo — более гибкий вывод (PNG, PDF, SVG, PS), часто даёт лучшую векторную точность.
  • ImageMagick (convert) — мощный для постобработки и конвертаций, но может потреблять много памяти на больших PDF.
  • Ghostscript (gs) — гибок для пакетных задач и контроля качества при создании растровых изображений.

Ментальная модель: pdftoppm = “рендеринг страницы → растровое изображение”; pdfimages = “извлечение оригинального изображения”; pdftocairo = “альтернатива для векторного вывода”.

Мини-методология: шаги для надёжной конвертации

  1. Откройте терминал и проверьте установку: pdftoppm -v.
  2. Оцените цель: предпросмотр, веб, печать, OCR.
  3. Выберите формат и DPI (меньше для веб, выше для печати).
  4. Тест на 1 странице: -f 1 -l 1 и проверьте результат.
  5. Массовая конвертация по результату теста.
  6. При необходимости постобработайте (сжатие, обрезка).

Критерии приёмки

  • Изображения открываются в стандартном просмотрщике.
  • Номер страниц соответствует исходному PDF.
  • Разрешение (DPI) соответствует заданному значению.
  • Цветовая схема (RGB/Gray/Mono) соответствует требованию.
  • Отсутствуют артефакты рендеринга (принимается минимум при сложных векторных эффектах).

Чеклист для ролей

  • Пользователь: установить poppler-utils, запустить простую команду, проверить одну страницу.
  • Разработчик/DevOps: автоматизировать команду в скрипт, логировать ошибки, учесть код возврата.
  • Системный администратор: контролировать зависимые пакеты, версионность poppler, политику безопасности (пароли в командной строке).

Безопасность и приватность

  • Пароли в аргументах командной строки видны в истории и в списке процессов. По возможности используйте защищённые методы передачи паролей (скрипт, временные файлы с правами 600) или извлекайте PDF в безопасном окружении.
  • Чистите временные изображения, если PDF содержит конфиденциальные страницы.

Производительность и масштабирование

  • Для больших PDF (сотни страниц) запускайте pdftoppm по пакетам страниц, чтобы не перегружать память.
  • Параллелизация: запустите несколько экземпляров pdftoppm, каждый работает с отдельным диапазоном страниц.
  • На серверах без GUI избегайте ImageMagick для больших документов, используйте pdftoppm/pdftocairo/ghostscript.

Частые ошибки и как их исправить

  • “command not found” — установите poppler-utils.
  • Неверный формат: укажите -png или -jpeg.
  • Неразрешённый PDF (permission denied) — проверьте права доступа и пароли.
  • Качество слишком низкое — увеличьте -rx/-ry.

Сравнение инструментов (кратко)

  • pdftoppm: простой рендер, удобен для изображений страниц.
  • pdftocairo: гибкий вывод, лучше для векторного экспорта.
  • pdfimages: извлечение оригинальных изображений без перекодировки.
  • ImageMagick: мощная постобработка, тяжелая при больших объёмах.

Частые вопросы

Q: Можно ли получить одно изображение для всего PDF?
A: pdftoppm делает по одному файлу на страницу. Чтобы объединить страницы в одно изображение, используйте ImageMagick (montage/convert) после конвертации.

Q: Сохраняет ли pdftoppm прозрачность?
A: Поддержка прозрачности зависит от исходного PDF и выбранного формата вывода. PNG может сохранить прозрачные области, но результат зависит от рендера.

Q: Как уменьшить размер выходных файлов?
A: Уменьшите DPI (-rx/-ry), используйте формат JPEG с более высокой степенью сжатия или примените оптимацию через jpegoptim/pngquant.


Краткое резюме

pdftoppm — надёжный инструмент для быстрой конвертации страниц PDF в растровые изображения прямо из командной строки. Он прост в использовании, хорошо подходит для тестов и автоматизации. Если нужны извлечение оригинальных изображений, векторный экспорт или OCR, рассмотрите pdfimages, pdftocairo или связку с Tesseract и ImageMagick.

Важно: подбирайте формат и DPI согласно задаче и проверяйте защиту паролей при работе с конфиденциальными файлами.

Поделиться: X/Twitter Facebook LinkedIn Telegram
Автор
Редакция

Похожие материалы

Adidas Forum Tech Boost — кроссовки Xbox 20 лет
Обзоры

Adidas Forum Tech Boost — кроссовки Xbox 20 лет

ADB по Wi‑Fi: настройка и безопасность
Android.

ADB по Wi‑Fi: настройка и безопасность

Canva: практические советы по дизайну
Дизайн

Canva: практические советы по дизайну

Как изменить размер изображения в Photoshop
Photoshop

Как изменить размер изображения в Photoshop

Как смотреть Instagram без аккаунта
соцсети

Как смотреть Instagram без аккаунта

Сравнить правки с оригиналом в Adobe Lightroom
Фотография

Сравнить правки с оригиналом в Adobe Lightroom