Гид по технологиям

Извлечь таблицы из PDF в Excel и Google Sheets

7 min read Инструменты Обновлено 08 Jan 2026
Извлечь таблицы из PDF в Excel и Google Sheets
Извлечь таблицы из PDF в Excel и Google Sheets

Человек работает за ноутбуком

Когда у вас есть таблица в PDF и нужно использовать её в анализе, правильный инструмент экономит часы работы. Копирование/вставка обычно не даёт нужного результата: структура теряется, строки и столбцы смешиваются. В этой статье собраны практические способы извлечения таблиц из PDF и перенос в таблицы (Excel, Google Sheets и BI‑инструменты), плюс проверенные приёмы, чек‑листы и план на случай ошибок.

Важно: под «таблицей» здесь понимают структурированные данные в виде строк и столбцов. OCR — автоматическое распознавание текста на изображениях.

Когда это пригодится

  • Перенести отчёт с таблицами в Excel для анализа и построения графиков.
  • Объединить данные из чужих PDF‑отчётов в единый датасет.
  • Подготовить прайсы, списки контактов или финансовые сводки для автоматической обработки.

Быстрая сводка способов

  • Excel: встроенный импорт из PDF, удобен, если вы работаете в Excel постоянно.
  • Power BI: импорт для визуализации и дальнейшей трансформации данных.
  • Adobe Acrobat DC: экспорт в XLSX; полезно, если у вас платная подписка Acrobat.
  • Онлайн‑конвертеры: быстро, не требует установки, но требует осторожности с конфиденциальными данными.

1. Microsoft Excel — встроенный импорт из PDF

Excel хорошо подходит, когда итоговая таблица должна быть именно в XLSX. Этот инструмент умеет распознавать таблицы внутри PDF и преобразовывать их в таблицы Excel с заголовками.

Краткое описание: откройте книгу Excel и используйте импорт данных из файла PDF.

Шаги:

  1. Откройте вашу книгу Excel.
  2. Перейдите на вкладку Данные (Data).
  3. В разделе Получение и преобразование (Get & Transform) нажмите Получить данные (Get Data). Получить данные из PDF в Excel
  4. Выберите Из файла, затем Из PDF (From File → From PDF). Укажите файл PDF.
  5. Выберите файл и нажмите Открыть.

После этого откроется окно Навигатор, где Excel покажет обнаруженные таблицы и страницы. Навигатор импортированных данных в Excel

  1. Выберите таблицу и нажмите Загрузить (Load).

Результат: Excel создаст таблицу с заголовками. Можно сразу применять фильтры и сортировку. Импортированная таблица в Excel

Совет: если форматирование не идеальное, используйте Power Query для очистки (раздел Данные → Запросы и подключения).

2. Microsoft Power BI — импорт для аналитики

Power BI удобен, если вам нужно визуализировать данные или проводить трансформации перед анализом.

Шаги:

  1. Откройте Power BI Desktop.
  2. На стартовом экране выберите Получить данные (Get data). Стартовый экран Power BI
  3. В окне поиска найдите «PDF» и выберите этот коннектор.
  4. Выберите файл PDF и нажмите Открыть.
  5. В Навигаторе отметьте нужные таблицы и нажмите Загрузить (Load). Импорт таблицы в Power BI

Power BI импортирует таблицу в модель данных. Вы сможете переключиться в представление данных, проверить столбцы и типы данных, а затем строить визуализации. Импортированные данные в Power BI

Когда использовать Power BI: если нужно объединять несколько PDF, строить отчёты или автоматизировать обновления.

3. Adobe Acrobat DC — экспорт в Excel

Если у вас есть подписка на Acrobat DC, можно экспортировать PDF в файл Excel (XLSX). Экспорт хорошо работает для документов с чёткими таблицами, но часто требует ручной доводки.

Шаги:

  1. Откройте Adobe Acrobat DC.
  2. Перейдите на вкладку Инструменты (Tools).
  3. В разделе Создать и редактировать нажмите Экспортировать PDF (Export PDF). Меню инструментов Adobe Acrobat DC
  4. Нажмите Выбрать файл и укажите ваш PDF.
  5. Выберите формат ТаблицаMicrosoft Excel Workbook. При необходимости откройте настройки (иконка шестерёнки) для выбора языка распознавания и дополнительных опций. Экспорт в таблицу в Adobe Acrobat DC
  6. Нажмите Экспорт и сохраните файл. Экспорт PDF в Adobe Acrobat DC

По умолчанию Acrobat откроет итоговый XLSX в Excel. Примечание: экспорт часто даёт диапазоны с текстом и числами, но без форматирования в виде таблицы. Преобразуйте диапазон в таблицу через Home → Format as Table. Форматирование таблицы в Excel Создание таблицы в Excel

4. Онлайн‑конвертеры — быстро и без установки

Онлайн‑сервисы (включая Adobe Acrobat Online) удобно использовать для разовых задач или когда у вас нет настольного ПО. Загружаете файл — получаете XLSX.

Шаги на примере Adobe Acrobat Online:

  1. Откройте страницу «PDF → Excel» Adobe Acrobat Online. Веб‑страница Adobe Acrobat Online
  2. Нажмите Выбрать файл и загрузите PDF. Конвертация начнётся автоматически.
  3. Скачайте результат или сохраните его в облако. Результат конвертации в Adobe Acrobat Online

Важно: не загружайте конфиденциальные или регуляторные документы на публичные сервисы без проверки политики конфиденциальности.

Когда автоматический импорт может не сработать

  • PDF — это изображение страницы (скан). Понадобится OCR. Иногда таблица распознана с ошибками.
  • Сложная верстка: объединённые ячейки, многоуровневые заголовки, примечания внутри ячеек.
  • Различные языки или специальные символы могут мешать корректному распознаванию.

Что делать:

  • Попробуйте включить OCR (в Acrobat или в онлайн‑сервисе).
  • Откройте результат в Power Query или в Power BI и исправьте разделение колонок/строк.
  • Если структура слишком сложна — восстанавливайте таблицу вручную по правилам (см. чек‑лист).

Практическая методика: быстрый SOP для извлечения таблиц

Мини‑методология, чтобы повторять процесс стабильно:

  1. Оцените PDF: текстовый или отсканированный? Есть ли сложная верстка?
  2. Если текстовый и вы работаете в Excel — попробуйте встроенный импорт.
  3. Если нужен аналитический отчёт — используйте Power BI для трансформаций.
  4. Если у вас Acrobat — экспортируйте в XLSX и проверьте формат.
  5. Для разовых конвертаций используйте проверенный онлайн‑сервис, соблюдая правила безопасности.
  6. После импорта обязательно проверьте типы столбцов (дата, число, текст), пробелы и неявные символы.

Критерии приёмки

  • Количество строк соответствует ожидаемому (или указано как «приблизительно» для отсканированных документов).
  • Заголовки распознаны и отделены от данных.
  • Числовые и датированные поля имеют корректный формат в приложении.
  • Нет слияния колонок, требующих ручной правки более N минут (оцените заранее).

Чек‑лист для ролей

Data analyst:

  • Использует Power BI или Power Query.
  • Проверяет типы данных и дубликаты.
  • Пишет трансформации (Applied Steps) для повторного использования.

Менеджер/бизнес‑пользователь:

  • Пробует импорт в Excel.
  • Проверяет визуально и сообщает проблемные участки аналитикам.
  • Не загружает конфиденциальные документы в публичные сервисы.

Технический специалист:

  • Запускает OCR при необходимости.
  • Автоматизирует повторяющийся импорт (скрипты, Power Automate).
  • Контролирует версионирование итоговых файлов.

Рекомендации по безопасности и конфиденциальности

  • Не отправляйте персональные данные и конфиденциальные финансовые документы в непроверенные онлайн‑сервисы.
  • Для корпоративных документов используйте локальные инструменты (Excel, Power BI, Acrobat DC) или сертифицированные облачные сервисы с соглашением о защите данных.
  • При использовании облака проверяйте, где хранится файл и есть ли автоматическое удаление после конвертации.

Важно: храните исходный PDF и итоговую таблицу отдельно, чтобы при ошибке распознавания можно было сравнить содержимое.

Отладка ошибок: краткий план действий

  1. Повторите импорт в другом инструменте (Excel ↔ Acrobat ↔ онлайн) — иногда один коннектор лучше обрабатывает конкретный документ.
  2. Если таблица отсканирована — прогоните OCR с языком документа.
  3. В Power Query разделите колонки по разделителю или по фиксированной ширине.
  4. Проверьте скрытые символы: неразрывные пробелы, табы, нестандартные кавычки.
  5. При массовом потоке документов автоматизируйте проверку качества (скрипт, который сверяет число столбцов и образец заголовков).

Решение: как выбрать метод (дерево решений)

flowchart TD
  A[Нужно извлечь таблицу из PDF?] --> B{PDF текстовый?}
  B -- Да --> C{Нужен Excel или визуализация?}
  C -- Excel --> D[Используйте Excel: Получить данные → Из PDF]
  C -- Визуализация --> E[Используйте Power BI: коннектор PDF]
  B -- Нет 'скан' --> F{Есть Acrobat DC?}
  F -- Да --> G[Export to Excel + OCR]
  F -- Нет --> H[Используйте онлайн‑OCR или локальный OCR, затем импортируйте]
  D --> I[Проверить типы, заголовки]
  E --> I
  G --> I
  H --> I

Примеры, когда автоматизация не подходит

  • Таблицы, где внутри ячеек содержатся мини‑таблицы или картинки с данными.
  • Документы с рукописными пометками.
  • PDF в нестандартной кодировке или с защитой от копирования.

В таких случаях придётся комбинировать автоматическое распознавание и ручную корректировку.

Быстрые подсказки и хитрости

  • Если столбцы сдвигаются, попробуйте сначала конвертировать в CSV и открыть в текстовом редакторе, чтобы увидеть, где утрачено разделение.
  • Используйте Power Query для регулярных трансформаций: один раз настроив — можно переиспользовать.
  • Проверяйте даты: формат дд.мм.гггг может распознаваться как текст.

Вывод

Извлечение таблиц из PDF — рутинная, но решаемая задача. Выбор инструмента зависит от частоты задач, конфиденциальности данных и желаемой глубины обработки. Excel и Power BI покрывают большинство сценариев для аналитиков и бизнес‑пользователей. Acrobat DC удобен при наличии подписки, а онлайн‑сервисы — быстрый вариант для единичных документов. Всегда проверяйте результат и планируйте этапы проверки данных.

Короткая памятка:

  • Оцените PDF (текст/скан/сложная верстка).
  • Выберите инструмент (Excel, Power BI, Acrobat, онлайн).
  • Выполните импорт и проверьте типы данных.
  • Примените Power Query или ручную корректировку при необходимости.

Важно: автоматические инструменты экономят время, но не заменяют контроль качества.

Поделиться: X/Twitter Facebook LinkedIn Telegram
Автор
Редакция

Похожие материалы

RDP: полный гид по настройке и безопасности
Инфраструктура

RDP: полный гид по настройке и безопасности

Android как клавиатура и трекпад для Windows
Гайды

Android как клавиатура и трекпад для Windows

Советы и приёмы для работы с PDF
Документы

Советы и приёмы для работы с PDF

Calibration в Lightroom Classic: как и когда использовать
Фото

Calibration в Lightroom Classic: как и когда использовать

Отключить Siri Suggestions на iPhone
iOS

Отключить Siri Suggestions на iPhone

Рисование таблиц в Microsoft Word — руководство
Office

Рисование таблиц в Microsoft Word — руководство