Гид по технологиям

Как выделить и удалить дубликаты в Google Sheets

8 min read Инструкции Обновлено 06 Dec 2025
Как выделить дубликаты в Google Sheets
Как выделить дубликаты в Google Sheets

Кратко: В этой инструкции показано, как быстро найти, выделить и при необходимости удалить дублирующиеся значения в Google Sheets. Описаны два основных подхода: условное форматирование с формулами (гибко) и дополнение Power Tools (удобно для массовых операций). Также приведены альтернативы, шаблоны, методология проверки и рекомендации по безопасности данных.

Зачем выделять дубликаты

  • Дубликаты искажуют отчёты, суммирование и анализ данных.
  • Быстрое визуальное выделение упрощает проверку и очистку больших таблиц.
  • Выделение помогает решить, какие данные удалять, объединять или пометить для ревизии.

Важно: выделение не удаляет данные — оно только меняет внешний вид ячеек. Всегда создавайте резервную копию таблицы перед массовыми изменениями.

Основная идея (одно предложение)

Используйте условное форматирование с формулой COUNTIF / COUNTIFS или сторонний плагин (Power Tools) для поиска и подсветки повторяющихся значений по столбцам, строкам или диапазонам.

Что вы получите из этой статьи

  • Пошаговые инструкции для подсветки дубликатов в столбцах, строках и между столбцами.
  • Альтернативные способы (встроенные средства Google, формулы, скрипты и плагины).
  • Практический чеклист, критерии приёмки и тест-кейсы.
  • Рекомендации по безопасности и приватности данных.

Как выделить дубликаты в столбце или строке с помощью условного форматирования

Условное форматирование позволяет изменять стиль ячеек на основе условий. Стандартные правил в Google Sheets нет для “дубликатов”, поэтому используем пользовательскую формулу COUNTIF.

Пример: выделение дубликатов в столбце B.

  1. Откройте таблицу Google Sheets (можно на пустой таблице для теста).
  2. Введите тестовые значения в B2:B5, например: 444, 333, 444, 222.

Фото листа с тестовыми данными Изображение: пример Google Sheets с тестовыми числами в столбце B.

  1. Выделите весь столбец B (щелкните по заголовку “B”).
  2. В меню выберите Формат → Условное форматирование.
  3. В разделе “Форматировать ячейки если” выберите “Пользовательская формула”.
  4. В поле формулы введите:

=COUNTIF(B:B,B1)>1

  1. Нажмите на заливку (Fill color) и выберите цвет для подсветки дубликатов.
  2. Нажмите “Готово”.

Тестовые дубликаты подсвечены Изображение: выделенный повтор 444 в столбце B.

Пояснение формулы: COUNTIF(B:B,B1) считает, сколько раз значение из текущей строки встречается во всём столбце B. Условие “>1” означает “повторяется хотя бы ещё раз”.

Советы:

  • Чтобы подсвечивать только значения, которые встречаются не менее N раз, измените “>1” на “>=N” или “>N” по нужной логике.
  • Для строк используйте ссылку на диапазон строки: =COUNTIF(2:2,A2)>1 (в формуле 2:2 — строка, A2 — первая ячейка ряда).

Как выделить дубликаты сразу в нескольких столбцах

Если нужно искать дубликаты по нескольким столбцам, задайте диапазон в COUNTIF.

Пример: у вас данные в столбцах A–C (A1:C10).

  1. Выделите диапазон, к которому примените форматирование (например A1:C10).
  2. Откройте Формат → Условное форматирование.
  3. Выберите “Пользовательская формула” и введите, например:

=COUNTIF($A$1:$C$10,A1)>1

  1. Установите цвет заливки и нажмите “Готово”.

Обратите внимание: в формуле используется относительная ссылка на первую ячейку области (A1), а диапазон фиксирован абсолютными ссылками ($A$1:$C$10). Формула будет корректно применяться к каждой ячейке выделенной области.

Дубликаты в нескольких столбцах подсвечены Изображение: одинаковое значение 333 подсвечено в двух столбцах.

Дополнительные формулы и приёмы

  • Для поиска повторяющихся строк (все столбцы строки одинаковы) используйте вспомогательный столбец с конкатенацией: =A2&"|"&B2&"|"&C2 и затем примените COUNTIF к этому столбцу.
  • Для учета регистра текста используйте функцию EXACT в сочетании с ARRAYFORMULA и SUMPRODUCT (сложнее, но позволяет строгое сравнение).
  • Для поиска уникальных значений используйте =UNIQUE(range).
  • Для фильтрации повторяющихся записей: =FILTER(range,COUNTIF(range,range)>1) — вернёт список повторов.

Пример формулы для конкатенации строк и подсветки повторов:

  1. Вставьте в D2 формулу: =A2&"|"&B2&"|"&C2 и протяните вниз.
  2. Примените условное форматирование к D-столбцу с формулой: =COUNTIF($D$2:$D$100,D2)>1.

Как выделить и удалить дубликаты с помощью Power Tools

Power Tools — надстройка для Google Sheets, которая имеет утилиту Dedup & Compare. Она упрощает поиск, подсветку и удаление дубликатов.

  1. Откройте страницу Power Tools и нажмите Install.
  2. Подтвердите аккаунт Google и предоставьте разрешения.
  3. В Google Sheets откройте таблицу и выберите Extensions → Power Tools → Start.

Опция запуска Power Tools в меню Extensions Изображение: пункт меню Extensions → Power Tools → Start.

  1. В боковой панели выберите Dedup & Compare.
  2. Выберите Remove duplicate cells или Remove duplicate rows в зависимости от задачи.
  3. Нажмите на кнопку выбора диапазона, выделите ячейки и подтвердите.
  4. На шаге “Find” выберите вариант Duplicates или Duplicates + 1 occurrences.
  5. На шаге “Action” выберите Fill with color или Clear values, затем Finish.

Настройки Dedup & Compare в Power Tools Изображение: выбор Dedup & Compare в боковой панели Power Tools.

Power Tools удобно, когда нужно быстро обработать большие диапазоны и применить гибкие сценарии очистки без ручного написания формул.

Встроенный инструмент Google: Data cleanup → Remove duplicates

Google Sheets имеет встроенный инструмент удаления дубликатов (Data → Data cleanup → Remove duplicates). Он находит и удаляет повторяющиеся строки по выбранным столбцам.

Плюсы:

  • Быстро удалить дубликаты строк.
  • Не требует надстроек.

Минусы:

  • Менее гибок в подсветке (он удаляет, а не подсвечивает).
  • Требует явного решения о том, какую строку оставить.

Рекомендация: сначала подсветите дубликаты, проверьте, потом используйте Remove duplicates для удаления.

Когда вышеописанные методы не сработают (ограничения)

  • Разные форматы данных: числа и текст, например “123” и 123 — COUNTIF может по-разному трактовать.
  • Невидимые символы (пробелы в конце/начале) — используйте TRIM или REGEXREPLACE для очистки.
  • Различия в регистре: “ABC” и “abc” — используйте LOWER/UPPER или EXACT для строгой проверки.
  • Комбинации дат и чисел: убедитесь, что формат ячеек корректен.

Быстрая методология очистки дубликатов (мини-SOP)

  1. Создайте копию файла или рабочий лист (резерв).
  2. Нормализуйте данные: TRIM, LOWER/UPPER, однотипный формат чисел и дат.
  3. Подсветите дубликаты (условное форматирование) для визуальной проверки.
  4. Примите правила удаления (какую строку считать источником, по какому столбцу приоритизировать).
  5. Удаляйте вручную или с помощью Remove duplicates / Power Tools.
  6. Проверьте агрегаты и формулы после удаления.
  7. Зафиксируйте изменения (версия, комментарий, дата).

Чеклист для ролей

Аналитик:

  • Создал резервную копию листа.
  • Нормализовал строковые поля (TRIM/LOWER).
  • Подсветил дубликаты и проверил выборочно 10–20 позиций.
  • Задокументировал правила удаления.

Администратор/оператор:

  • Применил удаление дубликатов (Remove duplicates / Power Tools).
  • Проверил логи изменений и вернул резерв при проблеме.
  • Сообщил владельцу данных о выполненных изменениях.

Критерии приёмки

  • Все видимые дубликаты подсвечены согласно правилам (проверить выборочно).
  • Непредвиденное удаление записей отсутствует (проверить контрольные суммы/агрегаты).
  • Лист с оригиналом сохранён в архиве.

Тест-кейсы и критерии приёмки

  1. Сценарий: два одинаковых значения в столбце — ожидаемый результат: оба значения подсвечены.
  2. Сценарий: значение с пробелом в конце и такое же без пробела — ожидаемый результат: подсвечивание после TRIM или отсутствие подсветки до очистки (зависит от методики).
  3. Сценарий: повторяющиеся строки по нескольким столбцам — ожидаемый результат: подсветка/удаление только тех строк, где совпадают выбранные столбцы.

Шаблон (быстрое руководство для команды)

  • Цель: найти и отметить повторяющиеся значения в таблице X.
  • Диапазон: лист “Данные” A1:F10000.
  • Правила нормализации: TRIM всех строковых столбцов; привести даты к формату YYYY-MM-DD.
  • Применяемая формула подсветки: =COUNTIF($A$1:$F$10000,A1)>1 (адаптировать под первый столбец области).
  • Действие после проверки: удалить дубликаты строк методом Remove duplicates с сохранением первой встречи.

Ментальные модели и эвристики

  • “Сначала подсветить, потом удалять”: визуальная проверка снижает риск потерь данных.
  • “Нормализовать — затем сравнивать”: очистка формата устраняет ложные дубликаты.
  • “Резерв перед действием”: быстрый способ отката при ошибке.

Риски и смягчение

  • Риск: потеря уникальных записей при агрессивном удалении. Митигирование: резервная копия и проверка правил приоритета.
  • Риск: удаление одной записи из связанных таблиц (внешние ссылки). Митигирование: проверить связи и формулы перед удалением.

Примечания по безопасности и конфиденциальности

  • Если в таблице персональные данные (PII), убедитесь, что доступ разрешён только уполномоченным лицам.
  • Не публикуйте резервные копии с PII в общедоступных местах.
  • При установке надстроек (Power Tools) проверьте запрашиваемые разрешения и политику конфиденциальности.

Быстрая справка по полезным формулам

  • Подсветка дубликатов в столбце: =COUNTIF(B:B,B1)>1
  • Подсветка дубликатов в строке: =COUNTIF(2:2,A2)>1
  • Дубликаты по диапазону: =COUNTIF($A$1:$C$10,A1)>1
  • Уникальные значения: =UNIQUE(A1:A100)
  • Фильтр повторов: =FILTER(A1:A100,COUNTIF(A1:A100,A1:A100)>1)
  • Конкатенация для строк: =A2&"|"&B2&"|"&C2

Примеры ошибок и как их избежать

  • Пробелы в конце/начале строки: используйте TRIM().
  • Несоответствие типов: проверьте формат ячейки (Число/Текст/Дата).
  • Разный регистр: используйте LOWER() или UPPER() или сравнивайте с EXACT().

Короткое резюме

  • Для визуального поиска дубликатов в Google Sheets удобно использовать условное форматирование с формулой COUNTIF: гибко и наглядно.
  • Если нужно массово удалять или обрабатывать дубликаты — Power Tools или встроенный Remove duplicates помогут быстрее.
  • Всегда делайте резервную копию и нормализуйте данные перед сравнением.

Полезные дополнения и ссылки (руководство по дальнейшей работе)

  • Используйте вспомогательные столбцы для сложных сравнений (несколько ключевых полей).
  • Для автоматизации повторяющихся задач рассмотрите Apps Script: можно написать скрипт, который подсвечивает, сохраняет отчёт и удаляет дубликаты по расписанию.

1‑строчный глоссарий

  • COUNTIF: функция, считающая количество ячеек, соответствующих критерию.
  • TRIM: удаляет лишние пробелы в начале и конце текста.
  • UNIQUE: возвращает список уникальных значений из диапазона.

Если нужно, могу подготовить готовый шаблон листа (копию) с уже настроенным условным форматированием и шаблоном проверок для вашей таблицы — укажите структуру столбцов и я помогу настроить точнее.

Поделиться: X/Twitter Facebook LinkedIn Telegram
Автор
Редакция

Похожие материалы

OpenJDK и Oracle Java на Linux
Linux

OpenJDK и Oracle Java на Linux

Как набрать амперсанд в колонтитулах Excel
Excel

Как набрать амперсанд в колонтитулах Excel

Заметки и задачи в Outlook Web
Продуктивность

Заметки и задачи в Outlook Web

Ошибка 0x80073cfc в Windows — как исправить
Windows 11

Ошибка 0x80073cfc в Windows — как исправить

Как сделать прозрачный фон в Paint.NET
Редактор изображений

Как сделать прозрачный фон в Paint.NET

Как изменить виртуальную память в Windows 11
Windows

Как изменить виртуальную память в Windows 11