Функция UNIQUE в Google Sheets: быстро удаляем дубликаты

Часто данные в таблицах приходят из разных источников: экспорты систем, CSV, формы, API. При объединении таких данных неизбежно появляются повторяющиеся записи. Удалять их вручную — долго и рискованно. Функция UNIQUE позволяет быстро получить список уникальных строк и использовать его в дальнейших вычислениях.
Что такое UNIQUE в Google Sheets?
Функция UNIQUE выбирает уникальные строки из указанного диапазона и отбрасывает дубликаты. Она полезна при работе с большими наборами данных — позволяет получить «чистый» список значений для отчётов, валидации и сводных таблиц.
Определение: UNIQUE — функция, возвращающая массив строк, которые встречаются в исходном диапазоне один или более раз, но каждая строка в выходе появляется только один раз.
Краткие преимущества:
- Быстрая очистка дубликатов без макросов.
- Работает с диапазонами из одной или нескольких колонок.
- Легко комбинируется с SORT, FILTER, QUERY и TRANSPOSE.
Синтаксис UNIQUE
=UNIQUE(range, filter-by-column, exactly-once)Аргументы:
- range — обязательный. Диапазон ячеек для анализа.
- filter-by-column — необязательный. TRUE, если фильтровать по столбцам, FALSE или опущено — по строкам.
- exactly-once — необязательный. TRUE возвращает только те строки, которые встречаются ровно один раз. FALSE (по умолчанию) возвращает каждое уникальное сочетание один раз, даже если оно повторялось.
Важно: формат чисел сохраняется от исходных ячеек. Проценты должны быть в формате % и т. п., иначе сравнение может вести себя неожиданно.
Как использовать UNIQUE — пошаговая инструкция
- Выберите пустую ячейку, где хотите получить результат.
- Введите формулу, например:
=UNIQUE(A2:A100). - Выделите или введите диапазон вручную и закройте скобку.
- Нажмите Enter — формула вернёт массив уникальных значений.
Пример для двух колонок:
Если диапазон включает несколько столбцов (например A:B), UNIQUE рассматривает каждую строку как комбинацию значений всех колонок. То есть строки с одинаковыми именами, но разными фамилиями останутся разными.
Вложение UNIQUE в другие функции
UNIQUE часто используют вместе с другими функциями, чтобы получить отсортированный, отфильтрованный или повернутый результат.
UNIQUE и SORT
Пример: =SORT(UNIQUE(A2:A100)) — сначала выбираем уникальные значения, затем сортируем их по алфавиту или по числу.
UNIQUE и TRANSPOSE
Если данные расположены по горизонтали, сначала примените TRANSPOSE, затем UNIQUE, а при необходимости снова TRANSPOSE для вывода в нужном ориентире. Пример: =TRANSPOSE(UNIQUE(TRANSPOSE(A1:Z1))).
Примеры сочетаний (шаблоны)
- Сортировка и исключение пустых значений:
=SORT(FILTER(UNIQUE(A2:A), UNIQUE(A2:A) <> "")) - Уникальные строки, которые встречаются ровно один раз:
=UNIQUE(A2:A, FALSE, TRUE) - Уникальные записи по колонкам (фильтрация по столбцам):
=UNIQUE(A1:Z1, TRUE)
Советы и подводные камни
Важно: функция UNIQUE возвращает массив. Убедитесь, что справа и/или снизу рядом с ячейкой формулы есть свободное место для вывода данных. Если место занято — вы получите ошибку #REF!.
- Если вы хотите сохранить только значения (без формулы), скопируйте результат и выберите «Правка → Специальная вставка → Вставить только значения».
- Чтобы удалить все строки, возвращаемые UNIQUE, просто очистите ячейку с формулой.
- Сравнение происходит по содержимому ячеек. Невидимые пробелы, разные форматы чисел или регистр текста могут привести к неожиданным уникальным значениями.
- Для чувствительности к регистру используйте формулы с UPPER/LOWER:
UNIQUE(ARRAYFORMULA(UPPER(A2:A100)))— так вы приведёте все значения к одному регистру перед сравнением.
Когда UNIQUE не подойдёт (примеры и причины)
- Если нужно удалить дубликаты в пределах одной колонки, но сохранить первую встречающуюся строку с другими колонками — лучше использовать меню «Данные → Удалить дубликаты» или QUERY с ключевыми группировками.
- Если требуется учитывать частоту появления и выбрать записи, которые встречаются чаще N раз, используйте сочетание QUERY и COUNTIF или функцию FILTER с условием по частоте.
- Если необходимо сравнение по частичной совпадающей подстроке (не полное равенство строк), UNIQUE не подходит; используйте формулы с REGEXMATCH или пользовательские скрипты.
Альтернативные подходы
- Удалить дубликаты через интерфейс: меню «Данные → Удалить дубликаты» — удобнее для однократной очистки диапазона.
- QUERY: мощная SQL-подобная функция, подходит для группировки, подсчёта и выбора агрегатов:
=QUERY(A2:B, "select A, count(B) where A is not null group by A"). - FILTER + COUNTIF:
=FILTER(A2:A, COUNTIF(A2:A, A2:A)=1)— вернёт значения, которые встречаются ровно один раз. - Google Apps Script — для сложной логики очистки и автоматизации.
Мини-методология: быстрая очистка данных с UNIQUE
- Скопируйте исходные данные в отдельный лист (стратегия безопасности).
- Приведите данные к единому формату: TRIM, UPPER/LOWER, числовые форматы.
- Примените UNIQUE к колонке или к диапазону.
- При необходимости отфильтруйте пустые строки и отсортируйте результат.
- Сохраните как значения или вставьте в отчёт.
Чек-листы по ролям
Аналитик данных:
- Привёл значения к единому регистру.
- Удалил ведущие/концевые пробелы (TRIM).
- Применил UNIQUE и проверил количество строк.
- Сверил результат с исходными метриками.
Менеджер продукта:
- Проверил, что уникальные ключи совпадают с бизнес-правилами.
- Убедился, что агрегаты корректны после удаления дублей.
- Документировал логику очистки.
Бухгалтер / Финансист:
- Убедился, что числовые и валютные форматы корректны.
- Проверил отсутствие потерянных транзакций после очистки.
Шаблон-читшит (быстрые формулы)
Уникальные значения из колонки A:
=UNIQUE(A2:A)Уникальные строки из диапазона A:B, отсортированные:
=SORT(UNIQUE(A2:B))Только значения, которые встречаются ровно один раз:
=FILTER(UNIQUE(A2:A), COUNTIF(A2:A, UNIQUE(A2:A))=1)Уникальные значения без пустых строк:
=FILTER(UNIQUE(A2:A), UNIQUE(A2:A)<>"")
Простая диаграмма принятия решения
flowchart TD
A[Есть дубликаты?] -->|Да| B{Нужно сохранить первую строку?}
A -->|Нет| Z[Ничего не делать]
B -->|Да| C[Данные → Удалить дубликаты]
B -->|Нет| D{Хотите автоматическую формулу?}
D -->|Да| E[Использовать UNIQUE]
D -->|Нет| F[Использовать QUERY или скрипт]
C --> G[Проверить результаты]
E --> G
F --> G
G --> H[Сохранить результат как значения]Краткий глоссарий
- Диапазон — набор ячеек, указанный через двоеточие, например A2:A100.
- Массив — результат функции, содержащий несколько ячеек из одной формулы.
- TRANSPOSE — функция, меняющая строки и столбцы местами.
Техника проверки и тест-кейсы
- Подготовьте тестовый набор с очевидными дублями и пустыми строками.
- Примените
=UNIQUE(range)и сравните количество строк с ожидаемым. - Проверьте поведение с разными регистрами и пробелами (TRIM + UPPER).
- Если используете
exactly-once = TRUE, проверьте, что значения, встречающиеся более одного раза, исключены.
Резюме
UNIQUE — лёгкий и надёжный инструмент для удаления дубликатов и получения списка уникальных строк в Google Sheets. Он удобен сам по себе и особенно полезен в сочетании с SORT, FILTER, TRANSPOSE и QUERY. Перед применением приведите данные к единому формату и оставьте достаточно пространства для вывода массива.
- Начните с копии данных.
- Приведите строки к единому виду (TRIM, UPPER/LOWER).
- Используйте UNIQUE, затем SORT или FILTER при необходимости.
Спасибо за чтение. Попробуйте несколько комбинаций на тестовом наборе, чтобы выбрать подходящую для вашей задачи.
Похожие материалы
RDP: полный гид по настройке и безопасности
Android как клавиатура и трекпад для Windows
Советы и приёмы для работы с PDF
Calibration в Lightroom Classic: как и когда использовать
Отключить Siri Suggestions на iPhone