Гид по технологиям

Как использовать описательную статистику в Excel

7 min read Анализ данных Обновлено 26 Nov 2025
Описательная статистика в Excel: быстрое руководство
Описательная статистика в Excel: быстрое руководство

Анализ данных: таблица и диаграммы

Важно: это руководство шаг за шагом, с пояснениями опций, примером, чеклистом для аналитика и подсказками, когда встроенные статистики недостаточны.

Что такое описательная статистика

Описательная статистика — это набор числовых показателей, которые кратко характеризуют распределение данных. Коротко: она не объясняет причин, а суммирует факты. Полезна для быстрой диагностики данных перед дальнейшим анализом или визуализацией.

Ключевые варианты запроса: описательная статистика в Excel, как запустить Descriptive Statistics, Analysis ToolPak, функции Excel для статистики.

Как добавить надстройку Анализ данных в Excel

Перед использованием Descriptive Statistics нужно установить Analysis ToolPak.

  1. Нажмите «Файл > Параметры > Надстройки».
  2. Внизу в поле «Управление» выберите «Надстройки Excel» и нажмите «Перейти…».

Окно управления надстройками Excel

  1. В появившемся окне отметьте «Analysis ToolPak» и нажмите «OK».

Установка Analysis ToolPak в Excel

После этого в ленте появится группа «Анализ данных» на вкладке «Данные».

Как запустить описательную статистику

  1. Подготовьте таблицу: каждая переменная — в отдельном столбце; при необходимости добавьте заголовки.
  2. Перейдите в «Данные > Анализ данных».
  3. В списке выберите «Descriptive Statistics» и нажмите «OK».

Параметры анализа данных в Excel

  1. В поле Input Range выделите диапазон данных (включая заголовки, если есть).
  2. Укажите, сгруппированы ли данные по столбцам или строкам (обычно «Columns»).
  3. Если в первом ряду есть метки, отметьте «Labels in first row».
  4. Выберите место вывода: Output Range (в текущем листе), New Worksheet Ply или New Workbook.
  5. Поставьте галочку «Summary statistics», чтобы вывести стандартный набор показателей.
  6. При необходимости задайте Confidence Level for Mean или опции Kth Largest / Kth Smallest.

Важно: Для корректных результатов диапазон должен содержать только числовые значения и отсутствующие ячейки либо заполнены, либо исключены из диапазона.

Пояснение параметров инструмента

ПараметрОписание
Input RangeВыделите диапазон данных, который нужно проанализировать. Несколько переменных должны представлять непрерывный блок.
Grouped ByУкажите, как агрегированы данные: по столбцам (Columns) или по строкам (Rows).
Labels in first rowОтмечайте, если первый ряд содержит заголовки переменных.
Output RangeДиапазон в текущем листе для вывода результатов.
New Worksheet PlyПоместить результат в новый лист текущей книги.
New WorkbookПоместить результат в новую книгу Excel.
Summary statisticsВывести стандартный набор описательных показателей.
Confidence Level for MeanПостроить интервал доверия для среднего при заданном уровне доверия.
Kth LargestНайти k-ую по величине максимальную величину (k=1 — максимум).
Kth SmallestНайти k-ую по величине минимальную величину (k=1 — минимум).

Как читать результаты

После запуска вы получите таблицу с набором показателей для каждой переменной. Ниже — перевод и пояснения значений.

ПоказательЧто показываетАльтернатива через формулу Excel
MeanСреднее значение выборки=AVERAGE(диапазон)
Standard ErrorСтандартная ошибка среднего — оценивает точность среднего как оценки генеральной совокупности; выше — больше неопределённости=STDEV.S(диапазон)/SQRT(COUNT(диапазон))
MedianМедиана — центральное значение отсортированного списка
ModeМода — наиболее частое значение=MODE.SNGL(диапазон)
Standard DeviationСтандартное отклонение выборки=STDEV.S(диапазон)
Sample VarianceДисперсия выборки (квадрат стандартного отклонения)=VAR.S(диапазон)
KurtosisКуртозис — «тяжесть» хвостов распределения; для нормального распределения значение около 0
SkewnessАсимметрия распределения; 0 — симметрично=SKEW(диапазон)
RangeРазмах — разница между максимумом и минимумом=MAX(диапазон)-MIN(диапазон)
MinimumМинимум=MIN(диапазон)
MaximumМаксимум=MAX(диапазон)
SumСумма всех значений=SUM(диапазон)
CountКоличество числовых значений=COUNT(диапазон)
Largest(k)k-я максимальная величина, заданная в опции Kth Largest
Smallest(k)k-я минимальная величина, заданная в опции Kth Smallest
Confidence Level(по умолчанию 95%)Интервал доверия для среднего при указанном уровне

Примечание: ToolPak рассчитывает показатели для числовых данных. Если в диапазоне смешаны текст и числа, результаты могут быть неполными.

Пример: пошаговый сценарий с тестовой таблицей

  1. Допустим, у вас есть столбец “Продажи” в диапазоне A1:A101, где A1 — заголовок.
  2. Выделите любую ячейку в таблице и откройте «Данные > Анализ данных > Descriptive Statistics».
  3. В Input Range укажите A1:A101 и отметьте “Labels in first row”.
  4. Выберите New Worksheet Ply и поставьте галочку “Summary statistics”.
  5. Нажмите OK — в новом листе получите таблицу со средним, медианой, стандартной ошибкой и прочими показателями.

Практический совет: после вывода результатов постройте гистограмму и ящик с усами (boxplot), чтобы визуально оценить асимметрию и выбросы.

Когда описательная статистика может вводить в заблуждение

  • Наличие выбросов: среднее может быть смещено; используйте медиану и межквартильный размах.
  • Нерепрезентативная выборка: результаты описательной статистики отражают только имеющиеся данные, а не общую популяцию.
  • Смешанные типы данных: если столбец содержит даты, тексты или пустые строки, результаты могут быть некорректны.
  • Несобранные данные по группам: если нужно сравнить подгруппы, анализируйте их отдельно или используйте сводные таблицы.

Контрпример: для сильно скошенного распределения среднее хуже отражает «типичное» значение — лучше смотреть медиану и процентные ранги.

Альтернативные подходы и когда их выбрать

  • Формулы Excel (AVERAGE, MEDIAN, STDEV.S, SKEW, KURT): удобны для динамического листа, когда данные регулярно обновляются.
  • Сводные таблицы (PivotTable): подходят для группировки по категориям и расчёта агрегатов по подгруппам.
  • Power Query: для подготовки и очистки больших наборов данных перед подсчётом статистик.
  • Power BI или Python/R: для сложной статистики, визуализации и автоматизации при больших объемах данных.

Когда выбрать ToolPak: быстрое одноразовое резюме набора данных; когда нужен повторяемый скрипт — лучше формулы или код.

Шпаргалка: соответствия между показателями ToolPak и формулами

  • Mean → =AVERAGE(range)
  • Median → =MEDIAN(range)
  • Mode → =MODE.SNGL(range)
  • Std Dev (выборочная) → =STDEV.S(range)
  • Variance (выборочная) → =VAR.S(range)
  • Skewness → =SKEW(range)
  • Kurtosis → =KURT(range)
  • Count → =COUNT(range)
  • Sum → =SUM(range)

Краткая методология подготовки данных перед анализом

  1. Проведите проверку на пустые и нечисловые значения.
  2. Удалите или пометьте выбросы (или проговорите, почему они важны).
  3. Убедитесь, что единицы измерения последовательны (валюта, единицы, даты).
  4. Разбейте данные на логичные подгруппы, если нужно сравнение.
  5. Сохраните исходные данные в отдельном листе перед преобразованиями.

Контрольный список по ролям

Аналитик:

  • Проверить данные на пропуски и некорректные значения.
  • Запустить Descriptive Statistics и сравнить с результатами через формулы.
  • Построить гистограмму и boxplot для каждой переменной.

Менеджер/стейкхолдер:

  • Оценить средние, медиану и стандартную ошибку для ключевых метрик.
  • Попросить разбивку по сегментам при необходимости.

Разработчик отчетов:

  • Интегрировать формулы в шаблон отчёта для автоматического расчёта при обновлении данных.

Критерии приёмки

  • Результаты совпадают с ручными формулами (на выборке).
  • Отчёт содержит минимум: среднее, медиану, стандартное отклонение, минимумы/максимумы и объём выборки.
  • Выбросы документационно проанализированы или помечены.

Краткий глоссарий (1‑строчные определения)

  • Среднее: арифметическое значение набора данных.
  • Медиана: центральное значение в отсортированном списке.
  • Мода: наиболее частое значение.
  • Стандартное отклонение: среднее отклонение значений от среднего.
  • Дисперсия: квадрат стандартного отклонения.
  • Куртозис: мера «тяжести» хвостов распределения.
  • Асимметрия: степень смещения распределения влево или вправо.

Когда переходить к продвинутой статистике

Если вы хотите делать выводы о причинно-следственных связях, проверять гипотезы или строить прогнозные модели — переходите к регрессии, тестам значимости, байесовским методам или машинному обучению. Описательная статистика сама по себе не даёт подтверждения гипотез.

Краткое резюме

  • Analysis ToolPak в Excel даёт быстрый набор показателей для первичного анализа данных.
  • Перед запуском очистите и проверьте данные, чтобы результаты были корректными.
  • Для повторяемых отчётов используйте формулы, Power Query или код.

Важно: используйте описательную статистику как диагностический инструмент, а не как окончательное доказательство. Анализируйте визуально и думайте о контексте данных.

Поделиться: X/Twitter Facebook LinkedIn Telegram
Автор
Редакция

Похожие материалы

RDP: полный гид по настройке и безопасности
Инфраструктура

RDP: полный гид по настройке и безопасности

Android как клавиатура и трекпад для Windows
Гайды

Android как клавиатура и трекпад для Windows

Советы и приёмы для работы с PDF
Документы

Советы и приёмы для работы с PDF

Calibration в Lightroom Classic: как и когда использовать
Фото

Calibration в Lightroom Classic: как и когда использовать

Отключить Siri Suggestions на iPhone
iOS

Отключить Siri Suggestions на iPhone

Рисование таблиц в Microsoft Word — руководство
Office

Рисование таблиц в Microsoft Word — руководство