Гид по технологиям

Диаграмма рассеяния в Google Sheets: построение и анализ тренда

6 min read Аналитика Обновлено 05 Jan 2026
Диаграмма рассеяния в Google Sheets
Диаграмма рассеяния в Google Sheets

Диаграмма рассеяния показывает взаимосвязь между двумя числовыми переменными: одна откладывается по оси X (независимая), другая по оси Y (зависимая). В Google Sheets её легко построить и дополнить линией тренда, чтобы оценить корреляцию и направление зависимости. В статье — пошаговая инструкция, критерии приёмки, альтернативы, шаблоны и чек-листы для аналитиков и менеджеров.

Плавающий логотип Google Sheets на пурпурно-розово-оранжевом градиенте

Что такое диаграмма рассеяния

Диаграмма рассеяния — это тип графика, в котором каждое наблюдение представлено точкой на плоскости. Ось X обычно показывает независимую переменную, ось Y — зависимую. Точка с координатами (x, y) показывает значение двух переменных для одного наблюдения.

Краткое определение терминов

  • Независимая переменная: значение, которое вы изменяете или которое считается входным (обычно по оси X).
  • Зависимая переменная: результат, который вы наблюдаете при изменении независимой переменной (обычно по оси Y).

Зачем использовать диаграмму рассеяния

  • Выявлять корреляцию между двумя числовыми переменными.
  • Видеть диапазон значений, выбросы и плотность точек.
  • Оценивать линейные и нелинейные зависимости.
  • Подготавливать данные для регрессионного анализа и прогнозов.

Важно

Диаграмма рассеяния подходит только для числовых данных. Для категориальных или порядковых переменных используйте столбчатые диаграммы или ящики с усами (box plot).

Когда стоит использовать диаграмму рассеяния

Используйте диаграмму рассеяния, когда:

  • Нужно проверить связь между двумя количественными переменными.
  • Вы хотите обнаружить выбросы или кластеры точек.
  • Планируете построить простую линейную модель (регрессию).

Примеры задач

  • Анализ зависимости веса от роста.
  • Связь рекламного бюджета и продаж по регионам.
  • Влияние температуры на потребление энергии.

Как построить базовую диаграмму рассеяния в Google Sheets

В примере ниже независимая переменная — Рост (Height), зависимая — Вес (Weight). Предполагается, что данные уже внесены в таблицу.

Снимок экрана с выделенными данными для диаграммы рассеяния в Google Sheets

Пошаговая инструкция

  1. Выделите диапазон с данными. Можно включить заголовки столбцов.Открытие редактора диаграммы в Google Sheets
  2. В меню выберите Вставка → Диаграмма. Редактор диаграмм откроется справа.Выбор диаграммы рассеяния в меню редактора диаграмм
  3. В редакторе диаграмм в разделе Тип диаграммы выберите Диаграмма рассеяния, если Sheets создал другой тип по умолчанию.

Совет

Если точки кажутся наложенными, увеличьте масштаб осей или добавьте прозрачность точек (опция в настройках серии данных).

Как добавить линию тренда

Линия тренда помогает увидеть общее направление и силу зависимости.

Как открыть настройки диаграммы

  1. Кликните по диаграмме. Нажмите на три точки в правом верхнем углу диаграммы.
  2. Выберите Редактировать диаграмму. Редактор откроется справа.Снимок экрана, показывающий повторное открытие меню диаграммы в Google Sheets

Добавление линии тренда

  1. В редакторе переключитесь на вкладку Настроить.
  2. Откройте раздел Серии.
  3. Прокрутите вниз и поставьте галочку напротив Линия тренда.Снимок экрана с опцией добавления линии тренда в Google Sheets

Опции линии тренда

  • Тип: Линейная, Экспоненциальная, Логарифмическая, Полиномиальная. Выберите в зависимости от характера связи.
  • Отображать уравнение: полезно для быстрых прогнозов.
  • Показать R²: измеряет, какую долю дисперсии объясняет модель (в процентах). Высокое R² у линейной модели указывает на сильную линейную зависимость.

Важно

R² сам по себе не доказывает причинно-следственную связь. Он показывает качество подгонки модели к данным.

Практическая методика анализа диаграммы рассеяния

Мини-методология из 6 шагов

  1. Проверка данных: уберите неверные или пустые значения. Убедитесь, что обе переменные числовые.
  2. Визуализация: постройте диаграмму рассеяния и настройте точки (цвет, размер, прозрачность).
  3. Линия тренда: добавьте и выберите тип (линейный по умолчанию).
  4. Оценка подгонки: посмотрите на распределение точек, расстояние до линии, R² и уравнение.
  5. Распознавание выбросов: отметьте точки за пределами общего распределения.
  6. Решение: при необходимости выполните трансформацию данных (логарифм, стандартизация) или используйте другой тип модели.

Критерии приёмки

  • Диаграмма отображает все корректные наблюдения.
  • Ось X — независимая переменная; ося Y — зависимая.
  • Линия тренда добавлена и выбрана подходящий тип.
  • При необходимости показаны уравнение и R².
  • Выбросы помечены или описаны в заметках.

Тестовые случаи и критерии проверки

  • Набор из 50 точек с видимой линейной зависимостью: R² > 0.5 и уравнение имеет значимый наклон.
  • Набор с отсутствующей зависимостью: линия тренда почти горизонтальна, R² близок к 0.
  • Наличие больших выбросов: отдельные точки удаляются в тестовой версии и сравнивается R² до и после.

Альтернативные подходы и когда они лучше

  1. Линейный график (Line chart) — если данные упорядочены по времени и важен порядок наблюдений.
  2. График пузырьков (Bubble chart) — когда нужно включить третью переменную через размер пузырька.
  3. Ящик с усами (Box plot) — для сравнения распределений между группами.
  4. Тепловая карта плотности — если много точек и важно показать плотность кластеров.
  5. Корреляционная матрица — для быстрого обзора парных корреляций между множеством переменных.

Когда диаграмма рассеяния не подходит

  • Одна или обе переменные категориальные.
  • Много повторяющихся точек на небольшом диапазоне (тогда используйте джиттеринг или тепловую карту).
  • Нужен порядок наблюдений по времени и важен тренд временных рядов.

Контрпримеры

  • Данные «Пол» и «Профессия» нельзя корректно представить диаграммой рассеяния.
  • Если обе переменные независимы и не связаны концептуально, вы, скорее всего, увидите случайный набор точек без тренда.

Чек-листы для ролей

Чек-лист для аналитика

  • Проверить формат переменных (числовой/текстовый).
  • Нормализовать или трансформировать данные при сильной скошенности.
  • Выявить и документировать выбросы.
  • Построить линию тренда и записать уравнение и R².
  • Сохранить диаграмму и снапшот с пояснением выводов.

Чек-лист для менеджера продукта

  • Понять, какая гипотеза проверяется с помощью диаграммы.
  • Проверить, соответствует ли выбранная зависимость бизнес-логике.
  • Попросить аналитика подготовить выводы и возможные действия.

Чек-лист для разработчика отчетности

  • Проверить, что данные подаются в нужном формате в отчёт.
  • Убедиться, что автоматизированное построение диаграмм корректно обрабатывает пустые значения.
  • Настроить экспорт диаграмм в PDF/PNG для презентаций.

Шаблоны и сниппеты

Мини-шаблон для описания диаграммы в отчёте

  • Данные: описать источник, период и размер выборки.
  • Ось X: назвать переменную и единицы измерения.
  • Ось Y: назвать переменную и единицы измерения.
  • Тип линии тренда: указать выбранный тип.
  • Результат: кратко интерпретировать наклон, R² и наличие выбросов.

Пример описания

Данные: выборка 120 записей за 2023 год. Ось X — Рост в см. Ось Y — Вес в кг. Линия тренда — линейная. Наклон положительный, R² = 0.62, что указывает на умеренно сильную линейную зависимость. Обнаружены 3 выброса с очень высоким весом относительно роста.

Безопасность и приватность данных

При работе с личными данными соблюдайте правила конфиденциальности. Убирайте идентифицирующую информацию перед обменом диаграммами и не публикуйте данные без согласия.

Советы по интерпретации и распространённые ошибки

  • Ошибка корреляции и причинности: даже сильная корреляция не доказывает, что X вызывает Y.
  • Неподходящий тип линии тренда: иногда экспоненциальная или полиномиальная линия лучше отражает данные.
  • Игнорирование выбросов: выбросы могут быть ошибками ввода или реальными событиями — проверьте источник.

Факто-бокс

  • Подходит для: числовых парных данных.
  • Не подходит для: категориальных данных.
  • Основные признаки: точки на плоскости, оси X и Y, опциональная линия тренда.

Глоссарий 1 строкой

  • Диаграмма рассеяния: график парных числовых наблюдений; точка = одно наблюдение.
  • Линия тренда: модель, показывающая общее направление зависимости.
  • R²: процент объяснённой дисперсии зависимой переменной моделью.

Итог

Диаграммы рассеяния в Google Sheets — простой и быстрый инструмент для первичного анализа связи между двумя переменными. Они наглядно показывают корреляцию, выбросы и помогают выбрать модель для прогноза. Используйте чек-листы и методику из статьи, чтобы строить корректные графики и делать обоснованные выводы.

Важно

Перед любыми выводами проверьте данные и помните, что визуальная подгонка не заменяет статистического анализа.

Поделиться: X/Twitter Facebook LinkedIn Telegram
Автор
Редакция

Похожие материалы

RDP: полный гид по настройке и безопасности
Инфраструктура

RDP: полный гид по настройке и безопасности

Android как клавиатура и трекпад для Windows
Гайды

Android как клавиатура и трекпад для Windows

Советы и приёмы для работы с PDF
Документы

Советы и приёмы для работы с PDF

Calibration в Lightroom Classic: как и когда использовать
Фото

Calibration в Lightroom Classic: как и когда использовать

Отключить Siri Suggestions на iPhone
iOS

Отключить Siri Suggestions на iPhone

Рисование таблиц в Microsoft Word — руководство
Office

Рисование таблиц в Microsoft Word — руководство