Гид по технологиям

Как построить график остатков в Excel и зачем он нужен

7 min read Аналитика Обновлено 02 Jan 2026
График остатков в Excel: два простых способа
График остатков в Excel: два простых способа

Человек строит графики на ноутбуке

Что такое остатки и почему они важны

Остаток — это разница между наблюдаемым (фактическим) значением и предсказанным моделью значением. Проще: остаток — это ошибка прогноза. Например, если наблюдаемое значение равно 10, а модель предсказала 8, остаток равен 2.

График остатков — это диаграмма, где по горизонтальной оси отложена независимая переменная (предиктор), а по вертикальной — остатки. Такой график показывает, насколько случайно распределены ошибки и есть ли систематические отклонения (например, нелинейность, гетероскедастичность или выбросы).

Коротко:

  • Остаток = наблюдаемое — предсказанное.
  • На хорошей линейной модели остатки распределены случайно вокруг нуля.

Определения в одну строку:

  • Регрессия — статистический метод для оценки зависимости между переменными.
  • Гетероскедастичность — изменение дисперсии остатков по диапазону предиктора.

Когда проверять график остатков

  • После подбора регрессионной модели (линейной или простой полиномиальной).
  • При поиске выбросов или сильных влияющих наблюдений.
  • Перед интерпретацией коэффициентов модели и построением прогнозов.

Полезная мысленная модель

Представьте, что модель — это «линия лучшего соответствия». Остатки — расстояния от точек до этой линии. Если эти расстояния случайны и малые, модель описывает данные хорошо.

Метод 1: Построение графика остатков через уравнение линии тренда

Этот способ требует явного вычисления предсказанных значений по уравнению линии тренда, а затем построения точечной диаграммы остатков. Он длиннее, но помогает понять сущность остатков.

Шаг 1: Введите данные

В столбец X поместите предиктор, в столбец Y — наблюдаемые значения (целевую переменную).

Данные для графика остатков

Шаг 2: Постройте точечную диаграмму

  1. Выделите столбцы X и Y.
  2. На ленте Excel выберите вкладку Вставка.
  3. В разделе Диаграммы нажмите стрелку под опцией Точечная диаграмма.

Создание точечной диаграммы

  1. Выберите тип «Точечная диаграмма только с маркерами».
  2. У вас появится диаграмма, похожая на эту:

Точечная диаграмма

Шаг 3: Добавьте линию тренда и отобразите уравнение

  1. Выделите диаграмму.
  2. На ленте выберите Макет.
  3. В разделе, где располагаются параметры фона/элементов диаграммы, нажмите стрелку под значком Линия тренда.
  4. Выберите Линейная линия тренда.

Добавление линии тренда

Чтобы отобразить уравнение линии тренда на диаграмме:

  1. В меню Линия тренда выберите Дополнительные параметры линии тренда.
  2. В окне Формат линии тренда поставьте галочку Отобразить уравнение на диаграмме.

Отобразить уравнение на диаграмме

На диаграмме появится уравнение вида y = a*x + b (например, y = 1.5115x + 23.133).

Шаг 4: Вычислите предсказанные значения

Создайте столбец Z рядом с данными и подставьте в формулу значения из столбца X.

Пример: если уравнение на графике — y = 1.5115 * x + 23.133, то формула в Excel для первой строки будет:

=1.5115*A2+23.133

Скопируйте формулу вниз для всех наблюдений.

Ввод формулы линии тренда

Предсказанные значения

Шаг 5: Найдите остатки

Остаток = наблюдаемое значение − предсказанное значение. Если Y в столбце B, а предсказанное в C, то для первой ячейки:

=B2-C2

Скопируйте формулу вниз. Это ваши остатки.

Значения остатков

Шаг 6: Постройте график остатков

  1. Скрыть вспомогательные столбцы Y и Z можно, выделив их и выбрав Скрыть.

Скрыть столбцы Y и Z

  1. Выделите столбцы X и Остатки.
  2. На вкладке Вставка выберите Точечная диаграмма → «Точечная лишь с маркерами».

Построение точечной диаграммы для остатков

  1. График должен выглядеть примерно так:

График остатков

На этом графике обратите внимание: остатки должны быть случайно распределены вокруг нуля; видимые тренды или изменение разброса по оси X указывают на нарушение предпосылок модели.

Метод 2: Построение графика остатков с помощью Analysis ToolPak

Этот метод автоматизирует расчёт и генерирует отчет регрессии вместе с остатками и графиками.

Шаг 1: Загрузка Analysis ToolPak

  1. Перейдите на вкладку ФайлПараметры.

Окно параметров Excel

  1. Внизу в поле Управление выберите Надстройки Excel и нажмите Перейти.
  2. В диалоге Надстройки поставьте галочку Analysis ToolPak и нажмите ОК.

Диалог надстроек

  1. Теперь на вкладке Данные появится кнопка Анализ данных в секции Анализ.

Анализ данных в ленте

Шаг 2: Подготовьте данные

  1. В одном листе поместите столбец X и столбец Y рядом.
  2. Если какие-то столбцы были скрыты, откройте их через Отобразить (Unhide).

Отобразить столбцы

  1. Скопируйте X и Y на новый лист для чистого вывода.

Копирование столбцов X и Y

Шаг 3: Проведите регрессию и получите остатки

  1. Нажмите Анализ данных → выберите РегрессияОК.

Диалог регрессии

  1. Укажите диапазон входных данных Y и X (например, Y: B2:B11, X: A2:A11).

Ввод данных в диалог регрессии

  1. В разделе Параметры вывода выберите Новый лист и нажмите ОК.

Excel сгенерирует развернутый отчет: статистику регрессии, таблицу ANOVA, таблицу коэффициентов и отдельный блок «Residual Output» с рассчитанными остатками.

График остатков и сводный вывод

График остатков можно дополнить на новом листе вручную, используя столбцы с предиктором и столбец Residual Output.

Как интерпретировать график остатков

Проверяйте следующие моменты:

  • Случайность: остатки должны быть распределены без видимого тренда.
  • Центрирование: среднее значение остатков близко к нулю.
  • Постоянство дисперсии: разброс остатков не должен систематически меняться по оси X.
  • Выбросы: отдельные большие по модулю остатки требуют проверки наблюдений.

Если вы видите ярко выраженную кривую (например, U-образную), модель скорее всего недооценивает нелинейность — рассмотрите добавление полиномиальных членов или переход к нелинейной регрессии.

Критерии приёмки модели по графику остатков

  • Среднее остатка ≈ 0.
  • Нет систематической структуры (тренда или кривизны).
  • Отсутствие явной зависимости вариации остатков от X.
  • Отсутствие нескольких сильных выбросов, влияющих на коэффициенты.

Если хотя бы одно из условий нарушено, требуется дополнительный анализ и, возможно, изменение модели.

Когда этот метод не годится и альтернативы

Когда график остатков может вводить в заблуждение:

  • При сильно несимметричном распределении ошибок или при наличии тяжелых хвостов — стандартные остатки могут недооценивать влияние выбросов.
  • Когда данные имеют мультиколлинеарность (несколько коррелированных предикторов) — простые графики по одному предиктору не показывают полной картины.
  • При временных рядах с автокорреляцией — нужны специализированные диаграммы и тесты (Durbin–Watson).

Альтернативные подходы:

  • Стандартизованные или студентированные остатки (учитывают изменение дисперсии).
  • Диаграммы влияния (Cook’s distance) и DFBETAS для поиска влияющих наблюдений.
  • Робастная регрессия (robust regression) для устойчивости к выбросам.
  • LOESS/локальная регрессия для визуализации нелинейных зависимостей.

Мини‑методология для анализа остатков (шаги)

  1. Построить график остатков против предиктора.
  2. Проверить центрирование и случайность.
  3. Вычислить стандартизованные остатки и найти наблюдения с |resid| > 2 или > 3.
  4. Провести тест на гетероскедастичность (например, тест Бреуша-Пагана).
  5. При выявлении проблем: изменить спецификацию модели, трансформировать переменные, использовать робастные методы.

Чек-лист ролей

Аналитик:

  • Построить модели двумя способами (ручной и через ToolPak).
  • Вычислить стандартизованные остатки.
  • Отправить отчет с графиками и таблицами коэффициентов.

Рецензент:

  • Проверить наличие тренда и гетероскедастичности.
  • Запросить дополнительные модели при необходимости.

Разработчик/инженер данных:

  • Убедиться в корректности обработки пропусков и кодировок.
  • Автоматизировать построение отчетов и графиков остатков.

Шпаргалка формул и примеры

  • Остаток: residual_i = y_i − ŷ_i
  • Пример в Excel: если наблюдаемое в B2, предсказанное в C2:
=B2-C2
  • Если уравнение линии тренда y = 1.5115*x + 23.133, формула для предсказанного значения при x в A2:
=1.5115*A2+23.133
  • Для стандартизованного остатка (приблизительно):
=residual / (стандартное отклонение остатков)

Примеры ошибок и как их исправить

  • Симптом: остатки образуют U-образную кривую. Причина: модель линейна, а связь нелинейна. Решение: добавить полиномиальные члены (x^2) или использовать нелинейную модель.
  • Симптом: разброс остатков увеличивается с ростом X. Причина: гетероскедастичность. Решение: применить взвешенную регрессию или трансформировать Y (например, логарифм).
  • Симптом: несколько точек с большими остатками и сильным влиянием на коэффиц. Действие: проверить исходные данные, удалить или смягчить влияние выбросов, попробовать робастную регрессию.

Быстрая проверка качества (Decision flow)

flowchart TD
  A[Начало: есть модель] --> B{График остатков случайный?}
  B -- Да --> C{Средний остаток ≈ 0?}
  B -- Нет --> D[Проверить нелинейность / трансформации]
  C -- Да --> E[Модель адекватна для линейной спецификации]
  C -- Нет --> F[Проверить смещение данных и константу]
  D --> G[Добавить полиномы или LOESS]
  F --> H[Переоценить модель: добавить/удалить переменные]
  G --> I[Повторная проверка остатков]
  H --> I
  E --> Z[Готово]
  I --> B

Краткое резюме

  • График остатков — обязательный элемент диагностики регрессионной модели.
  • В Excel его можно построить вручную через уравнение линии тренда или автоматически через Analysis ToolPak.
  • Используйте стандартизованные остатки, тесты на гетероскедастичность и диаграммы влияния для глубокой диагностики.

Часто задаваемые вопросы

Что считать критическим значением остатка?

Часто считают подозрительными стандартизованные остатки с модулем > 2, а особенно > 3. Это ориентировочные пороги — контекст данных важен.

Нужно ли всегда логарифмировать Y при гетероскедастичности?

Нет: логарифм может помочь, но стоит сначала оценить природу гетероскедастичности и попробовать альтернативы (взвешенная регрессия, трансформации, робастные оценки).

Можно ли доверять уравнению линии тренда, показанному на диаграмме?

Да, для простой линейной регрессии уравнение корректно, но для точных оценок и статистических выводов лучше использовать вывод Analysis ToolPak или встроенные функции регрессии.

Краткое резюме в один абзац: График остатков показывает, насколько предсказания модели совпадают с наблюдениями и помогает выявить нарушения базовых предпосылок линейной регрессии (нелинейность, гетероскедастичность, выбросы). В Excel его можно построить вручную по уравнению линии тренда или автоматически через Analysis ToolPak — оба подхода полезны и дополняют друг друга.

Поделиться: X/Twitter Facebook LinkedIn Telegram
Автор
Редакция

Похожие материалы

Переименовать и удалить устройства Kindle
Руководство

Переименовать и удалить устройства Kindle

Напоминания на Google Home и Nest
How-to

Напоминания на Google Home и Nest

Исправить Content file locked в Steam
Игры

Исправить Content file locked в Steam

Таймкоды в комментариях YouTube — как добавлять
YouTube

Таймкоды в комментариях YouTube — как добавлять

Преобразование 12‑часового времени в 24‑часовой
Программирование

Преобразование 12‑часового времени в 24‑часовой

Как очистить кэш в Kodi: быстро и безопасно
Kodi

Как очистить кэш в Kodi: быстро и безопасно