Гид по технологиям

Мониторинг VMware с помощью Checkmk: быстрое руководство

9 min read Мониторинг. Обновлено 25 Nov 2025
Мониторинг VMware с Checkmk
Мониторинг VMware с Checkmk

В этой статье показано, как за несколько шагов подключить VMware vCenter к Checkmk и начать мониторинг виртуальной инфраструктуры. Вы настроите vCenter как хост, создадите правило мониторинга через vSphere API и выполните автоматическое обнаружение сервисов. В завершение — чек-листы, отладка, методики и планы действий для реального применения.

Зачем это нужно

Мониторинг виртуализированных серверов помогает эффективно использовать серверное оборудование, предотвращать простои и быстро реагировать на инциденты. Хотя у VMware есть встроенные инструменты, лучше применять vendor-agnostic решение — оно позволит одновременно отслеживать серверное железо, сети и другие ресурсы.

Основные понятия в одной строке

  • Checkmk — система мониторинга с rule-based логикой и поддержкой piggyback для сбора данных через сторонние источники.
  • vCenter — централизованный сервер управления VMware vSphere.
  • ESXi — гипервизор, работающий на физических хостах.
  • Piggyback — механизм, позволяющий одному хосту в мониторинге предоставлять сервисы для других хостов.

Предварительные требования

  • Рабочая инстанция Checkmk (в инструкции использовалась Raw Edition, версия 2.1.0.p14).
  • Доступ к VMware vCenter с учётной записью только для чтения, охватывающей весь инвентарь vCenter.
  • Рекомендуется использовать FQDN (полные DNS-имена) для хостов. В примере vCenter называется vm-vcenter-01.lan.domain.net.

Внимание: используйте для мониторинга отдельную учетную запись с правами только для чтения. Не назначайте этому пользователю дополнительные права.

Изображения

Схематичное изображение инфраструктуры виртуализации и мониторинга

Шаг 1: добавить vCenter как хост в мониторинг

  1. Откройте сайт Checkmk и создайте папку для виртуальных машин:
    • Setup -> All hosts -> Add folder
    • В поле Title укажите имя (например «virtual machines»)
    • Сохраните

Добавление папки в Checkmk

Пояснение: папки помогают группировать однотипные хосты и управлять правилами централизованно.

  1. Перейдите в Setup -> All hosts -> выберите созданную папку -> Add host
    • Hostname: укажите отображаемое имя vCenter, например vm-vcenter-01.lan.domain.net
    • Если не используете DNS — отметьте IPv4 address и укажите IP
    • Сохраните и перейдите в папку

Добавление хоста VMware

Совет: в большинстве установок удобнее использовать FQDN — это упрощает корреляцию данных и карту зависимостей.

Шаг 2: подготовить правило мониторинга VMware

Checkmk должен иметь доступ к VMware API. Для этого создайте правило «VMWare ESX via vSphere» и укажите учётные данные vCenter.

  1. Setup -> поиск по “vmware” -> VMWare ESX via vSphere -> Add rule

Правило VMware в Checkmk

  1. В настройках правила:

    • vSphere User name: укажите [email protected]
    • vSphere secret: пароль
    • Type of query: выберите Queried host is vCenter
    • SSL certificate checking: по умолчанию Use hostname; если у vCenter самоподписной сертификат — выберите Deactivated
    • Connect Timeout: можно оставить по умолчанию
  2. Retrieve information about:

    • Host Systems: оставьте включённым (мониторинг ESXi через vCenter). Совет: добавьте ESXi как отдельные хосты позже.
    • License Usage: включайте только при реальной потребности в контроле лицензий
    • Do not monitor placeholder VMs: по умолчанию включено — оставьте
    • Display ESX Host power state / Display VM power state additionally: можно отключить
    • VM snapshot summary: включите — забытые снапшоты часто приводят к проблемам
  3. Piggyback name of virtual machines:

    • Объяснение: Checkmk сопоставляет полученные от vCenter объекты с хостами мониторинга по имени. По умолчанию пробелы в display name заменяются подчёркиваниями. При нестандартных именах используйте настройку, чтобы корректно парсить имена.

Конфигурация правила VMware в Checkmk

  1. Conditions: укажите, к каким хостам применимо правило. Для примера отметьте Explicit hosts и выберите ваш vCenter.

Сохраните правило.

Привязка правила к vCenter

Шаг 3: запустить автоматическое обнаружение сервисов

  1. Перейдите в Setup -> Hosts -> откройте папку с vCenter
  2. Найдите хост vCenter и нажмите на жёлтую иконку в тулбаре, чтобы запустить Automatic service discovery
  3. Дождитесь завершения и нажмите Accept all — все найденные сервисы попадут в мониторинг

Автоматическое обнаружение нашло три виртуальные машины

Примечание: vSphere API не всегда различает шаблоны и выключенные VMs. Шаблоны могут выглядеть как выключенные машины и попасть в мониторинг. Деактивируйте неактуальные сервисы (крестик), чтобы избежать ложных срабатываний.

  1. Нажмите на иконку в правом верхнем углу, чтобы просмотреть pending changes и Activate on selected sites

  2. Перейдите в Monitor -> All hosts -> найдите vCenter и откройте список его сервисов

Вид хоста vCenter в Checkmk

Следующие шаги для полноценного мониторинга VMware

Вы сделали первый важный шаг — подключили vCenter. Но для полного охвата необходимы дополнительные действия:

  • Добавить ESXi-хосты как отдельные хосты в Checkmk для сбора аппаратной телеметрии.
  • Настроить мониторинг гостевых ОС на уровне агентов или SNMP, если нужно глубокое наблюдение за метриками внутри ВМ.
  • Настроить оповещения и правила эскалации для бизнес-критичных сервисов.
  • Включить сбор информации о снапшотах, использовании дисков и latency на уровне datastore.

Полный пошаговый гайд доступен на странице «monitoring VMware with Checkmk» (см. исходный материал).


Практические советы и сценарии (value add)

Когда подход не сработает

  • Если у vCenter нет стабильного сетевого соединения с Checkmk — обнаружение и последующий сбор данных будут невозможны.
  • При использовании самоподписных SSL-сертификатов без отключения проверки SSL соединение будет отвергнуто.
  • Если права пользователя ограничены не только чтением — возможны сбои в работе или случайные изменения. Всегда используйте read-only профиль.

Альтернативные подходы

  • Прямой мониторинг ESXi через SNMP/SSH/agent: полезно для аппаратных метрик и при недоступности vCenter.
  • Использование специализированного VMware-решения (vRealize/вендорские пакеты): даёт глубинную интеграцию, но привязан к владельцу платформы.
  • Агентная модель внутри ВМ: ставьте системные агенты для мониторинга процессов, логов и детальных метрик.

Ментальные модели для принятия решений

  • «Source of truth»: если информация доступна в vCenter, получайте её оттуда; если нужен аппаратный контекст — берите данные с ESXi или серверного оборудования.
  • «Defense in depth»: комбинируйте несколько источников (vCenter + ESXi + агенты) для кросс-валидации метрик.

Уровни зрелости мониторинга (Maturity levels)

  • Level 1 — Основной: только доступность VMs через vCenter.
  • Level 2 — Инструментальный: добавлены ESXi, мониторинг снапшотов и datastore.
  • Level 3 — Полный: агенты внутри ВМ, аппаратные датчики, SLO и автоматические эскалации.

Факто-коробка

  • Что нужно: Checkmk, доступ к vCenter, учётная запись read-only, базовые права на просмотр инвентаря.
  • Что вы получаете: список виртуальных машин как сервисы, состояние ESXi-хостов через vCenter, метрики снапшотов.

Практические чек-листы (role-based)

Оператор (ответственный за первую настройку):

  • Установить Checkmk и открыть интерфейс.
  • Создать папку «virtual machines».
  • Добавить vCenter как хост с FQDN.
  • Создать правило VMWare ESX via vSphere с учётной записью vCenter.
  • Запустить Automatic service discovery и принять сервисы.

Инженер платформы (глубокая интеграция):

  • Добавить ESXi как отдельные хосты.
  • Подключить аппаратный мониторинг серверов (iLO/DRAC/IPMI).
  • Настроить мониторинг datastore и latency.

SRE / on-call:

  • Настроить уведомления и правила эскалации.
  • Подготовить runbook на случай недоступности vCenter.

Playbook: быстрая процедура реагирования на проблемы vCenter

  1. Сигнал: оповещение о недоступности vCenter или массовых WARN/CRIT на сервисы VMs.
  2. Проверка сети: проверить доступ от сервера Checkmk до vCenter (ping, traceroute).
  3. Проверка сертификата: если появились SSL-ошибки — проверьте дату и тип сертификата в vCenter.
  4. Проверьте учётные данные: подтвердите, что [email protected] не заблокирован и пароль актуален.
  5. Эскалация: если vCenter недоступен дольше 15 минут — уведомить администратора виртуализации.
  6. Резервный мониторинг: если vCenter недоступен, проверьте ESXi-хосты для поддержания видимости критичных метрик.

Критерии приёмки:

  • Checkmk успешно собирает список ВМ и сервисов от vCenter.
  • Разрешаются имена хостов корректно (FQDN или прописанный IP).
  • Ложные срабатывания из-за шаблонов минимизированы.

Incident runbook: восстановление при потере связи с vCenter

Шаг 1 — верификация

  • Выполните ping и curl с сервера Checkmk к vCenter.
  • Проверьте системные журналы Checkmk на ошибки соединения.

Шаг 2 — восстановление доступа

  • Если проблема сети — свяжитесь с сетевой командой.
  • Если сертификат — временно установите SSL check в Deactivated и планируйте замену сертификата.
  • Если учётные данные — подтвердите, что пароль действителен и учётная запись не заблокирована.

Шаг 3 — пост-инцидентный анализ

  • Проведите RCA: почему vCenter стал недоступен и какие метрики не были собраны.
  • Обновите playbook и добавьте автоматические проверки доступности vCenter каждые N минут.

Тест-кейсы и критерии приёмки

  1. Тест: добавить vCenter и выполнить автоматическое обнаружение

    • Критерий: обнаружены все существующие ВМ; сервисы перешли в мониторинг.
  2. Тест: изменить SSL-политику vCenter (самоподписной сертификат)

    • Критерий: Checkmk корректно обрабатывает выбранную опцию SSL certificate checking.
  3. Тест: создать шаблон ВМ в vCenter

    • Критерий: шаблон не вызывает аварийных оповещений после деактивации лишних сервисов.

Шаблон таблицы для инвентаризации (используйте в CMDB)

ПолеОписание
HostnameFQDN хоста в vCenter
RolevCenter / ESXi / VM
OwnerКоманда-владелец
Monitoring statusПодключён / Не подключён
NotesОсобые примечания (шаблоны, снапшоты)

Советы по безопасности и конфиденциальности

  • Храните учётные данные vCenter в защищённом секретном хранилище Checkmk (встроенный секреты/Password store).
  • Давайте мониторинговому аккаунту минимально необходимые права (read-only).
  • Логи и метрики могут содержать информацию о конфигурации виртуальных машин; ограничьте доступ к панели мониторинга в соответствии с политикой доступа в вашей организации.
  • GDPR/Privacy: если метрики содержат персональные данные, обеспечьте их маскирование и ограничьте периоды хранения.

Совместимость и миграционные советы

  • Если вы используете старую версию vCenter или ESXi, проверьте совместимость с вашей версией Checkmk. При проблемах — сначала обновите Checkmk на тестовом стенде.
  • При миграции vCenter (например, преобразование домена) проверьте, как изменятся display name в API — настройте Piggyback name при необходимости.

Диагностика распространённых ошибок

  • Ошибка: “Authentication failed” — проверьте логин/пароль и отсутствие блокировок в vCenter.
  • Ошибка: “SSL certificate” — смените настройку SSL certificate checking или установите корректный сертификат, выданный доверенным CA.
  • Ошибка: “No VMs found” — проверьте, доступен ли vCenter API и есть ли у учётной записи права на просмотр инвентаря.

Decision flow: стоит ли добавлять ESXi как отдельные хосты?

flowchart TD
  A[У вас есть доступ к ESXi?] -->|Да| B{Нужна ли аппаратная телеметрия?}
  A -->|Нет| C[Оставьте мониторинг только через vCenter]
  B -->|Да| D[Добавьте ESXi как отдельные хосты + подключите iLO/DRAC/IPMI]
  B -->|Нет| E[Оставьте только vCenter. Планируйте добавление позже]

1-строчный глоссарий

  • vCenter — управляющий сервер VMware.
  • ESXi — гипервизор для запуска ВМ.
  • Piggyback — механизм передачи сервисов от одного хоста другому в Checkmk.
  • FQDN — полное доменное имя хоста.

Короткое объявление для команды (100–200 слов)

Мы подключили VMware vCenter к Checkmk. Это позволяет автоматически обнаруживать виртуальные машины и получать базовые метрики через vSphere API. Для корректной работы использовалась учётная запись только для чтения. Следующие шаги — добавить ESXi как отдельные хосты для аппаратных данных, настроить глубинный мониторинг внутри ВМ и настроить оповещения для критичных сервисов. Пожалуйста, проверьте свои области ответственности в разделе чек-листов и уведомите команду платформы при необходимости дополнительных прав.


Заключение

Вы завершили базовую настройку мониторинга VMware через Checkmk. Это первый шаг к масштабируемому мониторингу виртуальной инфраструктуры. Дальше — добавляйте ESXi, настраивайте агентов внутри ВМ, внедряйте SLO и автоматизацию оповещений.

Если кратко:

  • Подключите vCenter как хост и создайте правило VMWare ESX via vSphere.
  • Выполните автоматическое обнаружение и активируйте сервисы.
  • Планируйте добавление ESXi и агентного мониторинга для полного покрытия.

Спасибо — действуйте по чек-листу и адаптируйте playbook под ваши бизнес-процессы.

Поделиться: X/Twitter Facebook LinkedIn Telegram
Автор
Редакция

Похожие материалы

Настройка Always On Display в One UI 7.0
Android.

Настройка Always On Display в One UI 7.0

Как алфавитно сортировать в Microsoft Excel
Excel

Как алфавитно сортировать в Microsoft Excel

Как связаться с Microsoft — всё о поддержке
Поддержка

Как связаться с Microsoft — всё о поддержке

Как настроить руль для Assetto Corsa на ПК
Симрейсинг

Как настроить руль для Assetto Corsa на ПК

Удалённый рабочий стол: Windows → Ubuntu
Удалённый доступ

Удалённый рабочий стол: Windows → Ubuntu

Заметки докладчика в PowerPoint — добавить и использовать
Презентации

Заметки докладчика в PowerPoint — добавить и использовать