RAID por software: notificaciones por correo al fallar
Configura mdadm para que envíe notificaciones por correo añadiendo una línea MAILADDR en /etc/mdadm/mdadm.conf y reiniciando el servicio. Verifica que tengas un MTA configurado (postfix, ssmtp, msmtp, etc.) y aprende a probar y depurar las alertas.
Versión 1.0
Autor: Falko Timme
Este breve artículo explica cómo configurar RAID por software (mdadm) para que envíe un correo electrónico cuando algo vaya mal, por ejemplo cuando falle un disco. La guía está basada en pruebas en Debian Etch, pero el procedimiento aplica a la mayoría de distribuciones con ajustes menores en rutas y en la forma de reiniciar servicios.
Qué es mdadm (una línea): mdadm es la utilidad de Linux para crear y gestionar arreglos RAID por software; su componente de monitorización puede enviar alertas por correo cuando detecta fallos.
Importante: esta guía no garantiza resultados en todos los entornos. Asegúrate de tener un agente de correo (MTA) instalado y configurado para que el sistema pueda enviar mensajes salientes.
Requisitos previos
- Acceso root o sudo en el servidor.
- mdadm instalado.
- Un MTA (postfix, ssmtp, msmtp, exim, etc.) o un mecanismo que permita enviar correo desde el sistema.
- Rutas de archivo: en Debian la configuración suele estar en /etc/mdadm/mdadm.conf.
Paso 1 — Editar el archivo de configuración de mdadm
Abre el archivo de configuración (ejemplo con vi):
vi /etc/mdadm/mdadm.conf
Añade o modifica una línea MAILADDR con tu dirección de correo. Por ejemplo, el archivo puede contener algo así:
DEVICES /dev/sda* /dev/sdb*
ARRAY /dev/md0 level=raid1 num-devices=2 UUID=c8a78e3a:e335c0f0:997be224:f02c088a
ARRAY /dev/md1 level=raid1 num-devices=2 UUID=fd9f3b6b:4fc9cf4f:09db592d:480d34fe
MAILADDR [email protected]
Asegúrate de sustituir [email protected] por tu dirección real de alerta.
Paso 2 — Reiniciar el servicio de mdadm
En sistemas SysV (viejos) puedes usar:
/etc/init.d/mdadm restart
En sistemas modernos con systemd prueba:
systemctl restart mdadm
Nota: el nombre exacto del servicio puede variar (mdadm, mdmonitor, mdadm.service). Si no existe el servicio mdadm, busca mdmonitor o similar con systemctl list-units | grep md.
Qué esperar: ejemplos de mensajes
Cuando mdadm detecte un evento (por ejemplo, degradación del arreglo o fallo de una pieza), enviará un correo automático similar a estos ejemplos:
From: mdadm monitoring <[email protected]> To: [email protected] Subject: DegradedArray event on /dev/md1:server1.example.com
This is an automatically generated mail message from mdadm running on server1.example.com
A DegradedArray event had been detected on md device /dev/md1.
Faithfully yours, etc.
P.S. The /proc/mdstat file currently contains the following:
Personalities : [raid0] [raid1] md1 : active raid1 sda2[2] sdb2[1] 487853760 blocks [2/1] [_U] [>………………..] recovery = 4.3% (21448384/487853760) finish=114.3min speed=67983K/sec
md0 : active raid1 sda1[0] sdb1[1] 530048 blocks [2/2] [UU]
unused devices:
O bien:
From: mdadm monitoring <[email protected]> To: [email protected] Subject: FailSpare event on /dev/md1:server1.example.com
This is an automatically generated mail message from mdadm running on server1.example.com
A FailSpare event had been detected on md device /dev/md1.
It could be related to component device /dev/sda2.
Faithfully yours, etc.
P.S. The /proc/mdstat file currently contains the following:
Personalities : [raid0] [raid1] md1 : active raid1 sda22 sdb2[1] 487853760 blocks [2/1] [_U] [===================>.] recovery = 99.9% (487851840/487853760) finish=0.0min speed=61037K/sec
md0 : active raid1 sda1[0] sdb1[1] 530048 blocks [2/2] [UU]
unused devices:
Comprobaciones y diagnóstico rápido
Si no recibes correos, revisa:
- ¿Hay un MTA instalado y accesible? Prueba enviar un correo manual desde la línea de comandos: echo “prueba” | mail -s “prueba” [email protected] (si el comando mail no existe instala bsd-mailx o mailutils).
- ¿El servicio de monitorización de mdadm está en ejecución? Revisa procesos y unidades systemd.
- ¿La dirección en MAILADDR está escrita correctamente y no bloquea tu servidor SMTP?
- ¿Hay reglas de firewall que impidan la salida SMTP (puerto 25) o el uso de un relay (587/465)?
- Consulta /proc/mdstat para ver el estado rápido: cat /proc/mdstat
- Información detallada del arreglo: mdadm –detail /dev/md1
- Revisa logs del sistema: grep mdadm /var/log/syslog o journalctl -t mdadm o journalctl | grep mdadm
Cómo probar las alertas (simulación segura)
Puedes forzar un evento para comprobar la notificación en un entorno controlado. Ejemplo (hacer esto sólo si entiendes las consecuencias):
# marcar una pieza como fallida
mdadm --manage /dev/md1 --fail /dev/sda2
# opcional: quitar la pieza
mdadm --manage /dev/md1 --remove /dev/sda2
# volver a añadirla cuando estés listo
mdadm --manage /dev/md1 --add /dev/sda2
Al marcar una pieza como fallida mdadm debe generar un evento que el monitor detecte y que, si está correctamente configurado, envíe un correo a MAILADDR.
Advertencia: estas operaciones afectan al arreglo; realízalas sólo en entornos de prueba o con conocimiento de lo que haces.
Alternativas y complementos
- Integrar monitorización externa (Nagios, Zabbix, Prometheus + Alertmanager) para recibir notificaciones más ricas y centralizadas.
- Usar smartd (part of smartmontools) para alertas tempranas de SMART del disco; combina ambas soluciones para cobertura completa.
- Configurar un relay SMTP o usar servicios de correo transaccional si el servidor no tiene salida SMTP directa.
Problemas comunes (cuando falla)
- No llega correo: MTA no instalado/configurado o bloqueo por firewall/ISP.
- Servicio mdadm no monitoriza: falta la unidad mdmonitor o no se ha activado la opción de monitorización.
- Correos filtrados como SPAM: añade una dirección fiable y valida registros SPF/DKIM si usas dominios propios.
Lista de comprobación para el equipo (roles)
Para el administrador de sistemas:
- Confirmar que mdadm está instalado y actualizado.
- Añadir MAILADDR en /etc/mdadm/mdadm.conf.
- Reiniciar el servicio adecuado (SysV o systemd).
- Verificar envío de correo con un MTA funcional.
Para el equipo de operaciones/monitorización:
- Integrar los avisos en el sistema de incidentes si procede.
- Documentar el procedimiento de reemplazo de discos y la política de notificación.
Resumen
Configurar mdadm para enviar alertas por correo es tan sencillo como añadir MAILADDR en /etc/mdadm/mdadm.conf y reiniciar el servicio, pero su efectividad depende de tener un MTA operativo y de comprobar que el monitor de mdadm esté activo. Realiza pruebas controladas, monitoriza /proc/mdstat y combina estas alertas con herramientas externas para una cobertura completa.
Notas importantes:
- Prueba en un sistema de laboratorio antes de realizar cambios en producción.
- No inventes direcciones en entornos productivos; usa cuentas comprobadas para recibir alertas.
Criterios de verificación
- Se recibe un correo cuando se marca manualmente una pieza como fallida.
- /proc/mdstat refleja el estado esperado tras las operaciones de prueba.
- Los logs del sistema muestran eventos de mdadm relacionados con el fallo o la recuperación.
Materiales similares

Error cliente de correo predeterminado en Outlook — Solución

AutoText en LibreOffice Writer: atajos y plantillas

Etiquetas de envío: imprimir con AirPrint

Mapas offline en Windows 10 — descargar y usar

Evitar el sobrecalentamiento del portátil
