Come configurare RAID software per inviare email quando c'è un problema
Versione e autore
Versione 1.0
Autore: Falko Timme (guida originale)
Introduzione
Questa guida spiega come configurare il monitoraggio di RAID software (mdadm) in modo da ricevere email quando qualcosa non va — ad esempio quando un disco si guasta o un array diventa degradato. Le istruzioni sono state testate su Debian Etch, ma si applicano con piccole differenze a molte distribuzioni Linux (percorsi dei file e nomi dei servizi possono variare).
Nota importante: non si offre alcuna garanzia che la procedura funzioni in tutti gli ambienti. Usa questa guida come base e adattala al tuo sistema.
Requisiti minimi
- mdadm installato e configurato per i tuoi array RAID.
- Un sistema in grado di inviare email (sendmail, postfix, ssmtp o simili) o un relay SMTP configurato sul server.
- Accesso root o privilegi sudo.
Passo per passo
- Apri il file di configurazione di mdadm. Su Debian il percorso è /etc/mdadm/mdadm.conf:
vi /etc/mdadm/mdadm.conf
- Aggiungi una linea MAILADDR con l’indirizzo email a cui vuoi ricevere le notifiche. Esempio (modifica con il tuo indirizzo):
| DEVICES /dev/sda* /dev/sdb* ARRAY /dev/md0 level=raid1 num-devices=2 UUID=c8a78e3a:e335c0f0:997be224:f02c088a ARRAY /dev/md1 level=raid1 num-devices=2 UUID=fd9f3b6b:4fc9cf4f:09db592d:480d34fe MAILADDR [email protected]
|
- Riavvia mdadm per applicare la nuova configurazione. Su sistemi con init tradizionale:
/etc/init.d/mdadm restart
Su sistemi moderni con systemd il nome del servizio può variare (mdadm, mdmonitor, mdadm@, ecc.). Usa systemctl e controlla lo stato del servizio nella tua distribuzione, per esempio:
systemctl restart mdadm
systemctl status mdadm
(Se il servizio si chiama diversamente, sostituisci mdadm con il nome corretto del servizio.)
Cosa succede dopo
Dopo la configurazione, mdadm invierà automaticamente email generiche quando rileva eventi come DegradedArray, FailSpare o altri problemi. Esempio di email che potresti ricevere (messaggi reali generati da mdadm):
From: mdadm monitoring < [email protected] >
To: [email protected]
Subject: DegradedArray event on /dev/md1:server1.example.com
This is an automatically generated mail message from mdadm
running on server1.example.com
A DegradedArray event had been detected on md device /dev/md1.
Faithfully yours, etc.
P.S. The /proc/mdstat file currently contains the following:
Personalities : [raid0] [raid1]
md1 : active raid1 sda2[2] sdb2[1]
487853760 blocks [2/1] [_U]
[>………………..] recovery = 4.3% (21448384/487853760) finish=114.3min speed=67983K/sec
md0 : active raid1 sda1[0] sdb1[1]
530048 blocks [2/2] [UU]
unused devices:
oppure:
From: mdadm monitoring < [email protected] >
To: [email protected]
Subject: FailSpare event on /dev/md1:server1.example.com
This is an automatically generated mail message from mdadm
running on server1.example.com
A FailSpare event had been detected on md device /dev/md1.
It could be related to component device /dev/sda2.
Faithfully yours, etc.
P.S. The /proc/mdstat file currently contains the following:
Personalities : [raid0] [raid1]
md1 : active raid1 sda22 sdb2[1]
487853760 blocks [2/1] [_U]
[===================>.] recovery = 99.9% (487851840/487853760) finish=0.0min speed=61037K/sec
md0 : active raid1 sda1[0] sdb1[1]
530048 blocks [2/2] [UU]
unused devices:
Questi esempi mostrano il formato tipico delle notifiche: l’oggetto indica l’evento, il corpo contiene una breve spiegazione e l’output corrente di /proc/mdstat, utile per diagnostica rapida.
Verifiche rapide dopo l’alert
- Controlla /proc/mdstat:
cat /proc/mdstat
- Controlla lo stato dell’array:
mdadm --detail /dev/md1
- Controlla i log di sistema (journalctl o /var/log/syslog) per messaggi mdadm/mdmonitor.
Playbook di risposta rapido (operatore)
- Leggi l’email e identifica il device coinvolto (es. /dev/md1, /dev/sda2).
- Controlla /proc/mdstat e mdadm –detail.
- Se un disco è marcato come failed (F) o removed, identifica il device fisico (smartctl -a /dev/sda).
- Se necessario, spegni o isolare il disco difettoso (consulta procedure del tuo server/rack).
- Sostituisci il disco e aggiungilo all’array con mdadm –add.
- Verifica la ricostruzione tramite /proc/mdstat fino al completamento.
Criteri di successo: l’array ritorna allo stato [UU] (per RAID1 a 2 dispositivi) e non ci sono errori SMART ricorrenti.
Alternative e miglioramenti
- Monitoraggio avanzato: integra mdadm con Nagios/Zabbix/Prometheus per alert centralizzati e escalation automatica.
- Script personalizzati: usa mdadm –monitor con opzioni aggiuntive (-f per logfile, -1 per debug) oppure esegui uno script via –program.
- SMTP autenticato: se il server non invia mail, configura postfix/ssmtp/ssmtp-mock o usa un relay SMTP esterno con autenticazione.
Esempi di comandi utili (fact box)
- Verificare array: mdadm –detail /dev/md1
- Stato rapido: cat /proc/mdstat
- Listare dispositivi riconosciuti: mdadm –examine –scan
Diagramma decisionale rapido
flowchart TD
A[Ricevuta email di alert] --> B{Tipo di evento}
B -->|DegradedArray| C[Verifica /proc/mdstat]
B -->|FailSpare| C
B -->|Altri| D[Controlla log di sistema]
C --> E{Disco failed?}
E -->|Sì| F[Isola e sostituisci il disco]
E -->|No| G[Controlla ricostruzione in corso]
F --> H[Aggiungi nuovo disco: mdadm --add]
G --> I[Attendi completamento e verifica]
H --> I
I --> J[Array sano: invia report e chiudi ticket]
Glossario (1 riga per termine)
- mdadm: utility Linux per creare, gestire e monitorare array RAID software.
- /proc/mdstat: file che mostra lo stato corrente degli array md (ricostruzione, sincronizzazione, ecc.).
Note finali e suggerimenti operativi
- Testa la ricezione delle email manualmente prima di affidarti completamente agli alert (invia una mail di prova dal server).
- Integra la procedura in un runbook aziendale con ruoli, escalation e contatti di reperibilità.
- Conserva backup aggiornati: il monitoraggio aiuta a reagire, ma non sostituisce il backup.
Riepilogo: aggiungi MAILADDR a /etc/mdadm/mdadm.conf, riavvia mdadm, verifica /proc/mdstat in caso di alert e segui il playbook per sostituire dischi e ricostruire l’array. Con un sistema di invio email funzionante, riceverai notifiche automatiche quando mdadm rileva problemi.
Materiali simili
Installare Linux Software RAID

Errore 'no default mail client' in Outlook: guida

AutoText in LibreOffice Writer — Guida rapida

Etichette di spedizione: guida e stampa con AirPrint

Mappe offline in Windows 10: guida rapida
