1.Настройка Zabbix-агента
1 |
# cat /proc/mdstat |
1 2 3 4 5 6 7 8 9 10 11 12 |
Personalities : [raid1] md3 : active raid1 sda4[0] sdb4[1] 1839089920 blocks super 1.2 [2/2] [UU] md2 : active raid1 sda3[0] sdb3[1] 1073610560 blocks super 1.2 [2/2] [UU] md1 : active raid1 sda2[0] sdb2[1] 523968 blocks super 1.2 [2/2] [UU] md0 : active raid1 sda1[0] sdb1[1] 16768896 blocks super 1.2 [2/2] [UU] |
1 |
# egrep -c "\[.*_.*\]" /proc/mdstat |
1 |
Если символа _ нет, то на выходе получаем значение 0. Если же это значение больше 0, то рейд считается поврежденным, zabbix отправляет уведомление. Отправлять полученные значения на сервер мониторинга будем с помощью UserParameter.
1 |
# nano /etc/zabbix/zabbix_agentd.d/userparameter_mdadm.conf |
1 2 |
### Software RAID Monitoring UserParameter=mdadm.status,egrep -c "\[.*_.*\]" /proc/mdstat |
1 |
# service zabbix-agent restart |
Проверка работу этого параметра локально с Zabbix-агента
1 |
# zabbix_agentd -t mdadm.status |
1 |
mdadm.status [t|0] |
Или удаленно с Zabbix-сервера
1 |
# zabbix_get -s myservername -k 'mdadm.status' |
1 |
2.Настройка Zabbix-сервера
Создание шаблона с одним событием(item) и одним тригерром(trigger)
Создание события
Создание триггера
В событии стоит интервал проверки/обновления 60 секунд
После отладки/проверки корректности работы увеличить интервал проверки, например, до 3600 секунд.
Добавляем шаблон к хосту
Проверяем, что через 1-2 минуты на хосте появились Item с именем Mdadm
Monitoring->Latest Data->фильтруем по требуемому хосту в поле Hosts->Mdadm
Источник:
http://serveradmin.ru/monitoring-programmnogo-reyda-mdadm-v-zabbix/