Nagios

Материал из Wiki
Перейти к: навигация, поиск

Nagios

Некоторые тонкости настройки

SNMP v3

Пример использования snmp v3

#
#./check_snmp -H <ip-address> -o sysUpTime.0 -L authNoPriv -U <username> -a MD5 -X <pass> -A <pass>  -P 3


define command{
        command_name    check_snmp_v3
        command_line    $USER1$/check_snmp -H $HOSTADDRESS$ -o sysUpTime.0 -L authNoPriv -U $ARG1$ a MD5 -X $ARG2$ -A $ARG2$  -P 3
        }



Мониторинг диапазонов значений

Для некоторых случаев нужно мониторить попадание значений в диапазон (а не просто больше или меньше чем порог) (например, для напряжения или частоты на входе УПСа)

Нашел в каком-то листе рассылки

max:min - non-ok within range min:max - ok within range.


Выдвать предупреждение если входное напряжение выходит за пределы 200-230 и критикал если выходит за пределы 180-240

# /usr/nagios/libexec/check_snmp -H ups0.mycompany.net -o  .1.3.6.1.4.1.318.1.1.1.3.2.1.0 -C public -P 2c -w 200:230 -c  180:240

Насколько я могу судить, запись min:max - выдать предупреждение если значение за пределами интервала max:min - выдать предупреждение если значение в пределах интервала.

Cинтаксис позволяет комбинировать интервалы через запятую: 10:20,30:40 но я не проверял работает ли. Cоответвенно описанеие сервиса выглядит например так

define service{
        use                                     generic-service
        host_name                               UPS0
        service_description                     IN_VOLTAGE
        is_volatile                             0
        check_period                            24x7
        max_check_attempts                      3
        normal_check_interval                   5
        retry_check_interval                    1
        contact_groups                          support
        notification_interval                   120
        notification_period                     24x7
        notification_options                    w,u,c,r
        check_command                           check_apc_in_voltage!my_community!180:240!170:250

При выходе за диапазон 180:240 - предупреждение, при выходе за 170:250 - критическое сообщение.


Нагиос

 net-analyzer/nagios-2.11

Мониторинг нагрузки на интерфейсы

Получить список - как-то так

/usr/lib64/nagios/plugins/check_snmp_netint.pl  -g  -2 -f -C public -H 172.31.0.254 -n "" -w10,10,0,0,0,0 -c100,100,0,0,0,0 -q -k -M -B -v

Пример конфига (для гигабитного интерфейса и для обычного):

# Net Check (iface overload etc)
define command{
        command_name    check_gig_iface_load
        command_line    $USER1$/check_snmp_netint.pl -r -t 10 -g -H $HOSTADDRESS$ -C $ARG1$ -2 -f  -n $ARG2$ -w$ARG3$ -c$ARG4$ -d $ARG5$ -q -k -M -B
}

define command{
        command_name    check_iface_load
        command_line    $USER1$/check_snmp_netint.pl -r -t 10  -H $HOSTADDRESS$ -C $ARG1$ -2 -f  -n $ARG2$ -w$ARG3$ -c$ARG4$ -d $ARG5$ -q -k -M -B
}

И сервис для проверки:

define service{
        use                                     generic-net-interface-overload
        host_name                               ES_4624-SFP__Core_
        service_description                     Port__01__Office_Switch_e1_28
        normal_check_interval                   5
        retry_check_interval                    5
        check_command                           check_gig_iface_load!public!"Ethernet1/1"!750,750,0,0,0,0!850,850,0,0,0,0!300
}


http://www.nagiosexchange.org/cgi-bin/page.cgi?g=1475.html;d=1