Nagios Server Monitoring

Ein paar Debian Server sind schnell installiert und ehe man sich versieht betreibt man ein Netzwerk aus Servern mit mehreren Diensten und verliert den Überblick. Fällt irgendwo etwas aus, führt das nicht selten zu einer Kettenreaktion und bemerkt man den Fehler zu spät, gibt es viel Aufräumarbeit. Das professionelle Monitoring Tool Nagios schafft Abhilfe. Und ist denkbar einfach einzurichten.

Zuerst sollte man sich im Klaren sein darüber, dass Nagios am sinnvollsten auf einer Maschine installiert wird, die für sich steht und außer dem Monitoring keine großartigen weiteren Aufgaben übernehmen sollte. In größeren Netzwerken installiere ich Nagios i.d.R. auf dem Gateway, also der Maschine, die den internen Server den Online-Zugriff ermöglicht. Da der Server meistens nicht viel zu tun hat, aber mit allen internen Maschinen verbunden ist und gleichzeitig auch Online ist, d.h. auch Alert-Emails versenden kann, ist er prädestiniert für ein Monitoring Tool. Im Folgenden eine kurze Anleitung wie man den Monitoring-Server (monitor) einrichtet und anschließend einen internen Server (server1) mit Nagios überwacht.

Als erstes bereiten wir den Server vor, der überwacht werden soll, also server1.

apt-get install nagios-nrpe-server nagios-plugins

Danach in der Datei /etc/nagios/nrpe.cfg den Parameter allowed_host auf die IP von monitor stellen, also z.B. so:

allowed_hosts=10.10.18.11

und dann den Dienst neustarten

service nagios-nrpe-server restart

Das war's schon für server1...

Jetzt wechseln wir zum monitor und installieren dort die nötige Software:

apt-get install nagios3 nagios-plugins nagios-nrpe-plugin

Während der Installation kann ein Passwort für den Webzugriff vergeben werden. Danach ist der Webzugriff über die URL http://monitor/nagios3 erreichbar mit username "nagiosadmin" und dem selbst vergebenen Passwort.

Jetzt legen wir eine Konfigurationsdatei für server1 an.

nano /etc/nagios3/conf.d/server1_nagios2.cfg

In diese Datei kopieren wir dann folgenden Inhalt:

define host{
        use                     generic-host
        host_name               server1
        alias                   server1
        address                 10.11.12.13
}
define service{
        use                     generic-service
        host_name               server1
        service_description     Current Load
        check_command           check_nrpe_1arg!check_load
}
define service{
        use                     generic-service
        host_name               server1
        service_description     Current Users
        check_command           check_nrpe_1arg!check_users
}
define service{
        use                     generic-service
        host_name               server1
        service_description     Total Processes
        check_command           check_nrpe_1arg!check_total_procs
}

Auch hier jetzt Nagios neustarten und schon ist die Arbeit getan.

service nagios3 restart

Über das Webinterface ist der neue Service mit den 3 Diensten jetzt beobachtbar. Die nächsten Artikel behandeln das einrichten von E-Mail-Alerts sowie die Einrichtung weitere Service Checks und auch das Installieren von Plugins.