• Willkommen im Linux Club - dem deutschsprachigen Supportforum für GNU/Linux. Registriere dich kostenlos, um alle Inhalte zu sehen und Fragen zu stellen.

uptime / Nagios: check_load

MOC

Newbie
Hallo zusammen,

habe folgendes Problem, ich nutze Nagios um sämtliche Server im Netzwerk zu überwachen. Nun habe ich die option check_load wo ich die Werte für die die CPU Last eingeben kann.
Laut Doku nutzt dieser check die daten wie wenn man "uptime" nutzt.

Ich verstehe nur den Zusammenhang der angaben dort nicht, man usw hatte ich schon durch, aber wenn ich z.B. sage ich will umgerechnet bei 50% CPU last ein warnung und bei 80% ein critical, wie mus ich diese range setzen?

uptime:
Durchschnittslast: 0,17, 0,16, 0,28
Also im Prinzip diese 3 Werte verstehen wie sie zusammengerechnet werden damit ich es schaffe eine limit dafür zu geben.

Danke euch und Gruß
MOC
 

regexer

Advanced Hacker
Ich verstehe nur den Zusammenhang der angaben dort nicht, man usw hatte ich schon durch, aber wenn ich z.B. sage ich will umgerechnet bei 50% CPU last ein warnung und bei 80% ein critical, wie mus ich diese range setzen?
Ich kenne dieses Nagios nicht. Ich gebe jedoch zu bedenken: Es ist aus meiner Sicht völlig uninteressant, ob die CPU mal zu 50% oder auch 80% ausgelastet ist. Selbst du 100% ist noch kein Beinbruch, solange das nur ein kurzer Peak ist. Viel interessanter ist doch, wie viele Prozesse aufgrund einer allgemein hohen Auslastung warten mussten. Und das ist exakt das, was diese drei von dir genannten Zahlen (=load average) aussagen. Wir hatten darüber schon mal eine Diskussion...

siehe http://www.linux-club.de/viewtopic.php?t=25495
 

TeXpert

Guru
was verstehst Du unter 80% Last?

der Load alleine ist relativ nichtssagend, er sagt aus wieviele aktive Prozesse gleichzeitig existieren. und das Zusammenspiel hängt stark von den verschiedenen Komponenten und der I/O-Architektur ab.

so ist das Arbeiten auf einer Single-CPU Maschine mit einfachem IDE-Bus ab 2.5 bis 3 nicht mehr schön, aber ersetze die IO durch ein gutes SCSI-Raid 5 und idr kannst Du noch mit einem Load von 5-8 gut arbeiten. Dicke Maschinen verkraften noch mehr, so ab ich letztens auf einer dicken Sun E-irgendwas rumgebastelt, ein Load von >80 merkt man nicht sonderlich...
 
OP
M

MOC

Newbie
Perfekt danke euch, jetzt sagt mir das was :)
Dann ist es für mich sinnvoller den "uptime" wert zu nehmen da ich das von einem durchschnittbrauche, wenn ich ein backup ziehe haber ich sofort 100% auslastung und die roten lampen fangen an.....

Grüße
MOC
 

TeXpert

Guru
MOC schrieb:
Perfekt danke euch, jetzt sagt mir das was :)
Dann ist es für mich sinnvoller den "uptime" wert zu nehmen da ich das von einem durchschnittbrauche, wenn ich ein backup ziehe haber ich sofort 100% auslastung und die roten lampen fangen an.....


Ah, ja. Ich versteh z.Zt. noch weniger als bei Deinem 1. Post ;)
 
OP
M

MOC

Newbie
Sorry, ich meinte das es für mich nützlicher ist dann die durchschnittszeit zu nehmen als die reine cpu last, da wenn ich z.b. ein backup auf einem server ziehe sofort 100%auslastung herrscht und nagios dann eben gleich auf critical springt.

Gruß
MOC
 

TeXpert

Guru
der Load (bei top und Co) sagt nichts über die CPU last aus... es können trivialprozesse sein (ein cp strengt die CPU nicht an) allerdings kopiere mal parallel 100 Dateien und Deine Load steigt, da alles auf das IO-System wartet.

Du musst Absolute Werte festlegen, bei denen Dein System nicht mehr reaktiv ist, und erst oberhalb davon warnst Du. Diese Werte sind auch kaum auf andere Maschinen zu übertragen
 
OP
M

MOC

Newbie
Ja dann wirds schwer diese werte zu ermitteln damit ich die richtigen grenzwerte habe würde ich sagen, oder gibts da richlinien bei normalen pc's? servern ? usw?
 

TeXpert

Guru
nein, d.h. Du musst die Werte beobachten und für Deine Maschine Grenzwerte festlegen. OK, eine single-CPU Maschine nur mit IDE sollte IMHO nicht langfristig mit einem Load > 2-4 gefahren werden... das schaukelt sich sonst schnell hoch aber sonst... auf meinem Dual P3 mit SCSI-Raid5 IO bin ich auch mit einer Load von 10 noch glücklich...
 
Oben