Page 1 of 1

Watchdog Funktion

Posted: Tue 26. Nov 2019, 16:37
by yockl
Hallo zusammen,

wäre es technisch möglich oder sinnvoll Watchdog mit in das Portal zu integrieren, welches die Services monitort und im Falle eines crash neu starten würde?

Vielen Dank vorab

Re: Watchdog Funktion

Posted: Tue 26. Nov 2019, 16:52
by Jolinar
yockl wrote: Tue 26. Nov 2019, 16:37 wäre es technisch möglich
Technisch möglich ist eigentlich fast alles. Kommt halt drauf an, welchen Aufwand man dafür betreiben will.

yockl wrote: Tue 26. Nov 2019, 16:37 oder sinnvoll
Da habe ich so meine Zweifel.
Wenn ein Dienst crasht, dann hat das auch einen Grund. Den Dienst dann einfach automatisiert neu zu starten, würde die Ursache für den Crash nicht beheben, kann aber im schlimmsten Fall zu Dateninkonsistenzen oder Datenverlust führen.
Davon mal abgesehen hat vermutlich der überwiegende Teil der Admins sowieso ein externes Monitoring etabliert, wodurch eine "Selbstüberwachung" des Systems überflüssig ist.
Ich bin sowieso kein Freund von Systemen, die sich selber überwachen sollen, denn so hat man immer ein SPOF-Konstrukt.

Aber das ist nur meine bescheidene persönliche Meinung.
Mal schauen, was die Community und/oder die Dev's dazu für eine Meinung haben. 8-)

Re: Watchdog Funktion

Posted: Wed 27. Nov 2019, 08:54
by yockl
Da gebe ich dir Recht. Auch wir nutzen ein externe Monitoring Tool. Aber leider schon selbst erlebt, dass man gerade unterwegs ist und nicht sofort reagieren kann. Ich kenne die Funktion noch von Plesk und fand die zum Teil schon sehr Sinnvoll. Vor allem konnte man dort selbst entscheiden welche Dienste überwacht und ggf. neu gestartet werden und welche nicht. Für mich war es z.B. sehr hilfreich bei einem XMR-Dienst, der sich hin und wieder mal aufgehängt hat und dadurch keine Echtzeit-Aktionen mehr ausgelöst wurden. Wir hatten zwar ein Fallback Szenario auf ‚Abholintervall von 1 Minute‘, aber das war natürlich kein Vergleich.

Re: Watchdog Funktion  [GELÖST]

Posted: Wed 27. Nov 2019, 09:10
by Jolinar
yockl wrote: Wed 27. Nov 2019, 08:54 Vor allem konnte man dort selbst entscheiden welche Dienste überwacht und ggf. neu gestartet werden und welche nicht.
Wenn es nur darum geht, unkritische Dienste (also welche, die z.B. nicht in Datenbanken schreiben o.ä.) zu überwachen und neu zu starten, wäre vielleicht die Installation von Monit eine Option.

Re: Watchdog Funktion

Posted: Wed 27. Nov 2019, 09:50
by mhagge
Ich hätte auch Monit vorgeschlagen - das setzte ich selbst als "First Responder" ein. Da kann man auch so Regeln wie "wenn Dienst xyz nicht erreichbar starte ihn neu, nach x Versuchen gebe auf und sende eine Alarmmail" definieren.

Als alleinige Überwachung sicherlich nicht sinnvoll (alleine schon weil halt auf dem gleichen Server ablaufend, das hilft also nichts wenn der Server ein grundsätzliches Problem hat), aber ein ganz nettes Hilfsmittel, welches viele Dinge von alleine beheben kann (ich würde sagen bei mir beheben sich so 95% aller Probleme von alleine - in den Logfiles nachschauen was denn genau war muss ich natürlich trotzdem, aber die Dienste laufen so ohne größere Unterbrechungen)

Zusätzlich dann noch ein externes Monitoring