Leider ein illustratives Beispiel von Murphy. Je länger je mehr der Komponenten beoi uns sind redundant ausgelegt (inkl. Dual-Homing des Internet-Anschlusses und Klima). Selbst unsere GUTOR hat nicht nur 10Ah Reserve, ist aber nach Angabe im Prospekt auch erdbebengeprüft (1E) etc….
…gestern Abend um 19:01 Uhr war es aber plötzlich dunkel im Serverraum. Ganz dunkel und namics in St.Gallen war gestern ein paar Stunden offline. GUTOR hatte seinen Geist aufgegeben. Oder in anderen Worten waren wir dank unserem USV-Doppelumwandlungs-System PDW (unterbruchsfreien Stromversorgung) die in einem eigenen Brandabschnitt vor sich hin schnurrt und dabei dauernd «Strom streichelt», häufiger ohne Strom als wenn wir das teure Gerät nicht hätten. Schade eigentlich.
Ein Teil des Piketts war noch im Haus und somit war nicht EM im 4. Stock angesagt, aber Wiederanlauf aller namics Server und Systemkomponenten (hundert reicht nicht). Doch nach der Überbrückung war der Anlaufstrom zu hoch und die Sicherungen hatten ihren Teil zu vermelden. Da alle Systeme absichtlich an zwei Phasen hängen, war das dann eine ziemliche Sisyphusarbeit (die am Ende dann aber zum Erfolg führte). Damit es aber nicht so einfach ist, vermeldete der zentrale Router (mit GB-Glas drin), dass er nun auch auf «kaputt macht» und zudem noch ein paar Anwendungen die nicht einfach so los rennen… 23.11 Uhr wieder online und 1.15 Uhr das letzte System «up and running».
Viiiiielen dank an Thomas und Adi. So eindrücklich sieht übrigens unser kranker Kandidat im Prospekt aus. Bei uns hat er aber kläglich versagt…
GUTOR we had a problem
G