G'schichten ausm Serverraum - Episode 1
von BitPoint AG (Kommentare: 0)
Notstromaggregate im Streik
Heute möchten wir ihnen einem Einblick hinter die Kulissen im Alltag eines Cloud-Providers geben und sie mit einer kleinen Anekdote aus unserem alten Rechenzentrum zum Schmunzeln bringen.
Vor einigen Jahren waren wir im Rahmen einer Colocation bei einem der global führenden Rechenzentrumsbetreibern selbst Kunde am Standort in München. Wie bei jedem Anbieter kommen im Alltag kleine und größere Störungen vor, Sicherheitsmechanismen verhindern in der Regel längere Ausfälle zuverlässig.
Bei einem Stromausfall z.B. springen die Notstromaggregate automatisch an und stellen die Versorgung des Rechenzentrums sicher, bis der Normalbetrieb wiederhergestellt ist. Ein Stromausfall ist also keine große Sache. Doch aus irgendeinem mysteriösen Grund versagten sie diesmal ihren Dienst. Das war der Beginn einer wahrhaftig haarsträubenden und zugleich humorvollen Odyssee.
Mitarbeiter des Betreibers, ausgestattet mit dem unbändigen Willen, das Problem zu lösen, machten sich auf den Weg zum Bedienpanel, um die Notstromaggregate manuell zu starten. Doch da war ein kleines Problem - der Schlüssel für das Bedienpanel war nirgendwo zu finden.
Kein Grund zur Panik, dachten wir. Schließlich werden Schlüssel akribisch dokumentiert und für die Verantwortlichen gut zugänglich aufbewahrt. Es gibt ja auch so etwas wie eine ISO-Zertifizierung. Nach zahlreichen Telefonaten zwischen den Verantwortlichen in Frankfurt und München und hektischen Sucheinlagen im gesamten Rechenzentrum wurde klar, dass sich der Schlüssel – warum auch immer – gar nicht in München befindet. Dieser war sicher verwahrt in der Zentrale in Frankfurt. Nicht gerade um die Ecke, oder?
Ein Mitarbeiter des Rechenzentrumbetreibers setze sich spontan in sein Auto und machte sich auf den Weg, ohne zu ahnen, dass diese kleine Reise zu einer epischen Mission werden würde. Kilometer um Kilometer hetzte er über die Autobahn und nichts konnte ihn von seinem Ziel abhalten - den heißbegehrten Schlüssel für das Bedienpanel zu holen und zurück nach München zu bringen.
Währenddessen mussten Kunden einen stundenlangen Ausfall hinnehmen, sofern sie ihre Infrastruktur nur in einem Rechenzentrum betrieben haben.
Letztendlich gelang es dem ambitionierten Mitarbeiter des Rechenzentrums, den begehrten Schlüssel in den Händen zu halten und zurück nach München zu bringen. Zu spät allerdings, denn der Stromversorger konnte die Störung in der Zwischenzeit beseitigen und das Rechenzentrum seinen Regelbetrieb wieder aufnehmen.
Warum sich übrigens kein Mitarbeiter aus Frankfurt mit dem Schlüssel nach München auf den Weg gemacht hat um zumindest nur eine einfache Strecke mit dem Auto zurück zu legen, oder gar geflogen ist, konnte uns bis heute niemand beantworten.
Wir hoffen, dass wir Sie mit dieser Geschichte ein wenig amüsieren konnten. Manchmal können die skurrilsten Zwischenfälle zu den besten Geschichten führen, oder?
Als moderner Cloud-Provider arbeiten wir hart daran, die besten Dienstleistungen und hochverfügbare Lösungen zu bieten. Doch manchmal lassen sich auch die besten Vorsichtsmaßnahmen von kleinen Streichen überraschen.
Wir danken unseren damals betroffenen Kunden für Ihre Geduld und Ihr Verständnis während des Ausfalls. Unser Team hat die erforderlichen Maßnahmen ergriffen, um sicherzustellen, dass ein derartiges Ereignis nicht wiederholen kann.
So arbeiten wir heute mit georedundanten Rechenzentren mit isoliertem Management-Cluster und bieten für unsere Kunden auf Wunsch eine Spiegelung ihrer Cloud in verschiede Rechenzentren in Echtzeit an.