Im Tagesgeschäft vieler Unternehmen ist schon ein kurzer Ausfall der zentralen Rechnerstrukturen kritisch. In Sekundenschnelle können viel Geld und Reputation vernichtet werden. Ein Knick im Datenfluss wäre da ein zu hohes Risiko. Ein Risiko, das man beherrschen kann. Bis zu welchem Grad, entscheidet der Anwender im Prinzip selbst. Eins ist aber gewiss: Mehr Sicherheit gibt es nicht geschenkt. Deswegen sollte man sorgsam prüfen, welchen Worst Case man sich noch leisten will.
Früher war alles einfacher
Früher war alles einfacher. Wenn man einen Mail-Server brauchte, ging man eben los und kaufte einen Mail-Server. Man wusste, wie viel Stauraum er benötigt und man hat seine Mitarbeiter informiert, falls die Blechbox mal für ein paar Stunden außer Betrieb lag.
Heute sind Server nicht mehr nur Server. In den Rechenzentren eines Unternehmens fließt das Blut, das die Firma am Leben erhält. Geldflüsse, Gespräche, Aufträge, Auftragsänderungen, Konstruktionsdaten, Firmeninterna, Arbeitsverträge und Zeiterfassung – gibt es einen Bereich, der nicht über die IT gespeist und im Rechenzentrum archiviert oder gesichert wird?
„Der Bau eines Rechenzentrums ist längst keine reine IT-Aufgabe mehr“, stellt Ralf Schaufler, Vorstand bei der LEITWERK AG, klar. Wer heute ein Rechenzentrum plant, der muss das Facility-Management mit einbeziehen, braucht Experten für Brandschutz, Wasser, Lüftung und auch eine zuverlässige Rechtsberatung. Denn an ein Rechenzentrum sind viele bindende Vorgaben geknüpft, etwa zu den Themen Datenschutz oder Informationssicherheit. Mit Hochverfügbarkeit hat das noch nichts zu tun. „Das ist der Mindeststandard”, mahnt Schaufler.
Hochverfügbarkeit
Hochverfügbarkeit bedeutet, dass man die Toleranz für mögliche Ausfallzeiten immer weiter nach unten schraubt. Der häufigste Fehler, der heute auch von Fachplanern gemacht wird, ist, den Flaschenhals aus dem Gebäude an eine andere Stelle zu verlagern. Ausfallsicherheit erreicht man durch Redundanzen, nicht dadurch, dass man den Single Point of Failure außerhalb des Rechenzentrums ansiedelt. Eine zweite, autarke Stromversorgung und eigenständige Kreisläufe für Wasser und Kaltluft gehören ebenso dazu. „Das nützt aber alles nichts, wenn am Ende alles am selben Trafo hängt”, sagt Schaufler.
Je komplexer das System, desto größer ist der Anspruch an die Technik. Und die muss dann einerseits an Kleinigkeiten wie doppelte Netzteile denken, aber auch an das große Ganze, das redundant aufgebaut sein muss.
Redundanz zu Ende denken
Redundanzen müssen daher konsequent bis zum Ende gedacht werden. „Bei vielen Planern aber hört der Horizont an der Tür zum Serverraum auf”, kritisiert Schaufler. Richtet man eine
unterbrechungsfreie Stromversorgung (USV) ein, so muss diese auch einen anderen Weg gehen als den konventionellen.
Wer seine mögliche Downtime aus den verschiedensten Gründen halbieren will oder muss, vervielfacht seine Kosten dafür. Deshalb ist es ratsam, einzelne Komponenten des Rechenzentrums nach deren Anspruch an die Zuverlässigkeit zu gliedern. Nur weil man in einem Bereich größtmögliche Sicherheit haben muss, gilt das nicht unbedingt fürs ganze System. Auch das wird in Planungen gerne mal übersehen.
Weniger ist mehr
Kurioserweise passieren in der Planung nicht nur Fehler, weil Sicherheitslücken übersehen werden, sondern auch, weil zu großzügig geplant wird. Ein Klassiker ist die Leistung der Klimaanlage. Diese wird oft zu hoch kalkuliert. Nun haben Klimaanlagen zwar einen Toleranzbereich, in dem sie verlässlich arbeiten. Schaufler hat es aber oft erlebt, dass bei diesem Aspekt grundlegend falsch gerechnet wurde. Das liege daran, so der Experte, dass der Fortschritt nicht einbezogen werde. Server sind heute viel leistungsfähiger als noch vor wenigen Jahren. So schaffen sie etwa das Zehnfache an Kapazität bei nahezu unveränderter Abwärme. Wer da noch die Formel von damals ansetzt, rechnet sich in die Antarktis.
Vier Stufen Sicherheit
Tier 1
Quasi die Economy-Class der Hochsicherheit mit einer theoretisch möglichen Ausfallzeit von knapp 30 Stunden im Jahr. Die Serverstruktur ist fehlertolerant ausgelegt, die Energie- und Klimaversorgung sind es jedoch nicht.
Tier 2
Hier werden Energie- und Klimaversorgung redundant ausgelegt. Man ist also darauf vorbereitet, wenn der Bagger ein Stromkabel durchtrennt oder die Klimaanlage kollabiert. Dennoch sind pro Jahr noch etwa 22 Stunden Ausfallzeit möglich, das entspricht einer Verfügbarkeit von 99,75 Prozent. Wartung im Betrieb nicht möglich.
Tier 3
In diesen Rechenzentren ist jede Komponente redundant ausgelegt. Das System ist fehlertolerant und kann im laufenden Betrieb gewartet werden. Mehrere Brandabschnitte erhöhen die Ausfallsicherheit. So sind gerade einmal 100 Minuten Ausfallzeit möglich.
Tier 4
In der Königsklasse werden die hohen Ansprüche aus Tier 3 noch auf die Spitze getrieben. Die maximale Ausfallzeit halbiert sich so gerade einmal auf 45 Minuten im Jahr. Single Points of Failure sind quasi ausgeschlossen. Die Verfügbarkeit beträgt 99,991 Prozent.