Verfügbarkeit, Hochverfügbarkeit, Disaster Recovery und der Plan B

Bei Veeam sprechen wir nicht nur von „einfachem“ Backup sondern von „Availability for the Always-On Enterprise“. Warum ist es so wichtig, die richtigen Lösungen zu kombinieren und nicht nur auf ein Verfahren zu setzen um seine Dienste verfügbar zu halten?

Die Geschäftsabläufe in fast allen Unternehmen sind abhängig von der EDV. Kaum eines kann es sich erlauben, dass die Geschäftsprozesse, die immer weniger ohne die elektronischen Datenverarbeitung auskommen, nicht zur Verfügung stehen. Doch was bedeutet Verfügbarkeit oder Hochverfügbarkeit und wie kann diese erreicht werden?

Verfügbarkeit bezeichnet die Wahrscheinlichkeit eines Ausfalls einer technischen Komponente.

Bei einem 7×24 Stunden Betrieb bedeutet eine Verfügbarkeit von 99,9 % über das Jahr gerechnet einen Ausfall von 8 Stunden. Ob diese 8 Stunden am Stück oder verteilt anfallen ist an dieser Stelle nebensächlich. 99,99% Verfügbarkeit bedeutet einen maximalen statistischen Ausfall von 53 Minuten im Jahr.

Je nach Bedeutung der EDV kann dieser Ausfall unternehmenskritisch sein oder sogar bis hin zur Insolvenz des Unternehmens führen. Darüber hinaus bedeutet eine Erhöhung der Verfügbarkeit Investitionen in die entsprechende Infrastruktur. Hierbei sind alle relevanten Komponenten mit einzubeziehen, beispielsweise also auch Stromversorgungen, Klimatisierungstechnik, Speichersysteme und Netzwerk.

Die Berechnung der Verfügbarkeiten in komplexen Rechenzentren ist daher sehr aufwendig. Deshalb ist es gängige Praxis grundsätzlich so viele Systeme wie möglich redundant auszulegen und auf eine genaue Kalkulation zu verzichten. Die redundante Auslegung der wichtigsten Komponente „Speicher“ ist besonders aufwendig und teuer.

Eine mindestens genau so wichtige Kenngröße ist die Wiederanlaufzeit nach einem kritischen Ausfall. Dies wird im Allgemeinen als Disaster Recovery bezeichnet. Bei einem Disaster Recovery Konzept müssen zwei Kennzahlen betrachtet werden:

Recovery Time Objective (RTO)

Die Ausfallzeit bis zur vollständigen Wiederherstellung der Dienste und Aufnahme der Geschäftsprozesse.

Recovery Point Objective (RPO)

Wie viele Transaktionen/Daten maximal verloren gehen dürfen, also der Abstand zwischen den einzelnen Datensicherungen.

RPO and RTO

Da sich die Kennzahlen RPO und RTO direkt auf das Geschäftsmodell des jeweiligen Kunden beziehen, sind dies wichtige Indikatoren bei der Auslegung der EDV. Die ganzheitliche Betrachtung der Verfügbarkeit mit dem Fokus auf die Geschäftsprozesse wird auch als Business Continuity bezeichnet. Die Kennzahlen für RPO und RTO können auch zur Definition der Verfügbarkeit einzelner Dienste herangezogen werden, so wie es ein SLA (Service Level Agreement) verlang.

Wenn zum Beispiel ein Mail-Service ein RTO von einer Minute und ein RPO von null Minuten aufweisen soll, so kann man hier von einer hochverfügbaren Auslegung des Services sprechen. Ein RPO von 15 Min. und ein RTO von 15 Min. für einen virtualisierten Printserver kann als „verfügbarer“ Service bezeichnet werden.

Genau für solche Fälle kann “Instant VM Recovery” von Veeam genutzt werden. Wir können diesen Printserver direkt aus dem Veeam Backup Repository booten und so den Service innerhalb des definierten RTO wiederherstellen. Und noch dazu ohne nennenswerte Investitionen in die erforderliche Infrastruktur.

Einem Totalausfall des Rechenzentrums durch unvorhersehbare Katastrophen wie beispielsweise Feuer, Löschwasser, Hochwasser usw. sollte durch das Auslagern der Daten an einen zweiten Standort begegnet werden. Dies kann im einfachen Fall durch ein Auslagern in Form von Bandsicherung oder im kostenintensiven Fall durch einen synchronen/asynchronen Spiegel der Daten erreicht werden. In jedem Fall sollte man sich Gedanken über die mögliche Wiederherstellungszeit machen. Dazu müssen in einem sogenannten Notfallhandbuch alle möglichen Szenarien genau betrachtet und beschrieben werden. Das Vorgehen der Datenauslagerung wird auch durch die 3-2-1 Regel definiert: Drei Kopien der Daten, auf zwei unterschiedlichen Medientypen und ein Datensatz sollte ausgelagert werden.

Bei dem Design der Rechenzentrumsinfrastruktur wird oft nur die Hardware bei der Auslegung der Verfügbarkeit berücksichtigt. Es wird aber oft der „Plan B“ vernachlässigt, vergessen oder am falschen Ende gespart. Mit „Plan B“ meine ich ein auf die neue, moderne Rechenzentrumsinfrastruktur angepasstes innovatives Backup.

Zwei Beispiele zur Veranschaulichung:

Infrastruktur Beispiel: Mittelstand, ohne zweites Rechenzentrum

Im Mittelstand ist es oft so, dass nur ein Serverraum zur Verfügung steht. Ein zweiter Serverraum auf dem Gelände oder an einer zweiten Lokation ist oft zu aufwendig und zu kostspielig. Die Kernkomponenten der Infrastruktur (Server, Storage) werden alle 3 – 5 Jahre erneuert und der Virtualisierungsgrad beträgt oftmals über 80%. Die Datensicherung erfolgt noch mit applikationsspezifischen Agenten auf eine Tape Library. Der Fokus der Datensicherung bei der „gewachsenen“ Infrastruktur liegt leider oftmals nur auf der Tape-Auslagerung und nicht auf der schnellen Widerherstellung der Daten. Und das, obwohl die Verfügbarkeit der Dienste im Mittelstand durch die „Globalisierung“ und das „Time to Market“ immer wichtiger wird. Es gibt hier meistens keinen optimalen „Plan B“… dabei muss der gar nicht kompliziert sein!

Veeam bietet hier unter dem Begriff „High-Speed Recovery“ eine Vielzahl innovativer Funktionen . Hinsichtlich der Vermeidung von Datenverlust hat Veeam unter anderem eine sehr komfortable Funktion der Datenauslagerung : „Veeam Cloud Connect“.

Veeam Cloud Connect

Da ist es wieder, das Unwort „Cloud“. Bei Veeam Cloud Connect handelt es sich um ein ausgelagertes Veeam Backup Repository (Backup Speicher) bei einem Partner in Ihrer Nähe. Dadurch entfällt die lästige Tape Organisation und das aufwendige Auslagern der Bänder. Die Backupdaten werden zum einen auf dem Transport über das WAN und zum anderen in der Ablage mit jeweils 256 Bit verschlüsselt. Dies ist eine einfache Lösung für Kunden, die kein zweites Rechenzentrum haben um ihre Daten auszulagern . Veeam Cloud Connect ist in allen Editionen von Veeam Backup und Replication enthalten.

Veeam Cloud Connect

Ja, wir können die virtuellen Maschinen nicht nur sichern, sondern auch in eine zweite virtuelle Infrastruktur replizieren. In der v9 von Veeam Backup und Replication erweitern wir unser „Veeam Cloud Connect“ um die Möglichkeit der „Veeam Cloud Connect Replica“

Veeam Cloud Connect Replica NEU in v9

Veeam Cloud Connect Replica ist eine DraaS-Lösung (Disaster Recovery as a Service) für Kunden, die keinen zweiten Rechenzentrumsstandort haben, aber dennoch einen schnellen Wiederanlauf ihrer Dienste sicherstellen müssen. Bei Veeam Cloud Connect Replica werden die virtuellen Maschinen (Microsoft Hyper-V oder VMware v-Shpere) auf eine virtuelle Infrastruktur bei einem Partner (Serviceprovider) in ihrer Nähe repliziert. Kommt es zu einem Problem im Rechenzentrum, können sie einzelne VMs oder die gesamte Infrastruktur beim Servicepartner starten.

Veeam Cloud Connect Replica NEU in v9

Starten sie einzelne VMs in der separierten Infrastruktur bei ihrem Serviceprovider, dann bauen wir automatisch einen Netzwerktunnel zwischen beiden Infrastrukturen auf. Die VMs verhalten sich so, als würden diese im Rechenzentrum des Kunden laufen.

Veeam Cloud Connect Replica NEU in v9

Infrastruktur Beispiel: Großunternehmen.

Große Unternehmen haben meistens mehrere Standorte und hunderte von virtuellen Maschinen. Hier werden alle Komponenten im Rechenzentrum redundant ausgelegt. Beim Storage ist es sehr oft so, dass ein synchroner Storage-Spiegel mit einem transparenten Failover eingesetzt wird. Dabei wird der Ausfall eines oder mehrerer Storage-Controller durch eine Virtualisierungsschicht oder die Übernahme der Identität (WWPN) von einem verfügbaren Controller kompensiert. Durch die doppelte Menge der benötigten schnellen Festplatten und dem komplexen Aufbau des Storage Netzwerks (SAN) wird die Lösung sehr aufwendig und teuer. Und oftmals spart man dann bei der Datensicherungslösung, um die Hardware Investitionen zu kompensieren: „Es kann ja nichts passieren, es ist doch alles redundant“. Wenn die Daten aber synchron „kaputt“ geschrieben werden, z. B. durch einen Virus oder eine fehlerhaften Firmware, hat diese Einstellung oftmals fatale Folgen. Oder es wurde in der Vergangenheit eine teure Enterprise Backup Lösung des Hardware-Lieferanten angeschafft, die für die mittlerweile virtualisierten Server ungeeignet ist. Und obwohl man ja eigentlich eine hohe Verfügbarkeit benötigt, wird hier dennoch der „Plan B“ oft vernachlässigt. Es entsteht so schnell ein Ungleichgewicht zwischen der statistischen Verfügbarkeit der teuren Hardwareinfrastruktur und den Möglichkeiten für ein effektives Disaster Recovery Konzept. Deshalb ist es wichtig nicht nur die Hardware-Verfügbarkeit zu betrachten. Veeam bietet hier mit RTPO (Recovery Time and Point Objectives) von 15 Minuten eine Vielzahl von Wiederherstellungsmöglichkeiten .

Stay up to date on the latest tips and news
Durch das Abonnieren unserer Blog-Updates erklären Sie sich mit der Verwaltung Ihrer Daten gemäß der Datenschutzrichtlinie von Veeam einverstanden.
You're all set!
Watch your inbox for our weekly blog updates.
OK