Disaster-Recovery-Strategie: Fünf Handlungsanweisungen
Der 28. Januar war der Europäische Datenschutztag. Er ruft Unternehmen ins Gedächtnis, dass sie von Regulierungsbehörden und Kunden beim Thema Datenschutz immer mehr in die Pflicht genommen werden. Firmen sollten den Schutz und die Wiederherstellung von Daten überall in der Organisation automatisieren und zugleich die 24/7-Verfügbarkeit von geschäftskritischen Anwendungen gewährleisten. Der folgende Beitrag gibt fünf Handlungsanweisungen für eine erfolgreiche Disaster-Recovery-Strategie.
Laut Verizon Data Breach Investigations Report 2019 machen Ransomware-Angriffe 24 Prozent der analysierten Malware-Vorfälle aus. Auch in der Schweiz nimmt die Anzahl der Angriffe weiter zu: Erst im Juli hat das Ransomware-Trio Emotet, Trickbot und Ryuk die IT-Systeme der Offix-Gruppe lahmgelegt. Für Unternehmensentscheider wird es daher immer wichtiger, Geschäftskontinuität und Datenschutz ganz oben auf die Agenda zu setzen, um auch im Katastrophenfall weiterhin arbeitsfähig zu sein. Eine Disaster-Recovery-Strategie ist vor diesem Hintergrund dringend erforderlich. Wir zeigen, in welchen fünf Schritten sich Unternehmen auf ein Katastrophenszenario vorbereiten können.
-
RTOs und RPOs festsetzen
Nicht alle Geschäftsanwendungen sind für Unternehmen gleich relevant. Die Anforderungen an die Wiederherstellungszeiten fallen daher individuell aus. Die IT-Entscheider sollten im Vorfeld bewerten, welche Anwendungen unternehmenskritisch sind: Kann ein Unternehmen ohne einen bestimmten Dienst nicht funktionieren, darf er nicht länger als 15 Minuten ausfallen. Die Recovery Time Objective (RTO) definiert den Zeitraum, der maximal vergehen sollte, bis alle Elemente einer Anwendung wieder betriebsbereit sind. Das Recovery Point Objective (RPO) dagegen gibt an, wie hoch der Datenverlust höchstens sein darf, um die Business Continuity aufrechtzuerhalten. Jede Wiederherstellungsstrategie muss sich an den festgelegten RTOs und RPOs orientieren.
-
Prozesse automatisieren
Automatisierung ist das A und O einer erfolgreichen Disaster-Recovery-Strategie. Wiederherstellungsprozesse, die händisch ausführt werden, bergen ein signifikantes Fehlerrisiko. Unternehmen sollten daher beispielsweise automatisch ablaufende Failover- und Failback-Prozesse etablieren. Ein automatisiertes Failover ist für die Business Continuity besonders wichtig. Sollte eine missionskritische Anwendung ausfallen, sorgt es im besten Fall dafür, dass der Nutzer den Systemausfall gar nicht bemerkt. Dafür initiiert das Failover das Umschalten auf ein anderes System, das für das ausgefallene einspringt. Ist das Ursprungssystem wiederhergestellt, geht es beim Failback darum, den Service in die Ausgangssituation zurückzuschalten. Das primäre System wird um die Workloads aktualisiert, die in der Zwischenzeit im sekundären System produziert wurden.
-
Ausfallszenarien individuell bewerten
Unternehmen müssen je nach Situation flexibel entscheiden, welche Anwendungen und Systeme wiederhergestellt werden sollen. Das kann virtuelle Maschinen, eine grosse Anzahl komplexer Anwendungen oder ein gesamtes Rechenzentrum betreffen. Die Wiederherstellungsstrategie des Unternehmens muss so anpassungsfähig sein, dass unterschiedliche Szenarien reibungslos abgewickelt werden können und der Arbeitsbetrieb schnell wieder aufgenommen werden kann. Dabei hilft ein detaillierter und umfassender Notfallplan.
-
Einheitliche Policies für Multi-Cloud-Umgebungen schaffen
Sind mehrere verschiedene Cloudumgebungen von einem Ausfall betroffen, kann die Komplexität der Wiederherstellungsprozesse steigen – beispielsweise, weil mehrere Mitarbeiter eingebunden werden müssen, die sich mit den einzelnen Clouds auskennen. Die Folge sind höhere Betriebskosten und längere Downzeiten. Ausserdem steigt die Wahrscheinlichkeit von Datenverlusten. Multi-Cloud-Umgebungen sollten daher zentral gesteuert werden. Dabei helfen Snapshot-basierte Cloud-Backup-Lösungen, die speziell für dynamische Multi-Cloud-Workloads entwickelt wurden. Mit einer geeigneten Snapshot-Lösung können Unternehmen einheitliche Policies für eine nahtlose Sicherung unterschiedlicher Clouds anwenden.
-
Prozesse regelmässig auf den Prüstand stellen
Gerade dieser Schritt wird in der Praxis oft vernachlässigt. Unternehmen müssen regelmässig testen, ob der etablierte Disaster-Recovery-Prozess funktioniert und wie viel Zeit er in Anspruch nimmt. Die Testphasen laufen im Hintergrund ab und stören den laufenden Betrieb nicht. Die Veritas Resiliency Platform beispielsweise erlaubt dem Kunden, den gesamten Disaster-Recovery-Prozess per Drag & Drop einzurichten. Über ein integriertes Dashboard lassen sich Echtzeit-Analysen abrufen. So können Unternehmen überwachen, ob die zeitlichen Zielvorgaben einhalten werden. Per Mausklick erhalten sie belastbare Werte dazu, wie lange der gesamte Umschaltprozess dauert und wie viele Produktiv-Daten verloren gehen. IT-Verantwortliche können dadurch mit Werten, die unter realen Bedingungen ermittelt wurden, den Ernstfall beschreiben und Krisensituationen werden berechenbar.
Autor:
Sascha Oehl ist Director Technical Sales DACH bei Veritas