WAFL - Das NetApp File-System, Teil 2 Wenn das Backup mit der gewünschten Datenverfügbarkeit nicht mehr nachkommt

Autor / Redakteur: Bernd Schöne / Rainer Graefen

Dass ein Filesystem Daten speichern kann, das allein reicht schon lange nicht mehr aus. Hohe Datenverfügbarkeit und Datensicherheit lassen sich nur herstellen, wenn das Dateisystem darauf vorbereitet ist. Ob deshalb ein Snapshot als Backup verkauft werden kann, darüber wird seit langem gestritten.

Firmen zum Thema

So stellt sich für NetApp das Thema Unified Storage auf der Protokoll- und Verwaltungsebene dar.
So stellt sich für NetApp das Thema Unified Storage auf der Protokoll- und Verwaltungsebene dar.
( Archiv: Vogel Business Media )

Zwei interne Mechanismen im NetApp-Dateisystem bieten Schutz vor Datenkorruption. Der Hersteller setzt ein patentiertes Verfahren für Snapshots ein, das als einziges am Markt verfügbare Verfahren performanceneutral operiert und zudem ohne kapazitiven Overhead auskommt.

NetApp bietet für alle im Rechenzentrum anzutreffenden Applikationen Tools und Schnittstellen, diese Snapshots mit dem Backupmodus der eingesetzten Applikationen (oder Hypervisor) zu verzahnen. NetApp bezeichnet dies als „Backup-integriert“, da keine zusätzlichen Applikationen benötigt werden.

Prüfsummen quer und diagonal

Eine weitere Sicherheit bietet zudem das von NetApp verwendete RAID-DP. (DP für double parity) ist eine Erweiterung von RAID 4. Da es immer mehr sehr große Festplatten mit mehreren TByte Speicherkapazität verwendet werden, benötigt die Wiederherstellung eines Datensatzes unter Umständen so viele Stunden, dass mit nicht zu gering zu schätzenden Wahrscheinlichkeit zwischenzeitlich eine weitere Platte ausfallen könnte.

Damit droht im klassischen RAID ein Datenverlust. RAID-DP arbeitet wie angedeutet mit zwei Parity-Platten und verkraftet so auch den Ausfall zweier Disks verlustfrei. Dies bietet mehr Sicherheit, ohne die doppelte Anzahl Platten im Array wie z.B. bei RAID-51 zu benötigen.

Die erste Parität wird horizontal, die zweite Parität diagonal berechnet. Beim Ausfall oder plötzlichen Entfernen von zwei Platten bleibt das Filesystem daher konsistent.

Zwischen den Schreibvorgängen für Daten- und Parity-Informationen entsteht keine zeitliche Lücke, da zwei Paritäts-Informationen (RAID-DP) in einem Stripe mit den Nutzer-Daten geschrieben werden.

Über den Scheduler ist ein permanentes Überprüfen der angeschlossenen Laufwerke (Data Scrubbing) einstellbar. Darüber hinaus werden die Daten mit zusätzlicher Prüfsumme geschrieben und automatisch umkopiert, wenn sich Plattenausfälle über ihre Messdaten ankündigen.

Metadaten

Die Metadaten benötigen nach Angaben von NetApp keine höhere Performance im Vergleich zu den Nutzdaten und erfordern somit keine Extrabehandlung. Bei Anforderungsprofilen, die einen Schwerpunkt auf Metadaten legen, werden diese allerdings dynamisch auf die schnellste verfügbare Speichertechnologie gelegt.

Snapshots sind aufgrund der speziellen NetApp-Technologie zu jedem beliebigen Zeitpunkt ohne Performance-Einbußen möglich, da diese nur die Änderungen erfassen müssen. Clones sind bei NetApp als beschreibbare virtuelle Kopien der Snapshots angelegt, wobei sie je nach Wunsch temporär oder permanent beschreibbar sind.

weiter mit: Disaster Recovery in Sekunden

Dies ist vor allem bei der Entwicklung oder Pflege von Applikationen und Datenbanken nützlich, da auf diese sofort zugegriffen werden kann. Man kann sich auch später noch entscheiden eine physische Kopie auf einem zweiten Medium anzufertigen. Dies geschieht im Hintergrund und hat keinen Einfluss auf den Betrieb.

Über weitere Tools werden Snapshots in enger Abstimmung mit den beteiligten Applikationen erstellt. Damit gewährleistet man die Daten-Konsistenz. Das Erstellen von Snapshots dauert Sekunden – unabhängig von der Datenmenge oder der Anzahl der bereits existierenden Snapshots. Die Maximalzahl ist allerdings in einem FAS-System auf 256 Snapshots pro Volume begrenzt.

Disaster Recovery ohne Verzug

Außerdem dient die Snapshot-Technik als Basis für die Backup-to-Disk-Verfahren und die Spiegelungs-Mechanismen von NetApp. Dies führt dazu, dass bei einem Desaster-Recovery oder im Restore-Fall ohne Verzug auf die konsistenten Daten zugegriffen werden kann und nicht erst aufwändige Logfile-Operationen mit unvorhersehbaren Laufzeit-Verzögerungen abzuarbeiten sind.

Bei der unmittelbaren Wiederherstellung von Backups unterscheidet NetApp drei Szenarien:

  • Wiederherstellung kompletter virtueller Container auf Basis von Snapshots,
  • Wiederherstellung einzelner Files oder
  • Wiederherstellung des gesamten Speichers von dem Backup-to-Disk-System.

Im ersten Fall erfolgt die Wiederherstellung wirklich unmittelbar, in weniger als einer Minute. In den anderen beiden Fällen dauert die Wiederherstellung der Daten so lange, wie die Rückkopie der Daten im Snapshot.

Diese beiden Operationen können prinzipiell auch von einem Endbenutzer ohne Zutun eines Administrators angestoßen werden, da das Snapshotverzeichnis für Anwender lesbar veröffentlicht werden kann.

Inkrementelle Backups

Die Snapshots sind stets Block-Inkrementell angelegt. Nach der ersten Sicherung, werden nur noch die veränderten Datenblöcke gespeichert. Ob man sie nach außen hin als einzelne Vollsicherungen oder inkrementelle Sicherungen in Erscheinung treten lässt, hängt vom Anwendungsfall, sowie der Vorliebe des Admins und der Backup-Logik ab.

Der Philosophie des Hauses entsprechend hat WAFL keine eigene Versionsnummer, sondern kommt stets nur mit einem neuen Version des Betriebssystems Data ONTAP heraus. Aktuell verfügbar ist die Version 8.0.1. Neue Versionen sind in Arbeit, Über Details wird Storage-Insider.de zum gegebenen Zeitpunkt berichten.

(ID:2052529)