Anforderungskatalog File-System

Das Cloud-Zeitalter fordert neue Dateisysteme

| Redakteur: Tina Billo

Dateisysteme müssen heute zahlreiche neue Anforderungen erfüllen.
Dateisysteme müssen heute zahlreiche neue Anforderungen erfüllen. (Bild: gemeinfrei - Jürgen Sieber / Pixabay / CC0)

Die Cloud - ob privat, hybrid oder öffentlich - ist inzwischen omnipräsent, ihre Nutzung für die meisten Unternehmen inzwischen eine Selbstverständlichkeit. Ebenso wie von jedem Standort - Hauptsitz, Niederlassung, Zweigstelle, Home Office oder mobil - auf geschäftsentscheidende und aufgabenrelevante Daten zugreifen zu können. In Anbetracht dessen, dass im selben Zuge sowohl die Zahl als auch Größe der Dateien beständig zunimmt und diese immer häufiger geografisch verteilt gespeichert werden, ändert sich auch die Rolle, die Dateisysteme übernehmen müssen.

Die Idee von File-Systemen war zunächst, die elektronische Ablage von Dateien ähnlich wie in der realen Welt zu gestalten. Das Prinzip von Aktenschränken und Hängeregistern wurde aufgegriffen und in eine Ordnerstruktur übersetzt, um ein vertrautes Umfeld für deren Aufbewahrung zu zu schaffen. Im Verlauf der Zeit entwickelten die Hersteller den Funktionsumfang der von ihnen angebotene Lösungen jedoch weiter, so dass diese wesentlich mehr konnten, als nur Nutzerdaten zu speichern, für die gemeinsame Nutzung bereitzustellen und zu schützen. Daneben nahm die Leistungsstärke von Dateisystemen zu, so dass sich auch größere Mengen an unstrukturierten Daten durchaus beherrschen ließen.

Doch der Einzug neuer technischer Möglichkeiten - darunter der Cloud, dem Internet der Dinge (IoT) und Big-Data-Analytics - in Kombination mit Unternehmen, die infolge der Globalisierung an immer mehr Standorten mit Niederlassungen und Außenstellen vertreten sind, erfordert Dateisysteme, die mit diesen Entwicklungen Schritt halten. Zentrale Kriterien sind unter anderem, dass sie die an Skalierbarkeit sowie Mobilität gestellten heutigen Anforderungen erfüllen können. Doch welche Leistungsmerkmale und Funktionalitäten muss ein "Cloud-Ära-"Dateisystem mitbringen?

In der Cloud zu Hause

Mit Dateisystemen, die neben den Dateien auch alle zugehörigen Metadaten in der Cloud speichern und deren gesamte Bestandteile - ob Verzeichnisstrukturen, Zugriffskontrolllisten (ACLs) etc. - hier vorgehalten werden, lassen sich die Vorteile von Cloud-Storage- darunter vor allem deren Skalierbarkeit und Georedundanz - ausschöpfen.

Des Weiteren nutzen sie diesen als zentrale Schaltstelle für den Austausch von Dateien. Kommen an den einzelnen Standorten für die Zwischenspeicherung aktiver Daten zusätzlich mit intelligenten Caching-Verfahren arbeitende Appliances zum Einsatz, lässt sich die Zahl der für die Ablage unstrukturierter Daten üblicherweise On-Premise erforderlichen Storage-Systeme - zum Beispiel von NAS-Lösungen - senken.

Optimierung von Performance und Latenz

Dieser Ansatz birgt einen weiteren Vorteil, denn er hebt das bislang der Cloud-Speicherung zugesprochene Problem der als zu lang erachteten Antwortzeiten bei Dateizugriffen auf. Realisiert wird dies, indem die "Masterdateien" in der Cloud liegen, dass Dateisystem diese als maßgebende Quelle nutzt. Jedoch auch die in den Edge-Standorten eingesetzten für die Zwischenspeicherung der aktiven Daten genutzten Appliances abdeckt.

Sicherlich stellt sich bei diesem Cloud/Edge-Konzept die Frage, wie sich Cache-Misses auswirken könnten - das heißt geforderte Daten nicht im Cache gefunden werden. Denn ohne Frage ist der Abruf von Dateien aus der Cloud langsamer, als wenn diese lokal verfügbar sind. Jedoch verhält es sich in der Unternehmenspraxis in der Regel so, dass ein Gros der vorgehaltenen Daten nach neunzig Tagen nur noch selten genutzt wird. Insofern reicht ein Cache, der 15 Prozent der Gesamtkapazität stellt, aus, um die tatsächlich benötigten Dateien für den schnellen Abruf bereitzustellen und Cache-Misses vorzubeugen. Ist dies dennoch ein Problem, lässt sich dieses dadurch lösen, dass der Zwischenspeicher größer dimensioniert wird.

Voneinander unabhängiger Ausbau von Leistung und Kapazität

Das Cloud-/Edge-Konzept - die Verbindung von Cloud-Storage mit physischen oder virtuellen Appliances an den einzelnen Standorten - stellt zudem die Weichen dafür, dass sich Leistung und Kapazität vollständig unabhängig voneinander skalieren lassen. Dank der hybriden Architektur lässt sich die Performance individuelle an Standort- oder Abteilungsanforderungen anpassen. Werden zum Beispiel in einer Außenstellen Datenanalysen durchgeführt, ist möglicherweise Flash-Leistung gefordert. In einer anderen Niederlassung wird hingegen auf just die gleichen Datensätze nur gelegentlich zugegriffen - hier reicht damit der Einsatz weniger performanter möglicherweise lediglich mit traditionellen Festplatten ausgestatteter Appliances aus. Wenngleich die Lösungen an beiden Standorten die gleichen Volumes und Kapazitäten zur Verfügung stellen, unterscheiden sie sich dennoch im Hinblick auf ihr Leistungsniveau.

Auch lässt dieses Modell einen unabhängigen Ausbau des Speicherplatzes zu. Kapazität in der Cloud lässt sich gemäß dessen, was wirklich nötig ist, nach dem "Pay-as-you-Grow"-Prinzip hinzubuchen, das Dateisystem skaliert dabei elastisch.

Aktives Archiv

Den Lebenszyklus betreffend unterscheiden sich unstrukturierte Daten nicht von strukturierten. Auf sie wird in den ersten Wochen nach der Erzeugung ebenfalls am häufigsten zugegriffen, darauffolgend "ruhen" sie meist. Allerdings werden sie tendenziell häufiger wiederverwendet, beispielsweise um mittels Analysen Nutzen aus ihnen ziehen.

Für den Cloud-/Edge-Umgebungen entwickelte Dateisysteme sollten inaktive Daten automatisch abrufen und sobald sie wieder "aktiv" sind auf der lokalen Appliance zwischenspeichern können. Dadurch stehen sie erneut für den schnellen Zugriff zur Verfügung.

Standortunabhängiger Datenzugriff und -austausch

Die nächste Anforderung ist der globale Zugriff auf Daten, da Unternehmen heute meist an vielen verschiedenen Standorten vertreten sind. Um eine reibungslose Zusammenarbeit der Mitarbeiter sicherzustellen, müssen die Mitarbeiter auf die für ihre Aufgaben erforderlichen Daten zugreifen können - ganz gleich, ob sie in der Zentrale, in Außenstellen, im Home Office oder mobil arbeiten.

Das zum Einsatz kommende Dateisystem muss demensprechend die globalen Zugriffs- und Kollaborationsanforderungen erfüllen und Daten aus der Cloud möglichst ohne die Inanspruchnahme von zu viel Bandbreite an die einzelnen Standorten gemäß deren Anforderungen verteilen.

Versionierung und File-Locking

Bei geographisch verteilt aufgestellten Unternehmen arbeiten Mitarbeiter oftmals an ihren jeweiligen Standorten an der gleichen Datei. Von verschiedenen Nutzern erstellte Versionen müssen sich speichern lassen. Hierfür benötigt das Dateisystem einen Volume-Manager, der die Änderungen anhand von Zeitstempeln abgleicht, eine "goldene Kopie" jeder Version in der Cloud speichert und dafür sorgt, das Anwender jede Version zu jedem beliebigen Zeitpunkt abrufen können. Zudem sollte zum Funktionsumfang eine globale File-Locking-Funktion zählen, dank der sich dieselbe Datei sicher an mehreren Standorten ohne die Gefahr des Überschreibens nutzen lässt.

Backup und Disaster Recovery

Die letzte Anforderung an ein für das Cloud-Zeitalter ausgelegtes Dateisystem besteht darin, dass dieses einen umfassenderen Datenschutz bieten sollte, als traditionelle Lösungen. Zum Funktionsumfang sollte unter anderem die nahezu kontinuierliche Erstellung von Snapshots gehören - dies ermöglicht fast jede Version einer Datei in nur wenigen Minuten wiederherzustellen. Ebenso sollten diese unveränderlich sein, so dass sich selbst nach geglückten externen Malware-Angriffen einzelne Dateien, ganze Volumes oder das komplette Dateisystem in den zuvor letzten Zustand zurücksetzen lassen.

Das Dateisystem aus der Cloud-Zeit bietet von Natur aus auch eine integrierte Disaster Recovery. Da die Primärkopie aller Daten in der Cloud gespeichert ist, ist sie automatisch off-site. Darüber hinaus speichert jeder Cloud-Anbieter automatisch eine oder mehrere Kopien aller Daten in anderen Regionen innerhalb seiner Infrastruktur, so dass er vor jeder Art von Katastrophe in einer Region geschützt ist. In Kombination mit an den einzelnen Standorten eingesetzten und mit der Cloud verbundenen Edge-Appliances lässt sich ein sofortiges Disaster Recovery ohne die hohen Kosten für dedizierte Standorte und doppelte Dateiinfrastruktur erreichen.

Kommentare werden geladen....

Kommentar zu diesem Artikel abgeben

Der Kommentar wird durch einen Redakteur geprüft und in Kürze freigeschaltet.

Anonym mitdiskutieren oder einloggen Anmelden

Avatar
Zur Wahrung unserer Interessen speichern wir zusätzlich zu den o.g. Informationen die IP-Adresse. Dies dient ausschließlich dem Zweck, dass Sie als Urheber des Kommentars identifiziert werden können. Rechtliche Grundlage ist die Wahrung berechtigter Interessen gem. Art 6 Abs 1 lit. f) DSGVO.
  1. Avatar
    Avatar
    Bearbeitet von am
    Bearbeitet von am
    1. Avatar
      Avatar
      Bearbeitet von am
      Bearbeitet von am

Kommentare werden geladen....

Kommentar melden

Melden Sie diesen Kommentar, wenn dieser nicht den Richtlinien entspricht.

Kommentar Freigeben

Der untenstehende Text wird an den Kommentator gesendet, falls dieser eine Email-hinterlegt hat.

Freigabe entfernen

Der untenstehende Text wird an den Kommentator gesendet, falls dieser eine Email-hinterlegt hat.

copyright

Dieser Beitrag ist urheberrechtlich geschützt. Sie wollen ihn für Ihre Zwecke verwenden? Infos finden Sie unter www.mycontentfactory.de (ID: 45657220 / Migration)