Cloud-basierte Plattformen für die Big-Data-Analyse

Forschen in der Cloud

| Autor / Redakteur: Alec Westley* / Dr. Ilka Ottleben

Big Data in der Forschung: Cloud-basierte Plattformen unterstützen bei Datenspeicherung, Datenmanagement und Datenanalyse.
Big Data in der Forschung: Cloud-basierte Plattformen unterstützen bei Datenspeicherung, Datenmanagement und Datenanalyse. (Bild: © vchalup - stock.adobe.com)

Jüngste Forschungstechnologien mit hoher Durchsatzleistung erlauben es Wissenschaftlern, mehr Daten zu sammeln als je zuvor. Big Data stellt Datenspeicherung, Datenmanagement und Datenanalyse indes vor große Herausforderungen. Cloud-basierte Plattformen bieten als flexibles und skalierbares System eine potenzielle Lösung.

Immer mehr und immer komplexere Daten in immer kürzerer Zeit: Die jüngsten bedeutenden Entwicklungen bei Technologien mit hoher Durchsatzleistung in der Life-Sciences-Forschung machen es möglich. Technologien wie Next-Generation-Sequencing (NGS), quantitative Polymerase-Kettenreaktion (qPCR), Massenspektrome­trie und synthetische Biologie haben zu einem gewaltigen Anstieg der produzierten Daten geführt. Dabei werden multidimensionale Daten in einem bislang beispiellosen Umfang generiert.

Diese „Big-Data“-Revolution hat zweifellos ein großes Potenzial für den wissenschaftlichen Fortschritt. Denn das Ziel besteht darin, diesen dramatischen Datenzuwachs in eine ähnlich spektakuläre Geschwindigkeit in den Bereichen Fortschritt und Entwicklung umzusetzen. Damit dies Realität werden kann, gilt es, große Herausforderungen zu überwinden.

Technologien mit hohen Durchsatzleistungen beinhalten häufig komplexe Arbeitsabläufe, und Unternehmen müssen in der Lage sein, diese Prozesse kontinuierlich zu überwachen und zu optimieren. Die große Menge anfallender, komplexer Daten muss ebenfalls effizient gespeichert, organisiert und analysiert werden. Da auch in der Biotechnologie die Zusammenarbeit eine immer größere Rolle spielt, wird es zunehmend wichtig, komplexe Daten in einem zugänglichen Format zu speichern. Erfolgreiche Labors müssen in der Lage sein, diesen Herausforderungen bei der Datenverwaltung, Datenspeicherung und beim Datenaustausch gerecht zu werden.

Fragmentierte Plattformen stoßen vielfach an Grenzen

Bislang verfügen viele Labors und Forschungseinrichtungen über Tools zum Datenmanagement, die sich in ihren eigenen Räumlichkeiten befinden und mit denen sie ihre Workflow-Daten organisieren. Obgleich digitale Systeme die papierbasierten Ansätze der Vergangenheit weitgehend abgelöst haben, werden viele dieser Plattformen als punktuelle Lösungen für spezifische Prozesse eingesetzt. Die Plattformen arbeiten isoliert und sind nicht Bestandteil eines integrierten Ganzen. Dies hat zur Folge, dass viele der derzeitigen Datenmanagement-Plattformen im Wesentlichen fragmentiert sind und die Herausforderungen von Workflows mit hoher Durchsatzleistung nicht bewältigen können.

Darüber hinaus steigen mit zunehmendem Datenvolumen und zunehmender Datenkomplexität auch die Wartungskosten der vor Ort installierten Datenmanagementsysteme [1], welche eine immer höhere Speicherkapazität und Rechenleistung erfordern. Kontinuierliche Investitionen in Ressourcen sind erforderlich, um die Systeme zu warten, Upgrades durchzuführen und die langfristige Compliance mit sich ändernden regulatorischen Standards sicherzustellen. Ferner sind Investitionen in Zeit und Ressourcen erforderlich, um die Datenintegrität und Sicherheit dieser Systeme zu gewährleisten. Die derzeitige Realität sieht so aus, dass viele Labors fragmentierte Datenmanagementsysteme in ihren Räumlichkeiten einsetzen. Diese verursachen erhebliche Kosten und sind nicht in der Lage, die Vorteile der Digitalisierung im Hinblick auf Effizienzsteigerung und Forschungsqualität zu erbringen. Die Fragmentierung erhöht auch die Risiken, die im Zusammenhang mit Datenintegrität und Sicherheitsproblemen bestehen.

Eine Cloud-basierte Lösung für Forschung & Entwicklung

Cloud-basierte Informatikplattformen bieten eine kostengünstige Lösung. Sie räumen die mit dem unternehmensinternen Datenmanagement einhergehenden Probleme aus dem Weg, indem sie den Unternehmen Elastizität verleihen und die Zusammenarbeit und den Austausch erleichtern. Moderne Plattformen sind wesentlich komplexer als einfache Datenspeichersysteme. Sie verwalten alle Phasen der Forschungs- und Entwicklungsabläufe, sind in Datenerfassungs- und Datenanalysesysteme integriert und stellen ein vernetztes, digitales Ökosystem dar. Derartige Plattformen bieten die für das Datenmanagement erforderliche Infrastruktur, die Unternehmen benötigen, um den Prozess der Datenerfassung und -analyse zu automatisieren, die Daten in einem organisierten und durchsuchbaren Format zu speichern und schließlich die entsprechenden Analysen durchzuführen. Über die Plattform haben Unternehmen Zugang zu den Informationen, die sie zur Rationalisierung ihrer Arbeitsabläufe und Optimierung der Ergebnisse benötigen.

Die Plattformen sind auf Flexibilität ausgelegt – ihr Hauptvorteil liegt in ihrem „modularen“ Aufbau, was es ermöglicht, sie an die Bedürfnisse einzelner Unternehmen anzupassen. Neben Elementen wie Software für die Laborautomatisierung und elektronischen Laborbüchern (ELN) entsteht zusätzliche Flexibilität durch das Hinzufügen Work- flow-spezifischer Anwendungen („Apps“), die sich nahtlos in die Plattform integrieren lassen [2].

Es kann eine Herausforderung sein, neue Laborsysteme in bestehende Technologien zu integrieren [3] – allerdings sollte der modulare und flexible Charakter von Cloud-basierten Informatik-Plattformen die Umstellung relativ einfach machen. Bei jedem System-Update ist die Datenintegrität ein wichtiges Anliegen, auch müssen die Wissenschaftler während der Umstellung Zugang zu Workflow-kritischen Informationen haben. Der Vorteil modularer Cloud-basierter Systeme liegt darin, dass neue Funktionen mit minimaler Unterbrechung in Betrieb genommen werden können. Unternehmen können wählen, ob sie ihr bestehendes System komplett ändern oder bestimmte Funktionen integrieren möchten, ohne dass die grundlegende Infrastruktur ersetzt werden muss. Die modulare Implementierung der Funktionen ermöglicht es den Unternehmen, nur die neuen Lösungen zu testen und je nach Erfordernis zu validieren.

Inhalt des Artikels:

Kommentare werden geladen....

Kommentar zu diesem Artikel abgeben

Der Kommentar wird durch einen Redakteur geprüft und in Kürze freigeschaltet.

Anonym mitdiskutieren oder einloggen Anmelden

Avatar
Zur Wahrung unserer Interessen speichern wir zusätzlich zu den o.g. Informationen die IP-Adresse. Dies dient ausschließlich dem Zweck, dass Sie als Urheber des Kommentars identifiziert werden können. Rechtliche Grundlage ist die Wahrung berechtigter Interessen gem. Art 6 Abs 1 lit. f) DSGVO.
  1. Avatar
    Avatar
    Bearbeitet von am
    Bearbeitet von am
    1. Avatar
      Avatar
      Bearbeitet von am
      Bearbeitet von am

Kommentare werden geladen....

Kommentar melden

Melden Sie diesen Kommentar, wenn dieser nicht den Richtlinien entspricht.

Kommentar Freigeben

Der untenstehende Text wird an den Kommentator gesendet, falls dieser eine Email-hinterlegt hat.

Freigabe entfernen

Der untenstehende Text wird an den Kommentator gesendet, falls dieser eine Email-hinterlegt hat.

copyright

Dieser Beitrag ist urheberrechtlich geschützt. Sie wollen ihn für Ihre Zwecke verwenden? Kontaktieren Sie uns über: support.vogel.de/ (ID: 45881687 / Datenbanken / Big Data)