Cloud-basierte Plattformen für die Big-Data-Analyse

Forschen in der Cloud

| Autor / Redakteur: Alec Westley* / Dr. Ilka Ottleben

Schnellere Erfassung und -Analyse von Big Data

Technologien mit hoher Durchsatzleistung machen Automatisierung und Standardisierung noch wichtiger, um Prozesse zu vereinfachen und Fehler zu vermeiden. Software zur Laborautomatisierung kann in Plattformen für die digitale Datenverarbeitung integriert werden. Auf diese Weise können die Wissenschaftler alle Prozesse einzeln optimieren und zu effizienten und integrierten Arbeitsabläufen zusammenfügen. Daraus ergeben sich erhebliche Vorteile in Bezug auf Datenintegrität und Qualitätskon­trolle.

Bei komplexen Arbeitsabläufen ist Überwachung der Schlüssel zur Sicherstellung korrekter und reproduzierbarer Bedingungen. Wenn einzelne Arbeitsschritte unabhängig voneinander ausgeführt werden, können vorgeschaltete Probleme leicht zu Problemen bei nachgeschalteten Ergebnissen führen. Durch sofortigen und einfachen Datenzugriff und Sichtbarkeit haben die Wissenschaftler mit integrierten digitalen Plattformen die Möglichkeit, Prozesse in Echtzeit zu bewerten und anzupassen und Compliance mit den gesetzlichen Anforderungen sicherzustellen.

Durch Auswahl Workflow-spezifischer Apps lassen sich Prozesse weiter optimieren, wodurch die Plattformen ihre Vielseitigkeit erhalten. Einige Apps können die Effizienz steigern, indem sie Vorlagen bereitstellen, die auf branchenspezifischen Best-Practice-Verfahren basieren. Andere wiederum können zur Überwachung eingesetzt werden, z.B. Apps für die Optimierung von Bioreaktoren, welche die Bedingungen im Bioreaktor und die Daten zum Zellwachstum überwachen. Wiederum andere Apps können zur Datenanalyse installiert werden.

Einige Plattformanbieter geben Nutzern die Möglichkeit, eigene Apps zu entwickeln und mit anderen Nutzern zu teilen, wodurch der Fortschritt für die gesamte wissenschaftliche Community beschleunigt werden kann. So erlaubt beispielsweise die von Thermo entwickelte Software „Plattform for Science“ eine Integration mit R Shiny, einem Cloud-basierten Datenvisualisierungs- und Analysepaket. Durch direkte Integration von Datenvisualisierungs- und Analysetools auf einer Plattform können Wissenschaftler eigene Apps für die Datenauswertung entwickeln und auf der Plattform veröffentlichen. Indem Anbieter die Datenanalyse direkt in die Plattform integrieren, beschleunigen sie den wissenschaftlichen Workflow und machen die Daten sofort verwertbar.

Gut organisierte, gemeinsam nutzbare Daten

Angesichts der stetig zunehmenden Menge zu verarbeitender multidimensionaler Daten stehen Datenmanagementsysteme vor der Herausforderung, eine Kombination aus strukturierten, unstrukturierten und Referenzdaten zu organisieren. Durch die Verwendung Cloud-basierter Informatikplattformen zur Organisation multidimensionaler Daten in einem einzigen digitalen Ökosystem können Wissenschaftler unstrukturierte Daten (z.B. aus elektronischen Laborbüchern) mit strukturierten Daten verknüpfen, was die Suche und das „Data-Mining“ wesentlich vereinfacht. Gut organisierte und abrufbare Daten beschleunigen den Prozess der Berichterstattung und der Identifizierung von Trends. Die Daten können sogar mit Informationen aus vor- und nachgelagerten Prozessen verglichen werden, was eine durchgängige Transparenz des Workflows und letztlich eine bessere Entscheidungsfindung ermöglicht.

Ergänzendes zum Thema
 
Buzzword Data-Mining

Die Nutzung eines einzigen integrierten digitalen Ökosystems wird auch den Datenaustausch erleichtern, wobei dieser in der sich ständig wandelnden Forschung und Entwicklung immer wichtiger wird. Erfolgreiche Innovationen in der Biotechnologie hängen zunehmend von Kooperationen ab, wobei Partnerschaften zwischen verschiedenen Organisationen immer häufiger werden.

Cloud-basierte Systeme sind für kollaborative Arbeitsansätze ideal geeignet und ermöglichen einen einfachen Datenaustausch und -abruf auch bei großen und multidimensionalen Datensätzen. Die Speicherung von Daten in der Cloud gibt Nutzern die Möglichkeit des Echtzeitzugriffs. Dies kann den Forschungs- und Entwicklungsprozess beschleunigen, sowohl durch Effizienzsteigerung innerhalb eines Unternehmens als auch durch schnellen Austausch mit externen Partnern. Die Plattform-Software ermöglicht es den Nutzern, die Art ihres „kollaborativen Ökosystems“ anzupassen, sodass Unternehmen je nach Bedarf des einzelnen Nutzers entweder auf Projektebene oder auf spezifischer Datenebene Einblick in die Daten gewähren können.

Eine Plattform für zukünftige Technologien

In dem Maße, wie sich Technologien mit hoher Durchsatzleistung weiterentwickeln, werden Umfang und Komplexität der zu verwaltenden Daten ebenfalls zunehmen. Informatikplattformen müssen flexibel und skalierbar sein, um zukünftigen Anforderungen gerecht zu werden. Cloud-basierte Plattformen sind von Natur aus erweiterbar und so konzipiert, dass sie sich mit fortschreitenden Technologien weiterentwickeln.

Die Kombination aus Zukunftstechnologien und Cloud-basierten digitalen Plattformen verspricht großes Potenzial. Künstliche Intelligenz (KI) ist ein sich rasch entwickelndes Feld mit einem immer größer werdenden Anwendungsspektrum. Die jüngsten KI-Programme sind durch Verwendung maschineller Lernmethoden in der Lage, komplexe unstrukturierte biologische Daten zu analysieren und somit zu ermöglichen, dass wichtige Forschungsfragen schneller bearbeitet werden können als durch herkömmliche Ansätze. Der Vorteil Cloud-basierter Plattformen besteht darin, dass sie alle Daten zu einem einzigen, integrierten digitalen Ökosystem kombinieren können, was es zukünftigen KI-Systemen ermöglichen wird, die Daten zu sammeln und die Ergebnisse zu analysieren.

In einer Welt mit ständig wachsenden Datenmengen bieten Cloud-basierte Informatikplattformen eine kostengünstige Lösung für die wachsenden Probleme, die sich bei Verwaltung von „Big Data“ in den eigenen Räumlichkeiten ergeben. Durch ihren vielseitigen und modularen Aufbau lassen sie sich an jede Laborumgebung anpassen. Diese Systeme haben große Vorteile, da sie die Datenerfassung und -analyse optimieren, die Datenspeicherung verwalten und den Datenaustausch erleichtern. Mit Blick auf die Zukunft lässt sich sagen, dass flexible und skalierbare Systeme wie diese in der Lage sind, sich Hand in Hand mit dem technologischen Fortschritt weiterzuentwickeln.

Literatur:

[1] D. Abadi, “Data management in the cloud: Limitations and opportunities,” IEE Data Eng. Bullitein, vol. 32, no. 1, pp. 3–12, 2009.

[2] H. Jin, S. Ibrahim, T. Bell, W. Gao, D. Huang, and S. Wu, “Cloud Types and Services,” in Handbook of Cloud Computing, 2010, pp. 335–356.

[3] I. Foster, “Globus Online: Accelerating and Democratizing Science through Cloud-Based Services,” IEEE Internet Comput., vol. 15, no. 3, pp. 70–73, 2011.

Diesen Beitrag haben wir von unserer Schwester-Publikation Laborpraxis übernommen.

* A. Westley: Thermo Fisher Scientific, WA14 5TP Altrincham/Großbritannien.

Inhalt des Artikels:

Kommentare werden geladen....

Kommentar zu diesem Artikel abgeben

Der Kommentar wird durch einen Redakteur geprüft und in Kürze freigeschaltet.

Anonym mitdiskutieren oder einloggen Anmelden

Avatar
Zur Wahrung unserer Interessen speichern wir zusätzlich zu den o.g. Informationen die IP-Adresse. Dies dient ausschließlich dem Zweck, dass Sie als Urheber des Kommentars identifiziert werden können. Rechtliche Grundlage ist die Wahrung berechtigter Interessen gem. Art 6 Abs 1 lit. f) DSGVO.
  1. Avatar
    Avatar
    Bearbeitet von am
    Bearbeitet von am
    1. Avatar
      Avatar
      Bearbeitet von am
      Bearbeitet von am

Kommentare werden geladen....

Kommentar melden

Melden Sie diesen Kommentar, wenn dieser nicht den Richtlinien entspricht.

Kommentar Freigeben

Der untenstehende Text wird an den Kommentator gesendet, falls dieser eine Email-hinterlegt hat.

Freigabe entfernen

Der untenstehende Text wird an den Kommentator gesendet, falls dieser eine Email-hinterlegt hat.

copyright

Dieser Beitrag ist urheberrechtlich geschützt. Sie wollen ihn für Ihre Zwecke verwenden? Infos finden Sie unter www.mycontentfactory.de (ID: 45881687 / Datenbanken / Big Data)