Informatica-Tagesgeschäft ETL-Prozess wird zur „Datenintegration“
ETL-Prozesse (Extraktion, Transformation und Laden von Daten) wurden früher häufig Batch-orientiert in der Nacht durchgeführt. Heutzutage klingt der Begriff fast schon antiquiert, denn es ist vielmehr von Datenintegration die Rede, erläutert der DACH-Chef von Informatica.
Anbieter zum Thema

Als Informatica vor 26 Jahren gegründet wurde, ging es vor allem darum, bei Großkunden mit Großrechnern Daten aus Silos zu extrahieren, um sie weiterverwenden zu können. „Das hatte viel mit Schnittstellenarbeit zu tun. Stellen Sie sich beispielsweise ein System auf einem Mainframe vor, das Logistikprozesse abwickelt. Um die Daten dort rauszubringen, um sie in einem Finanzbuchhaltungs- oder Reporting-System verwenden zu können, wurden im Hintergrund automatisiert Schnittstellen programmiert“, führt Oliver Schröder, Geschäftsführer DACH, Informatica aus. Offene Schnittstellenstandards wie heute gab es nicht, sodass eigene Datenbewegungsschnittstellen geschaffen werden mussten. Die Grundidee des ETL-Prinzips, also Extraktion, Transformation und Laden von Daten, stammt vor diesem Hintergrund aus dem Hause Informatica, sagt der DACH-Chef. „Auch wenn die Begrifflichkeit von Gartner und anderen Analysten geprägt wurde.“ Daten-Extraktion (aus System A), Transformation (für System B) und Laden von Daten (durch System B) wurde oft in der Nacht laufen gelassen.
ETL klingt fast schon antiquiert
Auch Realtime-Zugriffe waren damals noch kein Thema, und insgesamt klingt der Begriff ETL fast schon antiquiert, wenngleich er Informatik-Basiswissen darstellt. Heute ist von Datenintegration die Rede, unabhängig davon, ob es um den Austausch von Daten über offene Schnittstellen über Systemgrenzen von beispielsweise Salesforce-, Oracle- oder IBM-Lösungen hinweg geht, oder darum, Daten zwischen On-Premises- und Cloud-Welten zu verschieben.
Immens an Bedeutung gewann das Thema „Datenqualitätsmanagement“. Einmal auf Ebene der Speicherarchitektur, also bei der Frage, wo die Daten liegen und ob sie dort korrekt platziert sind. Andererseits bei der Frage, inwieweit die Daten inhaltlich richtig sind. „Ob beispielsweise eine hinterlegte Kreditkartennummer im Hinblick auf die Prüfziffer in sich schlüssig ist, ist eine Frage aus diesem Bereich. Oder die Frage, ob bei einem Betrag ein Wort steht oder andersherum. Beim Thema Stammdatenmanagement spielt die Dubletten-Problematik eine zentrale Rolle“, so Schröder. Hier Ordnung herzustellen ist eine Aufgabe von Master Data Management.
Alte und neue Probleme
Ein fast überall auftauchendes Problem in dem Kontext sei, dass dieselben Kunden in mehreren Systemen hinterlegt sind, beispielsweise einmal als Angebotskunde bei Salesforce und einmal als Rechnungskunde im SAP. Andere Problemstellungen durch Digitale Transformation sind in jeder Branche einzigartig. Schröder nennt Ebenen, auf denen sie auftauchen: Cloud/Hybrid, Next Gen Analytics, 360 Engagement und Data Governance/ Compliance. Die technologische Herausforderung dabei ist die, „mit Daten aus klassischen relationalen Datenbanken, Filesystem-basiert abgelegten Daten und Big-Data-Formaten, wie sie für Hadoop-Systeme gebraucht werden, gleichermaßen umgehen zu können“. Das sei alles andere als trivial, so der Informatica-Chef. All diese Themen würden nun sukzessive von Großkunden – wie zur Informatica-Anfangszeit – runter in mittelständische Unternehmen wandern, die ihr Business digitalisieren.
Partnerstrategie wird angepasst
Der Governance-Aspekt sei inzwischen ein ganz wesentlicher Treiber dafür, dass sich mehr und mehr Unternehmen mit dem Thema Datenmanagement beschäftigen: „Ob es darum geht, Daten über Transportwege für den Lieferkettennachweis ordnungsgemäß zu sammeln oder um die DSGVO-Thematik. Basel III und das kommende Basel IV spielen hier auch mit rein“, berichtet der Daten-Profi.
„Vor dem Hintergrund dieser Entwicklungen ändert sich unsere Partnerstrategie“, verrät der Informatica-Chef. Die Anzahl der Partner soll steigen und Informatica sucht Value Added Reseller, die tief in ihrer Branche verwurzelt sind. Ein typischer Kandidat für einen künftigen Informatica-VAR hat direkten Kundenzugang, beispielsweise mit ERP- oder DRM-Bezug. Die Themen Datenintegration, Datenqualität und Stammdatenmanagement kommen dann automatisch hinzu.
(ID:45847013)