Suchen

Enterprise-Search: wie Semantik bei der Bewältigung großer Datenvolumina helfen kann Management by Search - Big Data im Griff

Autor / Redakteur: Ulrike Kogler / Florian Karlstetter

Das Weltall – Unendliche Weiten. Viele kennen vielleicht diese Phrase. Begeben wir uns nicht auch täglich auf Entdeckungsreise? Besonders, wenn es darum geht, die richtigen Daten in unserem „Daten-Universum“ zu finden.

Firmen zum Thema

Enterprise Suche: Wie man mit Hilfe von Semantik selbst aus großen, unstrukturiert vorliegenden Datenmengen passende Ergebnisse filtert.
Enterprise Suche: Wie man mit Hilfe von Semantik selbst aus großen, unstrukturiert vorliegenden Datenmengen passende Ergebnisse filtert.
(© Nmedia - Fotolia.com)

Auf rund 40 Zettabyte soll das digitale Universum lt. IDC-Studie bis zum Jahr 2020 anwachsen. Betrachtet man diese Datenmenge, ist kaum vorstellbar, dass diese Daten strukturiert abgelegt werden. Realistischer scheint wohl eher, dass viele Informationen unstrukturiert in File-Systemen, Collaboration-Tools, Wikis, Blogs oder in der Cloud gespeichert werden.

Bereits heute stehen Unternehmen vor der Herausforderung effizient das vorhandene Datenmaterial zu nutzen, um sich ihren Wettbewerbsvorteil zu sichern und/oder auszubauen. Deshalb braucht es Lösungen, die über eine herkömmliche Suche hinausgehen und Daten nicht nur finden, sondern auch analysieren, Content-Zusammenhänge verstehen und aufbereiten. Weg von statischen Abfragemodellen gegen Datenbankeinträge hin zu dynamischen Abfragen, die auf Semantik basieren.

Die Bedeutung von Semantik

Das Wort Semantik stammt ursprünglich aus dem Altgriechischen und bedeutet „bezeichnen“, „zum Zeichen gehörig“. Semantik oder Bedeutungslehre nennt man die Theorie oder Wissenschaft von der Bedeutung der Zeichen. Zeichen können in diesem Fall Wörter, Phrasen oder Symbole sein. In der Informatik ist damit gemeint, dass der semantische Aspekt einer Information von Zeichen und deren Anordnung abhängt. Bei einem Programm werden die Bedeutungsinhalte durch Programmzeilen dargestellt. Da Computer keine Interpretationsmöglichkeiten haben, müssen die Programmzeilen aus einer exakten Syntax und einer eindeutigen Semantik bestehen. Zu diesem Zweck werden die semantischen Sprachelemente durch Zeichen, Ziffern und Befehle dargestellt.

Ein Beispiel dafür ist die Suche nach dem Begriff „Akte“. Der Computer weiß nicht, ob es sich beim Eingebenden um einen Mitarbeiter aus der Personalabteilung, der Personalakten oder um einen Mitarbeiter aus der Einkaufsabteilung, der Einkaufsakten sucht, handelt. Um den Zusammenhang zu erkennen, reicht die Eingabe eines Wortes nicht aus. Einwort-Suchen gehen zwar zurück, dennoch sind Suchabfragen meist recht knapp formulierte Anweisungen mit unterschiedlichen Zielen. Um Benutzern die richtigen Resultate liefern zu können, müssen Hintergrundwissen und Zusammenhänge in die Suche miteinfließen. Leistungsfähige Suchmaschinen erkennen zeitliche und räumliche Zusammenhänge sowie begriffliche Beziehungen. Diese dienen zur Ausweitung oder Einschränkung der Ergebnisse und zur Priorisierung in der Trefferliste. Wichtig ist, dass die Suche lernt und sich an geänderte Rahmenbedingungen anpasst.

Verknüpfung von Inhalten

Um aus allen Datenquellen die relevanten Ergebnisse finden zu können, versehen Suchmaschinen die dort enthaltenen Begriffe mit entsprechenden Anmerkungen. Für solche sogenannten Annotationen werden häufig Mechanismen des Textminings eingesetzt, um Inhalte korrekt zu analysieren und mit den entsprechenden Begriffen aus der Wissensbasis zu verbinden. Aktuelle Algorithmen erreichen hier eine Genauigkeit von mehr als 90 Prozent. Von der Qualität dieses Annotators hängen die Korrektheit und die Trefferquote der semantischen Suchmaschine wesentlich ab.

Semantik wird heute aber nicht mehr nur von Enterprise Search-Anwendungen genutzt. Auch klassische Suchmaschinen wie Google oder Yahoo, die ursprünglich eingegebene Wörter nur als Keywords ohne textlichen Zusammenhang berücksichtigt hatten, integrieren immer mehr semantische Funktionen.

Aus Datenschutzgründen dürfen sie aber nur begrenzt auf historische Suchanfragen oder andere Aktivitäten zugreifen. Da sie weitere Anwendungen wie E-Mail, Chat oder auch App Stores anbieten, könnten sie sonst leicht ein umfassendes Persönlichkeitsprofil anlegen. Daher suchen Maschinen weiterhin vorwiegend nach den eingegebenen Wörtern sowie anderen Kriterien wie Verlinkung, Klickrate oder Häufigkeit von Zitaten. Außerdem geben Keyword-Maschinen nur eine Linkliste aus.

Individuelle Anpassungen

Die beste Suchanwendung bringt keinen Mehrwert für die Anwender, wenn zwar alle relevanten Ergebnisse angezeigt werden, aber die Orientierung in der Trefferliste schwierig ist. Intelligente Suchmaschinen wie Mindbreeze gehen hier einen Schritt weiter. Sie unterstützen die User, da sie Ergebnisse mittels Suchreiter bereits nach Rubriken vorsortiert anzeigen.

Je nach Abteilung oder Anwendungsfall können die Suchreiter/Rubriken individuell angepasst werden, denn die Personalabteilung sucht nach anderen Begriffen und in anderen Bereichen als der Verkauf. Damit findet jeder Mitarbeiter „seine“ relevanten Informationen unabhängig, wo (Datenbank, Cloud, E-Mail-Archiv) diese ursprünglich gespeichert wurden, vorausgesetzt er besitzt die entsprechenden Zugriffsrechte dafür.

Die Vorteile der Cloud nutzen

Noch bequemer und einfacher wird die Einführung von Suchanwendungen für Unternehmen, wenn das ausgewählte Produkt als Cloud-Lösung angeboten wird. Hier stellt der Dienstleister die benötigte Rechenleistung zur Verfügung, kümmert sich um die Aktualität der Suchergebnisse und erledigt alle administrativen Tätigkeiten.

Zudem entlasten Cloud-Angebote die Unternehmen bei den einzusetzenden Sicherheitsmechanismen. Deren Firewall und Intrusion-Protection-Lösungen müssen nämlich nur die Übertragung von Suchwörtern und gefundenen Links wie bei einer externen Suchmaschine freigeben. Einfache Abrechnungsmodelle, meist auf monatlicher Basis und Volumen, erleichtern darüber hinaus die Planung des Budgetbedarfs, da jede Kostenposition transparent und klar definiert ist. Kurz: Man zahlt, was man nutzt.

Der Markt rund um Big Data und Cloud Computing ist wie ein Basar - bunt und agil.

Betrachtet man die unzähligen Meldungen, die Tag für Tag zu den Themen Big Data und Cloud Computing erscheinen, so sollte man bei der Auswahl des Anbieters sorgfältig vorgehen und im Hinblick auf Datenspeicherung und Datenschutz einheimische Dienstleister, Anbietern aus Übersee vorziehen. Think global – Act local.

Artikelfiles und Artikellinks

(ID:39230330)