Äquivalenzklassen und Kollokationen erschließen Bedeutung

Heimdall analysiert Texte as a Service

| Autor / Redakteur: Dirk Srocke / Florian Karlstetter

Heimdall greift wahlweise über Schnittstellen auf Texte beim Kunden zu und speichert Indices in einer In-Memory-Datenbank.
Heimdall greift wahlweise über Schnittstellen auf Texte beim Kunden zu und speichert Indices in einer In-Memory-Datenbank. (Bild: prego)

Mit Heimdall liefert IT-Dienstleister prego einen Dienst zur kontextsensitiven Analyse unstrukturierter Texte. Die Lösung erkennt auch Begriffe ähnlicher Bedeutung, findet Lücken in Wissensdatenbanken, Musterverträge oder Plagiate im wissenschaftlichen Umfeld.

Heimdall ist nicht nur eine Gottheit in der nordischen Mythologie, sondern ebenso der Name eines jetzt von prego services (prego) vorgestellten Systems zur kontextsensitiven Analyse unstrukturierter Texte. Zum Angebot gehören umfassende Auswertungs-Services, die auch Begriffe mit ähnlicher Bedeutung erkennen.

Das System liest Texte unterschiedlichster Formate, darunter .doc, .pdf, .txt oder .csv. Bei der Indexierung verwirft das Werkzeug irrelevante Stoppwörter und korrigiert Rechtschreibfehler. Die verbleibenden Begriffe werden auf ihre Stammform reduziert. Heimdall sortiert Begriffe mit ähnlicher Bedeutung in entsprechende Äquilvalenzklassen: Suchen Nutzer nach "Haus", finden sie auch "Gebäude". Zudem kann die Lösung Kollokationen darstellen – erkennt also mit welchen Begriffen ein gesuchtes Wort besonders häufig gemeinsam auftritt.

Heimdall nutzt eine In-Memory-Datenbank. Einmal verschlagwortete Texte sollen sich damit sehr schnell durchsuchen und in Echtzeit statistisch auswerten lassen – so prego.

Anwendungen für Heimdall sieht prego beispielsweise bei der Optimierung von Wissensdatenbanken. Anwender können unzureichend abgedeckte Themenschwerpunkte aufspüren oder Dokumente ähnlichen Inhalts finden und zusammenführen. Zudem helfe die Lösung Musterverträge aufzuspüren, die von Gesetzesänderungen betroffen sind. Im wissenschaftlichen Umfeld finde Heimdall derweil auch solche Plagiate, die zur Verschleierung umformuliert wurden.

Heimdall benötigt lesenden Zugriff auf Dokumente. Je nach Sicherheitsanspruch und vorhandenen Schnittstellen könne die Lösung auch direkt an Dokumente andocken, so Anbieter prego. Für fachspezifische Anwendungen lasse sich Heimdall zudem um zusätzliche Wortbibliotheken ergänzen.

Kommentare werden geladen....

Kommentar zu diesem Artikel abgeben

Der Kommentar wird durch einen Redakteur geprüft und in Kürze freigeschaltet.

Anonym mitdiskutieren oder einloggen Anmelden

Avatar
Zur Wahrung unserer Interessen speichern wir zusätzlich zu den o.g. Informationen die IP-Adresse. Dies dient ausschließlich dem Zweck, dass Sie als Urheber des Kommentars identifiziert werden können. Rechtliche Grundlage ist die Wahrung berechtigter Interessen gem. Art 6 Abs 1 lit. f) DSGVO.
  1. Avatar
    Avatar
    Bearbeitet von am
    Bearbeitet von am
    1. Avatar
      Avatar
      Bearbeitet von am
      Bearbeitet von am

Kommentare werden geladen....

Kommentar melden

Melden Sie diesen Kommentar, wenn dieser nicht den Richtlinien entspricht.

Kommentar Freigeben

Der untenstehende Text wird an den Kommentator gesendet, falls dieser eine Email-hinterlegt hat.

Freigabe entfernen

Der untenstehende Text wird an den Kommentator gesendet, falls dieser eine Email-hinterlegt hat.

copyright

Dieser Beitrag ist urheberrechtlich geschützt. Sie wollen ihn für Ihre Zwecke verwenden? Infos finden Sie unter www.mycontentfactory.de (ID: 43133308 / Content Management)