Definition: Kontextualisierung von Webinhalten Was ist das Semantic Web?

Von Laimingas 5 min Lesedauer

Anbieter zum Thema

Das Semantic Web oder Semantisches Netz bezeichnet eine Weiterentwicklung des herkömmlichen World Wide Web, um Daten für Maschinen bzw. Rechner einfacher verwertbar und austauschbar zu machen. Alternative Begriffe dafür sind Web 3.0 oder Web der Daten.

Evolution des World Wide Web: im semantischen Internet werden Informationen nicht nur mit eindeutigen Bedeutungen versehen, insgesamt soll auch eine bessere Maschinenlesbarkeit aller Webinhalte möglich sein.(Bild:  frei lizenziert © Gerd Altmann /  Pixabay)
Evolution des World Wide Web: im semantischen Internet werden Informationen nicht nur mit eindeutigen Bedeutungen versehen, insgesamt soll auch eine bessere Maschinenlesbarkeit aller Webinhalte möglich sein.
(Bild: frei lizenziert © Gerd Altmann / Pixabay)

Semantik ist ein Teilbereich der Sprachwissenschaft, bei dem es um die Bedeutung von Zeichen und Zeichenfolgen sowie um die Beziehungen zwischen Zeichen und Bezeichnetem geht. Dementsprechend soll das Semantische Web vorhandene Inhalte um semantische Informationen erweitern und Maschinen die Fähigkeit geben, zwischen Bedeutungen unterscheiden zu können. Denn abhängig vom Kontext kann ein Zeichen, beispielsweise ein Wort, verschiedene Bedeutungen haben, etwa „Schimmel“ als Bezeichnung für ein weißes Pferd oder für Schimmelpilz. Umgekehrt kommt es vor, dass verschiedene Zeichen die gleiche Bedeutung haben.

Hintergrund für die Entwicklung des Semantic Web

Computer können mit ihren Programmen lediglich Informationen verwerten, mit denen sie zuvor „gefüttert“ wurden und für deren Verarbeitung die Entwickler Regeln vorgegeben haben. Eine Bedeutung der Dinge erkennen wie ein Mensch kann die Maschine nicht. Bislang ist das Web an der Syntax von Informationen ausgerichtet. Mit den bisherigen Algorithmen analysieren Computeranwendungen Stichwörter, Daten-Indexe und Suchanfragen und liefern je nach Eindeutigkeit einer Anfrage mehr oder weniger passende Ergebnisse. Für die Nutzer ist es jedoch von Bedeutung, dass sowohl Such- als auch Nutzerabsichten möglichst effizient bearbeitet werden.

Mit dem Semantic Web soll erreicht werden, dass Rechner die zur Verfügung stehenden Daten und Inhalte selbstständig zueinander in eine Beziehung setzen können, um Bedeutungen zu erkennen. Das soll ebenfalls auf der Grundlage bestimmter Algorithmen geschehen. Bei der Analyse von Bedeutungen beschränkt sich das Semantic Web aber nicht nur auf Textinhalte, sondern bezieht auch Bilder, Zahlen, Symbole und Laute mit ein, also sämtliche Objekte, die Bedeutungsträger sein können.

Als Beispiel mag eine Anforderung an das Semantische Web bei der Suche im Netz dienen. Bis heute ist es schwierig bis unmöglich, dass eine Suche mit dem Inhalt „Warum leben Fische nicht auf Bäumen?“ zu einem sinnvollen Ergebnis führt, solange dieser Satz nicht exakt auf einer Webseite steht. Das Semantic Web soll dafür sorgen, dass derartige Fragen in Zukunft von Maschinen beantwortet werden können.

Grundlagen des Semantic Web

Wenn man das Semantische Web als Web 3.0 versteht, bilden das Web 1.0 und Web 2.0 dessen Grundlagen. Die Vorläufer haben sich zwar an der Lage und Form von Informationen ausgerichtet, aber nicht an Bedeutungen. Die Standards der klassischen World Wide Web sind HTML (Auszeichnungssprache), HTTP (Übertragungsprotokoll) und URLs (Adressbeschreibungen), die der Strukturierung von Daten dienen. Allerdings sind die allermeisten Inhalte im Netz unstrukturiert verteilt.

Es kommt nur selten vor, dass HTML-Dokumente die Bedeutung ihrer Inhalte und die Unterschiede zu anderen Inhalten definieren. Zwar werden Metadaten eingesetzt, aber diese haben nur eine begrenzte Aussagekraft. Computer sind also in der Lage, nach Adressen von Informationen und Inhalten zu suchen, sie können jedoch nicht deren Bedeutungen und deren Unterschiede erkennen.

Mit zusätzlichen logischen Aussagen sollen Anwendungen dabei unterstützt werden, Inhalte und Informationen nicht nur zu finden, sondern auch zu verstehen, sofern diese in einem semantischen Kontext stehen.

Entitäten und Ontologien

Entität ist ebenfalls ein Begriff aus der Semantik und innerhalb der Philosophie ein ontologischer Grundbegriff. Eine Entität bezeichnet etwas Seiendes oder ein konkretes oder abstraktes Ding. Sie besteht aus einem sogenannten Identifikator und dazugehörigen Attributen. „Albert Einstein“ wäre innerhalb einer Entität der Identifikator. Weitere Informationen zu seiner Person wie „Wissenschaftler“, „Physiker“ oder „Begründer der Relativitätstheorie“ sind als Attribute, als beschreibende Merkmale zu sehen.

Entitäten können zueinander in Beziehung stehen und thematisch entweder verwandt oder unterschiedlich sein. Stehen sie in einem Kontext zueinander, spricht man von Ontologien. Im Semantic Web sind sie für Menschen oder Computer lesbare, geordnete Informations- und Datenmengen und logische Aussagen, die Verbindungen knüpfen und Beziehungen aufzeigen können.

Beide Bestandteile – Entitäten und Ontologien – sind für das Semantische Netz unerlässlich. Nur mit ihnen können Computerprogramme Beziehungen zwischen Worten, Sätzen, Zeichen und Bildern verstehen, Mehrfachbedeutungen und doppelte Inhalte (Duplicate Content) filtern, Inhalte interpretieren und Entitäten nach ihrer Thematik unterscheiden.

Auf diese Weise kann ein Netzwerk entstehen, das über ein reiches Wissen verfügt und nicht nur über unstrukturierte Inhalte, Keywords und Adressen. Es ist davon auszugehen, dass Künstliche Intelligenz zukünftig in der Lage sein wird, die riesige Datenflut des World Wide Web nicht nur zu durchsuchen, sondern auch zielführend zu interpretieren und zu verstehen.

Jetzt Newsletter abonnieren

Täglich die wichtigsten Infos zu Cloud Computing

Mit Klick auf „Newsletter abonnieren“ erkläre ich mich mit der Verarbeitung und Nutzung meiner Daten gemäß Einwilligungserklärung (bitte aufklappen für Details) einverstanden und akzeptiere die Nutzungsbedingungen. Weitere Informationen finde ich in unserer Datenschutzerklärung. Die Einwilligungserklärung bezieht sich u. a. auf die Zusendung von redaktionellen Newslettern per E-Mail und auf den Datenabgleich zu Marketingzwecken mit ausgewählten Werbepartnern (z. B. LinkedIn, Google, Meta).

Aufklappen für Details zu Ihrer Einwilligung

Funktionsweise des Semantic Web

Damit das Semantische Netz realisiert werden kann, müssen Programme die Extraktion von Bedeutungen beherrschen. Das ist jedoch nur möglich, wenn bereits vorhandene oder neue Inhalte im Netz mit strukturierten Daten ausgestattet sind, die von Maschinen gelesen werden können. Diese strukturierten Daten werden auf der Grundlage von Klassifizierungen und speziellen Standards formuliert und auf Webseiten mit Schema- und In-Page-Markups codiert.

Die strukturierten Daten erlauben Programmen eine eindeutige Unterscheidung, zum Beispiel ob das Wort „Tau“ in einem Webseitentext für den morgendlichen Niederschlag oder für ein Seil steht. Für eine einheitliche Maschinenlesbarkeit werden im Semantic Web Standards benötigt, wie sie vom W3-Consortium bereits formuliert wurden.

Weitere Ansätze für solche Standards sind die Web Ontology Language (WOL), die Inhalte klassifizieren und hierarchisch ordnen kann, sowie die Contextual Browsing Language (CBL), mit der Zusammenhänge zwischen Inhalten beschrieben werden.

Weitere Standards und Markups dienen der Erstellung von semantischen Meta-Angaben und Regeln. Diese sind:

  • RDFS (Resource Description Framework Schema): für die Kennzeichnung des RDF-Vokabulars und die Festlegung der zu verwendenden Struktur und Syntax.
  • RDF/RDFa (Resource Description Network in Attributes): für eine detaillierte Beschreibung von Websites, um über beliebige Inhalte logische und semantische Aussagen zu treffen.
  • RIF (Rule Interchange Format): für die Definition von Regeln, denen gemäß Bedeutungszusammenhänge zu erstellen sind.
  • Dublin Core: für die Interpretation von Elementen, die in RDF formuliert wurden sowie ein Standard für Metadaten in digitalen Dokumenten.
  • URI (Uniform Resource Identifier): für die Identifizierung von Informationseinheiten und den Verweis auf weiterführende Daten, die auch als Linked Open Data (LOD) bezeichnet werden.
  • SPARQL (SPARQL Protocol And RDF Query Language): für die Abfrage und Protokollierung von Informationen und Inhalten aus dem RDF-System.

Noch steckt das Semantic Web in den Kinderschuhen, aber es gibt erste Ansätze wie Googles Knowledge Graph oder RankBrain. Am bekanntesten dürfte die Bildersuche von Google sein, die schon heutzutage bis zu einem gewissen Grad erkennen kann, was ein Nutzer sucht, und thematisch ähnliche Bilder anzeigt.

Microservices, Cloud Native, REST API , Kubernetes & Co.: Cloud Computing Wiki

Definitionen rund um Cloud ComputingVon AWS bis XaaS: Alle relevanten Schlagworte aus dem Bereich Cloud Computing finden Sie verständlich erklärt in unseren Definitionen. Ganz im Sinne eines kleinen, aber feinen Glossars lesen Sie hier neutral verfasste und leicht verständliche Erklärungen zu den wichtigsten Begriffen. Als Service für Sie haben wir die hier erklärten Begriffe in unseren Beiträgen auch direkt mit den zugehörigen Lexikoneinträgen verlinkt. So können Sie die wichtigsten Erläuterungen direkt dort nachschlagen.  

Zum Special: Definitionen rund um Cloud Computing

(ID:49822804)