Definition: Google-Suche im Zeichen der Wissenschaft

Was ist Google Scholar?

| Autor / Redakteur: MiR / Florian Karlstetter

Wichtige Merkmale von Google Scholar sind Volltextanalyse und -indexierung.
Wichtige Merkmale von Google Scholar sind Volltextanalyse und -indexierung. (Bild: gemeinfrei (geralt / pixabay) / CC0)

Grundsätzlich handelt es sich bei Google Scholar um eine Suchmaschine des US-amerikanischen Suchmaschinen-Unternehmens Google, das für die Literaturrecherche wissenschaftlicher Dokumente entwickelt wurde. Erfasst werden dabei sowohl kostenpflichtige Angebote als auch kostenfreie Textdokumente.

Google Scholar stellt eine Konkurrenz zu wissenschaftlichen Datenbanken dar. In der Regel werden über eine initiierte Sucheingabe vorwiegend Volltexte und bibliographische Nachweise als Treffer angezeigt. Zudem erstellt Google Scholar eine so bezeichnete Zitationsanalyse. Hierbei handelt es sich um eine bibliometrische Untersuchungsmethode, in deren Rahmen Google Scholar die in den Dokumenten enthaltenen Zitate analysiert und extrahiert. Außerdem können User über diesen besonderen Suchdienst von Google auch die bibliographischen Angaben der jeweiligen Zitate recherchieren.

Google Scholar auf den Spuren von Crossref

Google Scholar wurde am 18. November 2004 als englischsprachige Beta-Version gestartet. In Deutschland steht die Suchmaschine seit dem 21. April 2006 zur Verfügung. Das Projekt Crossref gilt dabei als der legitime Vorgänger von Google Scholar. Crossref ermöglichte dabei die Indexierung von Volltext-Beständen verschiedener Fachverlage sowie von Publikationen aus dem Self Archiving Bereich und von Open Access Dokumenten. Recherchiert werden konnten diese Materialien über die herkömmliche Google Suchoberfläche. Crossref als auch jetzt Google Scholar erschließen dabei einen Teil des sogenannten Deep Web.

Echte Besonderheit durch die Volltextanalyse und -indexierung

Google Scholar weist allerdings eine echte Besonderheit auf. Denn die Suchmaschine setzt auf die Volltextanalyse und -indexierung. Dies ist ein klarer Vorteil gegenüber wissenschaftlichen Datenbanken. Denn in diesen ist die Suche nur in den bibliographischen Angaben, in den Schlagworten und in den Abstracts möglich. Ein weiterer wesentlicher Unterschied zu den Fachdatenbanken ist die nicht intellektuell erfolgende Auswahl und Bewertung der jeweiligen Dokumente. Bei Google Scholar kommen stattdessen Algorithmen zum Einsatz, welche die Wissenschaftlichkeit beurteilen und damit letztendlich auch das Ranking der Ergebnisliste bestimmen.

Verschiedene Vorteile sorgen für echten Mehrwert

Im Rahmen der individuellen Literatursuche werden dem User Ergebnisse angezeigt, die grundsätzlich nach Relevanz sortiert sind. Unterschieden werden muss hierbei zwischen kostenfreien Nachweisen und kostenpflichtigen Verlagsangeboten sowie in Open Access Publikationen. Durch das Ranking von Dokumenten auf der einen Seite und der Extraktion bzw. Analyse der Zitationen auf der anderen Seite generiert Google Scholar dabei seinen Mehrwert. Vorteilhaft kommt hinzu, dass Suchanfragen auch direkt an den WorldCat (hier: aktuell die weltweit größte bibliografische Datenbank) weitergeleitet werden können und dass Nutzern von Bibliotheken ein Bibliothekslink zur Verfügung steht. Außerdem wird das Volltextangebot noch zusätzlich durch den Zugriff auf Daten aus Google Books deutlich erweitert.

Alle Dokumente mit wissenschaftlichem Inhalt können gesucht werden

Vom Eigenverständnis her definiert sich Google Scholar als ein Dienst für die allgemeine Suche nach Literatur mit wissenschaftlichem Inhalt. Hierzu zählen vorzugsweise:

  • Bücher
  • Technische Berichte
  • Zeitschriftenartikel
  • Seminararbeiten
  • Andere Arten von studentischen Abschlussarbeiten
  • Abstracts
  • Konferenzbeiträge
  • Preprints
  • Power Point Präsentationen.

Aufgrund der Verfügungslage ist Google Scholar vor allem für Wissenschaftler, Hochschuldozierende, Forscher, Studenten, Doktoranden, wissenschaftliche Mitarbeiter und auch Schüler interessant.

Mehrere Formate kommen zum Einsatz

Google Scholar analysiert und indexiert Publikationen und Dokumente in unterschiedlichen Formaten. Hierzu zählen in erster Linie die Formate PDF, HTML sowie PostScript; es können aber auch komprimierte Dateien bearbeitet werden. Seit die Integration von Google Books Daten realisiert wurde, hat sich der Umfang der Dokumente als Volltext-Version dabei deutlich ausgedehnt worden. Allerdings gibt es diesbezüglich auch kritische Stimmen, die anprangern, dass weniger relevante bzw. populäre Themen in Google Scholar nur unzureichend mit Nachweisen oder Volltexten unterrepräsentiert sind.

Google Scholar unterteilt sich in verschiedene Funktionsoptionen:

  • Abdeckung: Bei der Suche wird stets die Verlagspublikation als Treffer ganz oben angezeigt. Die anderen Versionen sind in zusammengefasster Form unterhalb dieses Treffers zu finden. Über den Link "alle ... Treffer" sind diese Versionen komprimiert zusammengefasst. Zudem kann über diesen Link die Liste der indexierten Versionen aufgerufen werden.
  • Indizierung: Grundsätzlich extrahiert Google Scholar aus den gefundenen Texten bzw. Dokumenten die Metadaten wie beispielsweise Autor, Titel und Erscheinungsjahr. Google Scholar lässt die Dokumente dabei automatisch von einem Webcrawler durchsuchen; zudem kommen so bezeichnete Linkresolver als Schnittstelle zu den digitalisierten bzw. elektronischen Angeboten von ausgewählten Bibliotheken zum Einsatz. Ein Algorithmus sorgt dann dafür, dass die einzelnen Texte und Artikel anhand des Layouts der Dokumente unterschieden werden. So erkennt die Software die einzelnen Textsegmente als Autorenname, als Zitation oder beispielsweise als Erscheinungsjahr.
  • Ranking: Die angewendete Verfahrenstechnik basiert auf den bereits etablierten Methoden von Google WebSearch. Dies liegt vor allem daran, dass Google Scholar die gleiche Bearbeitungsgeschwindigkeit sowie die gleiche Rechercheoberfläche bietet. Der Unterschied liegt hier allerdings im Detail. Denn wissenschaftliche Dokumente respektive deren Inhalte weisen ganz besondere Eigenschaften auf, wodurch es erforderlich wird, dass Algorithmen und Prinzipien des Pagerank angepasst werden müssen. Ein wesentlicher Punkt ist dabei die veränderte Gewichtung des Publikationsdatums. So belegen hier in der Regel Dokumente aktuelleren Datums auch einen höheren Rankingfaktor.
  • Zitationsextraktion: Als Basis für die automatische Extraktion respektive Analyse von Zitationen dienen die Erfahrungen und Erkenntnisse der Linkanalyse sowie der Suchmaschine CiteSeer. Dies ermöglicht im Rahmen von "autonomous citation indexing" das Entnehmen von Literaturangaben aus den vorliegenden Volltexten. Dies vergrößert den Abdeckungsgrad von Google Scholar, da nunmehr auch gerade Bücher erfasst werden. Im Grunde genommen kann Google Scholar im Hinblick auf die Zitationsextraktion durchaus als Konkurrenz zu den vergleichsweise kostenintensiven Zitationsdatenbanken Scopus und Science Citation Index (kurz: SCI) angesehen werden.

Public, Private, Hybrid & Co.: Definitionen rund um Cloud Computing

Definitionen rund um Cloud ComputingAlle relevanten Schlagworte aus dem Bereich Cloud Computing finden Sie auch gut erklärt in unseren Definitionen. Ganz im Sinne eines kleinen, aber feinen Glossars lesen Sie hier leicht verständliche Erklärungen zu den wichtigsten Begriffen. Als Service für Sie haben wir die hier erklärten Begriffe in allen unseren Beiträgen auch direkt mit den zugehörigen Lexikoneinträgen verlinkt. So können Sie die wichtigsten Begriffe direkt dort nachschlagen, wo sie im Text auftauchen.  

Zum Special: Definitionen rund um Cloud Computing

Kommentare werden geladen....

Kommentar zu diesem Artikel abgeben

Der Kommentar wird durch einen Redakteur geprüft und in Kürze freigeschaltet.

Anonym mitdiskutieren oder einloggen Anmelden

Avatar
Zur Wahrung unserer Interessen speichern wir zusätzlich zu den o.g. Informationen die IP-Adresse. Dies dient ausschließlich dem Zweck, dass Sie als Urheber des Kommentars identifiziert werden können. Rechtliche Grundlage ist die Wahrung berechtigter Interessen gem. Art 6 Abs 1 lit. f) DSGVO.
  1. Avatar
    Avatar
    Bearbeitet von am
    Bearbeitet von am
    1. Avatar
      Avatar
      Bearbeitet von am
      Bearbeitet von am

Kommentare werden geladen....

Kommentar melden

Melden Sie diesen Kommentar, wenn dieser nicht den Richtlinien entspricht.

Kommentar Freigeben

Der untenstehende Text wird an den Kommentator gesendet, falls dieser eine Email-hinterlegt hat.

Freigabe entfernen

Der untenstehende Text wird an den Kommentator gesendet, falls dieser eine Email-hinterlegt hat.

copyright

Dieser Beitrag ist urheberrechtlich geschützt. Sie wollen ihn für Ihre Zwecke verwenden? Kontaktieren Sie uns über: support.vogel.de/ (ID: 45564358 / Definitionen)