Information Retrieval: an Informationen kommen

Der Ausdruck Information Retrieval bedeutet aus Anbietersicht die Art, wie Information zugänglich gemacht werden soll, und aus Anwendersicht die Art, wie Information zugänglich ist. Im Prinzip lassen sich dabei zwei grundsätzliche Verfahrensweisen unterscheiden: die eine ist das gezielte Suchen nach bestimmten Daten oder einer bestimmten Information, und die andere ist das Stöbern in einem Informationsangebot.

Die klassische Datenverwaltung setzt beim Information Retrieval eher auf das Suchen. Größere herkömmliche Anwendungen, egal ob in Versicherungen oder beim Arbeitsamt, bieten ihren Anwendern typischerweise mehr oder weniger ausgefeilte Suchmasken an. Aus den Eingaben der Maske wird eine Abfrage der Datenbank erzeugt. Die Datenbank sendet eine Ergebnismenge an gefundenen Daten zurück. Diese Ergebnisse werden dem Anwender angezeigt.

Hypertext unterstützt von Haus aus eher das Stöbern. Nicht zufällig lautet das englische Wort für Stöbern to browse. Die Standard-Zugangssoftware für das World Wide Web, also die Web-Browser, sind also namentlich Stöberprogramme.

Vor- und Nachteile von Suchen und Stöbern

Die Vor- und Nachteile beider Formen des Information Retrieval hängen in erster Linie vom jeweils verfolgten Ziel ab. Suchen ohne einsteigendes Informationsangebot ist dann von Vorteil, wenn man genau weiß, wonach man sucht. Wer am kommenden Freitag mit der Bahn von Hamburg nach München fahren will und eine Zugverbindung sucht, dem ist mit einem geeigneten Suchformular am schnellsten geholfen. Stöbern ist dagegen von Vorteil, wenn man nur ungefähr weiß, wonach man sucht. Wer einen Ausflug plant und noch nicht so recht weiß wohin, dem hilft kein Suchformular. In solchen Fällen ist es besser, über ein hinführendes Informationsangebot auf Entdeckungsreise nach Angeboten zu gehen.

Nun können suchorientierte Angebote durchaus helfen, ungefähre Vorstellungen zu präzisieren. Wer im Web eine Partnerbörse aufsucht, kann über zahlreiche Multiple-Choice-Fragen Eigenschaften und Vorlieben seines Wunschpartners zusammenklicken und so die Ergebnismenge eingrenzen. Dennoch ist man bei suchorientierten Angeboten von der eigentlichen Information zunächst einmal abgeschirmt. Erst eine wohlformulierte Suche fördert eine Ergebnismenge aus dem eigentlichen Inhalt zu Tage. An der Formulierung der Suche führt kein Weg vorbei. Dazu sind Dialoge mit dem Anwender erforderlich, die meistens als Formulare realisiert sind.

Stöbern führt dagegen oft zu ganz anderen Ergebnissen bei dem, was ein Anwender am Ende auswählt, konsumiert oder tut. In Web-Angeboten, die zum Stöbern einladen, wählt man zwanglos einen Einstieg und lässt sich ebenso zwanglos durch weitere Links leiten. Durch ein paar Links gelangt man zu konkreter Information. Diese wiederum enthält diverse Links zu anderer Information. Oder man orientiert sich neu. Jedenfalls befindet man sich schnell mitten im Informationsangebot. Man ist nicht getrennt von der eigentlichen Information, doch dafür droht schnell der Überblick verloren zu gehen. Das Mindeste, was man in einer solchen Situation benötigt, ist eine Navigation. Sie ermöglicht die Neuorientierung beim Stöbern.

Keine der beiden Formen des Information Retrieval ist also der Königsweg. Festzuhalten bleibt, dass die Software-Gattung der Datenbank Management Systeme (DBMS) das Paradigma des Suchens geprägt haben, während Hypertext das Paradigma des Stöberns geprägt hat.

Verschwimmende Grenzen

Im Web kommen die Paradigmen von Suchen und Stöbern häufig zusammen. Die meisten größeren Webprojekte bieten Anwendern sowohl einen stöbernden als auch einen suchenden Zugang an. Allerdings wird eine der beiden Zugangsformen meistens optisch deutlich favorisiert. Viele Websites von Zeitungen, großen Firmen oder Organisationen laden den Besucher primär eher zum Stöbern ein, da die Optik aus direkten Inhalten wie aktuellen News auf der Startseite und einer oder mehreren Navigationsleisten besteht. Dennoch wird — oft nicht auf den ersten Blick sichtbar — in aller Regel auch ein kleines Suchfeld angeboten, das eine Volltextsuche im Informationsangebot ermöglicht. Andere Projekte wiederum begreifen sich primär als suchorientiert, bieten aber zusätzlich noch eine Art Linkverzeichnis an, um Anwendern, die einen stöbernden Einstieg bevorzugen, entgegenzukommen.

hypertext-1-1-4.jpg
Brainstorming für ein Datenhaltungskonzept — Quelle: Wikimedia

Viele Informationsangebote haben durchaus den Wunsch, Anwendern beide Formen des Information Retrievals gleichberechtigt anzubieten. in der Praxis ist das jedoch oft nicht so einfach. Der Grund dafür ist, dass die Entscheidung darüber, wie ein Angebot Informationen zugänglich macht, häufig schon im Vorfeld getroffen wird — nämlich beim Daten-Design. Aus Anbietersicht ist es deshalb wichtig, sich mit der Art, wie Informationsdaten gespeichert werden, eingehend auseinander zu setzen. Angenommen, die Nutzdaten einer Website werden in einer relationalen Datenbank gehalten. Dort gibt es beispielsweise Datenbanktabellen für Philosophen, philosophische Begriffe und Definitionen von Philosophien zu philosophischen Begriffen. In solchen Relationen ist jedoch nirgendwo festgehalten, was eine Inhaltseinheit sein soll, also etwa eine Webseite. Ein Web-Frontend könnte zwar das bequeme Durchsuchen der Datenbank ermöglichen. Doch aus den gespeicherten Daten lässt sich weder eine Navigation erzeugen noch ein Set an durchstöberbaren Webseiten. Die Inhalte einer Inhaltseinheit können durchaus dynamisch aus einer Datenbank erzeugt werden. Doch um einen stöbernden Zugang anzubieten, muss in den Datenstrukturen der Datenbank bereits das druchstöberbare Webseitenangebot abgebildet werden — in welcher Form auch immer.