Treffer ohne Ende

Bingo! Im Netz gibt es fast alles. Vom Kaffee über die New Yorker Untergrundbahn bis hin zur Partnervermittlung. Das Suchen, vielmehr das Finden ist jedoch eine kleine Wissenschaft für sich.

 
 
  Erschienen in Computer & Co, Heft 12/97.  
 
 
  Was zuviel ist, ist zuviel. Die sieben Buchstaben des Wortes "Titanic" zaubern bei "AltaVista" 11 815 Dokumente auf den Bildschirm, "HotBot", die bunt gestaltete Suchmaschine des Kultmagazins Wired, ist noch ausführlicher: "James Cameron" erzielt 83 240 Treffer, während der Ozeanriese in der Masse von 53 664 Dokumenten untergeht. Wer soll die alle durchforsten?

Auf rund 100 Millionen Dokumente soll das Datendickicht des Internets bereits angewachsen sein. Um sich auf der Reise durch die immer unübersichtlicher werdenden Planeten World Wide Web oder Usenet dennoch zurechtzufinden, helfen Suchwerkzeuge dabei, Informationen zu einem bestimmten Thema ohne großen Umweg aufzuspüren: Kataloge, "echte" Suchmaschinen und neuerdings auch "intelligente Agenten" trennen automatisch die Spreu vom Weizen.

Programmierter Datenmüll

Kataloge ordnen eine selektive Anzahl von Seiten in thematische Kategorien, in die man sich immer tiefer hineinklickt. Die gezielte Recherche ist jedoch meist recht mühsam und nicht immer ergiebig: Von der Rubrik "Kunst und Kultur" über "Malerei" bis hin zur Suche durch das ganze deutsche "Yahoo!" führt der vermeintlich richtige Weg zu Pablo Picasso - gerade einmal zwei Links zu Online-Kunstgalerien werden angezeigt, vom Künstler selbst keine Spur.

Weit schneller und umfangreicher als Kataloge führen automatisierte Indizes, die "echten" Suchmaschinen, zur gesuchten Information. Regelmäßig durchstöbern sogenannte Robots auf eigene Faust das gesamte Internet und speisen die neu aufgespürten Inhalte in die Datenbanken der Suchmaschinen ein. In Sekundenschnelle vergleichen "AltaVista", "Lycos" oder "Fireball" die vom Anwender eingegebenen Begriffe mit den nunmehr indizierten Dokumenten und zeigen die aufgespürten Treffer am Bildschirm des Suchenden an. Jede Menge unbrauchbarer Datenmüll ist ohne menschliche Korrektur unvermeidbar.

Während die inhaltliche Pflege über die Qualität eines Kataloges entscheidet, ist für Suchmaschinen die Flexibiliät der Abfragesteuerung, die Eingrenzung der Recherche mit logischen Verknüpfungen wie "and" (und), "or" (oder), "not" (nicht) oder "near" (nahe) ein entscheidendes Kriterium.

In Amerika erfreuen sich seit etwa einem halben Jahr auch auf bestimmte Themen spezialisierte Internet-Suchmaschinen größter Beliebtheit. Weinliebhaber finden ihre bevorzugten Weine in "Find Your Wine!" (http://www.findyourwine.de) und können sogar die Preise der unterschiedlichen Angebote auf einfache Weise miteinander vergleichen. Auch in Deutschland fassen diese Suchwerkzeuge allmählich Fuß. Die Suchmaschine der saarländischen Landesregierung (http://webservice.saarland.de) erlaubt ihren Besuchern beispielsweise, gezielt Seiten von Saarland-bezogenen Artikeln zu finden.

Ebenfalls aus Amerika, aus den Forschungslabors für Künstliche Intelligenz, kommen die sogenannten intelligenten Agenten wie der "Web Researcher" von Autonomy (http://www.MicroBasic.com). Vor ihrem Aufbruch in das Netz mit dem Thema vertraut gemacht, lernen sie bei jeder Informationsquelle hinzu und verfeinern selbständig ihren ursprünglichen Auftrag.

Aus der Häufigkeit der Wörter und der Stellung im Satz wird bestimmt, welche Stichworte wichtig sind und in welchem Zusammenhang sie stehen. Nach Analyse mehrerer "Star Wars"-Dokumente erkennt der intelligente Agent beispielsweise selbständig, daß "Luke Skywalker" eine zentrale Rolle spielt und berücksichtigt diese neu gewonnene Erkenntnis bei seinem nächsten Streifzug durch die virtuellen Landschaften. Derzeit funktionieren diese Programme jedoch noch lange nicht so, wie die Forscher sich dies ursprünglich vorgestellt haben.

 
 
  Tabelle mit einer Übersicht über einige Suchmaschinen
Tabelle mit einer Übersicht über einige Kataloge
Altavistas Übersetzungsservice "Babelfisch"
 
 
 

  © 1998 Werner Pluta, Computer & Co; Mail: , Web: http://www.wpluta.de; 04/99 wp