ICD
Interfacing Cultural Data

Suchmaschinen

Suchmaschinen im WWW Orakel der Moderne ! Die Standards und Strukturen, auf dem das Internet basiert, sind nicht auf eine zielgerechte Recherche entwickelt worden. Die wichtigsten Probleme hierbei sind die fehlende Organisations-Struckturierung. • Es ist kein Zentrale Koordination und Kontrolle vorhanden • Diverse Arten der Veröffentlichungen • Lagerung parallel nebeneinander • Dynamik wirkt erschwerend hinzu • Datenverluste oder -verschiebungen 1990 An der McGill Universität in Montreal wurde Archie entwickelt. Archie soll vorhandene Informationen über FTP-Dateien auf anonymous-FTP-Servern automatisch sammeln, sortieren und den Benutzern aufbereitet zur Verfügung stellen. Anfänglich konnte Archie nur über Telnet abgefragt werden, heute werden Formularabfragen über WWW unterstützt. 1991 An der University of Minessota wurde Gopher entickelt, um grosse Datenmengen über eine menügesteuerte Oberfläche abzufragen. Dieses Tool erhielt den Namen Veronica

(Very Easy Rodent-Oriented Netwide Index to Computerized Archives) und ist vergleichbar mit den heutigen Suchmaschinen.

1991 Jughead ist ein ähnliches Tool wie Veronica. Es durchsucht ebenfalls Gopher-Verzeichnisse, aber jeweils nur auf einem Server.

Brewster Kahle stellt WAIS (Wide Area Information Server) vor, der es ermöglicht, große Mengen an Daten zu indizieren und damit Suchabfragen zugänglich zu machen. 1993 Der erste Such-Robot für das gerade neu entstehende WWW war der World Wide Web Wanderer der von dem MIT-Studenten Mathew Gray im Frühjahr 1993 programmiert wurde. Ursprünglich zählte The Wanderer nur WWW-Server. Erstes Ergebnis: 100 Server sind am Netz. Aber einige Monate später fügte Michael L. Maudlin ein Program namens "Wandex" hinzu, um die gesammelten Daten durchsuchen zu können. Matthew Grays "Wanderer" zählt im Juni 130 Web-Sites, im Dezember über 620.The Wanderer durchsuchte und katalogisierte von Juni 1993 bis Januar 1996 zweimal pro Jahr das Netz.

1993 Im Oktober wurde der Archie-Like Indexing of the Web (Aliweb) entwickelt. Die Betreiber von WWW-Servern müssen eine Beschreibung ihres Service in einem Standard-Format in einer Datei ablegen. Die Adresse dieser Datei wird Aliweb mitgeteilt. Aus diesen Informationen generiert Aliweb einen durchsuchbaren Index.

Im Dezember wurden die Suchmaschinen Jumpstation, WordWideWeb Worm und RBSE Spider online gestellt. Die beiden erstgenannten waren Robots, welche WWW-Seiten nach Title und URL indizierten. Der RBSE Spider war die ersten Suchmaschine, die die Trefferlisten nach einem Ranking- System sortiert anzeigte. Alle drei Suchmaschinen haben heute ihren Dienst eingestellt. 1994 Im April wurde die Suchmaschine WebCrawlwr online gestellt, die ebenfalls über eine nach Ranking sortierte Trefferliste verfügte. WebCrawler wurde 1995 an AOL verkauft und 1996 von AOL an Excite.

Im Mai begann Michael Mauldins mit der Arbeit an der Suchmaschine Lycos, die dann im Juli online gestellt wurde. Neu an dieser Suchmaschine war, dass nicht nur die Worthäufigkeit innerhalb einer Seite sondern auch die Nähe von Suchbegriffen untereinandereinander ausgewertet wurde.

David Filo und Jerry Yang, Studierende des Bereichs "Electrical Engineering" an der Stanford University, starten eine Sammlung ihrer besten Web-Adressen unter dem Namen Yahoo! auf zwei Servern. 1995 In diesem Jahr sind die ersten Suchmaschinen, die nicht von Universitäten, sondern von kommerzielen Firmen entwickelt wurden, im WWW: - Infoseek - Architext - Alta Vista Im Oktober ändert Architext seinen Namen auf excite. 1996 1996 wird die Inktomi Corp. gegründet. Die gleichnamige Suchmaschine wird zur Grundlage von Hotbot und anderen Search Sites. Der Name stammt aus einer Legende der Lakota-Indianer über eine kleine Spinne, die schlauer ist, als ihre größeren Artgenossen. Suchmaschinen Abacho ABADOOR Acoon Aladin Alltheweb Alluna AltaVista Amadillo AOL NET Find

Blitzsuche BRITANNICA Coolibii Crawler

Direct Hit DisInformation

Der Prozess der Datenbankerstellung und abfrage wird in mehrere Teileschritte zerlegt, die von getrennten Subsystemen abgearbeitet werden:

• Identifizieren und Lokalisieren neuer Dokumente, die noch nicht erfasst sind • Herunterladen dieser Dokumente • regelmäßige Kontrolle der bereits erfassten Dokumente auf mögliche Änderungen • Herunterladen geänderter Dokumente • Analyse und Indexierung der Dokumente • Aktualisierung der Datenbank • Suchanfragen Ranking entgegennehmen, analysieren und abarbeiten • Standort des Suchbegriffe in der Site • Anzahl des Suchbegriffes im >head< • Anzahl des Suchbegriffes in der Site (je öfters er vorkommt desto wichtiger scheint er) • Beliebtheit der Seite (wieviele Links führen auf diese Seite)

! Hierarchisierung des Internets ! Grundsätzlich können 4 Haupttypen von Suchmaschinen unterschieden werden:

• Kataloge • Suchmaschinen oder Suchindices • Metasuchmaschinen • Spezialsuchmaschinen

Das effektive Ergebnis einer Suchanfrage hängt oft von der Wahl der richtigen Suchmaschine ab. Nur wenn man weiß, nach welchem Prinzip der gewählte Suchdienst arbeitet, kann eine effektive Suche erfolgen. Kataloge sind nach Kategorien hierarchisch gegliederte Linksammlungen. Die Kategorien werden redaktionell erstellt. Die Navigation durch Kataloge kann durch Anklicken der Hauptkategorien und danach der Unterkategorien erfolgen.

Oft wird zusätzlich noch eine Volltextsuche angeboten, über die der Datenbestand des Katalogs durchsucht werden kann. Wird kein Treffer im Katalogbestand gefunden, erfolgt bei einigen Katalogen die Weitergabe des Suchwortes an eine "normale" Suchmaschine, welche dann Treffer aus dem eigenen Index anzeigt.

Kataloge eigenen sich besonders, um ein umfassenden Ergebniss zu einem Thema oder einem Sachgebiet zu erhalten.

Als Beispiel soll die Hauptkategorie "Nachrichten und Medien" von Yahoo dienen, die in weitere Kategorien und Unterkategorien aufgeteilt ist. Die Anzahl der unter der Kategorie zu findenden Links steht in Klammern neben der Kategorie-/Unterkategorie. Alternativ ist eine Stichwortsuche möglich. 7 Suchmaschinen Fazit : Nicht immer wird auch das Gefunden Was wirklich gesucht wurde. Folge : Andere Suchmaschine als google benutzen hilft auch manchmal weiter : ) • auch mal ein blick auf die zweite Seite der Suchergebnisse werfen • Suchbegriffe genauer definieren durch Operatoren einschränken Treu nach der Bibel „Suchet so werdet ihr finden“

Viel Spaß beim zukünftigen Suchen Im World Wide Web


This is a Manila Site

 

This site is using the MinimalWhite theme.