Stefan R. Mueller: Warum keine Sonderzeichen fuer Suchmaschinen

Beitrag lesen

Hmm, aber was ist denn, wenn der Anwender nach Düsenflugzeug sucht und nicht nach Duesenflugzeug oder Dusenflugzeug? Ich weiss, fuer die US-Robots sind das "Ferner-Liefen-Probleme", aber wenn sie "international" suchen, dann sollten sie zumindest iso-8859-1 plus HTML 3.2-Codierungen kennen.

Ich stelle diese Fragen auch deshalb mal, weil ich sie selber oft gestellt bekomme und mich eigentlich immer unbestimmt herausrede ("tja, die Robots sind da sehr unterschiedlich").

viele Gruesse
  Stefan Muenz

Hi Stefan,
sorry, dass ich erst jetzt dazu etwas sage.

Es ist keine Ausrede, dass die robots, genauer deren Parsing
unterschiedlich ist, sondern eben Tatsache.

Bei den Duesenflugzeugen kann man sicherlich ein paar Ausnahmen
machen, wie etwa bei uns:
http://www.blinde-kuh.de/hilfe/eingabe.html

Allerdings hat die Fehlertoleranz auch ihre Grenzen, man findet dann
eben auch "aktüll" wenn da eigentlich "aktuell" steht, und leider,
ist jede Form der Fehlertoleranz recht aufwendig und servergefaehrdent,
es dauert einfach zu lange, um richtig intelligent zu wirken.

Wir haben zwar solche Dinge drin, die aus "Märchen" das
selbe machen wie "Maerchen" oder gar "Märchen", aber auch nur
deshalb, weil die Eingabe im nichtdeutschsprachigen Raum eigen-
artige Sonderzeichen hervorbringen kann, und auf mancher Tastatur
eben weit und breit kein "Ä" zu finden ist.

Die meisten Suchmaschinen erlauben keine Suche nach Zeichen,
die selbst bestandteil der logischen Verknüpfung sein koennten,
etwa bei regular-expressions von Perl. Dementsprechend ist
die Frage, welche sachen die Suchmaschinen wohl koennten,
die wichtigere. Gib in deinen Lieblingssuchmaschinen einfach
mal solche Ausdruecke ein, die aus Javascript, Perl oder sonstwas
stammen. Wirst sehen, die meisten lassen die Anfrage nicht zu,
so macht es bei denen auch keinen Sinn, da was an den Meta-
Infos herumzufriemeln.

Noch ein Wort zur Frage, warum sind die Suchmaschinen so,
bzw warum koennen die nicht alle das selbe, zumindest die
grundlegensten Sachen.

Zwei Punkte darf man dabei nicht vergessen. Erstens versuchen
die Suchmaschinen in erster Linie auf Namen zu regieren, also auf
nichtlogische Ausdruecke, seinen es Verben, Substantive oder
Eigennamen, etc. Zweitens gibt es keinerlei Richtlinien oder Absprachen
an denen sich Betreiber von Suchmaschinen halten muessten, die
wenigstens setzen sich vielleicht mal zu irgendwas zusammen. Es
gibt also kein Search3Consortium oder aehnliches. Nichteeinmal
verbindliche Massstaebe fuer die MetaTags oder das Ranking sind
vorhanden.

Ein ganz grosses Problem ist noch, dass es keinerlei Verhandlungs-
moeglichkeiten derzeit gibt, spezialisierte Datenbestaende optimal
zu indexieren. Alles ist auf allgemeine Suchmaschinen ausgerichtet,
also eher oberflaechlich.

Natuerlich werden einige Betreiber einfach irgendwann Realitaeten
schaffen, wovon PICs z.b.: einer ist, und DublinCore ein anderer.

Bis das alles mal zufriedenstellend ist, bleibt solchen Projekten wie
dem SelfHTML gar nichts anderes uebrig, als selbst eine Suchmaschine
im Netz zu haben, was ja auch schon der Fall ist, die eben solche
Optionen erlaubt. Aehnlich waere das bei anderen Themengleichen
Websites. Schmeist man die Datenbasen der verschiedensten Projekte
zum Thema HTML, Perl und was weiss ich zusammen, hat man eine
recht komnpetente Suchmaschine. Dieser Weg scheint mir sinniger,
als in den allgemeinen Suchmaschinen soviel herumzufriemeln und zu
tolerieren, bis sie am Ende gar nicht mehgr differenzieren koennen.

Allgemeine Suchmaschinen sollten beim Suchwort einfach nur
die entsprechenden spezialisierten Suchmaschinen mitauflisten,
damit man sich differenzierter auf die Suche machen kann. Nach
"P" oder "HTML and P" zu suchen, und damit 100% erfolgreich zu
sein, ist zwar vielleicht noch moeglich, aber meiner Meinung nach
nicht Sinn der allgemeinen Suchmaschinen.

Damit weiche ich hoffentlich nicht deiner Frage aus.

Schoene Gruesse

Stefan R. Mueller