Stefan Muenz: Ergänzung

Beitrag lesen

Hallo Stefan

Abgesehen von den Parsing-Problemee, ueber die Stefan M. ja schon viel geschrieben hat, sind die meisten HTML-Tags in der Stopwortliste der Suchmaschinen (wenn nicht sogar alle). Die werden ignoriert, nach denen kann man nicht suchen, weil sie zu oft vorkommen.

Es gibt da ein Missverstaendnis, weil hier im Forum Umschreibungen interpretiert werden. Ich meinte so was wie &_gt; und &_lt; (ohne den Unterstrich ;-)
Aber dann werde ich eben p, title, applet und wie sie alle heissen einfach so notieren, ohne spitze Klammern.

Und wie steht's mit anderen Sonderzeichen?
Beispiel Attribute:
<meta name="keywords" content="align=">
Geht so was?
Beispiel JavaScript-Methoden:
<meta name="keywords" content="window.open(),open()">
Geht so was?
Beispiel Perl-Variablen:
<meta name="keywords" content="$_,$'">
Geht so was?

Auch auf Entities in den Metas würde ich verzichten, manche Robots interpretieren sie, andere zeigen die Codierung. Hin und wieder ein o statt nem ö ist leichter zu lesen als ausgeschriebene Entities mitten im Wort.

Hmm, aber was ist denn, wenn der Anwender nach Düsenflugzeug sucht und nicht nach Duesenflugzeug oder Dusenflugzeug? Ich weiss, fuer die US-Robots sind das "Ferner-Liefen-Probleme", aber wenn sie "international" suchen, dann sollten sie zumindest iso-8859-1 plus HTML 3.2-Codierungen kennen.

Ich stelle diese Fragen auch deshalb mal, weil ich sie selber oft gestellt bekomme und mich eigentlich immer unbestimmt herausrede ("tja, die Robots sind da sehr unterschiedlich").

viele Gruesse
  Stefan Muenz