Michael Schröpl: Bitte um praktische Tipps

Beitrag lesen

Hallo Irina,

  1. Moderne Suchmaschinen durchsuchen die ganze Text auf diese Wörter.

Die Suchmaschinen haben schon immer den ganzen Text durchsucht - nur
haben sie früher die <meta>-Tags für _wichtiger_ als den Text ange-
sehen. Das dürfte heute eher umgekehrt sein.

Also, dursucht Suchmaschine alle meine Seiten  oder nur index.html?
Ich habe nähmlich ca.10 Seiten, die einmitandere verbinden sind.

Suchmaschinen-Crawler verstehen HTML - wenn Du normale <a href="...">-
Verweise hast, dann liest der Crawler automatisch auch alle anderen
Seiten ein, die er finden kann (je mehr Seiten er kennt, um so mehr
und ggf. bessere Treffer kann die Suchmaschine ja liefern - Crawler
sind "neugierig" ;-). In diesem Fall reicht es, wenn er Deine Start-
seite einmal gefunden hat - den Rest sammelt er ganz alleine ein.

Du kannst ihm natürlich auch helfen, indem Du eine Seite mit Verweisen
auf alle Deine Seiten erzeugst (z. B. per Programm) und diese eine
Seite bei der Suchmaschine anmeldest. (Das wäre beispielsweise gut,
wenn Du "exotische" Verbindungen zwischen den Seiten hättest, etwa
per JavaScript geöffnete Fenster oder auch Frames.)
Ich selbst mache das so - wenn Deine Seiten aber zu großen Teilen
dynamisch generiert werden (PHP), wird das nicht ganz einfach werden.

Vielleich wäre richtig zu sagen, 10 Dateien?

Ja, genau.

Soll ich dann in jede Datei nur das schreiben, was in diese Datei
steht?

Ja - denn wenn in allen Seiten dasselbe stehen würde, wie sollte
die Suchmaschine dann erkennen, welche Deiner Seiten am besten zu
der gestellten Such-Anfrage paßt?

Und dann bekomme ich Probleme mit moderne Suchmaschinen, weil in
Dateien fast die ganze Text auf Russisch ist, nur paar deutsche
Wörter, und meine Landsleute hier in Deutschland werden z.B. in
Jahoo mit Begriff "russische forum" oder änliches (auf Deutsch)
suchen. Was kann dann damit machen ohne META-Tag?

Da sind in der Tat mehrere Probleme miteinander verknüpft.

Zunächst einmal kannst Du der Suchmaschine mit HTML mitteilen, welche
Sprache Deine Dokumente (oder sogar einzelne Teile davon!) verwendet:
   http://selfhtml.teamone.de/html/kopfdaten/meta.htm#sprache
Google als die derzeit bekannteste Suchmaschine bietet auf ihrer
deutschen Startseite eine Option an, nur "in deutschsprachigen Seiten"
zu suchen - und das ist für viele Suchende eine gute Idee.
Wenn Du also russische Seiten schreibst, dann gib dies in Deinen
Seiten an - dann werden sie von Leuten, die kein Russisch verstehen,
wahrscheinlich überhaupt nicht gefunden, aber von Leuten, die gezielt
nach russischen Seiten suchen, um so besser.
Wenn Du Deutsche Seiten schreibst, ist es entsprechend umgekehrt.

Dann kannst Du bei Deinen keywords auch beschreiben, zu welcher
Sprache sie gehören:
   http://selfhtml.teamone.de/html/kopfdaten/meta.htm#sprache

Der nächste Punkt ist, daß Du Deinen Seiten (oder wenigstens einige
davon) auch in _mehreren_ Sprachen (zum Beispiel Deutsch und Russisch)
anbieten kannst.
Jeder Browser enthält eine Einstellung, welche Sprachen sein Benutzer
bevorzugt lesen möchte; der Browser sendet diese Einstellung an Deinen
Server, und dieser kann herausfinden, ob er besser die deutsche oder
die russische Version senden soll.
Dazu mußt Du gar nichts programmieren - das kann der Webserver ganz
alleine:
    http://aktuell.de.selfhtml.org/artikel/server/alt-http/

Für Deine Startseite (/index.html) würde sich ein solcher Mechanismus
am ehesten anbieten - wobei Du dann in der deutschen Version ggf.
angeben kannst, daß nachfolgende Seiten nur noch in russisch sind
(oder umgekehrt, oder wie Deine Seiten eben funktionieren).
Im Extremfall könntest Du in der Tat _alle_ Seiten zweisprachig an-
bieten - und das umso leichter, wenn die Seiten von Deinen eigenen
Programmen generiert werden (dann ist es wahrscheinlich gar nicht
so viel Text, den Du übersetzen mußt).

Allerdings bringt diese Form der zweisprachigen Seiten gerade bei
Suchmaschinen ein Problem mit sich: Beide Versionen haben denselben
URL. Der Suchmaschinen-Crawler besucht Dich also und bekommt irgend
eine dieser beiden Versionen - die andere bekommt er nie. Und diese
eine Version wird er in seiner Datenbank aufnehmen - nur diese kann
also von der Suchmaschine gefunden werden.

Wenn Du also zweisprachige Seiten mit "Content Negotiation" verwenden
willst, dann wäre es gut, in jeder dieser Seiten wenigstens ein paar
wichtige Begriffe auch in der anderen Sprache zu verwenden, etwa bei
den Verweisen zu den wichtigsten anderen Seiten. Und in diesem Fall
wäre es sinnvoll, die beiden Sprachvarianten (deren Dateien sich
um genau eine zusätzliche Endung unterscheiden, index.html.de und
index.html.ru) mit der oben erwähnten Liste aller Dateien zusätzlich
(!) bei den Suchmaschinen anzumelden. Denn auch ein direkter Verweis
auf diese "Verhandlungsseiten" ist durchaus erlaubt - und als
Suchmaschinentreffer eine durchaus brauchbare Idee.

Selbst wenn Du nur eine einige Version anbietest, macht es Sinn, die
wichtigsten Begriffe in Deutsch und Russisch auf Deinen Seiten zu
verwenden, wenn Deine Zielgruppe eher beide Sprachen spricht - Du
gibst der Suchmaschine einfach mehr Chancen, Dich zu finden.

Und falls tatsächlich jemand nach den Begriffen in _beiden_ Sprachen
fragt, also gezielt nach einer zweisprachigen Seite sucht, werden
Deine Seiten mit dieser seltenen Kombination wahrscheinlich ganz
weit oben in der Trefferliste landen. Das wäre eben das Besondere
an Deinen Seiten, was es im Internet nur relativ selten gibt ...

Viele Grüße
      Michael