Von Suchmaschinen gefunden werden
Poldi
- php
0 Götz0 Poldi
0 Thorsten Olscha0 Sönke Tesch
Hallo!
Ich weiß, das Thema ist schon etwas abgegriffen, aber ich habe da so meine Problemchen mit den Suchmaschinen. Es ist ja bekannt, daß dynamische Seiten z.B. mit PHP und MySQL, bei denen jeder Link einige Parameter enthält von Suchmaschinen verschmäht werden. Google durchsucht solche Seiten und von Google wird meine Seite auch gefunden. Von Altavista, Hotbot & Co aber nicht.
Nun habe ich mein Redaktionssystem erweitert und einen Ordner "static_pages" angelegt, in dem beim Speichern jede Seite, die ich editiert habe als reines HTML abgelegt wird. Es gibt in diesem Verzeichnis auch eine Index.html, in der alle Pages, welche auch in der Menüleiste auftauchen mit Links verzeichnet sind, ohne Parameter. Suchmaschinenfreundlicher geht es ja kaum noch.
Dennoch: Ich habe static_pages/index.html bei einigen Suchmaschinen angemeldet. Auch habe ich von der index.html, welche beim Aufruf des Domainnamens erscheint einen link auf static_pages gelegt. Bis jetzt war noch nicht mal ein Spider in dem Verzeichnis. Was läuft falsch?
Kann es sein, daß ein java-script, welches um die Seite herum die Titelleiste und die Navigationsleiste aufbaut von Suchmaschinen als Ausschließungsgrund angesehen wird ..?
Für Tips bzw. eine angeregte Diskussion über dieses Thema (das interessiert andere sicher auch brennend) wäre ich sehr dankbar!
Viele Grüße
Poldi.
Hallo Poldi!
Das JavaScript kann schon die Suchmaschine durcheinanderbringen, aber ich nehme nicht an, daß es daran liegt, weil sonst dürften die Suchmaschinen ja quasi gar keine Seiten finden, so oft wie JS eingesetzt wird ...
Hast du schon eine robots.txt angelegt?
Dies könnte sonst evtl. etwas bringen, wenn du jetzt nicht weißt, was robots.txt ist, dann schau am besten bei den Feature-Artikeln, da gibts imho was dazu.
MfG
Götz
Hi!
Nein, eine robots.txt habe ich bisher nicht angelegt. Ich weiß schon was das ist, dachte aber eher, daß eine robots.txt vor allem dann nötig ist, wenn man gewisse bereiche ausschließen möchte.
In der Zugriffsstatistik habe ich auch keinen Eintrag gefunden, dem man entnehmen könnte, daß irgendjemand versucht hat, auf eine nicht existierende robots.txt zuzugreifen. Vielleicht liegt es doch an etwas anderem ..?
Grüße und danke schonmal für den Tip
Poldi.
Hallo Poldi!
Das Javascript kann durchaus der Grund sein.
Wie sieht es denn aus?
Daneben kann es natürlich auch sein, dass die Seiten einfach noch nicht auf der ToDo Liste der Spider "drann" waren. (was ich vermute)
Hast du denn die Spider in deinen log-Files gefunden?
gruesse
thorsten
Ich weiß, das Thema ist schon etwas abgegriffen, aber ich habe da so meine Problemchen mit den Suchmaschinen. Es ist ja bekannt, daß dynamische Seiten z.B. mit PHP und MySQL, bei denen jeder Link einige Parameter enthält von Suchmaschinen verschmäht werden.
Das muß nicht sein (die Parameter meine ich). Überhaupt ist es nicht nur für Suchmaschineneinträge besser, sondern auch benutzerfreundlicher, wenn man statt index.php?menu=4546;hintergrund=879874;artikel=18082002 eine leicht merkbare Adresstruktur wie artikel/15.8.2002 angibt. Das Geheimnis dahinter lautet in aller Regel mod_rewrite. Wie ich gerade vor zwei Tagen erfahren durfte, gibt's auch eine praktische Einrichtung namens PATH_INFO.
mod_rewrite wird unter http://httpd.apache.org/docs/mod/mod_rewrite.html beschrieben, der Verlauf meines etwas unfreiwilligen und vor allen Dingen unerwarteten Kennenlernens mit PATH_INFO lässt sich unter http://forum.de.selfhtml.org/archiv/2002/8/20623/ bewundern.
Gruß,
soenk.e