Cheatah: Frage zu robots.txt und sitemap

Beitrag lesen

Hi,

Da war ich nicht genau genug, ich meinte die Sitemap für Google,

ah so.

ich würde trotzdem gerne wissen, ob der Link oder der Pfad, also Verzeichnisstruktur angegeben werden muss?!

Genau wie jeder und alles andere - von Dir persönlich abgesehen - besucht auch der Googlebot Deine Site per HTTP. Ergo existieren keine Dateien, ergo kann ein Dateipfad unter Garantie nicht die geringste Relevanz haben. Genau wie jeden und alles andere interessiert Google nur die URL.

Ist dies die URL zur Ressource, Tim Schumacher[1]?
Ich bin nicht Tim :) Die Datei liegt dort, aber über einen Link, käme man nur über www.domainname.de/seite.php?cnt=datei.htm ran

Siehe Gunnars Antwort. Mache Dir bewusst, dass Du hier mit fremder Leute Eigentum hantierst!

Wenn ich hier nun disallow: /*? schreibe
Dann bittest Du Robots, die URL "http://www.domain.de/*?" nicht anzufordern.
Also wird diese Seite nicht indeziert, richtig?!

Sofern der Robot sich daran hält, ja. Übrigens halte ich es nur bedingt für sinnvoll, die URI "*" im Root des Servers anzubieten, zudem mit einem existierenden, aber leeren Query-String.

Hat dieser externe Link die URL "http://www.domain.de/*?"?
Ne, der würde z.B. www.fremdedomain.de/fremde_seite.php?cnt=fremde_datei.htm lauten

Na also, dann ist sie nicht Teil Deiner Site, selbst wenn Du fremdedomain.de noch registrierst und darunter Inhalte anbietest.

Cheatah

--
X-Self-Code: sh:( fo:} ch:~ rl:° br:> n4:& ie:% mo:) va:) de:] zu:) fl:{ ss:) ls:~ js:|
X-Self-Code-Url: http://emmanuel.dammerer.at/selfcode.html
X-Will-Answer-Email: No
X-Please-Search-Archive-First: Absolutely Yes