Passwortschutz und Google
Jan
- programmiertechnik
0 Rafael0 Johannes Zeller2 Daniel Thoma
Guten Tag,
die meisten Inhalte auf meiner Website stehen unter Passwortschutz mit .htaccess und werden nur Besuchern zugänglich gemacht, die sich registrieren. Gibt es eine Möglichkeit, den Google-Spider dazu zu bewegen, auch die geschützten Inhalte zu indizieren? Z.B. über einen automatischen Log-In über die IP-Adresse?
Das Problem ist also genau umgekehrt zu diversen Beiträgen, die ich hier im Forum gefunden habe, wo Seitenbetreiber bestimmte Inhalte vor Google schützen wollten...
Vielen Dank,
Jan
Hallo,
diese Vorgehen ist seitens Google untersagt und kann zum Ausschluss deiner Domain aus den Suchergebnissen führen.
Grüße.
Hallo Jan,
die meisten Inhalte auf meiner Website stehen unter Passwortschutz mit .htaccess und werden nur Besuchern zugänglich gemacht, die sich registrieren. Gibt es eine Möglichkeit, den Google-Spider dazu zu bewegen, auch die geschützten Inhalte zu indizieren? Z.B. über einen automatischen Log-In über die IP-Adresse?
Zu der Problematik gibt es bereits einen Thread, allerdings aus der Sicht eines Suchenden https://forum.selfhtml.org/?t=159767&m=1039159. Obwohl es technisch möglich ist, rate ich dir, es zu unterlassen. Du verstößt damit nicht nur gegen die Google-Richtlinien, was zu einem Ausschluss aus dem Google-Index führt, sondern stößt auch viele potentielle Besucher vor den Kopf.
Warum stehen deine Inhalte überhaupt unter Passwortschutz, wenn du sie trotzdem öffentlich in Google gelistet haben willst?
Schöne Grüße,
Johannes
Hallo Jan,
die meisten Inhalte auf meiner Website stehen unter Passwortschutz mit .htaccess und werden nur Besuchern zugänglich gemacht, die sich registrieren. Gibt es eine Möglichkeit, den Google-Spider dazu zu bewegen, auch die geschützten Inhalte zu indizieren? Z.B. über einen automatischen Log-In über die IP-Adresse?
Es geht mittels des User-Agent-Headers. Da steht irgendwas von Googlebot drin. Allein mittels Serverkonfiguration wird sich das aber vermutlich nicht erreichen lassen. Dieses Vorgehen verstößt aber gegen die Google-Richtlinien. Außerdem kann sich natürlich jeder als Google-Bot ausgeben, wenn er das durchschaut.
Warum willst Du das denn tun?
Weiter unten gibt es eine längere Diskussion darüber, was von solchen Strategien zu halten ist.
Einige verteidigen das vermeintliche Recht des Betreibers, so etwas zu tun. Im großen und ganzen wird es aber zumindest für nicht wünschenswert und auch für den Betreiber als nachteilig gehalten, da die Vorgehensweise Besucher abschreckt.
Grüße
Daniel
Vielen Dank euch allen - und sorry! Ich habe nicht richtig nachgedacht. Es ging mir um die Option, Google als Suche in die eigene HP einzubauen, weil mein derzeitiger Suchdienst nur bis max. 8.000 Dateien spidert und ich gut das Doppelte an Material auf Sendung habe. Dass Google dann die gleichen Suchergebnisse bei einer "regulären" Websuche darstellt, habe ich far nicht bedacht...
Schöne Grüße,
Jan
Hallo Jan,
Vielen Dank euch allen - und sorry! Ich habe nicht richtig nachgedacht. Es ging mir um die Option, Google als Suche in die eigene HP einzubauen, weil mein derzeitiger Suchdienst nur bis max. 8.000 Dateien spidert und ich gut das Doppelte an Material auf Sendung habe.
Es gibt bestimmt auch Suchmaschinen für die eigenen Seite, die mehr Dateien verwalten können. Vielleicht lohnt sich für dich eine Suche in diese Richtung.
Schöne Grüße,
Johannes
Hallo Daniel Thoma,
Dieses Vorgehen verstößt aber gegen die Google-Richtlinien.
Auch Johannes benennt dies als Verstoß. Zu diesem Thema viel mir spontan folgendes ein, was mir kürzlich mal passiert ist. Mit dem Suchbegriff*: 01 BHM_O-301 wird google exakt einmal fündig und listet ein *PDF*. Möchte man sich dieses wiederum ansehen, wird man vom Springer-Verlag auf eine Seite geleitet, die diesen Artikel nur kostenpflichtig zugänglich macht. Das scheint bei allem Artikeln dort so zu sein. Ist dies nicht das selbe, was Jan zunächst wollte?
Mit freundlichem Gruß
Micha
(*)Mein Suchbegriff enthielt seinerzeit natürlich Wörter, die im Dokument auch vorkamen und bei google in der Vorschau auch hervorgehoben wurden.
Hallo Micha,
Ist dies nicht das selbe, was Jan zunächst wollte?
Doch, Springerlink ist auch eine ganz ätzende Angelegenheit und die Wissenschaftszeitungsverlage sollten sowieso besser mal sterben gehen ;-)
Mit etwas Glück findet man solche Papers auch irgendwo noch frei. http://citeseer.ist.psu.edu/ ist oft eine ganz gute Quelle.
In der Wissenschaftssuche (http://scholar.google.com) finde ich solche Treffer noch ok. Man will ja durchaus auch nicht frei erhältliche Quellen finden, vor allem wenn man über die Universität o.ä. auf die Quellen Zugang hat. Gut finde ich das da aber schon gar nicht, und etliche Wissenschaftler sehen das mittlerweile wohl auch so.
Grüße
Daniel