andReas: Frage zur Suchmaschinentechnik (Google)

Hallo zusammen,

was ich wissen will ist wieso Google nicht alle Seiten meiner Homepage durchsucht.  Es ist ja so dass man mit Google eine Adresse durchsuchen kann (mit dem Parameter "site:<seite>").

Google scheint aber kategorisch alle links mit parametern im Query String zu ignorieren - Frage: Normal?

Also auf index.php findet er noch was man sucht, aber auf index.php?nav=news findet er nix, (obwohl in der index.php ja ein Link zu index?nav=news existiert..)

Wenn jemand da mehr weiß wäre ich ihm sehr verbunden wenn er sein Wissen mit mir teilen könnte :)

vieln Dank,

andReas

  1. Hallo andReas,

    Google scheint aber kategorisch alle links mit parametern im Query String zu
    ignorieren - Frage: Normal?

    Ja. Google indiziert nur URLs, die einen statischen Character zu haben scheinen. Dazu
    gehoert unter anderem, dass die URL keinen Query-String haben sollte, und auch das
    X-Powered-By: PHP sollte man unterdruecken.

    Grüße,
     CK

    --
    No Shoes On Mat!
    http://wwwtech.de/
    1. vielen Dank für die Antwort, das war mir bisher nicht bekannt.

      Das gefällt mir garnicht, wollte mir nämlich diese Suchfunktion zu Nutze machen um damit einen einfachen seiteninternen Suchmeschanismus zu erstellen, da aber meine komplette Seite auf Query-String Variabeln aufbaut kann ich das vergessen.

      Kann mir wer ein freies Suchscript in php empfehlen?

      1. Hallo,

        Das gefällt mir garnicht, wollte mir nämlich diese Suchfunktion zu Nutze machen um damit einen einfachen seiteninternen Suchmeschanismus zu erstellen, da aber meine komplette Seite auf Query-String Variabeln aufbaut kann ich das vergessen.

        mod_rewrite ist dein Freund. Meine Weblogseiten sehen eigentlich auch so aus:

        /weblog/archiv.php?jahr=2004&monat=april&titel=obstsalat

        und werden dank mod_rewrite zu:

        /weblog/2004/april/obstsalat/

        welches von allen Suchmaschinen anstandslos gefressen wird. Eigentlich könnte man auch herne noch den letzten Slash weglassen.

        Kann mir wer ein freies Suchscript in php empfehlen?

        Kommt darauf an wie du deine Inhalte verwaltest. Es ist ein anderes Vorgehen nötig wenn sie alle in einer Datenbank sind, ein anderes wenn sie alle in .txt, .html oder gar .php Dateien sind.

        Grüße
        Jeena Paradies

        --
        Trauriger Mensch den ich bemitleide
        http://jeenaparadies.de/weblog/2004/september/trauriger-mensch/
        SELFTreffen in Dresden - Ein Bericht
        http://community.de.selfhtml.org/treffen/2004/dresden/
    2. Hallo Christian!

      Ja. Google indiziert nur URLs, die einen statischen Character zu haben scheinen. Dazu
      gehoert unter anderem, dass die URL keinen Query-String haben sollte, [...]

      Also, konsequent ist Google damit aber auf jeden Fall nicht.
      Denn auch einige Seiten von mir unterscheiden sich nur durch den Querystring, und da hat Google die meisten auch im Index.

      MfG
      Götz

      --
      Losung für Dienstag, 21. September 2004
      Wohl dem Volk, dessen Gott der Herr ist, dem Volk, das er zum Erbe erwählt hat! (Psalm 33,12)
      Wisst ihr nicht, dass die Ungerechten das Reich Gottes nicht ererben werden? Lasst euch nicht irreführen! (1. Korinther 6,9)
      (http://www.losungen.de/heute.php3)
      1. Hallo Götz,

        Ja. Google indiziert nur URLs, die einen statischen Character zu haben scheinen. Dazu
        gehoert unter anderem, dass die URL keinen Query-String haben sollte, [...]

        Also, konsequent ist Google damit aber auf jeden Fall nicht.
        Denn auch einige Seiten von mir unterscheiden sich nur durch den Querystring, und da
        hat Google die meisten auch im Index.

        Dann hast du sie von einer statischen Seite aus verlinkt. Das gibt der referenzierten Seite
        auch wiederum einen statischen Character.

        Grüße,
         CK

        --
        Descartes sagte: 'Ich denke, also bin ich.' Ich hingegen sage: 'Ich denke nicht, also bin ich.'
        http://wwwtech.de/
        1. Hallo Christian Kruse!

          Dann hast du sie von einer statischen Seite aus verlinkt. Das gibt der referenzierten Seite
          auch wiederum einen statischen Character.

          Nunja, die Startseite heißt index.php, und gibt ohne Parameter eben die Startseite aus, wie es ja so üblich ist.
          Das kann natürlich dieser "statische Charakter" sein, wobei auch Unterseiten aus der 2. Ebene Indiziert sind, und auf die wird auf der index.php noch nicht verwiesen.
          Ich wage zu behaupten, daß Google inzwischen auch Querystrings anstandslos frißt (vielleicht ja nur bis zu einer gewissen Länge oder so).

          MfG
          Götz

          --
          Losung für Dienstag, 21. September 2004
          Wohl dem Volk, dessen Gott der Herr ist, dem Volk, das er zum Erbe erwählt hat! (Psalm 33,12)
          Wisst ihr nicht, dass die Ungerechten das Reich Gottes nicht ererben werden? Lasst euch nicht irreführen! (1. Korinther 6,9)
          (http://www.losungen.de/heute.php3)
          1. Hallo Götz,

            Dann hast du sie von einer statischen Seite aus verlinkt. Das gibt der referenzierten
            Seite auch wiederum einen statischen Character.

            Nunja, die Startseite heißt index.php, und gibt ohne Parameter eben die Startseite aus,
            wie es ja so üblich ist.

            Ich vermute eher, du hast die URL mal irgendwo verlinkt -- z. B. hier.

            Das kann natürlich dieser "statische Charakter" sein, wobei auch Unterseiten aus der 2.
            Ebene Indiziert sind, und auf die wird auf der index.php noch nicht verwiesen.

            Nein, aber auf den Folgeseiten. Das pflanzt sich doch rekursiv fort. Dadurch, das Seite 1
            einen statischen Character hat, hat die Unterseite, die auf Seite 1 verlinkt ist, auch
            einen und die Unterunterseite, die auf der Unterseite verlinkt ist, auch. Und so weiter.

            Grüße,
             CK

            --
            Willst du die Freuden dieser Welt geniessen, so musst du auch ihr Leid erdulden.
            http://wwwtech.de/
            1. Hallo Christian!

              Ich vermute eher, du hast die URL mal irgendwo verlinkt -- z. B. hier.

              Es zeigen schon einige Links auf diese Seiten, das ist ja normal ;)

              Nein, aber auf den Folgeseiten. Das pflanzt sich doch rekursiv fort.

              Ja ok, aber dann gibts doch eh eigentlich nie ein Problem, oder?
              Denn auf jede Seite wird irgendwo verwiesen, und ein externer Verweis reicht ja prinzipiell, um die ganze Site in den Index zu bekommen.

              MfG
              Götz

              --
              Losung für Dienstag, 21. September 2004
              Wohl dem Volk, dessen Gott der Herr ist, dem Volk, das er zum Erbe erwählt hat! (Psalm 33,12)
              Wisst ihr nicht, dass die Ungerechten das Reich Gottes nicht ererben werden? Lasst euch nicht irreführen! (1. Korinther 6,9)
              (http://www.losungen.de/heute.php3)
              1. Hallo Götz,

                Nein, aber auf den Folgeseiten. Das pflanzt sich doch rekursiv fort.

                Ja ok, aber dann gibts doch eh eigentlich nie ein Problem, oder?

                Ausser man hat keinen Link von einer statisch anmutenden Seite ;-)

                Grüße,
                 CK

                --
                Es gibt keinen Ort, wo der Geist zu finden waere. Er ist wie die Fussspuren der Voegel am Himmel.
                http://wwwtech.de/
                1. Hallo Christian!

                  Ausser man hat keinen Link von einer statisch anmutenden Seite ;-)

                  Dann macht man sich eben einen, wie man einen Link setzt sollte man ja wissen, wenn man Seiten mit Querystring baut ;)
                  (und außerdem, wenn man sich bei Google "anmeldet", dann zählt das doch bestimmt auch quasi wie ein externer Link?!)

                  MfG
                  Götz

                  --
                  Losung für Dienstag, 21. September 2004
                  Wohl dem Volk, dessen Gott der Herr ist, dem Volk, das er zum Erbe erwählt hat! (Psalm 33,12)
                  Wisst ihr nicht, dass die Ungerechten das Reich Gottes nicht ererben werden? Lasst euch nicht irreführen! (1. Korinther 6,9)
                  (http://www.losungen.de/heute.php3)
    3. Hallo CK,

      X-Powered-By: PHP sollte man unterdruecken.

      Was meinst Du damit?
      das man .php seiten lieber .html nennen sollte und Sie durch den Parser jagen sollte?

      TomIRL

      1. Hallo TomIRL2,

        X-Powered-By: PHP sollte man unterdruecken.

        Was meinst Du damit?
        das man .php seiten lieber .html nennen sollte und Sie durch den Parser jagen sollte?

        PHP schickt diesen Header mit, sofern das nicht unterdrueckt wird. Bei Odin sieht der z.
        B. so aus:

        X-Powered-By: PHP/4.3.8

        Ob Google auch nach Dateiendungen guckt, weiss ich nicht.

        Grüße,
         CK

        --
        Wenn auf Erden alle das Schoene als schoen erkennen, so ist dadurch schon das Haessliche bestimmt.
        http://wwwtech.de/
        1. Hallo CK,

          PHP schickt diesen Header mit, sofern das nicht unterdrueckt wird. Bei Odin sieht der z.
          B. so aus:

          X-Powered-By: PHP/4.3.8

          Hm und wie macht man das am geschicktesten wenn man wie ich einen normalen Doaminaccount bei 1und1 hat?
          Weil egal was ich Parse, der Header dürfte gleich bleiben.

          ToMIRL

          1. hi,

            X-Powered-By: PHP/4.3.8

            Hm und wie macht man das am geschicktesten wenn man wie ich einen normalen Doaminaccount bei 1und1 hat?

            du fragst den support, ob sie bereit wären, dir zu liebe die option expose_php zu deaktivieren (kann nur in php.ini oder httpd.conf gemacht werden).
            http://www.php.net/manual/de/ini.sect.language-options.php

            gruß,
            wahsaga

            --
            "Look, that's why there's rules, understand? So that you _think_ before you break 'em."
            1. du fragst den support, ob sie bereit wären, dir zu liebe die option expose_php zu deaktivieren (kann nur in php.ini oder httpd.conf gemacht werden).
              http://www.php.net/manual/de/ini.sect.language-options.php

              :-)Na die werden sich freuen...
              Also keine Chance...

    4. Hallo Christian!

      Google scheint aber kategorisch alle links mit parametern im Query String zu
      ignorieren - Frage: Normal?

      Ja. Google indiziert nur URLs, die einen statischen Character zu haben scheinen. Dazu

      Das ist ein weit verbreiteter Unsinn!
      Google indiziert eigentlich alles, was ihm in den Weg kommt.
      Das Problem ist vielmehr, daß Session-Ids usw. nicht gerade zu einem hohen Rank-Wert führen und Ergebnisse somit kaum als Treffer auftauchen.
      Wenn man aber gezielt nach Werten sucht, findet man sie auch.
      Bspw.: http://www.google.de/search?hl=de&ie=ISO-8859-1&as_qdr=all&q=+site%3Asiemens.com+1796849071&btnG=Suche&meta=

      Gruß
      Reiner

      1. Hallo Reiner,

        Google scheint aber kategorisch alle links mit parametern im Query String zu
        ignorieren - Frage: Normal?

        Ja. Google indiziert nur URLs, die einen statischen Character zu haben scheinen. Dazu

        Das ist ein weit verbreiteter Unsinn!

        Diese Informationen sind von jemandem, der bei Google arbeitet.

        Grüße,
         CK

        --
        Q: God, root, what's the difference?
        A: God is merciful.
        http://wwwtech.de/
        1. Hallo Reiner,

          Google scheint aber kategorisch alle links mit parametern im Query String zu
          ignorieren - Frage: Normal?

          Ja. Google indiziert nur URLs, die einen statischen Character zu haben scheinen. Dazu

          Das ist ein weit verbreiteter Unsinn!

          Diese Informationen sind von jemandem, der bei Google arbeitet.

          Kann es sein, daß externe oftmals mehr Seiteneffekte einer Software kennen als interne Mitarbeiter?
          Frag Deinen Bekannten mal, was die Nummer bedeutet und warum eigentlich nur diese zu finden ist.

          Gruß
          Reiner

      2. Hi,

        Ja. Google indiziert nur URLs, die einen statischen Character zu haben scheinen. Dazu

        Das ist ein weit verbreiteter Unsinn!

        nein - aber auch nur die halbe Wahrheit.

        Google indiziert eigentlich alles, was ihm in den Weg kommt.

        Auch das ist genauso wenig korrekt.

        Das Problem ist vielmehr, daß Session-Ids usw. nicht gerade zu einem hohen Rank-Wert führen und Ergebnisse somit kaum als Treffer auftauchen.

        Hier hast Du zwar immer noch nicht Recht, aber zumindest einen relevanten Faktor aufgezeigt, nämlich den PR.

        Google "liebt" statische Seiten - das ist eine weitverbreitete Meinung, der auch ich mich anschließe. Und das ist auch der Grund, warum viele SEOs nicht nur ihre dynamischen URLs mittels mod_rewrite in ein statisches Format bringen sowie Session-IDs vermeiden, sondern darüber hinaus einen statischen HTTP-Header generieren, der insbesondere sinnvolle Angaben zu Last-Modified und Content-Length hat.

        Google folgt aber auch Query-Strings, allerdings sollte die Seite dann auch "wichtig" genug sein, sprich einen entsprechenden PR haben. Hierbei ist die Hürde für einen einzigen Parameter eigentlich recht niedrig; bei mir folgte er selbst auf einer PR0-Unterseite (Startseite damals PR4) einem (eigentlich unsinnigen) Parameter. Für mehrere Parameter braucht es aber AFAIK höheren PR.

        Dasselbe gilt übrigens auch für die Ebenen einer Seite. Was nicht von der Startseite aus verlinkt ist, wird bei geringem PR zunächst mal ignoriert. Eine "Vorschaltseite" ist also immer negativ in Hinblick auf Suchmaschinen, wenn dadurch sämtliche Folgeseiten eine Ebene tiefer rutschen.

        freundliche Grüße
        Ingo