Linuchs: Google und canonical

Hallo,

vor einigen Monaten habe ich aufgeräumt mit den Mehrfach-Einträgen meiner Seiten bei Google. Ich finde es Klasse, beim richtigen Suchbegriff auf der ersten Seite zu sein, aber nicht wie ein inflationärer Bauchladen daherzukommen.

Das Problem bei mir waren drei Domains in fünf Sprachen (Veranstaltungskalender). Ein Event konnte theoretisch 15-mal vorkommen, tatsächlich habe ich oft 5-fach Darstellungen gesehen.

Das Zauberwort ist "canonical" eingebettet in den HTML-Header:
<link rel="canonical" href="http://remso.eu/?VIP=364&amp;LO=kompakt">

Insgesamt ist mein Auftritt bei Google viel übersichtlicher und ich bin zufrieden.

Doch manchmal verstehe ich nicht ganz, warum Google canonical ignoriert. Das obige Beispiel etwa wird ohne den (wichtigen) Parameter LO=kompakt verlinkt. Im Google-Cache sehe ich die "falsche" Seite mit dem "richtigen" canonical.

Welche Erfahrungen habt ihr mit dem canonical-Eintrag gemacht? Klappt er auch über Domain-Grenzen hinweg?

Linuchs

  1. Hi,

    <link rel="canonical" href="http://remso.eu/?VIP=364&amp;LO=kompakt">

    Doch manchmal verstehe ich nicht ganz, warum Google canonical ignoriert. Das obige Beispiel etwa wird ohne den (wichtigen) Parameter LO=kompakt verlinkt. Im Google-Cache sehe ich die "falsche" Seite mit dem "richtigen" canonical.

    Was sagen die Google Webmaster Tools? Geben die irgendeinen Aufschluss darüber, was Google zu dem URL an Daten vorliegen hat?
    Wie sieht Fetch as Google für diesen URL aus?

    Ich bin nicht tief genug drin im SEO-Voodoo-Zirkus um sagen zu können, ob an „Suchmaschinen haben Probleme mit/ignorieren gerne mal GET-Parameter” (noch) was dran ist – aber hast du mal überlegt, das ganze mit Rewriting zu versehen, um „schönere” URLs zu haben?
    Sowas wie bspw. http://remso.eu/VIP/364/kompakt wäre für dein genanntes Beispiel denkbar.

    MfG ChrisB

    --
    Autocomplete has spoiled me to a point where it happens every so often that I encounter a CAPTCHA, and I just type in the first character … and then wait for the rest of the code to be automatically suggested :/
    1. Hi,

      Sowas wie bspw. http://remso.eu/VIP/364/kompakt wäre für dein genanntes Beispiel denkbar.

      Ich bin seit gestern dran am Thema. Es beginnt mit den Orten, z.B. http://remso.eu/Zell_(Mosel), erste Erfahrungen mit der Hand codiert, später natürlich aus der Datenbank. canonical ist heute aber noch die Ortsnummer http://remso.eu/?ORT=8845

      Und die Ortsnummern sind kürzer ;-)

      Linuchs

      1. Hi,

        Ich bin seit gestern dran am Thema. Es beginnt mit den Orten, z.B. http://remso.eu/Zell_(Mosel), erste Erfahrungen mit der Hand codiert, später natürlich aus der Datenbank. canonical ist heute aber noch die Ortsnummer http://remso.eu/?ORT=8845

        Und die Ortsnummern sind kürzer ;-)

        Kein Argument – im Gegenteil.

        /Zell_(Mosel) sagt mir als Nuzter sehr viel mehr über den zu erwartenden Inhalt, als /?ORT=8845. Also ist letzteres klar zu präferieren.

        MfG ChrisB

        --
        Autocomplete has spoiled me to a point where it happens every so often that I encounter a CAPTCHA, and I just type in the first character … and then wait for the rest of the code to be automatically suggested :/
        1. હેલો

          Und die Ortsnummern sind kürzer ;-)

          Kein Argument – im Gegenteil.

          Vorallem in anbetracht der tatsache, dass Google was mit _ganzen_ Postleitzahlen anzufangen weiss.

          /Zell_(Mosel) sagt mir als Nuzter sehr viel mehr über den zu erwartenden Inhalt, als /?ORT=8845. Also ist letzteres klar zu präferieren.

          Du meinst ersteres?

          બાય

          --
           .
          ..:
          1. Hi,

            /Zell_(Mosel) sagt mir als Nuzter sehr viel mehr über den zu erwartenden Inhalt, als /?ORT=8845. Also ist letzteres klar zu präferieren.

            Du meinst ersteres?

            Ja.

            Wurde ersteres nicht aus letzterem klar, nachdem ich zweiteres mit dem in der Mitte verwechselt habe? Na huch.

            MfG ChrisB

            --
            Autocomplete has spoiled me to a point where it happens every so often that I encounter a CAPTCHA, and I just type in the first character … and then wait for the rest of the code to be automatically suggested :/
        2. N'Abend,

          /Zell_(Mosel) sagt mir als Nuzter sehr viel mehr über den zu erwartenden Inhalt, als /?ORT=8845. Also ist letzteres klar zu präferieren.

          Habe diesen Link .../Zell_(Mosel) in einer Mail (plain/text) genannt und einige dutzendmal verschickt. Danach sehe ich, dass zumindest das Mailprogramm Sylpheed den Link vor dem Unterstrich beendet, also nur nach /Zell verlinkt (ohne Mosel). Es gibt jedoch mehrere Zellen, allerdings bei mir noch nicht aktiv. Habe also schnell auch /Zell akzeptiert.

          Doch bei /Bad_Arolsen klappt der Trick nicht mehr, Bäder gibt's schon mehrere.

          Was sind eigentlich gültige Zeichen in einer Webadresse und warum betrachtet Sylpheed gewisse Zeichen, auch Umlaute, als Ende-Angabe?

          Meine kurzen numerischen Links bleiben erstmal, Sonderzeichen mit kryptischen %nn zu codieren, ist ja noch schlimmer.

          Linuchs

          1. habe /Zell_(Mosel) testweise an ein GMX-Postfach geschickt. Dort wird der Link vor der schließenden Klammer beendet: www.remso.eu/Zell_(Mosel - also Version 3.

            Damit könnte man doch auch viele Wikipedia-URLs nicht per Mail versenden, auf das Problem bin ich aber noch nicht gestoßen.

            Übrigens - auch Quotes ändern nichts an dem Kürzungsproblem: "www.remso.eu/Zell_(Mosel)"

            Linuchs

          2. @@Linuchs:

            nuqneH

            Was sind eigentlich gültige Zeichen in einer Webadresse

            Kommt drauf an, was du unter „Webadresse“ verstehst. In einem IRI sind so ziemlich alle Unicode-Zeichen erlaubt.

            Technisch sind hier eher URIs von Interesse, deren Syntax im Abschnitt 3 von RFC 3986 beschrieben ist.

            Im Pfad sind pchar erlaubt, wobei
            pchar       = unreserved / pct-encoded / sub-delims / ":" / "@"
            unreserved  = ALPHA / DIGIT / "-" / "." / "_" / "~"
            pct-encoded = "%" HEXDIG HEXDIG
            sub-delims  = "!" / "$" / "&" / "'" / "(" / ")" / "*" / "+" / "," / ";" / "="

            und warum betrachtet Sylpheed gewisse Zeichen, auch Umlaute, als Ende-Angabe?

            Weil die in einem URI nicht vorkommen dürfen.

            Sonderzeichen mit kryptischen %nn zu codieren, ist ja noch schlimmer.

            Nein. Zeichen mit Sonderbedeutung in einem bestimmten Kontext zu escapen, ist nicht schlimm, sondern völlig normal.

            Und es stört auch nicht. Der Nutzer bekommt davon u.U. gar nichts mit.

            Wenn im Quelltext <a href="[link:http://example.org/%C3%9CTF-8@title=http://example.org/%C3%9CTF-8]">ÜTF-8</a> steht, zeigt der Browser in der Statuszeile „example.org/ÜTF-8“ an. Und nach dem Folgen des Links auch in der Adresszeile. Die Umwandlung URI–IRI läuft im Hintergrund.

            Der Nutzer bekommt die prozent-codierten Zeichen nicht zu sehen. Soll er auch nicht.

            Qapla'

            --
            „Talente finden Lösungen, Genies entdecken Probleme.“ (Hans Krailsheimer)
            1. Der Nutzer bekommt die prozent-codierten Zeichen nicht zu sehen. Soll er auch nicht.

              Er sieht sie bei in Mails verlinkten Web-Adressen, sieht Sch... aus, wie Schadcode.

              Linuchs

              1. @@Linuchs:

                nuqneH

                Der Nutzer bekommt die prozent-codierten Zeichen nicht zu sehen. Soll er auch nicht.

                Er sieht sie bei in Mails verlinkten Web-Adressen, sieht Sch... aus, wie Schadcode.

                So sieht ein URI sowieso aus. Was soll denn „http://“ sein? Nur dass sich Nutzer daran mittlerweile gewöhnt haben.

                Generell gilt aber: URIs sind für Maschinen. Linktitel sind für Menschen.

                Im Fall von E-Mails in text/plain gibt’s natürlich keine Linktitel. Mit der Unzulänglichkeit muss man irgendwie leben.

                Qapla'

                --
                „Talente finden Lösungen, Genies entdecken Probleme.“ (Hans Krailsheimer)
          3. Hi,

            Habe diesen Link .../Zell_(Mosel) in einer Mail (plain/text) genannt und einige dutzendmal verschickt. Danach sehe ich, dass zumindest das Mailprogramm Sylpheed den Link vor dem Unterstrich beendet, also nur nach /Zell verlinkt (ohne Mosel).

            Ja, was diverse (Web-)Mailclients aus in plain text genannten URLs machen, ist dann noch mal eine andere Geschichte …

            Ggf. bietet es sich also an, für Emails als andere URLs zu benutzen, kürzere und ohne „Sonderzeichen„, so wie in deinem Falle vielleicht das „Original” mit der PLZ als GET-Parameter (und dann bei Aufruf auf den canonical URL weiterzuleiten).

            MfG ChrisB

            --
            Autocomplete has spoiled me to a point where it happens every so often that I encounter a CAPTCHA, and I just type in the first character … and then wait for the rest of the code to be automatically suggested :/