Hes: Google demaskiert die Umlaute bei der Indexierung

Hallöchen,

was HTML betrifft, halte ich mich ja für einen alten Hasen, aber diesen Effekt kann ich mir nicht erklären. Also, ich habe eine Webseite gehäckelt - wer hätte das gedacht *zwinker* - die sich über PHP den Content aus bestimmten Dateien abholt. Im Content sind alle Umlaute vernünftig maskiert á la & u u m l; (schon klar, ohne Leerzeichen). Ich hab sogar in den Meta-Tags angegeben, dass es sich um einen europäischen Zeichensatz handelt. Trotzdem hat Google bei der Indizierung alle Umlaute verhunzt. Hat Google eventuell ein Problem mit PHP bzw. mit HTML Content in .php Dateien?

Wer kann helfen? Büdde, büdde, denn das sieht in der Google einfach nur peinlich aus. Alle Browser zeigen die Seite übrigens korrekt an.

Gruß aus Berlin - Hes

  1. Hiho,

    Hat Google eventuell ein Problem mit PHP bzw. mit HTML Content in
    .php Dateien?

    Nö, woher soll google denn wissen woher der Inhalt kommt, der gerade gelesen wird? Wenn dein PHP anständiges Zeug raus gibt, dann liest es google auch anständig...

    wie wärs mal mit einer oder zwei Adressen bei denen wir uns das mal ansehen können?

    Grüße

    Marc

    1. Sag mal, kannst Du Deine Email-Adresse rausrücken? Da es sich um eine kleine Firmenwebseite handelt, kann ich sie hier nicht nennen. Dieses Forum wird zu gut und zu häufig von Google indexiert *zwinker*.

      Schönes Wochenende - Hes

      1. Hallo Hes.

        Dieses Forum wird zu gut und zu häufig von Google indexiert *zwinker*.

        „indexiert“ versus „indiziert“.

        Einen schönen Samstag noch.

        Gruß, Ashura

        --
        Selfcode: sh:( fo:} ch:? rl:( br: n4:~ ie:{ mo:| va:) de:> zu:) fl:( ss:) ls:[ js:|
        30 Days to becoming an Opera8 Lover -- Firefox tools for Opera built-ins
        Meine Browser: Opera 8.02 | Firefox 1.0.6 | Lynx 2.8.5 | Netscape 4.7 | IE 6.0
        MathML fetzt | Use OpenOffice.org
        1. echo $begrüßung;

          Dieses Forum wird zu gut und zu häufig von Google indexiert *zwinker*.
          „indexiert“ versus „indiziert“.

          So ein Google-Fight ist ein ungünstiges Mittel, ein angeblich falsche Schreibweise zu belegen.

          Auch wenn es so aussieht, als ob du Recht hättest.

          echo "$verabschiedung $name";

          1. Hallo dedlfix.

            So ein Google-Fight ist ein ungünstiges Mittel, ein angeblich falsche Schreibweise zu belegen.

            Im Sinne der Aussage stimmt meine Anmerkung. (Das Wort „indexieren“ war ja korrekt geschrieben, doch wie hier selbst anmerkst, war inhaltlich „indizieren“ gemeint.)

            Auch wenn es so aussieht, als ob du Recht hättest.

            Religiöse Inhalte sind grundsätzlich zahlreicher vertreten.

            Einen schönen Samstag noch.

            Gruß, Ashura

            --
            Selfcode: sh:( fo:} ch:? rl:( br: n4:~ ie:{ mo:| va:) de:> zu:) fl:( ss:) ls:[ js:|
            30 Days to becoming an Opera8 Lover -- Firefox tools for Opera built-ins
            Meine Browser: Opera 8.02 | Firefox 1.0.6 | Lynx 2.8.5 | Netscape 4.7 | IE 6.0
            MathML fetzt | Use OpenOffice.org
  2. Hi,

    Ich hab sogar in den Meta-Tags angegeben, dass es sich um einen europäischen Zeichensatz handelt. Trotzdem hat Google bei der Indizierung alle Umlaute verhunzt.

    Was heißt "verhunzt" genau, wie sieht das aus?
    Wie lautet der vollständige HTTP-Header, den Google geliefert bekommt?
    Ist die Seite, die Google bekommt auch die _exakt_ gleiche, die der Browser bekommt?

    so short

    Christoph Zurnieden