Gregory: Robots.txt

Hallo,
ich möchte eine Internetseite auf deutsch und auf englisch erstellen.

Die deutsche Seite ist normal unter www.....de erreichbar. Die englische Version soll unter www.....de/en/ erreichbar sein.

Gibt es nun die Möglichkeit, die deutschsprachigen Suchroboter (vorallem von Google) mittels der Robots.txt Datei eben nur auf der deutschsprachigen Version zuzulassen und die englischsprachigen auf der englischen Version?

Danke für eure Hilfe!

  1. hallo gregory,

    schau mal hier:
    http://de.selfhtml.org/html/kopfdaten/meta.htm#robots

    grüße - binni

  2. Hi!

    Gibt es nun die Möglichkeit, die deutschsprachigen Suchroboter (vorallem von Google) mittels der Robots.txt Datei eben nur auf der deutschsprachigen Version zuzulassen und die englischsprachigen auf der englischen Version?

    Wäre es nicht eher schlauer, den Robots direkt zu sagen, welche Sprache verwandt wird? <html lang="de"> würde sich anbieten. Ist vor dem Hintergrund Barrierefreiheit eh anzuraten.

    Gruß

    Martin

    1. Hi Martin,
      wie sollte ich das Deiner Meinung nach anwenden - bin kein Profi.

      1. Hi!

        In jedem deiner HTML-Dokumente hast du jetzt höchstwhrscheinlich <html> ganz oben im Quelltext stehen. Ersetze dies durch <html lang="de"> bzw. für die englischen Seiten <html lang="en"> und schon ist klar, welche Sprache du verwendest.

        Du kannst zwar auch den Server entsprechend konfigurieren, aber ich glaube, obere Verson dürfte einfacher sein.

        Gruß

        Martin

        1. Wird die jeweilige Seite dann nur von deutschen bzw. englischen Suchrobotern besucht?

          1. Wird die jeweilige Seite dann nur von deutschen bzw. englischen Suchrobotern besucht?

            Nein, aber es wäre mir auch neu, dass es für jede Sprache nen eigenen Bot gibt (bitte korrigieren, wenn ich irre). Aber auf jeden Fall wird dann bei der Suche nach deutschsprachigen Seiten die deutsche Version und bei der Suche nach englischsprachigen Seiten die englische Version gefunden.

            Gruß

            Martin

          2. Wird die jeweilige Seite dann nur von deutschen bzw. englischen Suchrobotern besucht?

            die Seite wird grundsätzlich besucht, wenn:

            1. du sie bei einer Suchmaschine anmeldest
            2. du (oder sonstwer) extern von seiner indizierten Seite darauf verlinkt...(andere Domain)
        2. Hej,

          In jedem deiner HTML-Dokumente hast du jetzt höchstwhrscheinlich <html>
          ganz oben im Quelltext stehen.

          ^^^^
          Nur für den Fall das das wirklich so sein sollte, wäre vielleicht noch der Hinweis auf die Notwendigkeit einer Dokumenttyp-Deklaration angebracht. ;)

          Beste Grüße
          Biesterfeld

          --
          "Krieg!"
          1. Hi!

            ganz oben im Quelltext stehen.
              ^^^^
            Nur für den Fall das das wirklich so sein sollte, wäre vielleicht noch der Hinweis auf die Notwendigkeit einer Dokumenttyp-Deklaration angebracht. ;)

            Wieso? Funzt[sic!] doch auch ohne...

            Gruß

            Martin ;-)

            1. Wieso? Funzt[sic!] doch auch ohne...

              Lo0oL -> wenn man IE lieber im Quirksmode will...

              zum lang="bla" ne Frage von mir:
              warum darf ich das lang nicht in Xhtml 1.1 verwenden oder bin ich aufm Holzweg?

              1. Hej,

                Wieso? Funzt[sic!] doch auch ohne...

                Lo0oL -> wenn man IE lieber im Quirksmode will...

                Das ist ja sogar oft gewünscht. Dann macht er wenigstens berechenbar was er will!

                zum lang="bla" ne Frage von mir:
                warum darf ich das lang nicht in Xhtml 1.1 verwenden oder bin ich aufm Holzweg?

                Ist richtig, genau kann ich dir auch nicht viel mehr sagen, als dass es durch xml:lang ersetzt wurde und das ganze mit dem Konzept der Modularisierung zusammenhängt.

                Beste Grüße
                Biesterfeld

                --
                Wussten sie, dass die meisten Menschen mehr Beine haben als der Durchschnitt?
                1. Das ist ja sogar oft gewünscht. Dann macht er wenigstens berechenbar was er will!

                  das er im quirks noch viel mehr fehler macht ist dir bekannt?

                  Ist richtig, genau kann ich dir auch nicht viel mehr sagen, als dass es durch xml:lang ersetzt wurde und das ganze mit dem Konzept der Modularisierung zusammenhängt.

                  hab festgestellt, dass er auch hreflang in 1.1 nimmer will...
                  hast du die verwendung von xml:lang mit de schon erfolgreich ausprobiert? wenn ja, meinst du man kann es auch im dokument selbst verwenden.

                  danke und gruß

                  1. Hi!

                    das er im quirks noch viel mehr fehler macht ist dir bekannt?

                    Ja, ist bekannt, aber da macht er wenigstens konsequent Fehler.

                    Würgarounds muss man ja leider für alle Rendermodi des IE basteln, und da ist es IMHO Geschmackssache, ob man Not oder Elend wählt...

                    Grß

                    Martin

                  2. Hi,

                    hast du die verwendung von xml:lang mit de schon erfolgreich ausprobiert?

                    Ich verwende - für XHTML 1.0 - beides. Und Google indiziert meine Seiten lediglich wie dort angegeben als Deutsch. Allerdings verläßt sich Google nicht nur auf Sprachangaben im Head (wozu auch Meta-Angaben gehören können) sondern analysiert auch den Inhalt.

                    freundliche Grüße
                    Ingo

                  3. Hej,

                    Das ist ja sogar oft gewünscht. Dann macht er wenigstens berechenbar was er will!
                    das er im quirks noch viel mehr fehler macht ist dir bekannt?

                    DoctypeSwitch

                    hast du die verwendung von xml:lang mit de schon erfolgreich ausprobiert?

                    Sorry, wie gesagt mein Wissen in dem Bereich ist eher theoretischer Natur.

                    Beste Grüße
                    Biesterfeld

                    --
                    "Krieg!"
              2. Hi!

                Lo0oL -> wenn man IE lieber im Quirksmode will...

                Meine Seiten beginnen fast alle mit

                <!--Internet Explorer, bitte Quirks Mode benutzen, danke-->  
                <!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN" "http://www.w3.org/TR/html4/loose.dtd">
                

                Andere Webmaster nehmen ganz andere Begrüßungen für den IE, ich weiß leider nicht mehr, wer "<!--Hallo Internet Explorer, du kleiner Bastard!-->" reingeschrieben hatte.

                Gruß

                Martin

                1. hi,

                  Andere Webmaster nehmen ganz andere Begrüßungen für den IE, ich weiß leider nicht mehr, wer "<!--Hallo Internet Explorer, du kleiner Bastard!-->" reingeschrieben hatte.

                  beispielsweise http://medienrauschen.de/

                  gruß,
                  wahsaga

                  --
                  /voodoo.css:
                  #GeorgeWBush { position:absolute; bottom:-6ft; }