suit: meta language

Hallo, momentan hab ich bei mir (ein xhtml 1.0 transitional dokument, mit sicherheit valide) folgendes drinnen stehen:

<html xmlns="http://www.w3.org/1999/xhtml" xml:lang="de" lang="de">

wenn ich mit dem seekbot oder dem seitwert.de die seite anschaun lasse, werd ich drauf hingewiesen, dass das meta-tag "language" fehlt und das meta-tag "robots" fehlt

das hier denke ich:
<meta http-equiv="content-language" content="de" />
<meta name="robots" content="index, follow" />

ich bevorzuge die schöne variante, weil ich auch schönen quelltext haben will

die frage ist nun

brauche ich content-language wenn ich lang bzw xml:lang habe ueberhaupt?
und hat meta name robots überhaupt sinn, wenn ich eh eine robots.txt verwende - zudem warum soll ich ueberhaupt einem crawler "index, follow" sagen? ist doch blödsinn, da dies ohnehin das default-verhalten von denne ist?

danke
mfg suit

  1. Moin!

    Hallo, momentan hab ich bei mir (ein xhtml 1.0 transitional dokument, mit sicherheit valide) folgendes drinnen stehen:

    <html xmlns="http://www.w3.org/1999/xhtml" xml:lang="de" lang="de">

    wenn ich mit dem seekbot oder dem seitwert.de die seite anschaun lasse, werd ich drauf hingewiesen, dass das meta-tag "language" fehlt und das meta-tag "robots" fehlt.

    „Fehlt“ würde ich mal nicht so kritisch sehen, da richtige Robots™ sowohl eine robots.txt verstehen und respektieren als auch den entsprechenden meta-Tag.

    <meta http-equiv="content-language" content="de" />

    Das ^^^ ist prinzipiell allerdings etwas Anderes als die Sprachangabe im einleitenden html-Tag, aber welcher Angabe der Vorzug gegeben wird, weiß ich leider nicht. Es gibt Webserver, die in (X)HTML-Dateien http-equiv-Angaben auswerten und daraus HTTP-Header generieren. Wahrscheinlich bezieht sich die Content-Language auf die Sprache der Resource, während das lang-Attribut die Sprache eines Teilbaums der Datei angibt (also z.B. auch für nur einzelne Absätze).

    Viele Grüße,
    Robert

    1. Das ^^^ ist prinzipiell allerdings etwas Anderes als die Sprachangabe im einleitenden html-Tag, aber welcher Angabe der Vorzug gegeben wird, weiß ich leider nicht. Es gibt Webserver, die in (X)HTML-Dateien http-equiv-Angaben auswerten und daraus HTTP-Header generieren. Wahrscheinlich bezieht sich die Content-Language auf die Sprache der Resource, während das lang-Attribut die Sprache eines Teilbaums der Datei angibt (also z.B. auch für nur einzelne Absätze).

      hallo, danke fuer deine antwort

      der webserver von mir (läuft ein apache2 drauf) kümmert http-equiv nicht die bohne - die sprache ist nirgends im http header ersichtlich

      auf <meta http-equiv="content-type" content="text/html; charset=iso-8851-1" /> reagiert er übrigens auch nicht, der liefert trotzdem utf-8 aus - mir ist klar, dass das richtig so ist und ich verwende ohnehin utf-8

      ich hab inzwischen das hier gefunden:
      http://www.w3.org/International/questions/qa-http-and-lang

      hier wird empfohlen lang und xml:lang zu verwenden weil das ohnehin der einzige weg ist, um die sprache des entsprechenden textbereichs zu kennzeichnen da die metainformationen oder http-header aus verschiedenen gründen hier garnicht relevant sein können

      btw: die charset angabe als http-equiv wird von "jedem" browser gelesen und ist in allen fällen wichtig, die muss natürlich bleiben