Umlaute in den Metatags
Marco Jürgel
- html
0 Cheatah0 Marco Jürgel0 Cheatah
0 Achillia0 Sven
Hallo,
und zwar habe ich folgendes Problem: Habe meine Seiten vom Validator durchchecken lassen. Da in meinem Nachnamen aber ein Umlaut vorkommt hat er mir diesen natürlich jedesmal angekreidet. Also habe ich sämtlich ü durch ü ersetzt. Das klappt auch ersteinmal. Allerdings fand die Ersetzung auch in den Meta tags und im Seitentitel statt. So das es jetzt im Titel heißt: Töpferei Jürgel in Pulsnitz (Sachsen" statt Töpferei Jürgel in Pulsnitz (Sachsen) (das ö andere ich auch noch) nun meine Frage: Ist es besser wenn man im Titel und den Metatags die Umlaute als ASCII oder als normale Buchstaben darstellt?
Vielen Dank Marco
Hi,
Allerdings fand die Ersetzung auch in den Meta tags und im Seitentitel statt.
das ist auch völlig korrekt. Eher könntest Du die Ersetzung im Body weglassen, im Head muss sie aber _unbedingt_ sein. Auch wenn die eigentlichen Metadaten der Ressource aus dem HTTP-Header stammen, ist auch der HTML-<head>-Bereich ein Header - und dort haben 8-Bit-Zeichen _nie_ etwas zu suchen.
So das es jetzt im Titel heißt: Töpferei Jürgel in Pulsnitz (Sachsen" statt Töpferei Jürgel in Pulsnitz (Sachsen)
Dann hast Du entweder einen defekten Browser, oder etwas falsch gemacht. Warum benutzt Du eigentlich nicht ü für ein kleines "ü"? Dafür sind diese Entitäten schließlich definiert.
Cheatah
Hi,
ok, dann werde ich nochmal ersetzen. Also stört es Suchmaschinen nicht wenn mit den ASCII zeichen codiert wird.
Hi,
Also stört es Suchmaschinen nicht wenn mit den ASCII zeichen codiert wird.
nur die defekten, die von HTML keinen Schimmer haben, was keine bedeutenden sein können. Übrigens heißen die ASCII Zeichen "Entitäten".
Cheatah
Hallo
Vorab, verzeih, wenn ich jetzt gänzlich unqualifizierten Müll von mir gebe, aber so funktionierts bei mir immer (und meine seite ist 100% valide): Die Umlaute hab' ich einfach durch ä usw. ersetzt... hmm? Oder meinst was anderes... Getrau mich hier kaum zu antworten :-) Najo, falls es blödsinn ist... Sorry!
Lg
Achillia
Hi,
funzen tuts bei auch, die Frage ist nur bo das Suchmaschinen und ähnlich Programme auch so sehen. Wollte also wissen was für die Spider die bessere Alternative ist.
Gruß Marco
Hallo Marco,
vielleicht einfach mal den richtigen Zeichensatz angeben, dann bekomme ich hier zumindest keine Probleme mit unkodierten Umlauten:
<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01//EN"
"http://www.w3.org/TR/html4/strict.dtd">
<html>
<head>
<title>üöä - ? - ÜÖÄ</title>
<meta http-equiv="content-type" content="text/html; charset=ISO-8859-1">
</head>
<body>
<p>üöä - ? - ÜÖÄ</p>
</body>
</html>
Und Strict ist ja bekanntlich viel strenger als die Transitional-Variante, sollte also funktionieren.
ciao,
Sven
Hi,
vielleicht einfach mal den richtigen Zeichensatz angeben,
der Zeichensatz wird in einem Header angegeben und gilt selbstverständlich nicht rückwirkend - alles, was in einem Header steht, ist _immer_ und _grundsätzlich_ _ausschließlich_ ASCII. Ein Header ist die Beschreibung der Interpretation des Body, nicht der des Headers selbst.
<title>üöä - ? - ÜÖÄ</title>
<meta http-equiv="content-type" content="text/html; charset=ISO-8859-1">
Nein, die Reihenfolge umzudrehen gilt auch nicht. Der <title> ist Teil des <head> und _muss_ ergo ASCII beinhalten.
Cheatah
Hallo Cheatah,
<title>üöä - ? - ÜÖÄ</title>
<meta http-equiv="content-type" content="text/html; charset=ISO-8859-1">
Nein, die Reihenfolge umzudrehen gilt auch nicht. Der <title> ist Teil des <head> und _muss_ ergo ASCII beinhalten.
Umlaute sind doch aber auch ASCII? Oder meinst du, dass es nur 7bit-ASCII-Zeichen sein dürfen? Kann man dazu vielleicht irgendwo etwas nachlesen? Und warum akzeptiert der Validator solche Angaben?
ciao,
Sven
Hi,
Umlaute sind doch aber auch ASCII? Oder meinst du, dass es nur 7bit-ASCII-Zeichen sein dürfen?
es gibt kein 8-Bit-ASCII.[1] ASCII definiert ausschließlich die ersten 128 Zeichen.
Kann man dazu vielleicht irgendwo etwas nachlesen?
Das ist so grundlegend, dass man es sicher millionenfach nachlesen kann :-) Eine bestimmte Stelle kann ich Dir leider nicht nennen.
Und warum akzeptiert der Validator solche Angaben?
Keine Ahnung. Merkwürdige Umstände?
Cheatah
[1] Ja, es gibt Orte, wo diese Bezeichnung auftaucht. Sie ist aber falsch. "8-Bit-ASCII" kann nur eine von einer beliebig großen Anzahl unterschiedlicher Charmaps sein - und schon macht das "S" für "Standard" keinen Sinn mehr.
Hi,
Und warum akzeptiert der Validator solche Angaben?
Keine Ahnung. Merkwürdige Umstände?
aah - Quatsch. Ein SGML-Parser kennt natürlich nur die strukturellen Regeln und hat daher keine Ahnung, dass eines der Elemente die Bedeutung eines Headers vertritt. Deswegen ist ein aus Validator-Sicht nicht falsch. Genauer gesagt ist es HTML selbst im Prinzip egal, ob da nun unkodierte Umlaute drinstehen oder nicht. Ein Client aber (sprich: jemand, dass den HTML-Code nutzen möchte) muss erst den Head analysieren, um zu wissen, was für ein Content auf ihn zu kommt - und dazu ist es nötig, dass er sich auf die definierte Basis (ASCII also) verlassen kann.
Cheatah