Hello out there!
Mein editor (Crimson Editor) kann Dokumente als UTF-8 mit BOM und ohne BOM speichern. Kann mir jemand erklären was es damit auf sich hat, oder inwiefern es relevant für die darstellung im browser ist?
Wikipedia kann: Byte Order Mark.
UTF-8-codierte HTML-/PHP-Dateien solltest du ohne BOM speichern.
Nun habe ich meine index.php als UTF-8 dokument abgespeichert, mit dem ergebnis, daß äöü usw. In andere Zeichen kodiert werden. Das soll denk ich mal auch so sein.
?? Nein, das soll nicht so sein.
Im Header hab ich dann noch Charset UTF-8 vermerkt und probiert das ganze im Browser (firefox/iexplorer) darzustellen. Dieser spuckt mir dann aber die selben kodierten zeichen wie im Quelltext aus. Was hab ich da falsch gemacht?
Was meinst du mit „Header“? Das _head_-Element (ohne „er“)?
Das ist nur beim Aufruf übers lokale Dateisystem wirksam und übers Web, wenn der Server keine Zeichencodierungsangabe im HTTP-_Header_ (mit „er“) sendet, wie dir mehrfach in deinem alten Thread gesagt wurde.
Ohne einen Link zu deiner polnischen Seite bleibt meine Glaskugel trübe.
Und dann hab ich da noch ein Problem mit den polnischen Schriftzeichen. Mein Rohmaterial bekomme ich in solchen Worddokumenten […] geliefert. Der editor kann diese Zeichen aber nicht darstellen und deshalb kann ich die polnischen texte noch nicht einarbeiten. Kann mir da jemand auch einen Tip geben?
Benutze einen Unicode-fähigen Editor.
Alternativ: Speicher dein Word-Dokument als HTML. Du benutzt vom Ergebnis natürlich nicht den Müll, den Word für HTML hält, sondern nur deinen Text. Word wandelt nämlich die Nicht-ASCII-Zeichen in Entity-Referenzen oder numerische Zeichenreferenzen um (dummerweise dezimal statt hexadezimal, aber egal): aus
Myślę, więc jestem.
wird
Myślę, więc jestem.
See ya up the road,
Gunnar
“Remember, in the end, nobody wins unless everybody wins.” (Bruce Springsteen)