Sven Rautenberg: UTF-8 Codierung erkennen

Beitrag lesen

Moin!

Es geht um Texte, deren Codierung leider nicht immer geklärt ist.
Man müsste also mehrere Passagen daraus ausschneiden und diese einzeln prüfen.

Eher nicht.

Wie müsste ich denn schneiden? Ist das Zeilenende-Zeichen in allen üblichen Codierungen (im Prinzip sind es nur ISO8859-X, UTF-8, Windows 1252, ASCII+ CP-437, ASCII+ CP-850) identisch entweder "\r\n" oder "\n" oder "\r" ?

Da du dir Codetabellen aller genannten bzw. zu prüfenden Codierungen besorgen mußt, kannst du dir diese Frage ja selbst beantworten.

- Sven Rautenberg

--
"Love your nation - respect the others."