dedlfix: utf-8 und Einbinden verschiedener Quellen

Beitrag lesen

echo $begrüßung;

Wenn Bytes vorkommen, die laut UTF-8-Schema illegal sind, dann kann es kein UTF-8 sein. Das heißt für den umgekehrten Fall aber nicht, dass es dann in jedem Fall UTF-8 ist.
Das ist richtig, theoretisch kann es auch eine andere Kodierung sein. Aber da in UTF-8 Zeichen > 7 Bit (also alles über 2^7) nur in einer bestimmten Kodierung vorkommen dürfen, ist es sehr, sehr unwahrscheinlich, dass ein Text in einer anderen Kodierung als UTF-8 nur legale Byte-Sequenzen enthält. Praktisch kann man also feststellen, ob der Text in UTF-8 kodiert ist oder nicht.

In diesem Forum beinahe täglich zu sehen sind Anfragen wie: "Meine Umlaute werden mir immer als ä angezeigt." Dies ist sowohl gültiges ISO-8859-1 als auch gültiges UTF-8 und obendrein noch ein praktischer Anwendungsfall, ist aber als UTF-8 interpretiert sinnentstellend.

echo "$verabschiedung $name";