Lieber Christian,
Ja, es ist total zum kotzen! Man sollte sie verklagen, sie haben schließlich auch eine Gewährleistungspflicht! Ich meine, es ist ja nicht so als stünde das alles unter einer freien Lizenz und man könnte sich selbst darum kümmern, dass das gefixed wird!! Oh, wait…
;-)
wird es nicht auf PHP zurückzuführen sein sondern auf libxml
Gestern war ich zu müde, um an libxml im Besonderen zu denken und zu prüfen, ob meine lokale Testumgebung und die Produktionsumgebung dieselbe Version von libxml nutzen - was natürlich mal wieder nicht der Fall war. Mail an den Support ist unterwegs.
und zweitens finde ich, dass sie sich hier Standard-konform verhalten. HTML-Parser müssen fehlende Tags ergänzen, siehe auch den Parsing-Algorithmus von HTML5.
Ach, mich stört das zusätzliche Tag nicht, wenn meine Umlaute nicht verstümmelt würden. Alles ist intern UTF-8, nur der Output zeigt verstümmelte non-ASCII-Zeichen mit wilden HTML-Entitäten. Das hat mich aufgeregt. Auf meinem Testsystem (libxml 2.9.1) passiert das nämlich nicht. Und einen echten HTML5-Parser wollte ich für ein so winziges Projekt nicht bemühen.
Liebe Grüße,
Felix Riesterer.