Torsten Kammer: Verarbeitung von HTML: Strenge oder Fehlertoleranz?

Beitrag lesen

Die grundlegende Idee hinter XML, durch drakonische Fehlerbehandlung Parser klein und einfach zu halten, ist verdammt gut. Allerdings ist die Idee, diese Fehlerbehandlung auf eine riesige Menge von Dokumenten und Anwendern, die sich bisher nicht darum gekümmert haben und darum dazu inkompatibel sind, schlecht.

Der Gedanke hinter HTML5, Tag-Soup-Parsing genau zu spezifizieren, ist wohl der beste Weg für dieses Problem (nicht für neue Formate, da ist XML voll und ganz richtig). Es hält den Parser auf einer vertretbaren Größe und macht ihn zuverlässig, bleibt aber trotzdem halbwegs kompatibel zu dem, was in der echten Welt geschieht.