Felix Riesterer: DOMDocument - mit HTML5-Parser

Beitrag lesen

Lieber tami,

warum zitierst Du mein komplettes Posting...?

Das sieht so kompliziert aus. Aus welcher Quelle hast Du die Dateien?

Ich habe mir eine ZIP-Datei von der Github-Seite gezogen.

Was mir immer noch nicht klar ist, aus welcher Quelle kommt Dein ursprünglicher HTML-Quelltext

Ich verwende HTML-Dateien unterschiedlichster Bauart und Doctypes. Diese werden per Parser eingelesen und zu einem neuen HTML5-Dokument zusammengebaut. Es ist die Aufgabe des PHP-Scripts, validen und wohlgeformten HTML-Code zu erzeugen.

Damit nun alle HTML5-Elemente korrekt geparst werden, wollte ich einen leistungsfähigen Parser, der mir keine Fehler wirft, wenn ich Elemente wie <main>, <nav> und <section> verwende. Deshalb diese HTML5-Parser-Geschichte.

und warum funktioniert das nur mit einem speziellen Parser und nicht mit dem DOM-Funktionen von PHP allein?

Die werfen Fehler. Das kann nur bedeuten, dass der PHP-eigene Parser (molily verweist auf libxml2) ungenügend für die Aufgabe ist.

Oder habe ich das was übersehen?

Vielleicht molilys Posting?

Liebe Grüße,

Felix Riesterer.

--
"Wäre die EU ein Staat, der die Aufnahme in die EU beantragen würde, müsste der Antrag zurückgewiesen werden - aus Mangel an demokratischer Substanz." (Martin Schulz, Präsident des EU-Parlamentes)