Gunther: TOC aus HTML Code generieren

Beitrag lesen

Hi,

Womit ich mich jetzt aber schwer tue ist, eine mögliche Verschachtelung, sprich verschiedene Ebenen zu ermitteln, um meine TOC entsprechend zu gestalten.

Hör’ auf, reguläre Ausdrücke zum Parsen von HTML zu nutzen (was man sowieso nicht tun sollte),

Aha ... OK!
Warum denn eigentlich nicht?

Imho ist das ist in gewissen Fällen nämlich wesentlich einfacher.
In meinem konkreten Fall bspw. verändere ich ja gar nicht den vorhandenen HTML Code, sondern möchte ja nur gewisse Daten daraus extrahieren.

und nehme einen DOM Parser stattdessen.

Welchen? ;-)

Mal angenommen, man würde DOMDocument nehmen, dann weiß ich aber immer noch nicht, wie ich es am geschicktesten anstelle, quasi meine HTML Outline zu generieren?

Da mir das Ganze für mein kleines Projekt jetzt zu aufwendig ist, habe ich mir aktuell anders beholfen (setzte den Level manuell).

Aber für zukünftge Projekte würde es mich dennoch interessieren ...!

Soweit ich das bis jetzt durchblickt habe, müsste ich also

  • alle Nodes durchlaufen, um meine H1 Section Heading Nodes zu finden
  • bei einem Treffer, den entsprechenden ParentNode nach weiteren Sectioning ChildNodes durchsuchen, wobei sich bei jedem Treffer der Level jeweils um eins erhöht

Ist das vom Ansatz her so in etwa korrekt?

Gruß Gunther