Tach!
Kann das nicht die Wikisoftware selbst erledigen!?
Das war der Hauptgrund, warum ich diese zusammen mit einem Webserver ausliefere. Jede Menge Zeugs, das von Mediawiki erledigt wird, wollte ich nicht nacherfinden. Das wäre nämlich auch keine einmalige Sache, denn Mediawiki wird immer noch aktiv weiterentwickelt.
Eine Möglichkeit wäre, die API (Webservice) zu nutzen:
print
$json->decode(get "https://wiki.selfhtml.org/api.php?action=parse&page=XML/XSL/XPath&format=json")->{parse}->{text}{'*'};
Und das sieht schonmal ganz gut aus, auch die Tabelle ist gerendert. Ich guckmal inwieweit das noch etwas ansprechbarer und natürlich auch funktional aufgearbeitet werden kann (styles mit reinnehmen, links für offlinemodus anpassen).
~4000 Seiten abzurufen dürfte 1..2 Stunden dauern, welche das sind steht ja in sqlite und euer Server hat ein dickes Fell nehme ich an 😉
MfG