schmalhans: Konvertieren Datenbankinhalte nach XHMTL

Hi!

Ich haben eine Datenbanktabelle, deren Feldinhalte Texte sind, die noch alte HTML-Tags beinhalten.

Nun möchte ich diese Daten gerne in valides XHTML konvertieren.

Ein Skript (PERL/ PHP), was auf einem Windows-PC läuft, soll für mich das Auslesen der DB, das Konvertieren, sowie das Rückschreiben in die DB übernehmen.

Da ich die Konvertierungsregeln nicht per Hand erstellen möchte, wollte ich nachfragen, ob es evtl. schon ein Set an regulären Ausdrücken oder Regeln gibt, die ich in PERL/ PHP nutzen kann?

Habe das "HTML Tidy Library Project" auf Sourceforge gefunden und dazu auch eine Windows-EXE und auch anderswo andere Konvertierungsprogramme. Aber diese arbeiten alle nur mit Dateien als Input, ich bräuchte aber ein Skript/ Programm, welches ich in mein Ausgangsskript einbinden kann und dem ich Stringvariablen übergeben kann.

Habt ihr Tipps bzw. Erfahrungen damit? Wo finde ich diesbezügliche Infos?

Vielen Dank

  1. Hallo,

    Ich haben eine Datenbanktabelle, deren Feldinhalte Texte sind, die noch alte HTML-Tags beinhalten.
    Nun möchte ich diese Daten gerne in valides XHTML konvertieren.

    Habt ihr Tipps bzw. Erfahrungen damit? Wo finde ich diesbezügliche Infos?

    erstelle zuerst ein Backup. Ein anständiges Ergebnis wirst Du vermutlich nur durch Handarbeit erhalten :-)

    Freundliche Grüße

    Vinzenz

  2. Habe das "HTML Tidy Library Project" auf Sourceforge gefunden und dazu auch eine Windows-EXE und auch anderswo andere Konvertierungsprogramme.

    HTML Tidy gibt es sowohl als PHP- als auch als Perl-Erweiterung.
    Falls die Dateien annehmen, so ist es eher das kleinere Problem, einen String in eine Datei zu schreiben.

    Mathias

    1. HTML Tidy gibt es sowohl als PHP- als auch als Perl-Erweiterung.
      Falls die Dateien annehmen, so ist es eher das kleinere Problem, einen String in eine Datei zu schreiben.

      Danke für die Info. Schau ich mir an.

      Wegen "String in Datei schreiben" wäre letzer Ausweg, da ca. 1,5 Millionen Datensätze zu bearbeiten sind... :-)

    2. HTML Tidy gibt es sowohl als PHP- als auch als Perl-Erweiterung.

      Hm, hab mir das jetzt mal angeschaut.

      Aber wir mir scheint, testen die Erweiterungen nur, ob wellformed XHTML vorliegt oder nicht. Das Konvertieren machen sie aber nicht.
      Oder hab ich was übersehen?

      Danke