tufi: rtf-format mit PHP auslesen.

Hallo,

ich möchte eine anzahl von .rtf dateien im internet praesentieren. da die anzahl derer ziemlich hoch ist, möchte den vorgang automatisieren, ergo; ein PHP-skript soll für mich die vorgegebene rtf-datei öffnen, die zeilen herausnehmen, und diese passend zu meinem layout ausgeben.

mit fopen() und fgets() bekomme ich jedoch alle formattierungsinformationen auch mitgeliefert, so bekomme ich nur einen zeichenwirrwarr :-|

kann jemand mir eine idee geben, wie ich den "reinen" text aus den formattierungsinformationen extrahieren kann, oder generell mein vorhaben realisieren kann ?

für vorschlaege bin ich dankbar.

Grüsse

<<tufi>>

  1. Hallo,

    kann jemand mir eine idee geben, wie ich den "reinen" text aus den formattierungsinformationen extrahieren kann, oder generell mein vorhaben realisieren kann ?

    Da wirst Du wohl um Regex nicht rum kommen...

    http://de3.php.net/manual/de/ref.regex.php

    bei google würden Dir Keywords wie "Textparser,Parser" etc.. einige Ergebnisse dazu liefern :)

    Gruß

    Chris

  2. Hallo,

    Hallo,

    ich möchte eine anzahl von .rtf dateien im internet praesentieren. da die anzahl derer ziemlich hoch ist, möchte den vorgang automatisieren, ergo; ein PHP-skript soll für mich die vorgegebene rtf-datei öffnen, die zeilen herausnehmen, und diese passend zu meinem layout ausgeben.

    Hm, wenn der Kram auf einer Windowsmaschine liegt auf der auch MS-Word instaliert ist, wäre das hier wohl die arbeits-un-intensivste Lösung  ;-)

    http://hn273.users.phpclasses.org/browse.html/package/1352.html

    Detailed description:
    This class can be used to convert a Microsoft Word document to HTML, RTF or plain text using COM objects.

    The input document formats can be Microsoft Word DOC, RTF and plain text.

    Viele Grüße,
    Horst