cr: bei Word/PDF Dateiupload Seitenanzahl auslesen?

Hallo,

kann man mittels PHP beim Upload einer Textdatei, Word, Openoffice oder PDF Datei die Seitenzahl auslesen lassen? BZW auch auf andere Parameter zugreifen?

Vielen Dank für eure Hilfe.

cr

  1. Bei PDF könnte Dir z.B. die FPDI-Klasse weiterhelfen.

    Pure Textdateien kennen keine Seitenzahl und bei anderen Dokumenten sind verlässliche Angaben IMHO problematisch, da abhängig von der Plattform.

    Gruß, Samoht

    --
    fl:| br:> va:) ls:< n4:( ss:) de:] js:| mo:}
    "Computer games don't affect kids; I mean if Pac-Man affected us as kids, we'd all be running around in darkened rooms, munching magic pills and listening to repetitive electronic music."
    (Kristian Wilson, Nintendo, 1989)
  2. (Hallo|Hi(ho)|Tag) cr,

    kann man mittels PHP beim Upload einer Textdatei, Word, Openoffice oder PDF Datei die Seitenzahl auslesen lassen? BZW auch auf andere Parameter zugreifen?

    Da es kein einheitliches Format "Word" gibt, müsstest du für jede Art von Dateien, die auf ".doc" enden, eine Funktion schreiben, die in den hochgeladenen (Binär-)Dateien nach entsprechenden Markern sucht. Falls die Anzahl der Seiten gar nicht im "Word-Format" eingebaut ist (wovon ich ausgehe), dann müsstest du die Seiten zählen, sprich: eine Seite nach der anderen abarbeiten. Das ist schon mit vernünftigen Sprachen nicht trivial zu lösen. PHP aber kann Binärformate nur mit Hilfe von unpack() einlesen oder interpretieren. Eventuell gibts da einen besseren Weg.

    Falls du tatsächlich im Gekröse von micro$oftschen .doc-Dateien wühlen willst, findest du auf www.wotsit.org eine Liste mit Links zu den offiziellen Format-Definitionen von M$FT. Eventuell hilft dir auch das dort verlinkte Perl-Modul LAOLA (oder OLE::Storage) weiter. Schließlich müsste Perl (AFAIK) ja auch mit unpack() hantieren ...

    OpenOffice-Dateien können ebenfalls in verschiedenen Formaten vorliegen. Außerdem müsstest du diese erst entpacken, um an die "Innereien" zu kommen. Da könnte dir bei größeren Dateien das Memory-Limit von PHP einen Strich durch die Rechnung machen. Irgendwie wäre mir das zu viel Aufwand, nur um die Seitenzahl eines Textes zu ermitteln.

    cr

    lf ;-)

    MffG
    EisFuX

  3. Hallo,

    kann man mittels PHP beim Upload einer Textdatei, Word, Openoffice oder PDF Datei die Seitenzahl auslesen lassen? BZW auch auf andere Parameter zugreifen?

    bei PDF und Linux:
    pdfinfo

    lg
    Reiner