Rafael: Text aus PDF/PPT/DOC extrahieren

Beitrag lesen

Hab das noch nie ausprobiert, aber ich würde einfach fürs erste mit fopen die Datei öffnen, diesen lesen (fread) und dann versuchen einen Text daraus zu extrahieren. Sollte zumindest bei pdf möglich sein.
PDF ist glaube ich in aller regel komprimiert also mit gzuncompress auflösen.