Ich weiß nicht, was du da wirklich vorhast; ich glaube aber, dein Ansatz ist ungünstig.
Nach einem Upload auf meinem Server lese ich php-Dokumente aus, um den Inhalt in einer Datenbank zu speichern (für eine Suchfunktion).
Ich habe mir folgendes überlegt: $content = preg_replace ( '/[^a-z0-9äöüßÄÖÜ()!§%&()$+#=,;.: ]/i', '', $content );
Allerdings werden folgende Zeichen nicht herausgelöscht und verursachen Fehler:
Dies ist ��� der Inhalt einer PDF Datei: ���