Ja, das wäre wirklich die beste Alternative! Also einfach ein php-script als 404.php, und das in die htaccess - soweit habe ich das schonmal gemacht. Nur wie um Himmelswillen ermittelst Du "ähnliche" Seiten?
Das ist recht simpel: PHP hat eine Handvoll Funktionen, um die Ähnlichkeit zweier Texte zu ermitteln, z.B. Levenshtein. Die kannst du im einfachsten Fall auf die Dateinamen in dem betreffenden Verzeichnis anwenden (vorher alle Anhängsel entfernen), auf den gesamten Pfad oder auch noch die Titel einbeziehen.
Und noch eine Frage, ist das bei alles Seiten so extrem mit der gzip Komprimierung? Muß ich glaub ich auch mal drüber nachdenken! Aber ist nur für html, nicht Bilder..., oder? Geht das auch mit php?
Bilder sind bereits komprimiert (wenn man Web-übliche Formate wie GIF, JPEG oder PNG benutzt), da nutzt eine zweite Komprimierung obendrauf natürlich nichts mehr.
Bei Texten ist die Komprimierung eigentlich immer sehr gut, je mehr "Format" und Gleichförmigkeit im Text ist, desto besser. Ich hatte mal vor Jahren einen ganz extremen Fall mit einem Postscript-Text, der deutlich über 95% zusammengeschrumpft ist.
Die HTML-Dateien auf meinen Seiten bestehen hauptsächlich aus gleichförmigen Tabellen, deshalb ist die Komprimierung auch hier sehr schön zu sehen (im Durchschnitt 1/10 IIRC).
Die Komprimierung kannst du auf zweierlei Weise machen: Entweder du bzw. dein Server-Betreiber installiert ein Modul namens mod_gzip, das alle Daten, die der Server verschicken möchte, automatisch und transparent komprimiert. Oder du komprimierst vorher, legst beide Dateiversion auf dem Server ab und läßt den Server dann mittels "Options Multiviews" entscheiden, welche er an den Browser schickt - so mache ich es.
Um die Ausgabe von PHP-Skripten selber zu komprimieren, müßtest du wahrscheinlich alles statt gleich mit echo & Co. auszugeben in einem String speichern und den dann mit der zlib-Funktion gzcompress() komprimieren und an den Browser schicken. Die Sachen außerhalb der <?php..?>-Konstruktion bekommst du da aber nicht mit rein - also alles per PHP.
Für solche Fälle wäre mod_gzip natürlich ideal, aber kaum ein Server-Betreiber (außer mir:) wird auf deinen Wunsch hin ein Modul installieren.
Für alles andere, also statische Seiten, finde ich die vorherige Komprimierung praktischer, weil bessere Komprimierung bei weniger Resourcenverbrauch. Aber das ist wohl Geschmackssache.
Gruß,
soenk.e