Hallo
- Ein Artikel wird aus mehreren Blöcken zusammengestellt.
- Ein Block enthält z. B. folgenden Code:
header('Location: http://example.org');
- Mein Skript bekommt über eine CMS-interne Funktion den Inhalt des Artikels.
Spätestens an dieser Stelle ist dein Konzept fehlerhaft.
Begründung?
Weil in diesem Moment Code ausgeführt wird, der dein Suchkonzept (zer)stört. Da beißt sich was.
Gesetzt den Fall, du würdest deine Inhalte nicht über die fertig geparste Seite sondern über die in der DB hinterlegten Seitenteile indizieren, kannst du prüfen, ob ein Bestandteil (Block) der Seite zum Code oder zum Inhalt gehört?
Nein, Code ist (lies: produziert) Inhalt. Wie der Code aussieht, ist aus meiner Sicht irrelevant, da ich nur das Ergebnis, das der Code produziert, brauche.
Leider bekommst du das gelegentlich (oder immer?) nicht.
Das ist nicht das Problem. Die Artikel des CMS sind p. d. statisch.
Na offensichtlich sind sie das nicht, sonst bräuchte es keinen PHP-Code in ihnen.
Statisch sind diese Artikel im Sinne der Suche schon. Ein einmal indexierter Artikel verändert sich nicht. Wenn doch, so wird er (= seine Ausgabe) neu indexiert ist für die Suche somit wieder statisch.
PHP-Code ist deshalb vollkommen uninteressant. Mich interessiert ja nur, was auch ein "normaler" Benutzer sieht, weil dass das einzige ist, in dem gesucht werden kann/soll.
Du siehst aber offensichtlich genau das nicht (ab und zu?).
Die Ausführung von PHP-Code innerhalb der Artikel ist nötig, weil die Suche ja die eigentlichen Inhalte indexieren soll.
Also sind die Seiten wirklich nicht statisch.
Während der Indexierung müssen die Seiten natürlich ausgeführt werden, um deren Ausgabe statisch im Suchindex zu hinterlegen.
Mal 'ne blöde Idee. Wie wäre es, die Seite über http anzufordern. So bekäme sie das Indexierungsskript wie irgendein Client zu Gesicht und müsste nur noch den HTML-Quelltext parsen.
Es handelt sich übrigens um http://redaxo.de@Redaxo, falls es dich interessiert.
Das habe ich schon registriert. Ich halte das Konzept im Zusammenhang mit deinem Suchskript für nicht passend (es könnte aber auch dein Skript sein). :-)
Tschö, Auge
Verschiedene Glocken läuteten in der Stadt, und jede von ihnen vertrat eine ganz persönliche Meinung darüber, wann es Mitternacht war.
Terry Pratchett, "Wachen! Wachen!"
Veranstaltungsdatenbank Vdb 0.3