Halihallo Andreas
Hollodrio Philipp,
liegt ja doch noch einer nicht schlapp im Bett oder unterm Baum ;)
Nein, man erstellt einen sogenannten inverted index, d.h. eine Volltextsuche wird
_niemals_ alle Dokumente durchforsten.
das habe ich verstanden, deshalb will ich ja das indexieren lernen.
Jedes Dokument wird zuerst indexiert, d.h. in Wörter oder Wortkombinationen aufgeschlüsselt und nur diese werden gespeichert.
So! WELCHE Wörter nimmt man denn da. Alle? Und wann nehme ich Wortkombinationen?
Zudem kann ein guter Index sehr viel schneller durchsucht werden, da er vorsortiert sein kann (wie z.B. die Indizies bei Datenbanken).
ist denn ein assoziatives Array aus Sicht einer Programmiersprache auch 'vorsortiert'?
Benutzt du eine MySQL Datenbank? - Dann wäre ggf.
http://www.mysql.com/doc/en/Fulltext_Search.html lesenswert. Sonst müsstest du etwas mehr dazu sagen, wie du die Volltextsuche haben möchtest und welche Techniken dir zu Verfügung stehen.
Ich habe MySQL/PHP. Die Kopfdaten der Postings speichere ich in der DB, aber die Inhalte der Postings speichere ich in Dateien (aus Platzgründen, und um vielleicht mal einen Download anbieten zu können).
Gruß, Andreas