Hallo Don,
Naja, "komplex" ist relativ.
PHP kenne ich zu wenig, aber wenn globales Suchen & Ersetzen möglich ist mit Ermittlung der Anzahl Ersetzungen, dann ist ein entsprechender Algorithmus ganz einfach:
- Nimm das Erste Wort im Text.
wie erkennst Du ein Wort?
- Ersetze es global durch nichts, d.h. durch einen Leerstring
- Schreibe das Wort und die Anzahl der Erstzungen in die Datenbank.
Du hast das Trimmen vergesen :-)
=>zurück zu Punkt 1) bis der Text leer ist.
effektiv entspricht Dein Algorithmus folgenden zwei PHP-Anweisungen:
$myWords = [link:http://www.php.net/manual/de/function.preg-split.php@title=preg_split]( <muster zum Erkennen von Wörtern>, $input);
$highscore = array_count_values($myWords);
siehe auch suits "dreckige" Variante (preg_split ist in "wie auch immer" enthalten).
suit hat bereits das Problem der Worttrennung hingewiesen. Darüber hinaus gibt es noch das Problem der unerwünschten Wörter wie "der, die, das, ..." - die Stopword-Liste - das Problem der Groß- und Kleinschreibung und natürlich die Kombination von beidem und zu allem Überfluss gegebenenfalls noch die Notwendigkeit, unterschiedliche Sprachen unterschiedlich behandeln zu wollen - siehe suits Anmerkungen und die Anmerkungen von suit. :-)
Ich stelle fest: suit hat dieses Problem intensiv überdacht ...
Freundliche Grüße
Vinzenz