Vinzenz Mai: Logische Probleme durch andere Programmiersprache nicht lösbar.

Beitrag lesen

Hallo Don,

Naja, "komplex" ist relativ.
PHP kenne ich zu wenig, aber wenn globales Suchen & Ersetzen möglich ist mit Ermittlung der Anzahl Ersetzungen, dann ist ein entsprechender Algorithmus ganz einfach:

  1. Nimm das Erste Wort im Text.

wie erkennst Du ein Wort?

  1. Ersetze es global durch nichts, d.h. durch einen Leerstring
  2. Schreibe das Wort und die Anzahl der Erstzungen in die Datenbank.

Du hast das Trimmen vergesen :-)

=>zurück zu Punkt 1) bis der Text leer ist.

effektiv entspricht Dein Algorithmus folgenden zwei PHP-Anweisungen:

$myWords = [link:http://www.php.net/manual/de/function.preg-split.php@title=preg_split]( <muster zum Erkennen von Wörtern>, $input);  
$highscore = array_count_values($myWords);

siehe auch suits "dreckige" Variante (preg_split ist in "wie auch immer" enthalten).

suit hat bereits das Problem der Worttrennung hingewiesen. Darüber hinaus gibt es noch das Problem der unerwünschten Wörter wie "der, die, das, ..." - die Stopword-Liste -  das Problem der Groß- und Kleinschreibung und natürlich die Kombination von beidem und zu allem Überfluss gegebenenfalls noch die Notwendigkeit, unterschiedliche Sprachen unterschiedlich behandeln zu wollen - siehe suits Anmerkungen und die Anmerkungen von suit. :-)

Ich stelle fest: suit hat dieses Problem intensiv überdacht ...

Freundliche Grüße

Vinzenz