Stell ich mir nicht sehr schwer vor. Extrahiere die einzelnen Wörter, mit regex oder Trennzeichen. Die Wörter prüfst du dann gegen eine Liste mit bekannten Wörtern.
Das ist wäre natürlich das einfachste. Ich weiß nicht, ob in dieser Hinsicht ausgereiftere Programme so simpel vorgehen oder ob da z.B. nur gegen einen "Wortstamm" geprüft wird und eine Satzt von Regeln zur Wordbeugung hinzu kommt.
Deswegen fragte ich hier nach. Vielleicht kennt ja jemand eine entsprechende Bibliothek.
Das einzig schwierige dürfte sein, die Wörterliste zu finden. Die sollte ja möglichst alle vorkommenen Wörter enthalten, sonst ist das ganze wertlos.
So eine Liste sollte ja jedes (Open- bzw. MS-) Office enthalten. Btw: weiß jemand, wie man die z.B. in eine SQL Tabell packt?
Und eine sinnvolle Grenze zwischen richtigen Wörtern und falschen. In diesem Forum hast du damit wahrscheinlich ein Problem denn es taucht ja gerne auch HTML Coder oder CSS oder sonst was ganz anderes auf, das kein erkennbar sinnvoller Text ist aber trotzdem rein gehört.
Dort wo ich es brauche, schreibt niemand Code, nur Sch****.
Gruß
Ralf