RobRobson: Semantische Texterkennung

Beitrag lesen

Hallo,

gibts schon verwendbare Klassen für php/perl o.ä. die Stukturen in menschlich verfassten Texten semantisch erfassen können?

Auftrag ist, aus Listen die immer ziemlich unterschiedlich aufgebaut sind aber im Grunde ähnliche Informationen enthalten maschinell zu erfassen. Auch eine grobe Aufarbeitung könnte mir schon helfen. Also zB wieviel Listenpunkte entält ein Text, das richtet sich danach wie oft ähnliche Informationen auftreten. Wo fängt ein Punkt an und wo hört er auf. Also erstmal das erkennen der Stuktur würde mir schon weiterhelfen. Es geht nicht darum den ganzen Sinn des Textes zu erfassen. Würde mich auch über Hinweise und Lesestoff freuen.

Danke und viele Grüße,
Rob

PS: opencalais analysiert nur in English und zu Einzelwort orientiert / Gate zu groß / hypknowsys.org leider leere Seite über das Prudukt aus Dr. Karsten Winkler Dissertation