Björn Höhrmann: Erkennen von URLs

Beitrag lesen

"Meine Adresse lautet http://domain.de/pfad/index.html." (Man beachte den Punkt am Schluß...)

Es ist unmöglich ohne komplexe heuristik diesen Fall korrekt zu verarbeiten (und selbst mit nicht zuverlässlig).

Die 3.500 Zeichen RegEx von Abigail ist zumindest das zuverlässigste, was man bekommen kann, nur sind 3.500 Zeichen regulärer Ausdruck unangemessen viel.