Sven Rautenberg: Email Adresse aus Text lesen und löschen

Beitrag lesen

Moin!

Also ich habe ja schon brav gesucht, allerdings mein Problem nicht lösen könne.

Du glaubst, es liegt an deinem noch mangelhaften Wissen über reguläre Ausdrücke.

Ich glaube, es liegt an der grundsätzlichen Unmöglichkeit, menschliches Verhalten "programmierbar" zu machen.

Das Problem:

In einem Formular kann der Besucher einen Text eingeben.
In diesem Text sollen keine Emil-Adressen oder URLs stehen (hält sich natürlich nicht jeder dran).

Wie kann ich nun aus einem Text eine Email-Adresse (oder URL) auslesen, löschen und den Text bestehen lassen.

Wenn du den Text hinterher niemandem zeigst, könnte dein Ansatz funktionieren, die Mailadressen und URLs rauszulöschen. Aber wem wäre dann damit geholfen?

Wenn hingegen der Autor des Textes hinterher einen kontrollierenden Blick auf sein Werk wirft und die fehlenden Adressen erblickt, wird er es entweder darauf beruhen lassen, oder zu alternativen Schreibweisen greifen.

Bei Mailadressen wäre alternativ zu "mailbox@example.com" denkbar, dass man "mailbox(at)example.com" schreibt, oder "mailbox at example dot com" - oder sonst irgendeine Variante, die den Ersteller dieser für Menschen lesbaren Kreation davor schützt, dass Spambots die Adresse ebenso leicht erfassen können.

Und genau sowas, nämlich den Part "Mailadressenerkennung", den auch ein Spambot benötigt, willst du jetzt programmieren. Das wird schwierig bis unmöglich.

Das gleiche Spielchen spielt sich natürlich bei den URLs ebenso ab. Du kannst alle dir bekannten Schreibweisen erfassen und filtern, aber gegen die Kreativität von Menschen kommt dein Programm nicht an.

- Sven Rautenberg

--
"Love your nation - respect the others."