wunderwarzenschwein: Textteile ersetzen ?!

Beitrag lesen

Hi,

» http://perldoc.com/perl5.8.0/pod/perlfaq9.html#How-do-I-remove-HTML-from-a-string-
Hmm... sorry kann damit nicht viel anfagen, bin nämlich totaler anfänger in Perl =) könnt ihr mir das irgendwie verständlicher machen !?

Kennst du dich grundlegend mit regulären Ausdrücken aus? Wenn nicht: http://www.perldoc.com/perl5.8.0/pod/perlre.html

Die Codezeile, die in der FAQ genannt wird,

s/<(?:[^>'"]*|(['"]).*?\1)*>//gs

macht nix anderes als mittels des s//-Operators alle HTML-Tags in der Standardvariable $_ durch "nix" zu ersetzen, also zu löschen.

Wenn du nicht $_ sondern eine andere Variable bearbeiten willst, hilft dir der =~ Operator. Und anstatt die Tags rauszulöschen, kann man sie natürlich auch durch ein Leerzeichen ersetzen:

$html=~s/<(?:[^>'"]*|(['"]).*?\1)*>/ /gs

HTH

wunderwarzenschwein

--
ss:} zu:$ ls:} fo:| de:] va:) ch:? sh:( n4:# rl:? br:> js:| ie:( fl:{ mo:)