Horst: Umlaute verschwinden

Beitrag lesen

Hallo,

bitte mal schauen auf
http://rolfrost.de/cgi-bin/words.cgi?char=Q

da steht "Qualitt" wo das 'ä' fehlt. Weiter unten steht "Qualitätsweine", da ist das 'ä' dabei.

Die Liste mit diesen Worten erstelle ich auf dem Linux-Server mit einem CGI-Script und dem Modul HTML::TagPArser. Verwende ich das Script mit demselben Modul lokal auf WinXP, fehlt nicht ein einziger Umlaut.

Btw., es sind auch die anderen Umlaute, die sporadisch fehlen.

Untenstehend ein Auszug aus dem Scipt, was die Wortliste erstellt, wer mag schaue sich das mal an.

Vielen Dank schonmal,
Hotte

  
foreach my $file(@htmlfiles){  
 my $html = HTML::TagParser->new( $file );  
 my $body = $html->getElementsByTagName( "body" );  
 my $tit = $html->getElementsByTagName( "title" );  
 my $title = $tit->innerText();  
 my @words = split /\s+/, $body->innerText();  
 foreach my $word(@words){  
  # umlaute wandeln!! # ä => ä  
  $word = uml_ae($word);  
  
  $word =~ s/[^a-zA-ZäöüÄÖÜßàâéô]//g;  
  next if $word eq '';  
  
  push @{$words{$word}}, "$file=$title";  
 }  
}  
  
# Umlaute wieder umwandeln  
sub uml_ae{  
 my $s = shift;  
 $s =~ s/ß/ß/g;  
 $s =~ s/ä/ä/g;  
 $s =~ s/ö/ö/g;  
 $s =~ s/ü/ü/g;  
 $s =~ s/Ä/Ä/g;  
 $s =~ s/Ö/Ö/g;  
 $s =~ s/Ü/Ü/g;  
 $s =~ s/à/à/g;  
 $s =~ s/â/â/g;  
 $s =~ s/é/é/g;  
 $s =~ s/ô/ô/g;  
 return $s;  
}