Jan K.: Stringbearbeitung in Javascript (HTML Seite einlesen?)

Beitrag lesen

Hallo zusammen,

ich möchte gerne daten aus dem HTML Quelltext einer anderern Seite einlesen. Das mache ich momentan in PHP mit explode und sieht ca. so aus:
--------------------------------------------------------------------
$_POST[clan] = str_replace("§","§",$_POST[clan]);
$link=$_POST[clan];
if ( !(empty($_POST[clan])) ) {
 if ( !(file_exists($link)) ) { mkdir($link); }
 $papu=file_get_contents("http://www.battle.net/war3/ladder/w3xp-clan-profile.aspx?Gateway=Northrend&ClanTag=$link");
 $papu = htmlspecialchars($papu);
 $seiten=explode("PageNo=", $papu);
 $anzahl1 = (count($seiten));
 $seiten=explode(">", $seiten[2]);
 $seiten[0]=str_replace(""","",$seiten[0]);
 for ($x=1;$x<=$seiten[0];$x++){
  unset($zw1);
  $popo=file_get_contents("http://www.battle.net/war3/ladder/w3xp-clan-profile.aspx?ClanTag=$link&Gateway=Northrend&SortField=rank%20DESC,%20online%20desc&SortDir=Asc&PageNo=$x");
  $popo = htmlspecialchars($popo);
  $zw=explode("PlayerName=", $popo);
  $anzahl = (count($zw));
  for($i=1;$i<=($anzahl-1);$i++) {
  $zw1[$i]=explode("&gt;", $zw[$i]);
  }
  for ($i=1;$i<=15;$i++){
   if ( !(empty($zw1[$i][1])) ){
   $zw1[$i][1]=str_replace("&lt;/a","",$zw1[$i][1]);
   $ueb=$ueb.$zw1[$i][1]."§";
   }
  }
 }
 $pdat = fopen("$link/player.txt", "w+");
 fwrite($pdat, $ueb);
 fclose($pdat);
}
--------------------------------------------------------------------
Dieser Teil liest erstmal alle Spielernamen (15 Spieler pro Seite) von beliebig vielen Seiten ein (durchnittlich 5 seiten). Anschließend werden in einem anderen Teil ca. zehn detailinformationen jedes spielers (für jeden spieler eine andere Seite) abgefragt.

Das problematische daran ist, daß ich nach einer Handvoll Anfragen ein Gateway Tiemout bekomme, da mein script in zu kurzer Zeit zuviele Anfragen stellt.

Da mit PHP das Ergebnis erst angezeigt wird, wenn das Script fertig geladen ist (leerer Browser solange in bearbeitung u.U. 20sec) und keine Zwischenergebnisse angezeigt werden, dachte ich mir das ganze doch in Javascript zu gestalten und zwichen jeder abfrage ein bisschen pause einzulegen, um den Gateway Timeout zu vermeiden.

Den ganzen Grundschleim von javascript hab ich mir zwar schon des öfteren durchgelsen aber bisher noch nichts konkretes damit gemacht (diese Syntax is doch voll behämmert this.zickezacke so ein Unsinn!).

Meine Frage ist jetzt, kann ich in Javascript eine komplette HTML Seite einlesen und diese dann wie im obrigen besispiel (mit explode und str_replace) mit Stringfunktionen verarbeiten? Und wie heißen die konkreten Funktionen/Objekte(was auch immer in js)?

Gruß,

Jan