Hi,
ich die überflüssigen html-, head-, body-, usw.-Tags gleich rausfiltern könnte.
Das geht mit diesen beiden Funktionen:
function abinhalt($inp, $need, $offset=0) {
$a = strpos($inp, $need);
$a = substr($inp, $a + $offset);
return $a;
}
function bisinhalt($inp, $need) {
$a = strpos($inp, $need);
$a = substr($inp, 0, $a);
return $a;
}
Außerdem benötigst du den Inhalt der HTML-Datei. Dann sollte das ungefähr so gehen:
$a = implode("", file("http://www.url.de"));
$a = abinhalt($a, "<body>", 6); // Evtl. kann die 6 auch eine 5 oder 7 sein, musst mal schauen
$a = bisinhalt($a, "</body>");
echo $a;
Noch so ein kleiner Tipp am Rande: Falls du vorhast, die Hinweise auf Copyright/Urheberschutz zu entfernen und/oder gar keine Erlaubnis hast, den Text einzubinden - achte darauf, dass du ganz leicht Opfer einer Abmahnwelle werden kannst!
E7