Hello,
$strContent = file_get_contents( $strFile ); $objDom = new DomDocument(); @$objDom->loadHTML( $strContent ); $arLinks = $objDom->getElementsByTagName('link');
In meinen Parser-Applikationen habe ich immer stehen:
function get_linklist($page, &$_exceptions = NULL)
{
$dom = new DOMDocument('1.0', 'utf-8');
$dom->encoding = 'utf-8';
$dom->validateOnParse = TRUE;
$dom->strictErrorChecking = true ;
$dom->preserveWhiteSpace = true;
$dom->resolveExternals = true;
set_error_handler('handleError', E_WARNING);
$dom->loadHTML('<meta http-equiv="content-type" content="text/html; charset=utf-8">' . "\r\n" . $page);
restore_error_handler();
$a_nodelist = $dom->getElementsByTagName('a');
## ...
In $page
ist die Seite als String drin.
Glück Auf
Tom vom Berg
--
Es gibt nichts Gutes, außer man tut es!
Das Leben selbst ist der Sinn.
Es gibt nichts Gutes, außer man tut es!
Das Leben selbst ist der Sinn.