skript zur extrahierung von daten aus html
humpdi
- php
0 Vinzenz Mai0 Tom0 Vinzenz Mai0 Tom
0 stareagle0 humpdi0 Vinzenz Mai0 humpdi
0 humpdi
hallo!
ich suche ein php skript, mit dem ich eine beliebige seite einlesen und sagen wir, die daten zwischen zwei bestimmten tags (als 2 definierten strings) einlesen kann?
also: html-seite per php einlesen - string durchsuchen - ergebnis extrahieren
weiß jemand eine gute seite wo ich so etwas finden könnte? wär super :)
danke im vorraus für eure hilfe
lg humpdi
Hallo
ich suche ein php skript, mit dem ich eine beliebige seite einlesen und sagen wir, die daten zwischen zwei bestimmten tags (als 2 definierten strings) einlesen kann?
also: html-seite per php einlesen - string durchsuchen - ergebnis extrahieren
wo ist das Problem?
Was hast Du versucht?
Woran bist Du gescheitert?
weiß jemand eine gute seite wo ich so etwas finden könnte? wär super :)
Ja natürlich, das PHP-Handbuch weiß alles darüber.
Im einfachen Fall fallen mir z.B.
und
oder die Regulären Ausdrücke (Perl-kompatibel)
ein.
Wenn Dein Hoster bestimmte Features deaktiviert hat, entweder den Hoster wechseln oder mit fsockopen arbeiten.
Wo ist nun wirklich Dein Problem?
Bis wohin bist Du gekommen?
Welches Teilproblem hast Du noch nicht gelöst?
Fragende Grüße
Vinzenz
Hello,
weiß jemand eine gute seite wo ich so etwas finden könnte? wär super :)
Bei Grabbersoft unterm Ladentisch, da es vermutlich illegal ist, was Du vorhast.
Sogar der Goolge-Link auf die Seite ist schon wieder entfernt aus dem Index...
Harzliche Grüße vom Berg
http://bergpost.annerschbarrich.de
Tom
Hallo Tom,
weiß jemand eine gute seite wo ich so etwas finden könnte? wär super :)
Bei Grabbersoft unterm Ladentisch, da es vermutlich illegal ist, was Du vorhast.
ich hab' gar nichts vor :-) Spinnt mal wieder die Voransicht? SCNR.
Bei Deinen Exceptions kann ich Dir leider nicht weiterhelfen :-(
Freundliche Grüße
Vinzenz
Hello,
Bei Grabbersoft unterm Ladentisch, da es vermutlich illegal ist, was Du vorhast.
ich hab' gar nichts vor :-) Spinnt mal wieder die Voransicht? SCNR.
Ach, wahrscheinlich wollte ich deinen Beitrag vorher unbedingt noch lesen, bevor ich antworte und dann war ich so mit Google beschäftigt, dass ich gar nicht mehr gemerkt habe, dass es nicht der von humpdi war...
Harzliche Grüße vom Berg
http://bergpost.annerschbarrich.de
Tom
Hallo,
also: html-seite per php einlesen - string durchsuchen - ergebnis extrahieren
Ich würde - sofern es XHTML ist - versuchen mit http://www.php.net/manual/en/ref.dom.php@DOM oder http://www.php.net/manual/en/ref.simplexml.php@SimpleXML ranzugehen.
Ansonsten: Wie Vinzenz Mai schon schrieb: Was hast du bisher versucht/dir überlegt? Wo sind deine Schwierigkeiten?
Gruß
Stareagle
Hallo Stareagle
also: html-seite per php einlesen - string durchsuchen - ergebnis extrahieren
Ich würde - sofern es XHTML ist - versuchen mit http://www.php.net/manual/en/ref.dom.php@DOM oder http://www.php.net/manual/en/ref.simplexml.php@SimpleXML ranzugehen.
wegen der Aussage im Ausgangsbeitrag:
ich suche ein php skript, mit dem ich eine beliebige seite einlesen
dachte ich mir, dass man an die Qualität des zu durchsuchenden Materials keine Ansprüche stellen könnte.
Ansonsten: Wie Vinzenz Mai schon schrieb:
Vinzenz reicht schon, um mich zu identifizieren, mein Name ist selten genug :-)
Freundliche Grüße
Vinzenz
Hallo Vinzenz,
»
dachte ich mir, dass man an die Qualität des zu durchsuchenden Materials keine Ansprüche stellen könnte.
Da hast du natürlich recht. Aber leider war die Aussage im Angangspost so unspezifisch, dass man nicht wissen konnte, um was es genau geht. Außerdem wollte ich humpdi nur eine weitere Anregung geben. Wenn du dass mit Strings nicht schon geschrieben hättest, hätte ich die auch erwähnt.
Vinzenz reicht schon, um mich zu identifizieren, mein Name ist selten genug :-)
C&P. Hab einfach deinen ganzen Namen erwischt... War gestern für mich schon spät...
Gruß
Stareagle
vielen dank für eure antworten!
ich habe mittlerweile ein etwas anderes problem, und zwar lässt sich die seite http://whois.domaintools.com/orf.at nicht per file_get_contents funktion einlesen, ich bekomme immer den fehler "failed to open stream: HTTP request failed! HTTP/1.1 404 Not Found". bei anderen urls funktioniert das aber schon. was kann der grund dafür sein? kann diese seite denn zugriff über skripts/php unterbinden, und nur den direkten zugriff erlauben? gibt es eine alternative?
was ich machen möchte ist sicher nicht illegal. ich möchte mit hilfe dieses whois-services die adress-daten der blogs meiner freunde einlesen, und diese dann auf eine google-maps karte darstellen. thats it.
doch dazu muss ich diese seite eben erst einmal einlesen, und den string mit der adresse extrahieren. keine ahnung warum sich diese seite nicht einlesen lässt...
lg
Hallo,
was ich machen möchte ist sicher nicht illegal. ich möchte mit hilfe dieses whois-services die adress-daten der blogs meiner freunde einlesen, und diese dann auf eine google-maps karte darstellen. thats it.
ich verstehe zwar nicht, was Du vorhast - aber kann es sein, dass Du im wesentlichen gethostbyname() suchst?
Freundliche Grüße
Vinzenz
ja, das habe ich mir auch schon überlegt, nur die ip auszulesen. aber die ip verrät nicht immer den genauen standort, das ist das problem. die ip verrät nur den standort des providers, aber nicht den des domaininhabers. thats the difference.
aber danke für deine (sehr hilfreichen!) tips, bin echt froh darüber :)
lg
gut, bin schonwieder einen schritt weiter, habe jetzt einen andern whois-service herangezogen, nämlich http://www.who.is/. da funktionierts. mache mich jetzt an das durchsuchen des strings...
melde meine fortschritte (oder anders rum ;)