humpdi: skript zur extrahierung von daten aus html

hallo!

ich suche ein php skript, mit dem ich eine beliebige seite einlesen und sagen wir, die daten zwischen zwei bestimmten tags (als 2 definierten strings) einlesen kann?

also: html-seite per php einlesen - string durchsuchen - ergebnis extrahieren

weiß jemand eine gute seite wo ich so etwas finden könnte? wär super :)

danke im vorraus für eure hilfe

lg humpdi

  1. Hallo

    ich suche ein php skript, mit dem ich eine beliebige seite einlesen und sagen wir, die daten zwischen zwei bestimmten tags (als 2 definierten strings) einlesen kann?

    also: html-seite per php einlesen - string durchsuchen - ergebnis extrahieren

    wo ist das Problem?
    Was hast Du versucht?
    Woran bist Du gescheitert?

    weiß jemand eine gute seite wo ich so etwas finden könnte? wär super :)

    Ja natürlich, das PHP-Handbuch weiß alles darüber.

    Im einfachen Fall fallen mir z.B.

    file_get_contents

    und

    strpos
    substr

    oder die Regulären Ausdrücke (Perl-kompatibel)

    ein.

    Wenn Dein Hoster bestimmte Features deaktiviert hat, entweder den Hoster wechseln oder mit fsockopen arbeiten.

    Wo ist nun wirklich Dein Problem?
    Bis wohin bist Du gekommen?
    Welches Teilproblem hast Du noch nicht gelöst?

    Fragende Grüße

    Vinzenz

    1. Hello,

      weiß jemand eine gute seite wo ich so etwas finden könnte? wär super :)

      Bei Grabbersoft unterm Ladentisch, da es vermutlich illegal ist, was Du vorhast.

      Sogar der Goolge-Link auf die Seite ist schon wieder entfernt aus dem Index...

      Harzliche Grüße vom Berg
      http://bergpost.annerschbarrich.de

      Tom

      --
      Fortschritt entsteht nur durch die Auseinandersetzung der Kreativen
      Nur selber lernen macht schlau
      Ein Jammer ist auch, dass die Dummen so selbstsicher und die Klugen voller Zweifel sind. Das sollte uns häufiger zweifeln lassen :-)

      1. Hallo Tom,

        weiß jemand eine gute seite wo ich so etwas finden könnte? wär super :)

        Bei Grabbersoft unterm Ladentisch, da es vermutlich illegal ist, was Du vorhast.

        ich hab' gar nichts vor :-) Spinnt mal wieder die Voransicht? SCNR.
        Bei Deinen Exceptions kann ich Dir leider nicht weiterhelfen :-(

        Freundliche Grüße

        Vinzenz

        1. Hello,

          Bei Grabbersoft unterm Ladentisch, da es vermutlich illegal ist, was Du vorhast.

          ich hab' gar nichts vor :-) Spinnt mal wieder die Voransicht? SCNR.

          Ach, wahrscheinlich wollte ich deinen Beitrag vorher unbedingt noch lesen, bevor ich antworte und dann war ich so mit Google beschäftigt, dass ich gar nicht mehr gemerkt habe, dass es nicht der von humpdi war...

          Harzliche Grüße vom Berg
          http://bergpost.annerschbarrich.de

          Tom

          --
          Fortschritt entsteht nur durch die Auseinandersetzung der Kreativen
          Nur selber lernen macht schlau
          Ein Jammer ist auch, dass die Dummen so selbstsicher und die Klugen voller Zweifel sind. Das sollte uns häufiger zweifeln lassen :-)

  2. Hallo,

    also: html-seite per php einlesen - string durchsuchen - ergebnis extrahieren

    Ich würde - sofern es XHTML ist - versuchen mit http://www.php.net/manual/en/ref.dom.php@DOM oder http://www.php.net/manual/en/ref.simplexml.php@SimpleXML ranzugehen.

    Ansonsten: Wie Vinzenz Mai schon schrieb: Was hast du bisher versucht/dir überlegt? Wo sind deine Schwierigkeiten?

    Gruß

    Stareagle

    1. Hallo Stareagle

      also: html-seite per php einlesen - string durchsuchen - ergebnis extrahieren

      Ich würde - sofern es XHTML ist - versuchen mit http://www.php.net/manual/en/ref.dom.php@DOM oder http://www.php.net/manual/en/ref.simplexml.php@SimpleXML ranzugehen.

      wegen der Aussage im Ausgangsbeitrag:

      ich suche ein php skript, mit dem ich eine beliebige seite einlesen

      dachte ich mir, dass man an die Qualität des zu durchsuchenden Materials keine Ansprüche stellen könnte.

      Ansonsten: Wie Vinzenz Mai schon schrieb:

      Vinzenz reicht schon, um mich zu identifizieren, mein Name ist selten genug :-)

      Freundliche Grüße

      Vinzenz

      1. Hallo Vinzenz,
        »

        dachte ich mir, dass man an die Qualität des zu durchsuchenden Materials keine Ansprüche stellen könnte.

        Da hast du natürlich recht. Aber leider war die Aussage im Angangspost so unspezifisch, dass man nicht wissen konnte, um was es genau geht. Außerdem wollte ich humpdi nur eine weitere Anregung geben. Wenn du dass mit Strings nicht schon geschrieben hättest, hätte ich die auch erwähnt.

        Vinzenz reicht schon, um mich zu identifizieren, mein Name ist selten genug :-)

        C&P. Hab einfach deinen ganzen Namen erwischt... War gestern für mich schon spät...

        Gruß

        Stareagle

  3. vielen dank für eure antworten!

    ich habe mittlerweile ein etwas anderes problem, und zwar lässt sich die seite http://whois.domaintools.com/orf.at nicht per file_get_contents funktion einlesen, ich bekomme immer den fehler "failed to open stream: HTTP request failed! HTTP/1.1 404 Not Found". bei anderen urls funktioniert das aber schon. was kann der grund dafür sein? kann diese seite denn zugriff über skripts/php unterbinden, und nur den direkten zugriff erlauben? gibt es eine alternative?

    was ich machen möchte ist sicher nicht illegal. ich möchte mit hilfe dieses whois-services die adress-daten der blogs meiner freunde einlesen, und diese dann auf eine google-maps karte darstellen. thats it.

    doch dazu muss ich diese seite eben erst einmal einlesen, und den string mit der adresse extrahieren. keine ahnung warum sich diese seite nicht einlesen lässt...

    lg

    1. Hallo,

      was ich machen möchte ist sicher nicht illegal. ich möchte mit hilfe dieses whois-services die adress-daten der blogs meiner freunde einlesen, und diese dann auf eine google-maps karte darstellen. thats it.

      ich verstehe zwar nicht, was Du vorhast - aber kann es sein, dass Du im wesentlichen gethostbyname() suchst?

      Freundliche Grüße

      Vinzenz

      1. ja, das habe ich mir auch schon überlegt, nur die ip auszulesen. aber die ip verrät nicht immer den genauen standort, das ist das problem. die ip verrät nur den standort des providers, aber nicht den des domaininhabers. thats the difference.

        aber danke für deine (sehr hilfreichen!) tips, bin echt froh darüber :)

        lg

  4. gut, bin schonwieder einen schritt weiter, habe jetzt einen andern whois-service herangezogen, nämlich http://www.who.is/. da funktionierts. mache mich jetzt an das durchsuchen des strings...

    melde meine fortschritte (oder anders rum ;)