SI: +Browser+Logik ?!? Daten auslesen

Hallo zusammen,

ich hab folgende Aufgabe zu bewältigen:
Ich will aus einer von einem PHP-Skript erzeugt Website Daten auslesen.
Am besten wäre es denke ich den Cache meines IE 6.0 mit meinem Perl-Script
auszulesen, jedoch kann ich dort nirgends diese Website finden (Caching is an)?!?
Was kann ich nun tun ?
Problem bei direkten auslesen der Seite wie lwp oder so ist, dass dies eine
Seite ist bei der mann sich vorher wie php-Script anmelden muss (afaik dann ne
ne Session ist) und sich dann vie links durchhangelt auf die gewünschte Seite
, von der ich die Daten dann auslesen will.

Weiss jemand Rat ?

cya
SI

  1. Hi SI,

    Problem bei direkten auslesen der Seite wie lwp oder so ist, dass dies eine
    Seite ist bei der mann sich vorher wie php-Script anmelden muss (afaik dann ne
    ne Session ist) und sich dann vie links durchhangelt auf die gewünschte Seite
    , von der ich die Daten dann auslesen will.

    dann tue das 'einfach'.

    Es gibt ein Perl-Modul, welches Dir alle Links eines Dokuments extrahiert - HTML mußt Du nicht selber parsen.

    Viele Grüße
          Michael

    --
    T'Pol: I apologize if I acted inappropriately.
    V'Lar: Not at all. In fact, your bluntness made me reconsider some of my positions. Much as it has now.
    (sh:| fo:} ch:] rl:( br:^ n4:( ie:% mo:) va:| de:/ zu:| fl:( ss:) ls:~ js:|)
    Auch diese Signatur wird an korrekt konfigurierte Browser gzip-komprimiert übertragen.
    1. Hi SI,

      Problem bei direkten auslesen der Seite wie lwp oder so ist, dass dies eine
      Seite ist bei der mann sich vorher wie php-Script anmelden muss (afaik dann ne
      ne Session ist) und sich dann vie links durchhangelt auf die gewünschte Seite
      , von der ich die Daten dann auslesen will.

      dann tue das 'einfach'.

      Es gibt ein Perl-Modul, welches Dir alle Links eines Dokuments extrahiert - HTML mußt Du nicht selber parsen.

      Viele Grüße
            Michael

      Das Problem ist nciht das parsen sondern diese HTML-Seite zu kommen.

      cya
      SI

      1. Hi,

        Das Problem ist nciht das parsen sondern diese HTML-Seite zu kommen.

        was hast Du denn (mit Perl) versucht und was hast Du warum nicht bekommen?

        Gruss,
        Lude

      2. Hi SI,

        Problem bei direkten auslesen der Seite wie lwp oder so ist, dass dies eine
        Seite ist bei der mann sich vorher wie php-Script anmelden muss (afaik dann ne
        ne Session ist) und sich dann vie links durchhangelt auf die gewünschte Seite
        , von der ich die Daten dann auslesen will.
        dann tue das 'einfach'.
        Es gibt ein Perl-Modul, welches Dir alle Links eines Dokuments extrahiert - HTML mußt Du nicht selber parsen.
        Das Problem ist nciht das parsen sondern diese HTML-Seite zu kommen.

        wieso? LWP hast Du explizit selbst erwähnt; Deine Session-ID ist in den geparseten Links bereits enthalten. Wo ist das Problem?
        Du mußt halt mit Deinem Programm wirklich eine komplette Session (ab Login!) durchführen (also eine Folge von HTTP-Requests) und nicht bloß einzelne Seiten herauspicken.

        Sollte Dein Session-Mechanismus eventuell nicht auf Query-Strings, sondern auf Cookies basieren, dann ändert sich nichts an meiner Aussage: Du verwendest dann eben LWP::UserAgent statt LWP::Simple.
        Falls mindestens einer Deiner Requests nicht GET, sondern POST ist, mußt Du letzteres ohnehin tun.

        Viele Grüße
              Michael

        --
        T'Pol: I apologize if I acted inappropriately.
        V'Lar: Not at all. In fact, your bluntness made me reconsider some of my positions. Much as it has now.
        (sh:| fo:} ch:] rl:( br:^ n4:( ie:% mo:) va:| de:/ zu:| fl:( ss:) ls:~ js:|)
        Auch diese Signatur wird an korrekt konfigurierte Browser gzip-komprimiert übertragen.