+Browser+Logik ?!? Daten auslesen
SI
- perl
0 Michael Schröpl0 SI0 Lude0 Michael Schröpl
Hallo zusammen,
ich hab folgende Aufgabe zu bewältigen:
Ich will aus einer von einem PHP-Skript erzeugt Website Daten auslesen.
Am besten wäre es denke ich den Cache meines IE 6.0 mit meinem Perl-Script
auszulesen, jedoch kann ich dort nirgends diese Website finden (Caching is an)?!?
Was kann ich nun tun ?
Problem bei direkten auslesen der Seite wie lwp oder so ist, dass dies eine
Seite ist bei der mann sich vorher wie php-Script anmelden muss (afaik dann ne
ne Session ist) und sich dann vie links durchhangelt auf die gewünschte Seite
, von der ich die Daten dann auslesen will.
Weiss jemand Rat ?
cya
SI
Hi SI,
Problem bei direkten auslesen der Seite wie lwp oder so ist, dass dies eine
Seite ist bei der mann sich vorher wie php-Script anmelden muss (afaik dann ne
ne Session ist) und sich dann vie links durchhangelt auf die gewünschte Seite
, von der ich die Daten dann auslesen will.
dann tue das 'einfach'.
Es gibt ein Perl-Modul, welches Dir alle Links eines Dokuments extrahiert - HTML mußt Du nicht selber parsen.
Viele Grüße
Michael
Hi SI,
Problem bei direkten auslesen der Seite wie lwp oder so ist, dass dies eine
Seite ist bei der mann sich vorher wie php-Script anmelden muss (afaik dann ne
ne Session ist) und sich dann vie links durchhangelt auf die gewünschte Seite
, von der ich die Daten dann auslesen will.dann tue das 'einfach'.
Es gibt ein Perl-Modul, welches Dir alle Links eines Dokuments extrahiert - HTML mußt Du nicht selber parsen.
Viele Grüße
Michael
Das Problem ist nciht das parsen sondern diese HTML-Seite zu kommen.
cya
SI
Hi,
Das Problem ist nciht das parsen sondern diese HTML-Seite zu kommen.
was hast Du denn (mit Perl) versucht und was hast Du warum nicht bekommen?
Gruss,
Lude
Hi SI,
Problem bei direkten auslesen der Seite wie lwp oder so ist, dass dies eine
Seite ist bei der mann sich vorher wie php-Script anmelden muss (afaik dann ne
ne Session ist) und sich dann vie links durchhangelt auf die gewünschte Seite
, von der ich die Daten dann auslesen will.
dann tue das 'einfach'.
Es gibt ein Perl-Modul, welches Dir alle Links eines Dokuments extrahiert - HTML mußt Du nicht selber parsen.
Das Problem ist nciht das parsen sondern diese HTML-Seite zu kommen.
wieso? LWP hast Du explizit selbst erwähnt; Deine Session-ID ist in den geparseten Links bereits enthalten. Wo ist das Problem?
Du mußt halt mit Deinem Programm wirklich eine komplette Session (ab Login!) durchführen (also eine Folge von HTTP-Requests) und nicht bloß einzelne Seiten herauspicken.
Sollte Dein Session-Mechanismus eventuell nicht auf Query-Strings, sondern auf Cookies basieren, dann ändert sich nichts an meiner Aussage: Du verwendest dann eben LWP::UserAgent statt LWP::Simple.
Falls mindestens einer Deiner Requests nicht GET, sondern POST ist, mußt Du letzteres ohnehin tun.
Viele Grüße
Michael