+Browser+Logik ?!? Daten auslesen von SI, 09.09.2003 13:45

+Browser+Logik ?!? Daten auslesen

SI 08.09.2003 16:52

perl

Hallo zusammen,

ich hab folgende Aufgabe zu bewältigen:
Ich will aus einer von einem PHP-Skript erzeugt Website Daten auslesen.
Am besten wäre es denke ich den Cache meines IE 6.0 mit meinem Perl-Script
auszulesen, jedoch kann ich dort nirgends diese Website finden (Caching is an)?!?
Was kann ich nun tun ?
Problem bei direkten auslesen der Seite wie lwp oder so ist, dass dies eine
Seite ist bei der mann sich vorher wie php-Script anmelden muss (afaik dann ne
ne Session ist) und sich dann vie links durchhangelt auf die gewünschte Seite
, von der ich die Daten dann auslesen will.

Weiss jemand Rat ?

cya
SI

Beitrag melden

– Informationen zu den Bewertungsregeln

+Browser+Logik ?!? Daten auslesen
Michael Schröpl Homepage des Autors 08.09.2003 18:33

perl
– Informationen zu den Bewertungsregeln
Hi SI,

Problem bei direkten auslesen der Seite wie lwp oder so ist, dass dies eine
Seite ist bei der mann sich vorher wie php-Script anmelden muss (afaik dann ne
ne Session ist) und sich dann vie links durchhangelt auf die gewünschte Seite
, von der ich die Daten dann auslesen will.

dann tue das 'einfach'.

Es gibt ein Perl-Modul, welches Dir alle Links eines Dokuments extrahiert - HTML mußt Du nicht selber parsen.

Viele Grüße
Michael

--
T'Pol: I apologize if I acted inappropriately.
V'Lar: Not at all. In fact, your bluntness made me reconsider some of my positions. Much as it has now.
(sh:| fo:} ch:] rl:( br:^ n4:( ie:% mo:) va:| de:/ zu:| fl:( ss:) ls:~ js:|)
Auch diese Signatur wird an korrekt konfigurierte Browser gzip-komprimiert übertragen.
Beitrag melden

–
Informationen zu den Bewertungsregeln
1. +Browser+Logik ?!? Daten auslesen
  
  SI 09.09.2003 13:45
  
  perl
  – Informationen zu den Bewertungsregeln
  Hi SI,
  
  Problem bei direkten auslesen der Seite wie lwp oder so ist, dass dies eine
  Seite ist bei der mann sich vorher wie php-Script anmelden muss (afaik dann ne
  ne Session ist) und sich dann vie links durchhangelt auf die gewünschte Seite
  , von der ich die Daten dann auslesen will.
  
  dann tue das 'einfach'.
  
  Es gibt ein Perl-Modul, welches Dir alle Links eines Dokuments extrahiert - HTML mußt Du nicht selber parsen.
  
  Viele Grüße
  Michael
  
  Das Problem ist nciht das parsen sondern diese HTML-Seite zu kommen.
  
  cya
  SI
  Beitrag melden
  
  –
  Informationen zu den Bewertungsregeln
  Übersicht
  
  alle Foren
  
  SELFHTML-Forum
  
  anmelden
  
  Benutzerkonto erstellen
  
  Beitrag im Thread-Baum
  1. +Browser+Logik ?!? Daten auslesen
    
    Lude 09.09.2003 20:32
    
    perl
    
    – Informationen zu den Bewertungsregeln
    Hi,
    
    Das Problem ist nciht das parsen sondern diese HTML-Seite zu kommen.
    
    was hast Du denn (mit Perl) versucht und was hast Du warum nicht bekommen?
    
    Gruss,
    Lude
    Beitrag melden
    
    –
    Informationen zu den Bewertungsregeln
    
    Übersicht
    
    alle Foren
    
    SELFHTML-Forum
    
    anmelden
    
    Benutzerkonto erstellen
    
    Beitrag im Thread-Baum
  2. +Browser+Logik ?!? Daten auslesen
    
    Michael Schröpl Homepage des Autors 10.09.2003 18:35
    
    perl
    
    – Informationen zu den Bewertungsregeln
    Hi SI,
    
    Problem bei direkten auslesen der Seite wie lwp oder so ist, dass dies eine
    Seite ist bei der mann sich vorher wie php-Script anmelden muss (afaik dann ne
    ne Session ist) und sich dann vie links durchhangelt auf die gewünschte Seite
    , von der ich die Daten dann auslesen will.
    dann tue das 'einfach'.
    Es gibt ein Perl-Modul, welches Dir alle Links eines Dokuments extrahiert - HTML mußt Du nicht selber parsen.
    Das Problem ist nciht das parsen sondern diese HTML-Seite zu kommen.
    
    wieso? LWP hast Du explizit selbst erwähnt; Deine Session-ID ist in den geparseten Links bereits enthalten. Wo ist das Problem?
    Du mußt halt mit Deinem Programm wirklich eine komplette Session (ab Login!) durchführen (also eine Folge von HTTP-Requests) und nicht bloß einzelne Seiten herauspicken.
    
    Sollte Dein Session-Mechanismus eventuell nicht auf Query-Strings, sondern auf Cookies basieren, dann ändert sich nichts an meiner Aussage: Du verwendest dann eben LWP::UserAgent statt LWP::Simple.
    Falls mindestens einer Deiner Requests nicht GET, sondern POST ist, mußt Du letzteres ohnehin tun.
    
    Viele Grüße
    Michael
    
    --
    T'Pol: I apologize if I acted inappropriately.
    V'Lar: Not at all. In fact, your bluntness made me reconsider some of my positions. Much as it has now.
    (sh:| fo:} ch:] rl:( br:^ n4:( ie:% mo:) va:| de:/ zu:| fl:( ss:) ls:~ js:|)
    Auch diese Signatur wird an korrekt konfigurierte Browser gzip-komprimiert übertragen.
    Beitrag melden
    
    –
    Informationen zu den Bewertungsregeln
    
    Übersicht
    
    alle Foren
    
    SELFHTML-Forum
    
    anmelden
    
    Benutzerkonto erstellen
    
    Beitrag im Thread-Baum

SELFHTML Forum - Ergänzung zur Dokumentation Übersicht

SI: +Browser+Logik ?!? Daten auslesen