Michael Schröpl: regexp: Zerlegen einer Zeile mit _zwei_ unbekannten Teil-Mustern

Beitrag lesen

Hi Rolf,

Ich habe mit verschiedenen Browsern mal URLs mit Leerzeichen drin in die
URL-Zeile getippt und im access_log nachgesehen, was passiert.
Der M$IE 5.0 url-encoded das Leerzeichen sofort (ersetzt es sogar in der
URL-Zeile im Browser), aber beispielsweise bei Netscape 3 geht das Leer-
zeichen gnadenlos durch - bis ins Logfile.

Und werden Anführungsstriche die unerlaubter Weise im Agent oder URL
vorkommen escaped? Sonst fängt doch Michaels Problem von vorne an! :(

Eben - das werden sie leider nicht:

127.0.0.1 - - [24/Feb/2002:02:52:44 +0100] "GET /"1"2"3"4"5 HTTP/1.0" 403 279

Apache ist da gnadenlos. :-(

Mir ist bewußt, daß ich durch hinreichend viele Felder das "faken" immer
schwerer machen kann. Aber wenn ich "A X1 X2 X3 X4 B" als Felderliste habe,
wobei A und B die Felder mit unbekanntem Inhalt sind, dann kann eben A am
Ende UND B am Anfang ein Muster enthalten, das genau auf alle X-Felder
matcht. Und dann ist die Feldzerlegung anscheinend immer mehrdeutig ...

So weit war ich mit meinen Überlegungen, als ich diesen Thread eröffnet
hatte.

Viele Grüße
      Michael