Klaus Mock: regexp: Zerlegen einer Zeile mit _zwei_ unbekannten Teil-Mustern

Beitrag lesen

Hallo,

Das ist auf jeden Fall eine Idee, die ich mir durch den Kopf gehen lassen werde - auch wenn mir die Idee, eine logische auf mehrere physikalische Zeilen zu verteilen, nicht so spontan gefällt. (Für andere Benutzer sähe das dann doch sehr verwirrend aus.)

Du könntest das dann ja auch schön formatieren;-)
----Anfang Request ------------------------------
Remote-Host: 127.0.0.1
Username: -
Datum: [24/Feb/2002:17:40:27 +0100]
Request-Line: GET / HTTP/1.1
ResponseStatus: 200
Documente-Length: 2335
User-Agent: Mozilla/5.0 (Windows; U; Windows NT 5.0; de-AT; rv:0.9.8) Gecko/20020204
----Ende Request ---------------------------------

Braucht zwar massig Platz, ist aber von jedem DAU noch zu lesen *g*.

Inzwischen habe ich allerdings ein anderes Zeichen mit einer besonderen Eigenschaft gefunden, nämlich das '#'. Ein Browser sollte dieses Zeichen _eigentlich_ niemals als Bestandteil eines URL senden, weil es für ihn eine definierte, andere Bedeutung hat (die Abtrannung eines dokument-lokalen Ankers vom Dokument-URL). Kann jemand diese Idee widerlegen? (Hoffentlich nicht ... ;-)

Hmm, habs gerade lokal ausprobiert, und bei mir stehts drin (Apache 1.3.22 über Mozill 0.9.8), wenn auch nur im Referer, aber einmal ist in dem Fall sicherlich nicht keinmal:-(

Und wenn ich den URL zuverlässig parsen kann, dann ist mein Problem ja gelöst - _ein_ unbekanntes Feld (den UserAgent) halte ich aus.

Andererseits, wenn Du %r verwendest dann ist der URL auch eindeutig zwischen %m und %H eingeschlossen, womit das eigentlich immer klar sein müßte.

Grüße
  Klaus