Michael Schröpl: regexp: Zerlegen einer Zeile mit _zwei_ unbekannten Teil-Mustern

Beitrag lesen

Hi Rolf,

Ohne Apache-Patch läßt sich das Problem mathematisch nicht lösen!

Mit einem zuverlässigen Trennzeichen schon.
Ich finde den vorgeschlagenen "\n" ja nur häßlich, nicht aber unbrauchbar.
Mathematisch gesehen ist er die Lösung meines Problems, weil er innerhalb
eines HTTP-Headers nicht vorkommen _kann_.

Das unterscheidet ein Programm auch von einem Beweis, und damit
Informatik von Mathematik.

Dann haben wir unterschiedliche Vorstellungen vom Begriff "Informatik".

Im übrigen, erkennst du ja, wenn das Scanergebnis mehrdeutig ist

Ja? Wie denn?
Wenn der regular expression zwei Möglichkeiten zu matchen hat, wie bekomme
ich das mit?

Die Wahrscheinlichkeit das X1-X8 im AGENT auftauchen ist IMHO
geringer als das jemand deinen PGP oder SSL-Schutz aushebelt, Sachen
denen du täglich vertraust.

Ich habe allerdings mein erstes Trennzeichen '|' bereits im täglichen
Betrieb ausgehebelt bekommen ...

Konkret: M$ würde postulieren das keine Leerzeichen vorkommen dürfen und
den schwarzen Peter zu Apache und NS3 schieben. :(

Genau das möchte ich eben nicht. Ich möchte zumindest etwas Besseres als
das Leerzeichen - und herausfinden, welche Möglichkeiten es gibt. Ich muß
keinem Aktionär Rechenschaft über die von mir investierte Zeit in die Lö-
sung dieses (zugegebenermaßen eher ästhetischen) Problems geben.

Sowohl das "\n" als auch das '#' sind Verbesserungen meines bisherigen
Zustands - insofern hat sich der Thread für mich schon gelohnt.

Viele Grüße
      Michael