Hi Michael,
verstehe ich dich richtig das du die Sortierung der Spalten vorgeben kannst? (Kenn mich mit Apache nicht aus)
Wie wärs mit AGENT IP URL ?
mit (hingerotzt)
/(\w[\w ]+?) (\d+.\d+.\d+.\d+) (http://[\w ]+)/
fängst du alle Fälle in denen der AGENT nicht die Form 'IP-Muster http://' enthält, was sehr krank wäre.
Falls doch würden dann IP und AGENT in $3 stecken
Mit ner Sicherheitsabfrage ob 'IP-Muster http://' nochmal in $3 steckt erkennst du diesen seltenen Fehlerfall ohne ihn korrigieren zu können, denn 'IP-Muster http://' könnte auch aus der URL stammen.
Aber du weißt wenigstens wie groß der Fehler ist, und
dieser Fehler erscheint mir am unwahrscheinlichsten.
Solange er eine Toleranzschwelle nicht überschreitet
ignoriere ihn (nimm die wahrscheinlichste Annahme wie bei fehlerkorrigierenden Codes)
Falls du noch mehr verläßliche Spalten zur Verfügung hast quetsche sie zwischen AGENT und IP, dann senkst du
die Wahrscheinlichkeit weiter (sind URLs nicht sowieso
auf 256 Zeichen begrenzt? Dann könntest Du auch irgendwann 100%ige Sicherheit haben!)
Hoffe ich konnte dir weiterhelfen :)
Tschau
Rolf