Der Martin: Transfairvolumen

Beitrag lesen

Hallo Tom,

»» wobei das übliche Log-Format ja auch ein "unmögliches Chaos" ist: Leerzeichen als Field Delimiter; Timestamp in eckigen Klammern; Request, User Agent und Referrer (sinnvollerweise) in Anführungszeichen; aber sowohl im Timestamp als auch in Request und im UA treten Leerzeichen auf ...
Ich habe alle Spalten in " und nehme die Trennung durch ; vor.

ja, das sind dann Feinheiten. Aber in beiden Fällen (sowohl bei meinem wie auch bei deinem Format) ist es konsequenter strukturiert und dadurch leichter maschinell auszuwerten. Ich lese es z.B. mit Excel, das dann so schlau ist, allen Feldern in Anführungszeichen gleich den Typ "Text" zuzuordnen und allen anderen den Typ "Zahl".
Wobei ich festgestellt habe, dass das Komma als Trennzeichen bei Excel-Versionen ab 2003 (vielleicht auch schon 2000, nie probiert) ungünstig ist, weil neuere Versionen anscheinend ein Semikolon als Trennzeichen erwarten. Hat man komma-getrennte Felder, muss man sich durch den Import-Assistenten quälen und das manuell angeben, während die 97er Version das automatisch erkennt: Öffnen und gut.
Das nennt sich dann Fortschritt, glaube ich. ;-)

Theoretisch könnte es aber immer noch passieren, dass Dir ein Irrer da ein nicht codiertes " in den Querystring reinhaut. Die Browser codieren das zwar zum Glück automatisch, aber bei der wachsenden Zahl von "Post2Host"-Benutzern ist es mMn nicht ausgeschlossen.

Nicht ausgeschlossen, aber im Query doch eher unwahrscheinlich. Im UA könnte ich mir ein Anführungszeichen (oder ein Pärchen davon) aber durchaus vorstellen. Dagegen habe ich auch noch nichts unternommen, aber den Fall hatte ich auch bisher nicht.

Schönes Wochenende noch,
 Martin

--
Man sollte immer wissen was man sagt
 - aber auf keinen Fall alles sagen, was man weiß.