ChrisB: daten einlesen

Beitrag lesen

Hi,

mit PHP lese ich eine Datei ein, die folgende (hier stark vereinfachte) Struktur hat:

ere,cer,23d,ad23,332;dde,343,234,2343,lldo;wert1,wert2,wert3,wert4,wert5; etc

Das heisst, im Prinzip eine kommaseparierte Datei (im Prinzip deshalb, weil die Trenner variieren können).

Geht das immer so weiter, oder kommt da auch mal Zeilenumbruch? (Und wenn ja, welche Bedeutung hat er, wenn offenbar das Semikolon schon der Datensatztrenner zu sein scheint, da du an diesem zuerst aufsplittest.)

Das Problem:

Diese Datei kann sehr groß werden, d.h. ich rechne mit einer Dateigröße von > 1GB, kann gut auch das zehnfache sein. Diese Datei kann ich natürlich in der Größe nicht einlesen und dann weiter verarbeiten.

Nicht in einem "Happen" - aber zeilenweises einlesen sollte auch bei grossen Dateien nicht allzu unperformant sein.

Wenn man nicht zeilenweise einlesen kann (siehe Nachfrage oben) - dann muss man sich im zweifelsfalle selbst was basteln, was eine bestimmte Anzahl Bytes einliest, und schaut, wo diese zu splitten sind - unter "Übertrag" durch das auf Bytezahl begrenzende Einlesen bedingter "zerschnittener" Feldinhalte an den nächsten Durchlauf.

Die Frage:

Wie würde ein Programmierer dieses Problem am sinnvollsten lösen?

Er würde nach exakteren Vorgaben und Spezifikationen fragen.

Wenn
MfG ChrisB

--
Light travels faster than sound - that's why most people appear bright until you hear them speak.