Moin!
XML sagst du. Willst du das dann noch auswerten? Das belegt dann unter Umständen noch mehr Speicher, wenn du daraus einen DOM-Baum erstellst. Wenn dir nun keine Methode einfällt, das Teil häppchenweise zu verarbeiten, wirst du um ein höheres Speicherlimit nicht umhin kommen.
Womit wir dann auch wieder bei einem der Nachteile von XML wären: Lässt sich nicht (wirklich) zeilenweise, also speicherschonend verarbeiten. Stellt sich die Frage ob man das Grundübel beseitigen kann in dem man z.B. CSV benutzt. (Dazu müsste man mehr über die Datenstruktur wissen.)
Niemand will CSV nutzen! CSV ist das Synonym für "irgendein Dateiformat, feld- bzw. tabellenbasiert, mit irgendwelchen Trennzeichen, irgendwelchen Stringbegrenzern und irgendwelchen Escape-Zeichen".
So einen Mist, wie man ihn in CSV-Dateien findet, findet man nicht mal in /dev/urandom.
Also in ziviler Sprache ausgedrückt: Das sogenannte CSV-Dateiformat ist extrem unterspezifiziert und sorgt durch die Vielfalt an möglichen Formaten und die Unmöglichkeit der Kennzeichnung des konkret verwendeten Formats in einem Metadatenkanal für häufige Inkompatibilitätsprobleme.
Grüße Sven