Tach!
Erst zur Laufzeit bekannte in Javascript versteckte URLs wirst du nicht mit Parsen herausfinden.
Du sprichst bspw. von "Image Preloading"?
Oder von Ajax-Request, oder Include-Funktionen der JS-Frameworks. Kurz, alles was nicht standardisiert ist und das Nachzuladende als einfaches Stringliteral angibt.
Ja, solche Sachen kann man so nicht erfassen (das "Problem" haben aber alle mir bekannten Tools), oder kennst du eine Methode mit vertretbarem Aufwand, die solche Fälle auch noch mit einschließt?
Der Browser lässt das Javascript laufen und durch dessen Wirken kommen die Requests zustande, die natürlich der Browser ausführt und dessen Tools sie überwachen können.
Wie kann ich dann die unkomprimierte Größe ermitteln?
Du bekommst nur die unkomprimierte Version durchgereicht. Der Webserver packt es bereits aus.
Wozu dann die Komprimierung? Ich dachte eigentlich, der Browser packts aus ...
Ich war hier auf dem falschen Dampfer. Wenn der Webserver einen Request entgegennimmt, dann packt der den aus, bevor ihn PHP zu Gesicht bekommt. Aber dein Fall ist ja anders. Du spielst hier Client und verwendest einen in PHP eingebauten Wrapper, um mit file_get_contents() einen Webzugriff zu machen. Von dem Wrapper nahm ich auch an, dass der sich um das Auspacken kümmert. Zumindest kam hier nie eine Anfrage diesbezüglich. Allerdings gibt es einige Fundstellen im Netz, bei denen wohl doch komprimierte Daten über file_get_contents() empfangen wurden - nebst Lösungsvorschlägen.
dedlfix.