Hallo Gunther,
möglich, dass mir hier ein Denkfehler unterläuft – vielleicht gibt es aber auch eine ganz einfache Lösung:
Ich muss ja in jeder Datei "gucken", welche weiteren externen Resourcen geladen werden.
Also z.B. in der Ausgangs HTML-Datei Stylesheet(s), Javascript(s), Image(s) usw.! Und wenn diese eine relative Pfadangabe haben (bspw. 'css-files/style.css'), dann muss ich daraus eben eine absolute (z.B. 'http://example.com/css-files/style.css') machen, um auch diese Resource per cURL laden und analysieren zu können.
Wenn du CURLINFO_EFFECTIVE_URL verwendest, musst du nur noch, wie es auch ein Browser tun würde, relative Pfadangaben und den „effective“ URL zusammenbringen und erhälst einen absoluten URL. Wie das auf dem (entfernten) Server intern abläuft muss dich dabei nicht interessieren, ein Browser wüsste darüber ja auch nicht Bescheid.
Viele Grüße,
Claudius