Der Martin: Download von Webseiten

Beitrag lesen

Hallo,

hmm... also meines Wissens "verstümmeln" aktuelle Browser auch dann den Code ein wenig, oder?

Soweit ich weiß, ist der IE der einzige Browser, der den Quellcode beim Speichern im großem Stil verstümmelt. Da werden
 * willkürlich Anführungszeichen bei HTML-Attributwerten weggelassen
 * Attribute in ihrer Reihenfolge vertauscht
 * sowohl Tags als auch Attribute bzgl. der Groß/Kleinschreibung verhunzt
   (besonders übel bei XHTML)
 * im Quellcode vorhandene Zeilenumbrüche ignoriert, stattdessen willkürlich
   neue gesetzt
 * sämtliche CSS-Eigenschaften groß geschrieben
 * sämtliche CSS-Eigenschaften in ihren Einzelwerten notiert (also z.B.
   border-top, border-left, border-right, border-bottom)
 * die abschließenden Semikola eines Rulesets vor der schließenden Klammer
   '{' einfach weggelassen
und außerdem wird der HTML-Quelltext zusätzlich dadurch verhunzt, dass die eigentliche HTML-Datei _außerhalb_ des Verzeichnisses gespeichert wird, das alle anderen Ressourcen (Bilder, JS, CSS) enthält und demzufolge jedem Verweis auf eine eingebundene Ressource "NameDerWebsite_Dateien/..." vorangestellt wird.

Was kann man dagegen tun?

Die Website aus dem IE heraus komplett speichern, dann über Ansicht/Quelltext den Original-Quellcode im Editor öffnen und von dort aus noch einmal speichern.

Schönen Abend noch,
 Martin

--
Niemand lebt allein von seinen Träumen.
Aber wer träumt, lebt noch.