Robert22: HTML Optimizer

Hi!

Kennt ihr ein Tool/eine Website die, den HTML-Code (ja, ich weiß eigentlich Text...) mit basisfunktionen optimiert?
Mir fallen da derzeit folgende Sachen ein:
 - Leerzeichen löschen
 - Enter löschen
 - Kommentare löschen

Am liebsten wär mir ein Tool was gleich den ganzen Ordner durchläuft,
im Optimalfall liest es sogar PHP-Dateien und ignoriert den PHP-Code einfach.
Andernfalls wäre auch eine Website nett, so wie z.B. http://www.cleancss.com/

Vielen Dank
Robert

  1. Kennt ihr ein Tool/eine Website die, den HTML-Code (ja, ich weiß eigentlich Text...) mit basisfunktionen optimiert?
    Mir fallen da derzeit folgende Sachen ein:

    • Leerzeichen löschen
    • Enter löschen
    • Kommentare löschen
      Am liebsten wär mir ein Tool was gleich den ganzen Ordner durchläuft,
      im Optimalfall liest es sogar PHP-Dateien und ignoriert den PHP-Code einfach.
      Andernfalls wäre auch eine Website nett, so wie z.B. http://www.cleancss.com/

    Hallo
    Es braucht nur einen Perl onelines, dass man sich seinen Code kaputt macht.

    Du kennst das Problem, scheinbar überflüssige Leerzeichen in <pre>   </pre> zu löschen?
    Ok alles ausser pre... Auch Elemente, die via CSS dann mit white-space:pre gekennzeichnet wurden?

    Jedes Leerzeichen und jeder Umbruch birgt Information.
    Vom Löschen desselben ist noch keine Seite besser geworden.
    Im Gegenteil wurde sie dadurch unlesbar, manchmal falsch und und schneller gerendert wurde sie auch nicht.

    Ja ich habe vernommen, dass php Standardmässig solche Funktionen mitbringt.
    Dadurch lässt sich der Output filtern, ohne dass man das original kaputt macht. Aber ich weiss nicht, wie sinnvoll und vor allem ungefährlich diese Funktion ist, deren Name ich nicht kenne.

    Und natürlich: Wer ein Codeproblem hat und Selfhtml um Hilfe fragt, sollte diese Filterfunktion dann deaktivieren.

    mfg Beat

    --
    Woran ich arbeite:
    X-Torah
    ><o(((°>    ----       ><o(((°>
       <°)))o><                      ><o(((°>o
    1. Guten Tag,

      Jedes Leerzeichen und jeder Umbruch birgt Information.

      Das stimmt zwar selbstreferenziell (ein CR sagt, hier ist ein CR). Ansonsten hängt es vom Kontext ab.

      Vom Löschen desselben ist noch keine Seite besser geworden.

      Stimmt nicht.

      Im Gegenteil wurde sie dadurch unlesbar,

      Stimmt nicht. Es ist doch absolut problemlos möglich, auch komprimiert formatierten Text wieder automatisch einrücken zu lassen. Das geht z.B. mit tidy für HTML und oder mit xmlindent für XHTML.

      [...]

      Ja ich habe vernommen, dass php Standardmässig solche Funktionen
      mitbringt.

      Ist mir jetzt nicht bekannt. Welche genau meinst du?

      Dadurch lässt sich der Output filtern, ohne dass man das original kaputt
      macht. Aber ich weiss nicht, wie sinnvoll und vor allem ungefährlich
      diese Funktion ist, deren Name ich nicht kenne.

      Oh, ok.

      Und natürlich: Wer ein Codeproblem hat und Selfhtml um Hilfe fragt,
      sollte diese Filterfunktion dann deaktivieren.

      Da hast du allerdings recht.

      Gruß
      Christoph Jeschke

      --
      Zend Certified Engineer
      1. Ja ich habe vernommen, dass php Standardmässig solche Funktionen
        mitbringt.

        Ist mir jetzt nicht bekannt. Welche genau meinst du?

        Vielleicht voreilige Vermutung, da ich selbst nicht in php programmiere, aber ab und zu das Handbuch konsultiere.
        Ich erinnere mich in zwei Fälle in den letzte Monaten, wo jemand einen Filter vor einer Seitenbewertung nicht deaktivierte. Vielleicht handelte es sich um selbstgebastelte Filter.

        mfg Beat

        --
        Woran ich arbeite:
        X-Torah
        ><o(((°>        ><o(((°>
           <°)))o><                      ><o(((°>o
  2. Hallo Robert,

    Kennt ihr ein Tool/eine Website die, den HTML-Code (ja, ich weiß eigentlich Text...) mit basisfunktionen optimiert?
    Mir fallen da derzeit folgende Sachen ein:

    • Leerzeichen löschen
    • Enter löschen
    • Kommentare löschen

    einen bereits kommentierten und anständig formatierten Quellcode wieder zu verstümmeln, würde ich jetzt nicht als "optimieren" bezeichnen ...

    Andernfalls wäre auch eine Website nett, so wie z.B. http://www.cleancss.com/

    Dieser Dienst tut ja nun genau das Gegenteil von dem, was du beschreibst. Er formatiert den Code ordentlich, wenn auch nicht so, wie ich es gern hätte (wobei ich das Ersetzen von numerischen Angaben durch Namen schon wieder für kontraproduktiv halte, z.B. ersetzt das Tool die Farbangabe "#000080" durch die weniger anschauliche Bezeichnung "navy"), fasst auf Wunsch redundante Angaben zusammen und ersetzt ggf. Lang- durch Kurzschreibweisen. Das gibt's für HTML auch.

    Aber letztendlich kann kein Tool so flexibel sein, dass es in allen Fällen die Notation bzw. Formatierung trifft, die der Anwender haben will. Ich empfehle daher, von derartigen "Optimierern" Abstand zu halten und lieber von Hand ordentlich zu schreiben.

    So long,
     Martin

    --
    F: Was sagt die kleine Kerze zur großen Kerze?
    A: Ich gehe heute nacht aus!
    1. Guten Tag,

      einen bereits kommentierten und anständig formatierten Quellcode wieder
      zu verstümmeln, würde ich jetzt nicht als "optimieren" bezeichnen ...

      Das sehe ich anders: Wenn der Quelltext mal einem Live-System gelandet ist, sind Kommentare und Einrückung verschwendete Übertragungskapaziät. Auf dem Dev-System sieht es natürlich anders aus.

      Für den Client sind Kommentare und Formatierungen (wie z.B. Einrückungen) nicht notwendig. Der sollte eher möglichst wenig geschickt bekommen.

      Gruß
      Christoph Jeschke

      --
      Zend Certified Engineer
    2. Ich schreibe von hand ordnetlich, wenn ich jedoch ein FERTIG ENTWICKELTES HTML habe, kann ich ja - um die Dateigröße zu minimieren - unnötige Leerzeichen & Enter löschen, ein Original bei eventuellen Weiterentwicklungen behalte ich mir natürlich ;)

      lg
      Robert

  3. Guten

    Kennt ihr ein Tool/eine Website die, den HTML-Code (ja, ich weiß eigentlich
    Text...) mit basisfunktionen optimiert?

    Nein. Aber ich habe mir einen Rollout-Prozess mit make geschrieben, der XHTML-Dokumente mit einem XSLT-Stylesheet umformt und dabei auch gleichzeitig Formatierungs- und Syntaxunschädliche Tokens entfernt, bspw. Kommentare, aber keine SSI-Anweisungen und auch keine Leerzeichen aus präformatierten Blöcken. JavaScript und CSS säubere ich mit dem yuicompressor. Der Server liefert die Dokumente dann auch noch komprimiert aus.

    Mir fallen da derzeit folgende Sachen ein:

    • Leerzeichen löschen

    Da Leerzeichen Wörter trennen, würdest du hier den Sinn des Textes auflösen.
    In Blöcken mit präformatiertem Text würdest du zusätzlich noch die Formatierung modifizieren.

    • Enter löschen

    Du solltest eher Linefeeds und Carriage returns durch Leerzeichen ersetzen.

    • Kommentare löschen

    Beachte, dass SSI-Anweisungen in der Apache-Standardkonfiguration wie Kommentare aussehen.

    Am liebsten wär mir ein Tool was gleich den ganzen Ordner durchläuft,
    im Optimalfall liest es sogar PHP-Dateien und ignoriert den PHP-Code
    einfach.

    Ich kenne kein solches Werkzeug. Die Unterscheidung, was in einem PHP-Skript (X)HTML ist und was nicht, stelle ich mir auch reichlich schwierig vor.

    Gruß
    Christoph Jeschke

    --
    Zend Certified Engineer
    1. Du solltest eher Linefeeds und Carriage returns durch Leerzeichen ersetzen.

      Hallo Christoph

      Deine Webseite wird bemängelt vom Validator. Da ist ein Fehler in Zeile 3.
      ;))))))))))

      Die Fehler sind zwar unwichtig, da du ja XHTML als HTML sendest. (warum eigentlich?)

      mfg Beat

      --
      Woran ich arbeite:
      X-Torah
         <°)))o><                      ><o(((°>o
      1. Guten Tag,

        Deine Webseite wird bemängelt vom Validator. Da ist ein Fehler in Zeile 3.
        ;))))))))))

        Nein. Der Validator vom W3C kann kein XML-Schema validieren. Der XML Schema Validator von Christoph Schneegans kann das: christoph-jeschke.de validiert. Da stimmt dann auch alles.

        Die Fehler sind zwar unwichtig, da du ja XHTML als HTML sendest. (warum
        eigentlich?)

        Es ist erlaubt und IMHO derzeit aus Kompatiblitätsgründen die beste Wahl.

        Gruß
        Christoph Jeschke

        --
        Zend Certified Engineer
    2. Mir fallen da derzeit folgende Sachen ein:

      • Leerzeichen löschen

      Da Leerzeichen Wörter trennen, würdest du hier den Sinn des Textes auflösen.
      In Blöcken mit präformatiertem Text würdest du zusätzlich noch die Formatierung modifizieren.

      ich wollte das jetzt nur grob sagen und keinen Aufsatz schreiben ;)

      • Enter löschen

      Du solltest eher Linefeeds und Carriage returns durch Leerzeichen ersetzen.

      Gemeint war, dass Enter durch Leerzeichen ersetzte werden. Danach wird eine Verkettung von mehr als einem Leerzeichen auf eines reduziert ;)

      • Kommentare löschen

      Beachte, dass SSI-Anweisungen in der Apache-Standardkonfiguration wie Kommentare aussehen.

      Am liebsten wär mir ein Tool was gleich den ganzen Ordner durchläuft,
      im Optimalfall liest es sogar PHP-Dateien und ignoriert den PHP-Code
      einfach.

      Ich kenne kein solches Werkzeug. Die Unterscheidung, was in einem PHP-Skript (X)HTML ist und was nicht, stelle ich mir auch reichlich schwierig vor.

      Naja, alles außerhalb von <?php ... ?> is schon mal nicht PHP ;)
      Die Leerzeichenreduktion kann genauso auf jede andere PHP-Ausgabe angewandt werder....
      (und ja, ich hab wieder mal etwas simplifiziert, andernfalls könnt ich ja gleich den Code selber schreiben....)

      lg
      Robert