Rocket: Konvertierung altes HTML nach 4.01 oder XHTML

Hallo,
kennt jemand Konvertierprogramme, die uraltes, zusammengestochertes HTML (verschiedenster Versionen) in eine aktuelle Version überführen.
Ganz kann das ja nicht gehen aber vielleicht teilweise mit entsprechenden Hinweisen?
Gruß

  1. Hallo Rocket.

    kennt jemand Konvertierprogramme, die uraltes, zusammengestochertes HTML (verschiedenster Versionen) in eine aktuelle Version überführen.

    Ja, die multifunktionale brain.exe.

    Ernsthaft: eine Maschine kann das gewünschte Ziel nie und nimmer erreichen. Im Idealfall extrahierst du sämtliche Inhalte so gut wie es möglich ist und fügst sie in der neuen gewünschten Struktur wieder zusammen. Hier ist Handarbeit erforderlich.

    Einen schönen Donnerstag noch.

    Gruß, Ashura

    --
    sh:( fo:} ch:? rl:( br: n4:~ ie:{ mo:| va:) de:> zu:} fl:( ss:) ls:[ js:|
    „It is required that HTML be a common language between all platforms. This implies no device-specific markup, or anything which requires control over fonts or colors, for example. This is in keeping with the SGML ideal.“
    [HTML Design Constraints: Logical Markup]
    1. Hello out there!

      Ernsthaft: eine Maschine kann das gewünschte Ziel nie und nimmer erreichen.

      Wieso das nicht? Das hört sich für mich intuitiv berechenbar an. Also gibt es eine Turing-Maschine*, die dieses tut. Es sei denn, du widerlegst mal eben die Churchsche These.

      See ya up the road,
      Gunnar

      Zu deren Findung brain2.exe behötigt wird. ;-)

      --
      “Remember, in the end, nobody wins unless everybody wins.” (Bruce Springsteen)
      1. Hallo Gunnar.

        Ernsthaft: eine Maschine kann das gewünschte Ziel nie und nimmer erreichen.

        Wieso das nicht? Das hört sich für mich intuitiv berechenbar an.

        In Ordnung, dann erstelle einmal eine Anwendung die folgendes macht:

        • Tabellenlayout vernichten¹
        • Formatierende Elemente und Attribute entfernen
        • Basierend auf dem Inhalt die passenden Elemente aussuchen
        • Alle Elemente korrekt verschachtelt in eine sinnvolle Struktur bringen

        Einen schönen Donnerstag noch.

        Gruß, Ashura

        ¹ Da es damals nichts Anderes gab, nehme ich dies provisorisch einmal als gegeben an.

        --
        sh:( fo:} ch:? rl:( br: n4:~ ie:{ mo:| va:) de:> zu:} fl:( ss:) ls:[ js:|
        „It is required that HTML be a common language between all platforms. This implies no device-specific markup, or anything which requires control over fonts or colors, for example. This is in keeping with the SGML ideal.“
        [HTML Design Constraints: Logical Markup]
        1. Hallo Ashura,

          • Tabellenlayout vernichten¹
          • Formatierende Elemente und Attribute entfernen
          • Basierend auf dem Inhalt die passenden Elemente aussuchen
          • Alle Elemente korrekt verschachtelt in eine sinnvolle Struktur bringen

          • Ein Stylesheet erstellen, das die ursprüngliche oder eine andere sinnvolle und ansprechende Darstellung wieder sicherstellt.

          So long,
           Martin

          --
          Rizinus hat sich angeblich als sehr gutes Mittel gegen Husten bewährt.
        2. Hallo

          Ernsthaft: eine Maschine kann das gewünschte Ziel nie und nimmer erreichen.

          Vielleicht kann mir die 'Maschine' aber sagen, was an meinem HTML nicht dem neuen Standard entspricht (missing ending xy-tag, xy not allowed usw.).
          Dann wäre mir wenigstens etwas geholfen.

          Gruß
          Rocket

          1. hi,

            Vielleicht kann mir die 'Maschine' aber sagen, was an meinem HTML nicht dem neuen Standard entspricht (missing ending xy-tag, xy not allowed usw.).

            Kann sie, sie heißt "Validator".

            gruß,
            wahsaga

            --
            /voodoo.css:
            #GeorgeWBush { position:absolute; bottom:-6ft; }
        3. Hello out there!

          Ernsthaft: eine Maschine kann das gewünschte Ziel nie und nimmer erreichen.

          Wieso das nicht? Das hört sich für mich intuitiv berechenbar an.

          In Ordnung, dann erstelle einmal eine Anwendung die folgendes macht:

          Nö, keine Lust. Das Erstellen eines solchen Algorithmus ist sicher anwändiger als dieses für eine Webseite oder auch zwei selbst zu erledigen.

          Was nicht heißt, dass es nicht ginge. Das „nie und nimmer“ in deiner Aussage will ich nicht glauben.

          See ya up the road,
          Gunnar

          --
          “Remember, in the end, nobody wins unless everybody wins.” (Bruce Springsteen)
  2. Hallo Rocket,

    kennt jemand Konvertierprogramme, die uraltes, zusammengestochertes HTML (verschiedenster Versionen) in eine aktuelle Version überführen.

    HTML Tidy. Es wird noch einiges zu tun sein, aber die gröbsten Arbeiten lassen sich damit erledigen.

    Grüße
     Roland

    1. Hallo,

      HTML Tidy. Es wird noch einiges zu tun sein, aber die gröbsten Arbeiten lassen sich damit erledigen.

      Das ist doch schon etwas, mit dem ich anfangen kann
      Danke!

      1. Hallo,

        HTML Tidy. Es wird noch einiges zu tun sein, aber die gröbsten Arbeiten lassen sich damit erledigen.

        Jetzt ist mir folgendes aufgefallen.
        Bisher habe ich Umlaute/Sonderzeichen dargestellt durch &...
        (z.B. ä). Nach Behandlung mit tiny stehen jetzt die Umlaute im HTML-Text und werden beim Aufruf der Seite als ? dargestellt.
        Woran könnte dies liegen?
        Gruß
        Rocket

        1. Hallo Rocket

          Bisher habe ich Umlaute/Sonderzeichen dargestellt durch &...
          (z.B. ä). Nach Behandlung mit tiny stehen jetzt die Umlaute im HTML-Text und werden beim Aufruf der Seite als ? dargestellt.
          Woran könnte dies liegen?

          An einer fehlerhaften Zeichenkodierung.
          Wann werden die Sonderzeichen falsch dargestellt, beim Aufruf vom Server oder bereits beim lokalen Aufruf der Seite?

          Die charset-Angabe, die der Server im HTTP-Header sendet, die Angabe zur Zeichekodierung im Dokument, die, in der das Dokument gespeichert ist und in deinem Fall die entsprechende Einstellung in tidy müssen übereinstimmen.

          Auf Wiederlesen
          Detlef

          --
          - Wissen ist gut
          - Können ist besser
          - aber das Beste und Interessanteste ist der Weg dahin!
          1. Wann werden die Sonderzeichen falsch dargestellt, beim Aufruf vom Server oder bereits beim lokalen Aufruf der Seite?

            Im Sourcecode, den ich mit Wordpad ansehe sind die Umlaute uncodiert vorhanden. Schon beim lokalen Aufruf kommen Fragezeichen.
            Ich bin der Meinung, dass sie im Quelltext codiert sein müssten - wie es vor der Bearbeitung mit HTML-Tidy der Fall war?
            Gruß
            Rocket

            1. Hallo Rocket

              Im Sourcecode, den ich mit Wordpad ansehe sind die Umlaute uncodiert vorhanden.

              Wordpad halte ich für kein geeignetes Werkzeug für HTML-Seiten.

              Schon beim lokalen Aufruf kommen Fragezeichen.

              Dann stimmt bereits Angabe zur Zeichekodierung im Dokument nicht mit der überein, in der es gespeichert ist.
              Was steht dort in deinem Dokument?

              Ich bin der Meinung, dass sie im Quelltext codiert sein müssten - wie es vor der Bearbeitung mit HTML-Tidy der Fall war?

              Das muss nur sein, wenn das Dokument als ASCII gespeichert oder/und verarbeitet wird, oder die Zeichenkodierungen nicht übereinstimmen.

              Wenn ich mich richtig errinnere kann das Ersetzen der Zeichenreferenzen bei Tidy auch ausgeschaltet werden.

              Auf Wiederlesen
              Detlef

              --
              - Wissen ist gut
              - Können ist besser
              - aber das Beste und Interessanteste ist der Weg dahin!