Konvertierung altes HTML nach 4.01 oder XHTML
Rocket
- html
1 Ashura0 Gunnar Bittersmann0 Ashura0 Der Martin0 Rocket0 wahsaga
0 Gunnar Bittersmann
0 Orlando
Hallo,
kennt jemand Konvertierprogramme, die uraltes, zusammengestochertes HTML (verschiedenster Versionen) in eine aktuelle Version überführen.
Ganz kann das ja nicht gehen aber vielleicht teilweise mit entsprechenden Hinweisen?
Gruß
Hallo Rocket.
kennt jemand Konvertierprogramme, die uraltes, zusammengestochertes HTML (verschiedenster Versionen) in eine aktuelle Version überführen.
Ja, die multifunktionale brain.exe.
Ernsthaft: eine Maschine kann das gewünschte Ziel nie und nimmer erreichen. Im Idealfall extrahierst du sämtliche Inhalte so gut wie es möglich ist und fügst sie in der neuen gewünschten Struktur wieder zusammen. Hier ist Handarbeit erforderlich.
Einen schönen Donnerstag noch.
Gruß, Ashura
Grundlage für Zitat #432.
Hello out there!
Ernsthaft: eine Maschine kann das gewünschte Ziel nie und nimmer erreichen.
Wieso das nicht? Das hört sich für mich intuitiv berechenbar an. Also gibt es eine Turing-Maschine*, die dieses tut. Es sei denn, du widerlegst mal eben die Churchsche These.
See ya up the road,
Gunnar
Zu deren Findung brain2.exe behötigt wird. ;-)
Hallo Gunnar.
Ernsthaft: eine Maschine kann das gewünschte Ziel nie und nimmer erreichen.
Wieso das nicht? Das hört sich für mich intuitiv berechenbar an.
In Ordnung, dann erstelle einmal eine Anwendung die folgendes macht:
• Tabellenlayout vernichten¹
• Formatierende Elemente und Attribute entfernen
• Basierend auf dem Inhalt die passenden Elemente aussuchen
• Alle Elemente korrekt verschachtelt in eine sinnvolle Struktur bringen
Einen schönen Donnerstag noch.
Gruß, Ashura
¹ Da es damals nichts Anderes gab, nehme ich dies provisorisch einmal als gegeben an.
Hallo Ashura,
• Tabellenlayout vernichten¹
• Formatierende Elemente und Attribute entfernen
• Basierend auf dem Inhalt die passenden Elemente aussuchen
• Alle Elemente korrekt verschachtelt in eine sinnvolle Struktur bringen
• Ein Stylesheet erstellen, das die ursprüngliche oder eine andere sinnvolle und ansprechende Darstellung wieder sicherstellt.
So long,
Martin
Hallo
Ernsthaft: eine Maschine kann das gewünschte Ziel nie und nimmer erreichen.
Vielleicht kann mir die 'Maschine' aber sagen, was an meinem HTML nicht dem neuen Standard entspricht (missing ending xy-tag, xy not allowed usw.).
Dann wäre mir wenigstens etwas geholfen.
Gruß
Rocket
hi,
Vielleicht kann mir die 'Maschine' aber sagen, was an meinem HTML nicht dem neuen Standard entspricht (missing ending xy-tag, xy not allowed usw.).
Kann sie, sie heißt "Validator".
gruß,
wahsaga
Hello out there!
Ernsthaft: eine Maschine kann das gewünschte Ziel nie und nimmer erreichen.
Wieso das nicht? Das hört sich für mich intuitiv berechenbar an.
In Ordnung, dann erstelle einmal eine Anwendung die folgendes macht:
Nö, keine Lust. Das Erstellen eines solchen Algorithmus ist sicher anwändiger als dieses für eine Webseite oder auch zwei selbst zu erledigen.
Was nicht heißt, dass es nicht ginge. Das „nie und nimmer“ in deiner Aussage will ich nicht glauben.
See ya up the road,
Gunnar
Hallo Rocket,
kennt jemand Konvertierprogramme, die uraltes, zusammengestochertes HTML (verschiedenster Versionen) in eine aktuelle Version überführen.
HTML Tidy. Es wird noch einiges zu tun sein, aber die gröbsten Arbeiten lassen sich damit erledigen.
Grüße
Roland
Hallo,
HTML Tidy. Es wird noch einiges zu tun sein, aber die gröbsten Arbeiten lassen sich damit erledigen.
Das ist doch schon etwas, mit dem ich anfangen kann
Danke!
Hallo,
HTML Tidy. Es wird noch einiges zu tun sein, aber die gröbsten Arbeiten lassen sich damit erledigen.
Jetzt ist mir folgendes aufgefallen.
Bisher habe ich Umlaute/Sonderzeichen dargestellt durch &...
(z.B. ä). Nach Behandlung mit tiny stehen jetzt die Umlaute im HTML-Text und werden beim Aufruf der Seite als ? dargestellt.
Woran könnte dies liegen?
Gruß
Rocket
Hallo Rocket
Bisher habe ich Umlaute/Sonderzeichen dargestellt durch &...
(z.B. ä). Nach Behandlung mit tiny stehen jetzt die Umlaute im HTML-Text und werden beim Aufruf der Seite als ? dargestellt.
Woran könnte dies liegen?
An einer fehlerhaften Zeichenkodierung.
Wann werden die Sonderzeichen falsch dargestellt, beim Aufruf vom Server oder bereits beim lokalen Aufruf der Seite?
Die charset-Angabe, die der Server im HTTP-Header sendet, die Angabe zur Zeichekodierung im Dokument, die, in der das Dokument gespeichert ist und in deinem Fall die entsprechende Einstellung in tidy müssen übereinstimmen.
Auf Wiederlesen
Detlef
Wann werden die Sonderzeichen falsch dargestellt, beim Aufruf vom Server oder bereits beim lokalen Aufruf der Seite?
Im Sourcecode, den ich mit Wordpad ansehe sind die Umlaute uncodiert vorhanden. Schon beim lokalen Aufruf kommen Fragezeichen.
Ich bin der Meinung, dass sie im Quelltext codiert sein müssten - wie es vor der Bearbeitung mit HTML-Tidy der Fall war?
Gruß
Rocket
Hallo Rocket
Im Sourcecode, den ich mit Wordpad ansehe sind die Umlaute uncodiert vorhanden.
Wordpad halte ich für kein geeignetes Werkzeug für HTML-Seiten.
Schon beim lokalen Aufruf kommen Fragezeichen.
Dann stimmt bereits Angabe zur Zeichekodierung im Dokument nicht mit der überein, in der es gespeichert ist.
Was steht dort in deinem Dokument?
Ich bin der Meinung, dass sie im Quelltext codiert sein müssten - wie es vor der Bearbeitung mit HTML-Tidy der Fall war?
Das muss nur sein, wenn das Dokument als ASCII gespeichert oder/und verarbeitet wird, oder die Zeichenkodierungen nicht übereinstimmen.
Wenn ich mich richtig errinnere kann das Ersetzen der Zeichenreferenzen bei Tidy auch ausgeschaltet werden.
Auf Wiederlesen
Detlef