Christoph Schnauß: mso-margin-bottom-alt

Beitrag lesen

morgens,

irgendwo im Archiv (ich habs jetzt nicht gefunden) gab es mal von Stefan Münz höchstpersönlich einen Beitrag zum "neuen" Format für Word-Dateien  -  als sich bei Word 8 herausstellte, daß die berüchtigten proprietären *.doc-Formate offenbar langfristig auf HTML umgestellt werden sollen. Es wäre zu schön gewesen, wenn sich das bewahrheitet hätte ...

Seit Word 8 gibt es die Option "als Webseite speichern", und da passiert genau das, was hier gefragt wird. Es wird letzten Endes mit einem unendlichen Aufwand an diversen Stylesheets ein "Word"-Dokument mit der Extension "*.htm" abgespeichert, das aufgrund von META-tags auch von Word erneut als Word-Dokument erkannt werden kann. Gleichzeitig damit hat Microsoft natürlich WORD mit einer Standard-Abfrage versehen, ob man das Teil nun als Standard-HTML-Editor einsetzen möchte ...

Bei der weiteren Entwicklung des Office-Pakets sind die unendlich vielen proprietären tags inzwischen doch etwas "abgeschmolzen" worden. Aber den "MSO"-Kram trifft man immer noch an. Ich habe im Moment Office 2003beta installiert, das heißt, ich habe Word 11. Wenn ich damit in ein Word-Dokument bloß "hallo" reinschreibe und das dann "als Webseite" abspeichere, kommt folgendes raus:

====================
<html>
<head>
<meta http-equiv=Content-Type content="text/html; charset=windows-1252">
<meta name=Generator content="Microsoft Word 11 (filtered)">
<title>hallo</title>
<style>
<!--
 /* Font Definitions */
 @font-face
 {font-family:Tahoma;
 panose-1:2 11 6 4 3 5 4 4 2 4;}
 /* Style Definitions */
 p.MsoNormal, li.MsoNormal, div.MsoNormal
 {margin:0cm;
 margin-bottom:.0001pt;
 font-size:12.0pt;
 font-family:"Times New Roman";}
@page Section1
 {size:595.3pt 841.9pt;
 margin:70.85pt 70.85pt 2.0cm 70.85pt;}
div.Section1
 {page:Section1;}
-->
</style>
</head>
<body lang=DE>
<div class=Section1>
<p class=MsoNormal>hallo</p>
</div>
</body>
</html>

Das ist sowohl ein HTML- wie auch ein WORD-Dokument. Erst wenn ich den "Generator"-META-tag rausnehme, kann es WORD 11 nicht mehr sofort als WORD-Datei akzeptieren, aber wenn ich nun bloß noch DOCTYPE ergänze und das Quoting vervollständige, ist das sogar valides HTML.

Frühere WORD-Versionen haben noch _wesentlich_ mehr Quatsch da reingeschrieben. Jetzt ist es immerhin "bloß noch" ein Stylesheet, und natürlich kommt dieses "MsoNormal" darin vor.

Was "lernt" uns das?
Irgendwie scheint Microsoft tatsächlich entschlossen, sein proprietäres WORD-Format _langfristig_ durch HTML zu ersetzen. Das hat mit Office 2000 (also Word 8) begonnen, ist allerdings mit Office 2003 (Word 11) immer noch nicht W3C-gerecht.

Wie geduldig wollen wir Microsoft gegenüber nun sein? Vielleicht kann ja Word 2010 in sieben Jahren tatsächlich korrektes HTML liefern ...

Um das Ganze zusammenzufassen: Ja, dieser "mso"-Kram hat mit Microsoft Office zu tun. "mso" steht in der Tat für "Micro Soft Office"  -  das kann man auch irgendwo in der MSDN nachlesen, ich bin bloß jetzt nicht in der Stimmung (und auch auf dem "falschen" System), danach herumzukramen.

Grüße aus Berlin

Christoph S.