Stefan Muenz: (ZUR INFO) Office 2000 - ein Blick ins Datei-Innere...

Beitrag lesen

Liebe Forumsbesucher,

MS Office 2000, das ja mittlerweile auf dem Markt ist, hat jeweils 2 eigene Dateiformate: die alten, also doc, xls, ppt, und ein gemeinsames neues: naemlich htm (Datei/Speichern als/Webseite). In beiden Dateitypen koennen alle Office-Daten verlustfrei gespeichert werden. Gucken wir doch mal, wie so eine Webseiten-Datei von MS Word 2000 (oder Word 9, wie es sich auch nennt) aussieht:

====================================================

<html xmlns:v="urn:schemas-microsoft-com:vml"
xmlns:o="urn:schemas-microsoft-com:office:office"
xmlns:w="urn:schemas-microsoft-com:office:word"
xmlns="http://www.w3.org/TR/REC-html40">

<head>
<meta http-equiv=Content-Type content="text/html; charset=windows-1252">
<meta name=ProgId content=Word.Document>
<meta name=Generator content="Microsoft Word 9">
<meta name=Originator content="Microsoft Word 9">
<link rel=File-List href="./test-Dateien/filelist.xml">
<title>Das ist ein Absatz vom Typ Überschrift 1</title>
<!--[if gte mso 9]><xml>
<o:DocumentProperties>
  <o:Author>Stefan Muenz</o:Author>
  <o:Template>Normal</o:Template>
  <o:LastAuthor>Stefan Muenz</o:LastAuthor>
  <o:Revision>2</o:Revision>
  <o:Created>1999-06-12T08:43:00Z</o:Created>
  <o:LastSaved>1999-06-12T08:43:00Z</o:LastSaved>
  <o:Pages>1</o:Pages>
  <o:Company>-</o:Company>
  <o:Lines>1</o:Lines>
  <o:Paragraphs>1</o:Paragraphs>
  <o:Version>9.2812</o:Version>
</o:DocumentProperties>
</xml><![endif]--><!--[if gte mso 9]><xml>
<w:WordDocument>
  <w:HyphenationZone>21</w:HyphenationZone>
</w:WordDocument>
</xml><![endif]-->
<style>
<!--
/* Font Definitions */
@font-face
{font-family:"Rockwell Extra Bold";
panose-1:2 6 9 3 4 5 5 2 4 3;
mso-font-charset:0;
mso-generic-font-family:roman;
mso-font-pitch:variable;
mso-font-signature:3 0 0 0 1 0;}
/* Style Definitions */
p.MsoNormal, li.MsoNormal, div.MsoNormal
{mso-style-parent:"";
margin:0cm;
margin-bottom:.0001pt;
mso-pagination:widow-orphan;
font-size:12.0pt;
font-family:"Times New Roman";
mso-fareast-font-family:"Times New Roman";}
h1
{mso-style-next:Standard;
margin-top:12.0pt;
margin-right:0cm;
margin-bottom:3.0pt;
margin-left:0cm;
mso-pagination:widow-orphan;
page-break-after:avoid;
mso-outline-level:1;
font-size:16.0pt;
font-family:Arial;
mso-font-kerning:16.0pt;}
@page Section1
{size:595.3pt 841.9pt;
margin:70.85pt 70.85pt 2.0cm 70.85pt;
mso-header-margin:35.4pt;
mso-footer-margin:35.4pt;
mso-paper-source:0;}
div.Section1
{page:Section1;}
-->
</style>
<!--[if gte mso 9]><xml>
<o:shapedefaults v:ext="edit" spidmax="1026"/>
</xml><![endif]--><!--[if gte mso 9]><xml>
<o:shapelayout v:ext="edit">
  <o:idmap v:ext="edit" data="1"/>
</o:shapelayout></xml><![endif]-->
</head>

<body lang=DE style='tab-interval:35.4pt'>

<div class=Section1>

<h1>Das ist ein Absatz vom Typ Überschrift 1</h1>

<p class=MsoNormal>Das ist ein Textabsatz in Times New Roman 12pt</p>

<p class=MsoNormal><span style='font-family:"Rockwell Extra Bold"'>Das ist ein
Textabsatz in Rockwell Extra Bold</span></p>

</div>

</body>

</html>

Wie man gut erkennen kann, wird hier ein HTML benutzt, das um office-eigene XML-Definitionen erweitert ist. Jene Tags, die nicht zu HTML gehoeren, sondern mit Hilfe von XML definiert wurden, kommen in entsprechenden Passagen vor, wie:
<xml>
<o:DocumentProperties>
....
</o:DocumentProperties>
</xml>
Ansonsten viel CSS, wie man sieht, auch die ganzen Definitionen zum Druckseitenlayout - und jetzt duerfte auch dem Letzten klar sein, warum Microsoft die CSS-Sprache schon vor einiger Zeit lizensiert hat.

Browser, die XML nicht kennen, ignorieren einfach die <xml>...</xml>-Passagen und stellen den Rest ganz normal dar. Der MSIE5 allerdings erkennt auch den Kram innerhalb der xml-Passagen und macht was draus, sofern was draus zu machen ist.

Word und die anderen Office-Programme sind dadurch in der Lage, alles, was sie koennen, ohne Verlust in HTML-Dateien abzuspeichern. Office-Dateien befreien sich dadurch von den Programmen und werden Web-gerechte Dokumente. HTML hat damit vor allem eine der letzten grossen Bastionen der herkoemmlichen Textverarbeitung erobert. Tja, Adobe, dann pennt mal schoen weiter...

viele Gruesse
  Stefan Muenz