Sven Rautenberg: PDF-Downloads: Paradigmenwechsel bei den Multimedien

Informationen werden immer häufiger als PDF verfügbar gemacht.

Ein Umstand, der mir aktuell in der "Bilanzpressekonferenzsaison" der diversen Aktiengesellschaften aufgefallen ist: PDF-Downloads sind irgendwie stark im Kommen.

Es gab eine Zeit, da war das Erstellen von HTML-Dokumenten sozusagen "in". Barrierefreiheit, Suchmaschinenkompatibilität, Hypertext-Möglichkeiten - alle die Vorteile wurden beispielsweise auch in den Online-Geschäftsberichten der Aktiengesellschaften ausgespielt.

Dabei wurde viel Mühe darauf verwendet, im Design und inhaltlich echten Mehrwert zu bieten, und dem Benutzer sozusagen ein echtes Erlebnis zu bieten.

Irgendwann aber muß sich wohl jemand gedacht haben: Blöd irgendwie. So ein Geschäftsbericht interessiert die Welt zu genau einem Zeitpunkt sehr, danach aber kaum noch jemanden. Warum machen wir denn so einen riesigen Aufwand, nur damit der Online-Besucher ebenfalls bedient wird? Und der Verbleib des Geschäftsberichts auf der Website ist natürlich auch ein Problem - ganz abgesehen von der Problematik, dass der Besucher sich den aktuellen Stand eines umfangreichen, mehrseitigen HTML-Dokuments nur unter größeren Mühen lokal konservieren kann.

Genau diese Probleme scheint das Anbieten eines herunterladbaren PDF-Dokuments ideal zu lösen.

  1. Es besteht nur aus einer einzigen Datei, ist also leicht herunterladbar und lokal zu speichern.
  2. Deshalb ist es auch einfacher online zu behalten, auch wenn das Design oder (schlimmer) die technische Grundlage der Firmenwebsite sich verändert - Dokumente zum Download anbieten kann jedes CMS.
  3. Designprobleme wie mit CSS kennt man bei PDFs ebenfalls keine.
  4. Ein Geschäftsbericht wird beispielsweise auch als Druckwerk erstellt - das Online-PDF fällt dabei nebenbei mit ab. Alternativ sind Office-Dokumente schnell als PDF "gedruckt".
  5. PDF ist mindestens ebenso plattformunabhängig geworden wie HTML, also auf breiter Basis verfügbar.

PDF-Dokumente vereinigen also viele Vorteile in sich: Sie sind leicht zu erstellen (auch für HTML-Unkundige - einfach "drucken"), enthalten Bilder- und Text-Ansammlungen in einer einzigen Datei, und Suchmaschinen durchsuchen ihre Inhalte mittlerweile auch.

Da könnte man HTML-Webseiten dann doch eigentlich demnächst komplett abschaffen - oder?

  1. Offensichtlich kapiere ich es nicht, und formuliere es mal "entschaerft", indem ich den Beitrag auf eine ominoese Zukunft (war) beziehe, in der nichts verstanden wurde ("in"), in der irgendwelche Unternehmen ganz paradiesisch schon nahezu ausnahmslos Benutzer und Standards beruecksichtigt haben (Vorteile wurden [...] ausgespielt, um echten Mehrwert zu bieten), obwohl zeitgleich aber kaum jemand mehr (technische) Skills hatte (Mühe darauf verwendet), und dann alle nochmal degeneriert sein muessen (nur damit der Online-Besucher ebenfalls bedient wird).

    Die beschriebene Zukunft wird noch "interessanter": Es scheint keinen "Speichern"-Dialog mehr zu geben (Problematik, dass der Besucher [...] HTML-Dokuments [...] nur unter größeren Mühen lokal konservieren kann), ebensowenig, wie es noch "Standalone"-HTML-Dokumente gibt (denn im Gegensatz dazu besteht [ein PDF] nur aus einer einzigen Datei), PDFs verfuegen auf einmal ueber CSS-Unterstuetzung (denn PDF sei einfacher online zu behalten, auch wenn das Design [...] der Firmenwebsite sich verändert), HTML kann ueber CSS hingegen aber offensichtlich nicht mehr formatiert werden, CSS kennt und beherrscht wiederum ueberhaupt keiner mehr (Designprobleme wie mit CSS), Barrierefreiheit ist ueberall implizit (schnell als PDF "gedruckt"), und WYSIWYG-Editoren wurden mittlerweile verboten ([für HTML-Unkundige] leicht zu erstellen).

    Logischerweise könnte man HTML-Webseiten dann doch eigentlich demnächst komplett abschaffen. Ja. Gottseidank ist das heute alles nicht so: Richtig angewandt ist HTML cool, richtig angewandt ist CSS cool, und richtig angewandt ist PDF cool.

  2. PDFs lassen sich auch einfacher durchsuchen, denn man kann das ganze Paket an Seiten durchsuchen und nicht nur die einzelne Seite. Und "Barierefrei" bekommt man sie ja eigentlich auch. Screenreader haben keine wirklichen Probleme damit und Vergrößerung funktioniert wunderprächtig.

    Ein Nachteil wäre vielleicht die Größe, aber diese Argument wird immer kleiner je mehr DSL-Zugänge es gibt.

  3. Solange Lynx keine PDFs anzeigen kann, werden wir wohl noch HTML-Seiten brauchen ;-)

    Ich denke, dass die mittlerweile exzessive Verwendung von PDFs mehr Nach- als Vorteile mit sich bringt:

    • PDF-Viewer lassen sich IMHO nicht so komfortabel wie moderne Browser bedienen, z.B. fehlen Lesezeichen, die Google-Suche, …
    • Gibt es Screenreader für PDfs, die auch mit Links umgehen können? Webseiten scheinen aktuell noch barrierefreundlicher zu sein.
    • PDFs sind zwar sehr schön fürs Drucklayout, aber ich möchte farbenfrohe Online-Layouts, als PDF umgesetzt, nicht unbedingt ausdrucken wollen. Es gibt Unterschiede zwischen Bildschirm- und Papierdarstellung, die sich nur schwer egalisieren lassen.
    • Praktisch jede Textverarbeitung kann von Haus aus HTML-Dokumente erstellen, der PDF-Export ist allerdings momentan noch nicht selbstverständlich.
    • Die Navigationsmöglichkeiten innerhalb eines PDFs sind in vielen, wenn nicht gar den meisten Fällen, äußerst eingeschränkt im Vergleich zu dem, was praktisch jede HTML-Datei bietet.

    Wir wollen hier allerdings einen entscheidenden Vorteil nicht ausblenden: Es gibt deutlich weniger Sicherheitslücken in Software zur Betrachtung von PDF-Dateien als in Webbrowsern, wobei durch die eingeschränkten Scripting-Möglichkeiten ein weiterer Sicherheitszugewinn verbucht werden kann.

    Generell lässt sich außerdem feststellen, dass die größten Probleme allerdings beim Zusammenspiel zwischen PDF und HTML auftreten: Links innerhalb der PDF-Datei werden im Browser geöffnet, während in HTML verlinkte PDFs bei mangelndem Plugin erst heruntergeladen werden müssen und anschließend manuell mit dem PDF-Viewer betrachtet werden können. Meine Lösung des angesprochenen Problems ist deshalb so simpel wie einleuchtend:
    Die PDf-Viewer der Zukunft sollten genauso intuitiv wie Webbrowser funktionieren. Das Problem der PDF-Erstellung wird sich zukünftig wohl immer seltener ergeben, da immer mehr Büroprogramme dieses Format „kennen“. Zusätzlich müssen Druckertinte und Papier (wieder) deutlich günstiger zu haben sein, um endlich diese doppelte Arbeit für ein separates Papierlayout zu sparen.

  4. Praktisch jede Textverarbeitung kann von Haus aus HTML-Dokumente erstellen, der PDF-Export ist allerdings momentan noch nicht selbstverständlich.

    Wobei hier je nach Programm die Frage ist, ob man das Ergebnis noch als HTML bezeichnen kann.

  5. Antwort auf Robert Bienert:

    * PDF-Viewer lassen sich IMHO nicht so komfortabel wie moderne Browser bedienen, z.B. fehlen Lesezeichen, die Google-Suche, ...

    Meine PDF-Software hat/kann Lesezeichen. Das kann man von Microsoft Word z.B. überhaupt nicht behaupten, von einer "Google-Suche" (was soll das sein???) ganz zu schweigen und dennoch wird es millionenfach eingesetzt.

    Wenn Herr Bienert mit "Google-Suche" die Durchsuchbarkeit von PDF-Dateien meint, ähnlich wie die Suchmaschinen das Internet durchsuchen, dann gibt es das doch natürlich auch für PDF-Dateien.

    Ach ja, die Internet-Suchmaschinen finden übrigens nicht alles, was "da draußen" vorhanden ist, im Gegensatz zur Suche nach PDF-Dateien: Wenn ich sie auf meinen Festplatten nicht gelöscht habe, dann werden sie auch gefunden.

    * Gibt es Screenreader für PDfs, die auch mit Links umgehen können? Webseiten scheinen aktuell noch barrierefreundlicher zu sein.

    Meine PDF-Software kann mit "Links" umgehen.

    * PDFs sind zwar sehr schön fürs Drucklayout, aber ich möchte farbenfrohe Online-Layouts, als PDF umgesetzt, nicht unbedingt ausdrucken wollen. Es gibt Unterschiede zwischen Bildschirm- und Papierdarstellung, die sich nur schwer egalisieren lassen.

    Meine PDF-Software kann farbige PDF-Dateien auch schwarz/weiß ausdrucken.

    * Praktisch jede Textverarbeitung kann von Haus aus HTML-Dokumente erstellen, der PDF-Export ist allerdings momentan noch nicht selbstverständlich.

    Das Web ist voll von kostenlosen bis teuren PDF-Druckertreibern/Exporteuren/Distillern und sie sind oft schneller und einfacher installiert als die betreffende Textverarbeitung.

    Außerdem empfiehlt sich in solchen Fällen immer Open Office 2.0, welches MS Office weit voraus ist.

    * Die Navigationsmöglichkeiten innerhalb eines PDFs sind in vielen, wenn nicht gar den meisten Fällen, äußerst eingeschränkt im Vergleich zu dem, was praktisch jede HTML-Datei bietet.

    Die Navigationsmöglichkeiten innerhalb einer PDF-Datei sind Kapitel, Sprungmarke, Suchfunktion usw. - wo ist der Unterschied zu einer HTML-Datei?

    Übrigens: Wenn es in einer HTML-Datei keine Anker gibt, dann ist die Navigation unmöglich, HTML-Dateien sind also nur so gut wie ihr Programmierer sie ausgestattet hat.

    Just my 2C!

  6. Mit „Google-Suche“ meine ich dieses schöne Textfeld, in meinem Browser oben rechts, in welches ich einen Suchbegriff eingeben kann und mit dem Bestätigen wird dieser Text in einer Suchmaschine meiner Wahl (kann ich selbst einstellen) im Internet gesucht. „Google-Suche“ habe ich als Begriff benutzt, weil standardmäßig und bei den meisten Nutzern dort Google eingestellt ist. Mein PDF-Betrachter kann nur und ausschließlich im aktuellen PDF-Dokument suchen, nicht im Internet, und auch nur dann, wenn der Inhalt als Text und nicht als Grafik vorliegt, was es leider auch gibt.

    Meine PDF-Software kann mit "Links" umgehen.

    Kann deine PDF-Software den Text denn auch vorlesen und dem Benutzer Links akustisch schmackhaft machen? Weiterhin glaube ich nicht, dass PDF Möglichkeiten bietet, für Grafiken oder andere Multimedia-Inhalte alternativen Text zu definieren.

    Meine PDF-Software kann farbige PDF-Dateien auch schwarz/weiß ausdrucken.

    Kann deine PDF-Software auch beim Ausdruck auf die Hintergrundverzierung verzichten und Bilder ausblenden sowie Links das Linkziel hintenanstellen? Da scheint CSS doch mächtiger zu sein.

    Das Web ist voll von […] PDF-Druckertreibern/Exporteuren/Distillern und sie sind oft schneller und einfacher installiert als die betreffende Textverarbeitung.

    Die betreffende Textverarbeitung, meistens M$ Office oder Works, ist allerdings meist schon auf dem Rechner vorinstalliert, ein PDF-Drucker nicht.

    Die Navigationsmöglichkeiten innerhalb einer PDF-Datei sind Kapitel, Sprungmarke, Suchfunktion usw. - wo ist der Unterschied zu einer HTML-Datei?

    Was passiert, wenn du in einem PDF-Dokument einen externen Link, meinetwegen auch zu einem anderen PDF-Dokument, anklickst? Der PDF-Betrachter öffnet die URL im Standardbrowser, der erkennt, dass es eine PDF-Datei ist und reicht diese an den PDF-Betrachter weiter. Was passiert, wenn du in einem HTML-Dokument einen externen Link anklickst? Der Browser öffnet die URL im gleichen Fenster bzw. Tag.

    Übrigens: Wenn es in einer HTML-Datei keine Anker gibt, dann ist die Navigation unmöglich, HTML-Dateien sind also nur so gut wie ihr Programmierer sie ausgestattet hat.

    Wenn der Autor einen PDF-Drucker einsetzt, der mit Überschriften und Textmarken nichts anfangen kann, ist die Navigation praktisch auch unmöglich, es sei denn, du kannst auf den Piktogrammen etwas erkennen.

  7. Wer es ernst meint mit seinen Publikationsstrategien, schreibt die Geschäftsberichte in XML und produziert dann daraus nach Bedarf die Print- und Online-Produkte. Oder?

  8. Das glaube ich eher nicht. Vermutlich auch, weil allein die Erstellung einer entsprechenden Infrastruktur ziemlich aufwendig wäre. Diverse Systemgrenzen wären zu überwinden, diverse Entwicklungsstadien der zu erstellenden Publikation zu beachten, die grafische Gestaltung der Printausgabe kann zweifelsohne nicht automatisiert ablaufen, sondern erfordert zwingend Seite für Seite menschliche Intervention.

    XML ist in diesem Prozess genauso toll oder schlecht, wie jedes andere Datenformat. Wobei es in einem Geschäftsbericht nur zu einem Drittel um die Zahlen geht. Zum zweiten Drittel geht es um erklärenden und darstellenden Text. Und das letzte Drittel sind Grafik und imagebildende Gestaltung. XML würde sich hier vermutlich hauptsächlich auf den Zahlentransport konzentrieren (für sich genommen schon eine anspruchsvolle Aufgabe), die Textverarbeitung wäre eine zweite anspruchsvolle Aufgabe, und die Gestaltung dürfte mit heute existierenden Programmen einfach mal komplett ohne XML ablaufen, weil die Profiprogramme der Gestalter einfach andere Dateiformate benutzen.

    XML als Datenquelle eventuell, da habe ich keine Ahnung, was benutzt wird. Aber damit dürfte der Weg von XML im Erstellungsprozess auch recht schnell wieder enden. :)

  9. Ach ja, die Internet-Suchmaschinen finden übrigens nicht alles, was "da draußen" vorhanden ist, im Gegensatz zur Suche nach PDF-Dateien: Wenn ich sie auf meinen Festplatten nicht gelöscht habe, dann werden sie auch gefunden.
    Ah, wie man sieht, hält der Trend, sich "das Internet" sicherheitshalber lokal abspeichern zu wollen, (teilweise) immer noch an.
  10. Klar sind PDF-Downloads schwer im Kommen. Manche Seiten sind von oben bis unten voll davon. Wer aber seine Informationen als PDF einstellt, hat eigentlich nichts davon verstanden, daß es im Hinblick auf das "Sematic Web" ja darauf ankommt, Daten zu strukturieren, um dann auf die Unterstrukturen automatisch zugreifen zu können bzw., dieselben auswerten zu können.

    Und das kann man eben mit PDF-Dokumenten nicht so gut wie mit strukturierten x(ht)ml-Dateien. Aber das braucht man wahrscheinlich den meisten, die hier lesen, nicht weiter zu erklären, oder?

    P.R.