Linuchs: Codiertes / geschütztes PDF-Dokument?

Moin,

ich habe die Aufgabe übernommen, für unseren Chor A3-Textseiten für Notenständer zu drucken.

Zahlreiche Texte müssen von A4 PDF übernommen und neu layoutet werden, um den Text so groß wie möglich darzustellen. Das mache ich mit HTML.

Wenn ich den Text der Quelle markiere, sieht es seltsam aus:

und die Übernahme in den Editor ist nicht brauchbar:

Was ist das? Unabhängig davon erzählte mir eine Bekannte, dass ihr Sachverständigen-Büro PDF Dateien verschlüsselt, damit sie nicht manipuliert werden können.

Ist das sowas? Unser Chorleiter tut immer so unschuldig, hat der das aus einem Word-Dokument bewusst gemacht oder ist das eine Eigenschaft von Word?

Gruß, Linuchs

  1. Hallo,

    ich habe die Aufgabe übernommen, für unseren Chor A3-Textseiten für Notenständer zu drucken.

    Zahlreiche Texte müssen von A4 PDF übernommen und neu layoutet werden, um den Text so groß wie möglich darzustellen.

    oh je, da hast du dir aber wieder eine Aufgabe ans Bein gebunden!

    und die Übernahme in den Editor ist nicht brauchbar:

    Was ist das?

    Vermutlich der PDF-Binärcode. Denn PDF ist zwar ein Standardformat und die Spezifikation seit vielen Jahren offengelegt (war ursprünglich "geheim" von Adobe). Aber es ist kein einfach lesbares Textformat.

    Unabhängig davon erzählte mir eine Bekannte, dass ihr Sachverständigen-Büro PDF Dateien verschlüsselt, damit sie nicht manipuliert werden können.

    Kann man tun.

    Einen schönen Tag noch
     Martin

    --
    "Haben Sie meinen Hund gerade dämlich genannt? Unerhört!! Mein Hund ist intelligenter als ich!"
    1. Hallo Martin,

      Vermutlich der PDF-Binärcode

      Meine mit Firefox erzeugten PDF Dokumente ergeben das nicht:

    2. Hello,

      und die Übernahme in den Editor ist nicht brauchbar:

      Was ist das?

      Vermutlich der PDF-Binärcode. Denn PDF ist zwar ein Standardformat und die Spezifikation seit vielen Jahren offengelegt (war ursprünglich "geheim" von Adobe). Aber es ist kein einfach lesbares Textformat.

      PDF ist ein Containerformat, dass unterschiedlichste Formate und Codierungen zusammenfassen kann.

      Für jedes Subformat muss der Reader also einen Handler haben. Da verirrt sich der Reader dann, wenn der Writer nicht den passenden Schlüssel oder die passende Codierung dafür eingesetzt hat, sondern eben einen "passt so ungefähr"-Handler referenziert hat.

      Verlust ist überall ;-)

      Glück Auf
      Tom vom Berg

      --
      Es gibt soviel Sonne, nutzen wir sie.
      www.Solar-Harz.de
      S☼nnige Grüße aus dem Oberharz
  2. Was ist das?

    Was soll es schon sein? Für Dich (aus Deiner Perspektive) ist es jedenfalls „Murks“.

    PDF kennt massenhaft „Subformate“. Das kann allerfeinstes PDF sein, welches direkt aus Postscript erzeugt wurde, solches in welches eine Grafik (quasi ein virtuelles Bildschirmfoto) eingebettet wurde - und noch viel mehr. Tatsache ist, man kann faktisch nur probieren welche Optionen beim Export aus dem Programm A gesetzt werden müssen, damit man im Programm B mit Copy und im Programm C mit Paste agieren kann. Und ob es hinsichtlich Programm A überhaupt eine Chance gibt.

    Unabhängig davon erzählte mir eine Bekannte, dass ihr Sachverständigen-Büro PDF Dateien verschlüsselt, damit sie nicht manipuliert werden können.

    Das machen die aber wohl explizit. Dabei wird festgelegt, welche Handlungen (z.B. drucken, verändern) mit dem PDF erlaubt sind.

    Ist das sowas?

    Ich weiß es nicht. Ich war nämlich nicht dabei.

    Unser Chorleiter tut immer so unschuldig,

    Vermutlich ist er es auch, jedenfalls so lange Du ihm Vorsatz unterstellst. Der Grund folgt.

    hat der das aus einem Word-Dokument bewusst gemacht oder ist das eine Eigenschaft von Word?

    Kaum jemand, der M$ Word benutzt, macht sowas wirklich absichtlich. Microsofts „Dokumentation“ ist oft eigentlich „Werbung“. Soll heißen, man erfährt wie „toll, einfach und sicher“ dieses oder jenes geht - nicht aber den technischen Hintergrund. Man erfährt vom M$ faktisch nie, was wirklich passiert.

    Abhilfe: Versuche mal, ihn dazu zu bewegen, das Zeug für Dich im ODF-Format (mit Endungen wie „.odt“ oder „.odp“) zu speichern und exportiere das Resultat dann selbst in LibreOffice. Möglicherweise kannst Du bei der Gelegenheit auch noch mehr bewegen.

    1. Versuche mal, ihn dazu zu bewegen, das Zeug für Dich im ODF-Format

      Das PDF Format macht Sinn, die Texte des Liederbuches können aus einer Cloud geholt und gedruckt werden. So ist jeder Sänger für seine Dokumenten-Sammlung selbst verantwortlich.

      Ach so - für mich. Das dauert dann ...

      Da hole ich mir lieber die Lyrics aus dem Web und passe sie an.

  3. Hello KH,

    das ist eine Macke in den diversen Codierungsschichten, die zwischen dem (HTML-)Frontend und der gespeicherten Codierung steckt.

    Ich habe bei der Übertragung/Zusammenführung von kryptischen Manuals für Dummies, wie mich, auch immer wieder das Problem.

    Stell es Dir enifach so vor, wie den Unterschied zwischen PHP strpos() und mb_strpos() und das mehrfach hin und her.

    Da verzählt sich das Ding einfach. Durch eine interne Korrektur für MB-3-Bit und MB-4-Bit findet der Konverter aber trotzdem oft die richtigen Aufsetzpunkte wieder. Teilweise fehlt dann zwischendurch etwas.

    Tipp aus der Praxis: versuche das Lesen einfach mit unterschiedlichen PDF-Readern im Browser und stand alone. Die haben alle unterschiedliche Macken und einer ist meistens dabei, der es richtig™ kann. Aber Schuld ist meistens der verwendete Writer/Creator.

    Glück Auf
    Tom vom Berg

    --
    Es gibt soviel Sonne, nutzen wir sie.
    www.Solar-Harz.de
    S☼nnige Grüße aus dem Oberharz
  4. Hallo Linuchs,

    ich habe schon mal (geschützte) PDF-Dokumente als PDF gedruckt. Danach konnte ich damit weiterarbeiten. Evtl. darfst du dafür nicht den Acrobat nehmen.

    Gruß
    Jürgen

    1. Hello,

      [...] Evtl. darfst du dafür nicht den Acrobat nehmen.

      full ack

      (kürzt man das jetzt "fuck", oder besser "fack" ab? scnr)

      Glück Auf
      Tom vom Berg

      --
      Es gibt soviel Sonne, nutzen wir sie.
      www.Solar-Harz.de
      S☼nnige Grüße aus dem Oberharz
  5. Hallo,

    Zahlreiche Texte müssen von A4 PDF übernommen

    Warum? Kannst du nicht direkt den Text als Textdatei bekommen?

    Gruß
    Kalk