Camping_RIDER: Können Daten aus einem PDF-Dokument maschinell gelesen werden?

Beitrag lesen

Aloha ;)

Das die Daten nach dem Ausfüllen und Speichern im Dokument drin sein müssen - und zwar in einer dokumentierten und auslesbaren Form - hatte ich vorausgesetzt. Sonst könnte man das PDF nicht ausfüllen, speichern und sich dann ausgefüllt anzeigen lassen.

Ja, richtig. Ich hatte mich allerdings noch nie wirklich mit tatsächlichem Text-Inhalt einer PDF-Datei auseinandergesetzt, da ich PDF immer im Bereich "Binärformat und Ähnliches" verortet hatte.

Ich war daher implizit davon ausgegangen, dass wohl auch die Inhalte der Formularfelder zwar nicht verschlüsselt, aber zumindest irgendwie codiert und nicht in Plaintext in der PDF vorkommen würden.

Ich hatte allerdings ganz "akademisch" gehofft, dass Adobe hierfür einen (leicht isolierbaren) Container vorsieht, der dann XML, JSON oder in einer anderen, verbreiteten Form serialisierte Daten beinhaltet.

Ja! Vor allem dann, wenn der Rest der Datei ja kein Klartext-Format ist.

Ich bin nach dem "reingeneering" ziemlich enttäuscht von dem was Adobe da spezifiert hat und vermute mal, dass Adobe das aus pekunärem Interesse so gemacht hat.

Möglich. Ich verstehe vieles nicht, was hinter der Idee des PDF-Format steht und kann für mich nur den Kopf schütteln, dass das der quasi-Standard geworden ist und nicht ein Format, das sich leichter analysieren und manipulieren lässt. Vermutlich genau deshalb, weil die Komplexität des Formats eine hohe Hürde für Re-Engineering von Dateien aufbaut und damit uninteressant macht. Oder so. Wirkliches Argument ist das aber keins.

Wie auch immer: Danke dir für die Nachforschungen und das Teilen deiner Ergebnisse!

Grüße,

RIDER

--
Camping_RIDER a.k.a. Riders Flame a.k.a. Janosch Zoller
# Twitter # Steam # YouTube # Self-Wiki # Selfcode: sh:) fo:) ch:| rl:) br:^ n4:? ie:% mo:| va:) js:) de:> zu:} fl:( ss:) ls:[
0 98

ausfüllbare PDF-Datei im Browser nicht ausfüllbar

Linuchs
  • sonstiges
  1. 0
    Der Martin
    • formulare
    • pdf
    1. 0
      Linuchs
      1. 2
        Der Martin
        1. -1
          Linuchs
        2. 2
          seth
  2. 2
    Felix Riesterer
    1. 0
      Der Martin
    2. 1
      JürgenB
    3. 1
      Auge
      • html
      • sonstiges
      • usability
      1. 0
        Matthias Apsel
        1. 0
          Auge
          1. 0
            Matthias Apsel
    4. 0
      encoder
      1. 1
        Auge
        1. 0
          Felix Riesterer
        2. 0
          encoder
      2. 0
        Matthias Apsel
        1. 0
          encoder
          1. 0
            Der Martin
            • formulare
            • sonstiges
            1. 0
              Matthias Apsel
              1. 0
                Der Martin
                1. 0
                  Camping_RIDER
                2. 0
                  Julius
                  • formulare
                  • pdf
                  • sonstiges
                  1. 0
                    Camping_RIDER
                  2. 0
                    Matthias Apsel
                    1. 0
                      Julius
            2. 0
              Camping_RIDER
              1. 0
                Der Martin
                1. 0
                  Camping_RIDER
    5. 0
      Camping_RIDER
      1. 0
        Felix Riesterer
        1. 0
          Camping_RIDER
          1. 0
            Der Martin
            1. 0
              Camping_RIDER
          2. 0
            Felix Riesterer
            1. 0
              Felix Riesterer
              1. 1
                Camping_RIDER
            2. 0
              Camping_RIDER
    6. 0
      klawischnigg
  3. 0
    Raketenpsychopharmakologe
  4. 0
    Raketenbildschirmbetrachter
  5. 1
    Camping_RIDER
    1. 0
      Tabellenkalk
      1. 0
        Camping_RIDER
  6. 0

    Können Daten aus einem PDF-Dokument maschinell gelesen werden?

    Linuchs
    • pdf
    • php
    1. 0
      Matthias Apsel
      • sonstiges
      1. 0
        Autor
        • datenmodell
        • pdf
        • software
        1. 0
          Matthias Apsel
          1. 0
            Autor
            1. 0
              Matthias Apsel
              1. 0
                Autor
                1. 3
                  Camping_RIDER
                  1. 0
                    Autor
                2. 0
                  Matthias Apsel
        2. 0
          Der Martin
    2. 0
      Rolf B
      1. 0
        Julius
        1. 0
          Linuchs
          1. 0
            Matthias Apsel
            • zu diesem forum
          2. 0
            Julius
            1. 0
              Linuchs
              1. 0
                Julius
                1. 1
                  Matthias Apsel
                  1. 0
                    Linuchs
                    • menschelei
                    1. 0
                      Der Martin
                  2. 0
                    Julius
    3. 0
      Autor
      • pdf
      • php
      • software
      1. 0
        Raktendatenextraktor
        1. 0
          Raketendatenextraktor
          1. 0
            Raketendatenextraktor
            1. 3
              Camping_RIDER
              1. 0
                Raketendatenextraktor
                1. 0
                  Matthias Apsel
                  1. 0
                    Raketendatenextraktor
                    1. 0
                      Camping_RIDER
                      1. 0
                        Raketenwilli
                        • sonstiges
                        1. 0
                          Camping_RIDER
                          1. 0
                            Julius
                            1. 0
                              Der Martin
                              • pdf
                              • sonstiges
                          2. 0

                            Frühkybernetische Erfahrung ...

                            Raketenhistoriker
                            1. 0
                              Der Martin
              2. -1
                Raketendatenextraktor
                • humor
                • meinung
                1. 0
                  Der Martin
                  • meinung
                  1. -1
                    Raketendatenextraktor
                2. 3
                  Camping_RIDER
                  1. 2

                    Frickeln

                    Der Martin
                    • meinung
                    • sprache
                    1. 0
                      Matthias Apsel
                    2. 0
                      klawischnigg
                      1. 0
                        Der Martin
                  2. 0
                    Raketendatenextraktor
    4. 1
      encoder
  7. 0

    TCPDF: Seitenrand muss weg!

    Linuchs
    • php
    • sonstiges
    1. 0
      Matthias Apsel
      1. 0
        Linuchs
        1. 0
          Matthias Apsel
          1. 0
            Linuchs
    2. 0

      TCPDF: Seitenrand - Problem gelöst

      Linuchs