Raketendatenextraktor: Können Daten aus einem PDF-Dokument maschinell gelesen werden?

Beitrag lesen

Das, was du da vorschlägst, ist ein Gefrickel, um doch irgendwie an die Daten zu kommen.

Also, wenn der Benutzer das Formular in der konkreten PDF-Datei ausfüllt und das Resultat per Mail verschickt, dann lässt es sich mit einem konkretem Skript sehr einfach auf die Eingaben untersuchen. Es sei denn, sein PDF-Betrachter macht Mist.

Wenn das fehlschlägt, kann man den Scan immer noch per OCR machen, dann wurde es aber wahrscheinlich auch noch mit der Hand ausgefüllt und meine Erfahrungen mit OCR sind in dem Fall „sehr unterschiedlich“.

„Gefrickel“

Wieso also sollte also mein Vorgehen mit der Untersuchung des Quelltextextes „Gefrickel“ sein? „Gefrickel“ ist es, mit allem Verlaub, hier überhaupt mit PDF-Formularen zu arbeiten. Denn dieser Schritt zieht den ganzen Mist doch bitteschön nach sich. (Hier ist ein Punkt!)

0 98

ausfüllbare PDF-Datei im Browser nicht ausfüllbar

Linuchs
  • sonstiges
  1. 0
    Der Martin
    • formulare
    • pdf
    1. 0
      Linuchs
      1. 2
        Der Martin
        1. -1
          Linuchs
        2. 2
          seth
  2. 2
    Felix Riesterer
    1. 0
      Der Martin
    2. 1
      JürgenB
    3. 1
      Auge
      • html
      • sonstiges
      • usability
      1. 0
        Matthias Apsel
        1. 0
          Auge
          1. 0
            Matthias Apsel
    4. 0
      encoder
      1. 1
        Auge
        1. 0
          Felix Riesterer
        2. 0
          encoder
      2. 0
        Matthias Apsel
        1. 0
          encoder
          1. 0
            Der Martin
            • formulare
            • sonstiges
            1. 0
              Matthias Apsel
              1. 0
                Der Martin
                1. 0
                  Camping_RIDER
                2. 0
                  Julius
                  • formulare
                  • pdf
                  • sonstiges
                  1. 0
                    Camping_RIDER
                  2. 0
                    Matthias Apsel
                    1. 0
                      Julius
            2. 0
              Camping_RIDER
              1. 0
                Der Martin
                1. 0
                  Camping_RIDER
    5. 0
      Camping_RIDER
      1. 0
        Felix Riesterer
        1. 0
          Camping_RIDER
          1. 0
            Der Martin
            1. 0
              Camping_RIDER
          2. 0
            Felix Riesterer
            1. 0
              Felix Riesterer
              1. 1
                Camping_RIDER
            2. 0
              Camping_RIDER
    6. 0
      klawischnigg
  3. 0
    Raketenpsychopharmakologe
  4. 0
    Raketenbildschirmbetrachter
  5. 1
    Camping_RIDER
    1. 0
      Tabellenkalk
      1. 0
        Camping_RIDER
  6. 0

    Können Daten aus einem PDF-Dokument maschinell gelesen werden?

    Linuchs
    • pdf
    • php
    1. 0
      Matthias Apsel
      • sonstiges
      1. 0
        Autor
        • datenmodell
        • pdf
        • software
        1. 0
          Matthias Apsel
          1. 0
            Autor
            1. 0
              Matthias Apsel
              1. 0
                Autor
                1. 3
                  Camping_RIDER
                  1. 0
                    Autor
                2. 0
                  Matthias Apsel
        2. 0
          Der Martin
    2. 0
      Rolf B
      1. 0
        Julius
        1. 0
          Linuchs
          1. 0
            Matthias Apsel
            • zu diesem forum
          2. 0
            Julius
            1. 0
              Linuchs
              1. 0
                Julius
                1. 1
                  Matthias Apsel
                  1. 0
                    Linuchs
                    • menschelei
                    1. 0
                      Der Martin
                  2. 0
                    Julius
    3. 0
      Autor
      • pdf
      • php
      • software
      1. 0
        Raktendatenextraktor
        1. 0
          Raketendatenextraktor
          1. 0
            Raketendatenextraktor
            1. 3
              Camping_RIDER
              1. 0
                Raketendatenextraktor
                1. 0
                  Matthias Apsel
                  1. 0
                    Raketendatenextraktor
                    1. 0
                      Camping_RIDER
                      1. 0
                        Raketenwilli
                        • sonstiges
                        1. 0
                          Camping_RIDER
                          1. 0
                            Julius
                            1. 0
                              Der Martin
                              • pdf
                              • sonstiges
                          2. 0

                            Frühkybernetische Erfahrung ...

                            Raketenhistoriker
                            1. 0
                              Der Martin
              2. -1
                Raketendatenextraktor
                • humor
                • meinung
                1. 0
                  Der Martin
                  • meinung
                  1. -1
                    Raketendatenextraktor
                2. 3
                  Camping_RIDER
                  1. 2

                    Frickeln

                    Der Martin
                    • meinung
                    • sprache
                    1. 0
                      Matthias Apsel
                    2. 0
                      klawischnigg
                      1. 0
                        Der Martin
                  2. 0
                    Raketendatenextraktor
    4. 1
      encoder
  7. 0

    TCPDF: Seitenrand muss weg!

    Linuchs
    • php
    • sonstiges
    1. 0
      Matthias Apsel
      1. 0
        Linuchs
        1. 0
          Matthias Apsel
          1. 0
            Linuchs
    2. 0

      TCPDF: Seitenrand - Problem gelöst

      Linuchs