Martin_: meta informationen aus pdf dateien auslesen

Hallo,
hat das schonmal von euch jemand gemacht: mit Perl die Meta Informationen aus einer PDF Datei ausgelesen? Meine Perl Kenntnisse sind leider etwas verstaubt und ich bräuchte daher Unterstützung.
Vielen Dank!
Martin

  1. Hell-O!

    hat das schonmal von euch jemand gemacht: mit Perl die Meta Informationen aus einer PDF Datei ausgelesen?

    Nein, aber es gibt eine Reihe von Modulen rund um PDF auf cpan.org. Gleich der erste Treffer sieht vielversprechend aus.

    Siechfred

    --
    Ich bin strenggenommen auch nur interessierter Laie. (molily)
    Kabelkuddelmuddel || Steuerfreie Geburtsbeihilfen?  || RT 221 Erfurt-Altstadt i.V.
    1. Nein, aber es gibt eine Reihe von Modulen rund um PDF auf cpan.org. Gleich der erste Treffer sieht vielversprechend aus.

      Danke für den Link. Da muss ich mich wohl mal durchschlagen.
      Falls jemand noch so on-the-fly was in der Hinterhand hat: bitte posten, ihr würdet mir sehr weiter helfen.

      Danke, Martin

      1. Nein, aber es gibt eine Reihe von Modulen rund um PDF auf cpan.org. Gleich der erste Treffer sieht vielversprechend aus.

        Hab mir das mal angeschaut, ist leider nicht sehr gut dokumentiert. Ich versuche mich noch daran den Autor oder den Titel auszulesen.
        Wie gesagt, ist lange her, dass ich zuletzt mal was mit Perl gemacht habe. :-/
        Wenn jemand noch was einfacheres hat, freue ich mich sehr darüber.

        Danke, Martin

        1. Hell-O!

          Hab mir das mal angeschaut, ist leider nicht sehr gut dokumentiert. Ich versuche mich noch daran den Autor oder den Titel auszulesen.

          So geht's:

          use strict;  
          use warnings;  
          use PDF;  
            
          print "Content-type: Text/html; charset=utf-8\n\n";  
          my $pdf = PDF->new;  
          $pdf->TargetFile('pfad/zu/datei.pdf');  
          $pdf->LoadPageInfo;  
          print 'Version: ', $pdf->Version, '<br>';  
          print 'Autor: ', $pdf->GetInfo('Author'), '<br>';  
          print 'Titel: ', $pdf->GetInfo('Title');
          

          Vorteil des Moduls ist, dass es ohne PDF-Bibliotheken auskommt, der Nachteil ist, dass die aktuellste Version 1.11 aus dem Jahr 2000 stammt, also bei neueren PDF-Dateien ungewöhnliche Ergebnisse liefern kann (so stehen bei meinen Tests vor Titel und Autor ziemlich seltsame Zeichen).

          Siechfred

          --
          Ich bin strenggenommen auch nur interessierter Laie. (molily)
          Kabelkuddelmuddel || Steuerfreie Geburtsbeihilfen?  || RT 221 Erfurt-Altstadt i.V.