Pit: Nochmal Regex gesucht

Beitrag lesen

Heheh Pit. Ruhig mit den Pferden. Ohne Rückfragen geht es halt manchmal nicht.

Alles gut, ich war nicht sicher, ob meine Frage unhöflich 'rüberkam. Daher wollte ich es erklären.

was Du mit diesem Durcheinander

Wenn man Beispieldaten hat, wird es sicher deutlicher.

Ich habe eine Textzeile, in der ein bestimter String "XYZ" oder "ABC" oder "Trallala" als ganzes Wort vorkommt. Vor diesem String steht immer ein Leerzeichen und davor eine Zahl, die aus n Ziffern besteht. Begrenzt in Richting Zeilenanfang wird diese Zahl wieder durch ein Leerzeichen. Hinter dem String steht (nach dem Leereichen) ein Betrag (mit Tausendepunkt und Komma). Diese Zahl bildet auch zugleich das Zeilenende.

Beispieldaten:

AB0006777 Lore Ipsum 25 ABC 3,72

AB09899 AB00067127 At vero, eos et 2 1 XYZ 13,11

AB0007711 CD0TZUUZ AB899979 At vero eos et 10 100 XYZ 1.223,50

In Zeile 1 suche ich: Lore Ipsum; 25;ABC;3,72

In Zeile 2 suche ich: At vero, eos et 2;1;XYZ;13,11

In Zeile 3 suche ich: At vero eos et 10;100;XYZ;1.233,50

Hintergrund ist, aus einem unsortierten Datenhaufen eine sortierte Tabelle oder csv zu machen.

Pit

071

Nochmal Regex gesucht

  1. 0
    1. 0
    2. 0
      1. 0
        1. 0
          1. 0
            1. 0
              1. 0
                1. 0
                  1. 0
                    1. 0
                  2. 0
                    1. 0
                      1. 0
                        1. 0
                          1. 0
                            1. 0
                              1. 0
                                1. 0

                                  So geht es fast...

                                  1. 0

                                    Diese Zeile krieg ich nicht gematcht

                                    1. 0
                                      1. 0
                                        1. 0
                                          1. 0
                                            1. 0
                                              1. 0

                                                Lösungsalternative: pdftotext

                                          2. 0
                                            1. 0

                                              Diese Zeile krieg ich nicht gematcht - weitere Vereinfachung

                                    2. 0
                                      1. 0
                                        1. 0
                                          1. 0
                                            1. 0
                                              1. 0
                                                1. 0
                                                2. 0
                                                  1. 1
                        2. 0
                        3. 0
                          1. 0
                            1. 0
                              1. 0
                  3. 0

                    Nach Deinen Ergänzungern verbesserte Lösung

                    1. 0
                      1. 0
                        1. 0
                          1. 0

                            Tips zur Fehlersuche

                            1. 0
                              1. 0

                                Du bist nicht allein ...

                                1. 0
                  4. 0
                    1. 0
                      1. 0
              2. 0

                Vorhersehbar untauglicher Lösungsversuch

              3. 0
          2. 0
            1. 0
          3. 0
            1. 0
      2. 0
        1. 0
          1. 0
          2. 0
            1. 0
              1. 0
                1. 0
                  1. 0
            2. 0
      3. 0
        1. 0