Hallo Self-Nachtwächter,

willkommen in der Wirklichkeit. Es gibt einfach Datenbestände, die - zumeist wegen manueller Erfassung durch kreative „Künstler“ - vermüllt sind und kein Original haben, von dem man eine bessere Fassung ableiten könnte. Die Daten sind einfach so erfasst worden, von mehreren Leuten, die unterschiedliche Vorstellungen von richtig und falsch hatten, gerne über viele Jahre hinweg, gerne auch mal mit verrutschten Spalten bei der Erfassung.

Zumindest stellt sich mir Pits Problem so dar. Er versucht jetzt, das beste draus zu machen und die Daten zu sanieren. Solchen Schwierigkeiten habe ich in meiner Berufspraxis mehr als einmal gegenüber gestanden. Wenn man versucht, solche Datengebilde zu restrukturieren, entstehen genau die beschriebenen Sonderfälle. Man guckt sich die Daten an, entwickelt eine Strategie wie man sortieren könnte, probiert aus, fällt auf die Nase, probiert neu, etc.

Deine Forderungen sind ein schöner Wunsch und Pit wäre sicher froh, wenn er diese Forderungen erfüllen könnte. Denn dann hätte er sein Problem gelöst.

Rolf

-- sumpsi - posui - clusi
freiwillige Angabe, für jeden sichtbar
freiwillige Angabe, für jeden sichtbar
freiwillige Angabe, für jeden sichtbar

Vorschau (Nachricht wird im Forum „SELF-Forum“ erscheinen)

  • Keine Tag-Vorschläge verfügbar
  • keine Tags vergeben

abbrechen

071

Nochmal Regex gesucht

  1. 0
    1. 0
    2. 0
      1. 0
        1. 0
          1. 0
            1. 0
              1. 0
                1. 0
                  1. 0
                    1. 0
                  2. 0
                    1. 0
                      1. 0
                        1. 0
                          1. 0
                            1. 0
                              1. 0
                                1. 0

                                  So geht es fast...

                                  1. 0

                                    Diese Zeile krieg ich nicht gematcht

                                    1. 0
                                      1. 0
                                        1. 0
                                          1. 0
                                            1. 0
                                              1. 0

                                                Lösungsalternative: pdftotext

                                          2. 0
                                            1. 0

                                              Diese Zeile krieg ich nicht gematcht - weitere Vereinfachung

                                    2. 0
                                      1. 0
                                        1. 0
                                          1. 0
                                            1. 0
                                              1. 0
                                                1. 0
                                                2. 0
                                                  1. 1
                        2. 0
                        3. 0
                          1. 0
                            1. 0
                              1. 0
                  3. 0

                    Nach Deinen Ergänzungern verbesserte Lösung

                    1. 0
                      1. 0
                        1. 0
                          1. 0

                            Tips zur Fehlersuche

                            1. 0
                              1. 0

                                Du bist nicht allein ...

                                1. 0
                  4. 0
                    1. 0
                      1. 0
              2. 0

                Vorhersehbar untauglicher Lösungsversuch

              3. 0
          2. 0
            1. 0
          3. 0
            1. 0
      2. 0
        1. 0
          1. 0
          2. 0
            1. 0
              1. 0
                1. 0
                  1. 0
            2. 0
      3. 0
        1. 0