Walther Mann: Quellcode von NS-Composer reparieren

Hallo,

ich stehe hier vor dem Problem, wie ich am schnellsten - die Zeit eilt, Deadline morgen - irrtümlich
im Netscape Composer geöffnete und gespeicherte Dokumente reparieren kann. Es handelt sich dabei
um ca. 500 Files in verschiedenen Verzeichnissen.

Um MS-Office Quelltext zu "reparieren" habe ich schon Dreamweaver und andere Werkzeuge gefunden.

Das Hauptproblem besteht darin, daß der Text mit dem <pre>-Tag vorformatiert war und das hätte auch so
bleiben müssen, aber Composer setzt stattdesen das <br>-Tag ein und wirft damit das <pre>-Tag raus.
Somit ist die gesamte Formatierung verloren und das Dokument sieht noch schlimmer aus als vorher.

Vielen Dank für Eure Hilfe

Walther Mann

  1. Walther,

    außer Mitgefühl kann ich dir wahrscheinlich nicht helfen, denn ein rückwärts-replace "alle <br> zu <pre>" geht ja nun wohl nicht.
    Hast du keine Sicherheitskopie?

    Gruss
    Connie

  2. Hi Walther,

    ich würde ganz simpel vorschlagen, in einem Texteditor (Notepad auf NT oder Wordpad auf Win9x) die Suchen-und-Ersetzen-Funktion drüber laufen zu lassen - dann hast Du überall, wo jetzt <BR> steht, <PRE> stehen - natürlich auch da, wo Du im Ursprung schon <BR> hattest, dagegen ist aber kein Kraut gewachsen.

    Grüße,

    Utz

    1. Hi Walther,

      ich würde ganz simpel vorschlagen, in einem Texteditor (Notepad auf NT oder Wordpad auf Win9x) die Suchen-und-Ersetzen-Funktion drüber laufen zu lassen - dann hast Du überall, wo jetzt <BR> steht, <PRE> stehen - natürlich auch da, wo Du im Ursprung schon <BR> hattest, dagegen ist aber kein Kraut gewachsen.

      Grüße,

      Utz

      Lieber Utz, ich hatte das so gemeint:

      Früher:

      <body blabla="#blabla">
      <pre>
      <b>4.2 Das ist die Überschrift der zweiten Ebene</b>

      Text über bla und sonstiges. Früher ist am Ende jeder Zeile einfach kein Tag für einen Umbruch
      gestanden und die Seite wurde durch das <pre>-formated an den entsprechenden Stellen
      umgebrochen.

      <kotz>So entstanden dann die verschiedenen Absätze, das ist zwar nicht schön (aber selten),
      aber in Anbetracht an ca. 6000 Dokumente war das die schnellste Lösung</kotz>
      </pre>

      Heute:
      <body blabla="#blabla">

      <b>4.2 Das ist die Überschrift der zweiten Ebene</b> <br>
      <br>
      Text über bla und sonstiges. Früher ist am Ende jeder Zeile einfach kein Tag für einen Umbruch&nbsp<br>
      gestanden und die Seite wurde durch das <pre>-formated an den entsprechenden Stellen&nbsp<br>
      umgebrochen&nbsp<br>
      <br>
      <kotz>So entstanden dann die verschiedenen Absätze, das ist zwar nicht schön (aber selten),&nbsp<br>
      aber in Anbetracht an ca. 6000 Dokumente war das die schnellste Lösung</kotz><br>

      Das <br>-Tag zu ersetzen würde wohl nichts bringen.

      Viele Grüße
      Walther Mann

      1. Hallo Walter,
        der folgende Vorschlag ist ziemlich arbeitsreich (von Hand alle Dokumente einzeln bearbeiten), aber da bis jetzt noch nichts bessers da ist :-) :
        Versuch mal, die Dateien als Textdateien in Word zu laden. Dann teste, ob Word hinter jeder Zeile einen Absatzumbruch einfuegt. Wenn ja, hast Du vielleicht Glueck.
        Dann mit der Suchen und Ersetzen (erweitert!) Funktion von Word alle <br> Tags, die noch ein Leerzeichen vornedran haben (und einen Zeilenumbruch hintendran), durch eine ungewoehnlich Zeichenkette ersetzen,
        z.B. 111111 oder so.
        Das sieht dann ungefaehr so aus: search: " <br>^p", replace 11111
        Das mit allen Dokumenten (viel Spass). Danach mit dem Editor von Uli Meybohm, http://www.meybohm.de/htmledit/index.html (der kann dateiuebergreifendes Ersetzen) alle noch verbleibenden <br> Tags (die dann mal <pre>-tags waren, durch eben diese <pre> tags ersetzen lassen.
        Ich weiss allerdings nicht, ob der Phase5 500 Dateien auf einmal schafft, aber das kannst Du dann ja ausprobieren.
        Im letzten Schritt alle "111111" wieder durch den Phase5 rausschmeissen lassen (Achtung, durch ein Leerzeichen ersetzen, sonst stehen die Woerter u.U. aneinander).

        Das sollte funktionieren (hoffe ich).   Probiere es halt erst mal mit ein paar Dokumenten aus.
        Heute:
        <body blabla="#blabla">

        <b>4.2 Das ist die Überschrift der zweiten Ebene</b> <br>
        <br>
        Text über bla und sonstiges. Früher ist am Ende jeder Zeile einfach kein Tag für einen Umbruch <br>
        gestanden und die Seite wurde durch das <pre>-formated an den entsprechenden Stellen <br>
        umgebrochen <br>
        <br>
        <kotz>So entstanden dann die verschiedenen Absätze, das ist zwar nicht schön (aber selten), <br>
        aber in Anbetracht an ca. 6000 Dokumente war das die schnellste Lösung</kotz><br>

        Zum generellen Reparieren empfehle ich Dir tidy, http://www.w3.org/People/Raggett/tidy/
        aber erst nach dem Ersetzen.
        Hoffe, das hilft.

        Gruss
        Thomas

        1. Hi zusammen,

          bei mir hat sich das Freeware-Tool BK ReplaceEm (http://www.orbit.org/replace/ bestens bewährt, um in mehreren Dateien komplexe Suchen-und-Ersetzen-Aktionen durchzufühen. Für verschiedene immer wiederkehrende Aktionen lassen sich Replacegroups und Filesets erstellen und abspeichern.

          Gruß,
          Stefan

          P.S. (off-topic): Was ist denn mit dem Zeilenumbruch in der Textarea dieses Forums passiert...?

          1. Hallo Stefan!

            P.S. (off-topic): Was ist denn mit dem Zeilenumbruch in der Textarea dieses Forums passiert...?

            Dem neuesten Virus: dem "Valligator" zum Opfer gefallen:

            http://www.teamone.de/selfaktuell/forum/messages/55440.html

            Grüße
            Thomas

            PS: das Problem gibts nur bei NS.

            PSps: Archiv: suchen: "valligator" oder "valigator" ;-))

            1. Moin,

              PS: das Problem gibts nur bei NS.

              PPS: Und der hat es M14 erfolgreich vererbt

              Swen