Christoph Zurnieden: Prog(Linux) zum Umwandeln von chars dec 128 bis dec 256 in html entities

Hallo zusammen,

Kann so ein Progrämmchen jemand gebrauchen?

Download unter
http://www.01019freenet.de/czurnieden/entitiechanger-0.3.tar.gz ca 37 kb (klein genug?)

Funktion:
nimmt eine Datei von Stdin wchselt jedes Vorkommen eines Buchstabens wie ä ö ü und alle anderen aus HTML 3.2 in, je nach Wunsch, named entities oder Unicode um und gibt das Ergebniss nach Stdout aus.

Vorteil:
Bei Benutzung eines kleinen Editors (Emacs kann aussen vorgelassen werden, da der selbst so programmiert werden kann, das er das automatisch beim Tippen umwandelt) auf der Konsole, brauchen keine langen entitienamen mehr getippt werden.
Deutsche oder andere Texte mit Sonderzeichen brauchen nicht mehr von Hand vorbehandelt zu werden. Besonders günstig bei vielen Dateien da eine kleine Zeile in der Shell alles automatisiert.
Kann bei dem Htmleditor WebMaker als in/out Filter benutzt werden(natürlich auch bei anderen, die das unterstützen).
In Verbindung mit txt2html eine sehr schnelle Lösung, um Dokumente webgerecht aufbereiten zu können.

Lizens:
GPL (kost nix und der Quellcode wird mitgeliefert)

Hoffe auf gelegentliche Rückmeldung
Grüße
Christoph

  1. Hallo Christoph,

    Kann so ein Progrämmchen jemand gebrauchen?

    Diue meisten HTML-Editoren haben heute so eine Konvertierung eingebaut. Was sie aber meistens nicht bieten, ist, diese Konvertierung dateiuebergreifend vorzunehmen. Ein separates Programm waere fuer meine Begriffe also dann sinnvoll, wenn es die Konvertierung auf mehrere Dateien im Batchverfahren anwenden kann, sei es durch Verarbeitung mehrerer Dateien in mehreren Aufrufparametern, oder in Form von Wildcards (z.B. *.htm;*.html).

    viele Gruesse
      Stefan Muenz

    1. (Oh, der Chef persöhnlich ;-)

      Hallo Stefan,

      Diue meisten HTML-Editoren haben heute so eine Konvertierung eingebaut.

      Auch für alle aus HTML 3.2?

      Was sie aber meistens nicht bieten, ist, diese Konvertierung dateiuebergreifend vorzunehmen. Ein separates Programm waere fuer meine Begriffe also dann sinnvoll, wenn es die Konvertierung auf mehrere Dateien im Batchverfahren anwenden kann, sei es durch Verarbeitung mehrerer Dateien in mehreren Aufrufparametern, oder in Form von Wildcards (z.B. *.htm;*.html).

      Unter Linux gibt es die shell, ein

      #!bin/sh

      FILES=$(ls -A *.htm*)

      for file in $FILES; do entitiechanger < $file >$file.temp$$;

      done

      und um die Dateien wieder mit dem Orginalnamen zu haben noch

      for i in *temp$$; do mv $i ${i%.temp$$}; done

      Für die rekursive Ersetzung müßte es oben "ls -AR" heißen.
      Ja, ich weiß, das geht unter Windows nicht.
      Falsch!
      Unter http://www.cygnus.com gibt es den Cygnus Kompiler, der normalerweise zu Portierungszwecken benutzt wird. Im Gesamtpacket ( full.exe ca 13 MB) gibt es aber auch die Bash 2.02 mit allem was dazugehört, den ganzen kleinen Progrämmchen, die einem das Leben unter *nix so erleichtern. Ob es unter Win95 funktioniert, weiß ich nicht, NT und Win98 gehen.

      Grüße
      Christoph