Jesco: Sonderzeichen in Textdatei Datenbanken (Perl u.a.), No. 2

Beitrag lesen

Hallo Cheatah,

vielen Dank für deine Antworten, ich denke ich sehe da jetzt schon klarer:

Ist ein bestimmter Zeichenraum (egal ob ASCII oder Unicode) gegeben und in den Zellen der Datensatz-Datei sollen alle diese Zeichen vorkommen dürfen, dann *müssen* notgedrungen für Spalten- und Zeilenseparator Zeichen gewählt werden, die auch in den Zellen vorkommen können. Und dann besteht die *einzige* Möglichkeit darin Maskierungen vorzunehmen. So weit so klar.

Jetzt hatte ich aber vor mich zu beschränken und einen Teil von Zeichen in den Zellen der Datensatz-Datei *nicht* zu erlauben. Da ich aber keinen guten Überblick über die existierenden Zeichensätze habe, weiss ich nicht welche Zeichen da geeignet wären?! Im Zellinhalt stehen beispielsweise Inhaltsangaben zu technischen Publikationen. Da möchte ich, dass Sonderzeichen wie Gradzeichen, Angstroem, , ¦, ù und Ø vorkommen dürfen. Auf dieses \036-Zeichen dagegen meine ich gut verzichten zu können. Gibt es da nicht ein weiteres Zeichen, das sich als Zeilenumbruchszeichen anbietet?

Der Grund dafür ist, dass ich es möglichst einfach machen möchte, die Datei auch mit einem einfachen Texteditor bearbeiten zu können. Das erscheint mir schwieriger, wenn ich beim Einfügen von Text eine Reihe von Zeichen maskieren muss - dagegen leichter, wenn ich nur alle Zeilenumbrüche durch ein bestimmtes Zeichen ersetze.

Wie ist es eigentlich bei Binärdateien gelöst, z.B. in Word? Wird da auch das Prinzip der Zeichenmaskierung eingesetzt?

Viele Grüße,
Jesco