michael: komische zeichen beim lesen aus DB (steuerzeichen?)

hallo alle zusammen,

ich habe einen text aus einem PDF direkt per copy&paste in das Textfeld einer datenbank geschrieben.

dieser text bestand hauptsächlich aus einer aufzählung.
als ich ihn mir danach in der db angesehen habe, wurde für jeden aufzählungspunkt (zeilenumbruch?) ein dicker, vertikaler balken eingesetzt. ähnlich dem pipe-zeichen, nur kürzer und fett.

wenn ich mir das wieder mit echo nl2br($datensatz) ausgeben lasse,
kommt das bei raus:
 Wide Supply Range: 2,7V to 5,5V
 Tiny SOT23-6 Package
 Programmable thresholds with ALERT
function (TMP101NA/250)

dabei steht dieses Zeichen "" <-hier genauso im quelltext...?

wie kann ich dieses Zeichen abgreifen? würde mir ja gern irgendeinen regex bauen, mit dem ich das abgreifen kann...?

grüße,
michael

  1. Hallo Michael,

    ich habe einen text aus einem PDF direkt per copy&paste in das Textfeld einer datenbank geschrieben.

    Dein Problem ist fuer mich ein weiteres Argument gegen PDF...
    Aus PDFs laesst sich nun mal schlecht Copy-Pasten.
    (btw: Auch unser Freund Jakob Nielsen findet PDFs schlecht:
    http://www.useit.com/alertbox/20010610.html)

    dabei steht dieses Zeichen "" <-hier genauso im quelltext...?

    Das SelfForum hat offenbar seine eigenen Filter... Hier war zwischen den Anfuehrungszeichen nichts zu sehen.

    wie kann ich dieses Zeichen abgreifen? würde mir ja gern irgendeinen regex bauen, mit dem ich das abgreifen kann...?

    Dazu musst Du zuerst mal wissen, welchen Wert das Zeichen hat.

    Dabei koennte Dir eines der folgenden Tools helfen:
    * Der Mozilla Web Sniffer:
      http://webtools.mozilla.org/web-sniffer/
    * Irgend ein Hex Editor, z.B. Hex Wizard:
      http://de.geocities.com/hexwizard2/
    * oder natuerlich die Funktion ord() von PHP:
      http://www.php.net/manual/de/function.ord.php

    Im Extremfall filterst Du Deine Ausgabe so, dass nur die von Dir
    erlaubten Zeichen rausgehen (z.B. ASCII 32..126). Kommt natuerlich
    darauf an, wie Du Umlaute und Sonderzeichen in der DB speicherst
    und ob/wann Du sie in Entities umwandelst.

    HTH, mfg
    Thomas