UTF-8 Zeichen in die Unicode-Nummer konvertieren von Björn Höhrmann, 19.09.2002 17:19

UTF-8 Zeichen in die Unicode-Nummer konvertieren

Robert Allerstorfer 19.09.2002 13:56

perl

Hi,

welche methode ist empfehlenswert, um ein zeichen, das in UTF-8 vorliegt (zB. als 3-Byte-Sequenz "\x{e6a49c}"), in die Nummer zu konvertieren, durch die dieses Zeichen in Unicode repräsentiert wird (wäre im beispiel "U+691C")?

Habe ein bisschen mit Perl 5.8's Encode modul herumexperimentiert, bin aber leider noch nicht zum ziel gekommen.

Danke,
rob.

Beitrag melden

– Informationen zu den Bewertungsregeln

UTF-8 Zeichen in die Unicode-Nummer konvertieren
MudGuard 19.09.2002 14:33

perl
– Informationen zu den Bewertungsregeln
Tach

welche methode ist empfehlenswert, um ein zeichen, das in UTF-8 vorliegt (zB. als 3-Byte-Sequenz "\x{e6a49c}"), in die Nummer zu konvertieren, durch die dieses Zeichen in Unicode repräsentiert wird (wäre im beispiel "U+691C")?

http://www.ietf.org/rfc/rfc2279.txt?number=2279
enthält alle nötigen Angaben.

Andreas
Beitrag melden

–
Informationen zu den Bewertungsregeln
1. UTF-8 Zeichen in die Unicode-Nummer konvertieren
  
  Robert Allerstorfer 19.09.2002 15:50
  
  perl
  – Informationen zu den Bewertungsregeln
  Hi,
  
  http://www.ietf.org/rfc/rfc2279.txt?number=2279
  enthält alle nötigen Angaben.
  
  Andreas
  
  danke für den verweis auf das "gesetz" ;-) Mittlerweile hab ich eine wunderbare lösung gefunden:
  
  #!/usr/bin/perl -w
  use strict;
  use 5.008;
  use Encode;
  my $string = v230.164.156;
  my $unicode = uc(sprintf "%lx", join("\n", map( ord($_),split(//,$string))));
  print "Content-Type: text/html\n\n";
  print "<meta http-equiv="Content-Type" content="text/html; charset=utf-8" />";
  print "<pre>U+$unicode\t$string";
  
  Hat vielleicht jemand ne idee, wie das in $]<5.008 funktioniert, also in Perl 5.6.1 oder auch 5.6.0, evt. sogar unter 5.005_03? das schöne in 5.8 ist, dass Encode ein standard modul ist! Nur hat sich diese version bisher kaum verbreitet, so scheint es zumindest.
  
  rob.
  Beitrag melden
  
  –
  Informationen zu den Bewertungsregeln
  Übersicht
  
  alle Foren
  
  SELFHTML-Forum
  
  anmelden
  
  Benutzerkonto erstellen
  
  Beitrag im Thread-Baum
UTF-8 Zeichen in die Unicode-Nummer konvertieren
Björn Höhrmann Homepage des Autors 19.09.2002 17:19

perl
– Informationen zu den Bewertungsregeln
welche methode ist empfehlenswert, um ein zeichen, das in UTF-8 vorliegt (zB. als 3-Byte-Sequenz "\x{e6a49c}"), in die Nummer zu konvertieren, durch die dieses Zeichen in Unicode repräsentiert wird (wäre im beispiel "U+691C")?

Unicode::String bietet dafür die unpack()-Methode.
Beitrag melden

–
Informationen zu den Bewertungsregeln

SELFHTML Forum - Ergänzung zur Dokumentation Übersicht

Robert Allerstorfer: UTF-8 Zeichen in die Unicode-Nummer konvertieren

UTF-8 Zeichen in die Unicode-Nummer konvertieren

UTF-8 Zeichen in die Unicode-Nummer konvertieren

UTF-8 Zeichen in die Unicode-Nummer konvertieren

UTF-8 Zeichen in die Unicode-Nummer konvertieren

UTF-8 Zeichen in die Unicode-Nummer konvertieren