NCR und Valligator -- gelöst von pl, 28.12.2017 10:52

SELF-Forum

NCR und Valligator

pl 27.12.2017 14:27

html

– Informationen zu den Bewertungsregeln

problematische Seite

Hmm,

warum quittiert mir der Valligator ein 龜 mit Text run is not in Unicode Normalization Form C.???

Bitte mal um Hinweise. MfG

Beitrag melden

– Informationen zu den Bewertungsregeln

NCR und Valligator
Gunnar Bittersmann Homepage des Autors 27.12.2017 15:03 (Versionen)

html
−1 Informationen zu den Bewertungsregeln
problematische Seite

@@pl

warum quittiert mir der Valligator ein 龜 mit Text run is not in Unicode Normalization Form C.???

Woran hapert’s denn? An Unicode Normalization Form C wohl nicht – in Sachen Zeichncodierungen bist du ja hier der allwissende Überflieger.

Am Herausfinden, was U+FACE für ein Zeichen ist? Dafür hast du gerade eben dein eigenes Tool angepriesen.

Am Herausfinden, was es mit CJK Compatibility Ideographs auf sich hat? Die Suchmaschine deiner Wahl sollte dich zur Wikipedia führen.

Die deutsche Wikipedia sagt dir auch, welches Zeichen in NFC anstelle von U+FACE zu verwenden ist.

LLAP 🖖

--
“When UX doesn’t consider all users, shouldn’t it be known as ‘Some User Experience’ or... SUX? #a11y” —Billy Gregory
Beitrag melden

−1
Informationen zu den Bewertungsregeln
1. NCR und Valligator
  
  pl 27.12.2017 15:26
  
  html
  
  zu diesem forum
  – Informationen zu den Bewertungsregeln
  problematische Seite
  
  Woran hapert’s denn? An Unicode Normalization Form C wohl nicht – in Sachen Zeichncodierungen bist du ja hier der allwissende Überflieger.
  
  So eine arrogante Antwort kann ja nur von Dir kommen. Darauf kann ich gerne verzichten. MfG
  Beitrag melden
  
  –
  Informationen zu den Bewertungsregeln
  Übersicht
  
  alle Foren
  
  SELFHTML-Forum
  
  anmelden
  
  Benutzerkonto erstellen
  
  Beitrag im Thread-Baum
  1. NCR und Valligator
    
    Gunnar Bittersmann Homepage des Autors 27.12.2017 15:59
    
    zu diesem forum
    
    – Informationen zu den Bewertungsregeln
    problematische Seite
    
    @@pl
    
    Du suchst schon wieder Streit? Nicht mit mir.
    
    LLAP 🖖
    
    --
    “When UX doesn’t consider all users, shouldn’t it be known as ‘Some User Experience’ or... SUX? #a11y” —Billy Gregory
    Beitrag melden
    
    –
    Informationen zu den Bewertungsregeln
    
    Übersicht
    
    alle Foren
    
    SELFHTML-Forum
    
    anmelden
    
    Benutzerkonto erstellen
    
    Beitrag im Thread-Baum
NCR und Valligator -- gelöst
pl 27.12.2017 15:45 (Versionen)

html
– Informationen zu den Bewertungsregeln
problematische Seite

Hmm,

warum quittiert mir der Valligator ein 龜 mit Text run is not in Unicode Normalization Form C.???

Es betrifft eine ganze Reihe weiterer Zeichen. Und die Meldung des Valigators liegt darin begründet, daß Unicode kanonisch aufgebaut ist. Für meine Anwendung ist das ohne Belang. MfG
Beitrag melden

–
Informationen zu den Bewertungsregeln
1. NCR und Valligator -- gelöst
  
  pl 28.12.2017 10:52
  
  html
  – Informationen zu den Bewertungsregeln
  problematische Seite
  
  Hmm,
  
  warum quittiert mir der Valligator ein 龜 mit Text run is not in Unicode Normalization Form C.???
  
  Es betrifft eine ganze Reihe weiterer Zeichen. Und die Meldung des Valigators liegt darin begründet, daß Unicode kanonisch aufgebaut ist. Für meine Anwendung ist das ohne Belang. MfG
  
  Das war gestern. Meine Anwendung habe ich entsprechend Unicode Standard Annex 15 erweitert, das Decomposition Mapping habe ich so in das Suchergebnis übernommen, daß beim Anklicken eine neue Suche in der Datei UnicodeData.txt stattfindet.
  
  Im Beispiel listed das Suchergebnis alle Zeichen auf, die das COMBINING CARON, Codepoint 030C verwenden.
  
  Es ist von der Handhabe (UX) evnt. noch verbesserungswürdig aber ihr seid ja auch noch da und dürft euren Senf dazugeben 😉
  
  Und jetzt werde ich mal schauen ob CPAN schon ein API für diese Datei UnicodeData.txt hat, vielleicht gibts ja auch einen Webservice vom Konsortium. MfG
  Beitrag melden
  
  –
  Informationen zu den Bewertungsregeln
  Übersicht
  
  alle Foren
  
  SELFHTML-Forum
  
  anmelden
  
  Benutzerkonto erstellen
  
  Beitrag im Thread-Baum
Unicode Character Database Webservices
pl 30.12.2017 11:37

html

perl

unicode
– Informationen zu den Bewertungsregeln
problematische Seite

Was sich auch der Valligator da einmischt 😉

Wie auch immer, bei einer Response als JSON hat der Valigator nichts mehr zu meckern. Schließlich kann sich jeder anhand der Codepoints seine Zeichen selber basteln wie er das für richtig hält, egal ob als NCR oder proprietäre Bytesequenzen.

Was mich etwas verwundert ist, daß es auf unicode.org noch keinen solchen Webservice gibt oder habe ich da was übersehen?

Für diesen Service habe ich ein PerlModule UnicodeDataAPI entwickelt, sowas gibt es auch noch nicht auf CPAN.

Ansonsten MfG
Beitrag melden

–
Informationen zu den Bewertungsregeln
1. Unicode Character Database Webservices
  
  Gunnar Bittersmann Homepage des Autors 30.12.2017 12:04
  
  html
  
  perl
  
  unicode
  – Informationen zu den Bewertungsregeln
  problematische Seite
  
  @@pl
  
  egal ob als NCR oder proprietäre Bytesequenzen.
  
  Proprietäre Bytesequenzen?? Was soll das sein?
  
  Du meintest nicht NCR, sondern NFC?
  
  Was mich etwas verwundert ist, daß es auf unicode.org noch keinen solchen Webservice gibt oder habe ich da was übersehen?
  
  Was genau sollte es da geben? Es ist doch Sache des Texteditors, die Zeichen in NFC (oder einer anderen Normalisierungsform) zu speichern.
  
  LLAP 🖖
  
  --
  “When UX doesn’t consider all users, shouldn’t it be known as ‘Some User Experience’ or... SUX? #a11y” —Billy Gregory
  Beitrag melden
  
  –
  Informationen zu den Bewertungsregeln
  Übersicht
  
  alle Foren
  
  SELFHTML-Forum
  
  anmelden
  
  Benutzerkonto erstellen
  
  Beitrag im Thread-Baum
  1. Unicode Character Database Webservices
    
    pl 30.12.2017 14:44 (Versionen)
    
    html
    
    perl
    
    unicode
    
    – Informationen zu den Bewertungsregeln
    problematische Seite
    
    Malne Frage: Ω entspricht nicht der Normalform C (sagt Valligator). Was verrät mir die Abfrage auf UnicodeData.txt über die Normalform für dieses Zeichen?
    
    Das Decomposition_Mapping (lt. UCD) zeigt auf den Codepoint 03A9 ist das die Normalform und wenn ja warum und welche Information liefert UCD zum warum? MfG
    Beitrag melden
    
    –
    Informationen zu den Bewertungsregeln
    
    Übersicht
    
    alle Foren
    
    SELFHTML-Forum
    
    anmelden
    
    Benutzerkonto erstellen
    
    Beitrag im Thread-Baum
    1. Unicode Character Database Webservices
      
      Gunnar Bittersmann Homepage des Autors 30.12.2017 15:23
      
      html
      
      perl
      
      unicode
      
      – Informationen zu den Bewertungsregeln
      
      problematische Seite
      
      @@pl
      
      Das Decomposition_Mapping (lt. UCD) zeigt auf den Codepoint 03A9 ist das die Normalform und wenn ja warum
      
      Ja. Aus demselben Grund, warum Å U+00C5 (lateinisches großes A mit Ring) die Normalform zu Å U+212B (Ångström-Zeichen) ist.
      
      Darum gegt’s ja bei Normalisierung: dass man nicht mehrere Vorkommen desselben Dings zulässt.
      
      LLAP 🖖
      
      --
      “When UX doesn’t consider all users, shouldn’t it be known as ‘Some User Experience’ or... SUX? #a11y” —Billy Gregory
      
      Beitrag melden
      
      –
      Informationen zu den Bewertungsregeln
      
      Übersicht
      
      alle Foren
      
      SELFHTML-Forum
      
      anmelden
      
      Benutzerkonto erstellen
      
      Beitrag im Thread-Baum
      1. Unicode Character Database Webservices
        
        pl 30.12.2017 16:12
        
        html
        
        perl
        
        unicode
        
        – Informationen zu den Bewertungsregeln
        
        problematische Seite
        
        @@pl
        
        Das Decomposition_Mapping (lt. UCD) zeigt auf den Codepoint 03A9 ist das die Normalform und wenn ja warum
        
        Ja. Aus demselben Grund, warum Å U+00C5 (lateinisches großes A mit Ring) die Normalform zu Å U+212B (Ångström-Zeichen) ist.
        
        Ja, mit Perl Unicode::Normalize kann ich z.B. die Normalform NFC erzeugen:
        
        my $string = pack "U", 0x212B; my $normalized_string = normalize('NFC', $string); printf "%X", unpack "U", $normalized_string;
        
        und sehe, daß da C5 rauskommt. Meine Frage war, wie ich das anhand der Unicode Character Database nachvollziehen kann.
        
        MfG
        
        Beitrag melden
        
        –
        Informationen zu den Bewertungsregeln
        
        Übersicht
        
        alle Foren
        
        SELFHTML-Forum
        
        anmelden
        
        Benutzerkonto erstellen
        
        Beitrag im Thread-Baum
  2. Unicode Character Database Webservices
    
    pl 31.12.2017 18:45
    
    html
    
    perl
    
    unicode
    
    – Informationen zu den Bewertungsregeln
    problematische Seite
    
    hi @Gunnar Bittersmann ,
    
    Was genau sollte es da geben?
    
    Genau Sowas
    
    Es ist doch Sache des Texteditors, die Zeichen in NFC (oder einer anderen Normalisierungsform) zu speichern.
    
    Meine UnicodeDataAPI habe ich ergänzt. Jede Abfrage liefert nun auch die Normalform C. Um die anderen Normalformen, KC, D und KD kann ich das auch noch ergänzen.
    
    MfG
    Beitrag melden
    
    –
    Informationen zu den Bewertungsregeln
    
    Übersicht
    
    alle Foren
    
    SELFHTML-Forum
    
    anmelden
    
    Benutzerkonto erstellen
    
    Beitrag im Thread-Baum

SELFHTML Forum - Ergänzung zur Dokumentation Übersicht

pl: NCR und Valligator

NCR und Valligator

NCR und Valligator -- gelöst

Unicode Character Database Webservices

NCR und Valligator

NCR und Valligator

NCR und Valligator

NCR und Valligator

NCR und Valligator -- gelöst

NCR und Valligator -- gelöst

Unicode Character Database Webservices

Unicode Character Database Webservices

Unicode Character Database Webservices

Unicode Character Database Webservices

Unicode Character Database Webservices

Unicode Character Database Webservices