Umlaute ändern sich zurück!??
hurrah
- html
0 suit0 Der Martin0 suit0 dedlfix0 suit
0 Der Martin
0 dedlfix0 Gunnar Bittersmann0 hurrah
0 Opa Horst0 suit
Hallo!
Ich habe ein - wie ich finde - verrücktes Problem. Ich habe eine utf-8 kodierte Seite, auf der ich alle Umlaute geändert habe - ä=ä etc.
Wunderschön, alles ist gut. Dachte ich. Beim nächsten Öffnen der Datei waren die Umlaute wieder ä's, ü's usw. (Bin ich verrückt? Das habe ich doch eben gemacht. Na gut, mach ich's nochmal.) Toll, beim wieder nächsten Öffnen das gleiche Spiel. Wobei ich noch verrückter finde, dass er dann durchaus nicht ALLE Umlaute wieder zurückverändert.
Welchen verflixten Fehler mache ich???
Vielen Dank für die Kopferhellung im voraus,
Hurrah!
Ich habe ein - wie ich finde - verrücktes Problem. Ich habe eine utf-8 kodierte Seite, auf der ich alle Umlaute geändert habe - ä=ä etc.
Zu welchem Zweck? Du hast scheinbar das verrückte Problem, an "entitus brachialis" zu leiden :)
Welchen verflixten Fehler mache ich???
Vielleicht ist dein System schlauer als du, und weiss solche dinge zu verhindern, wenn du explitz UTF-8 verwendest und löst automatisch unsinnige Entities auf.
Alternativ: Schreibschutz auf dem dem File.
Alternativ: PEBKAC :p
Hi,
Ich habe ein - wie ich finde - verrücktes Problem. Ich habe eine utf-8 kodierte Seite, auf der ich alle Umlaute geändert habe - ä=ä etc.
wozu tust du sowas? Normalerweise ist man bestrebt, die Zeichen möglichst im Klartext zu schreiben. Und das ist dank UTF-8 mit *allen* nur erdenklichen Zeichen möglich.
Wunderschön, alles ist gut. Dachte ich. Beim nächsten Öffnen der Datei waren die Umlaute wieder ä's, ü's usw. (Bin ich verrückt? Das habe ich doch eben gemacht. Na gut, mach ich's nochmal.) Toll, beim wieder nächsten Öffnen das gleiche Spiel. Wobei ich noch verrückter finde, dass er dann durchaus nicht ALLE Umlaute wieder zurückverändert.
Mysteriös. Ein mitdenkender Editor?
Welchen verflixten Fehler mache ich???
Zunächst nur, dass du unnötigerweise deinen Quellcode verstümmelst.
Ansonsten ist die Frage: Was für einen Editor verwendest du? Ist der so schlau, von sich aus festzustellen, dass die Entity-Notation überflüssig ist, und korrigiert das von selbst?
Ciao,
Martin
Und das ist dank UTF-8 mit *allen* nur erdenklichen Zeichen möglich.
Übertreib's nicht :)
Hi!
Und das ist dank UTF-8 mit *allen* nur erdenklichen Zeichen möglich.
Übertreib's nicht :)
Möglich ist es schon, es sind nur noch nicht alle erdenklichen Zeichen in Unicode aufgenommen worden.
Lo!
Möglich ist es schon, es sind nur noch nicht alle erdenklichen Zeichen in Unicode aufgenommen worden.
Es gibt weit mehr "erdenkliche" Zeichen als der Unicode-Bereich umfassen können wird :p
Aber ja, so war das gemeint :)
Hallo,
Und das ist dank UTF-8 mit *allen* nur erdenklichen Zeichen möglich.
Übertreib's nicht :)
doch doch, das meinte ich schon so: Unicode enthält viel, viel mehr Zeichen als ich mir je ausdenken könnte! Selbst wenn wir die regulären Schriftzeichen verschiedener Sprachfamilien (Kyrillisch, griechisch, hebräisch, japanisch, Thai, klingonisch, ...) mal ausklammern, gibt es beispielsweise bei den mathematisch-wissenschaftlichen Zeichen viele, die ich noch nirgends außer in den Unicode-Tabellen gesehen habe.
So long,
Martin
doch doch, das meinte ich schon so: Unicode enthält viel, viel mehr Zeichen als ich mir je ausdenken könnte!
Ich helfe deinem Gedächtnis auf die Sprünge: altägyptischen Hieroglyphen :p
@@Der Martin:
nuqneH
Unicode enthält viel, viel mehr Zeichen als ich mir je ausdenken könnte! Selbst wenn wir die regulären Schriftzeichen verschiedener Sprachfamilien (Kyrillisch, griechisch, hebräisch, japanisch, Thai, klingonisch, ...) mal ausklammern
Nein, pIqaD [KLI, Wikipedia] gibt’s nicht in Unicode.
Qapla'
Hallo,
Unicode enthält viel, viel mehr Zeichen als ich mir je ausdenken könnte! Selbst wenn wir die regulären Schriftzeichen verschiedener Sprachfamilien (Kyrillisch, griechisch, hebräisch, japanisch, Thai, klingonisch, ...) mal ausklammern
Nein, pIqaD [KLI, Wikipedia] gibt’s nicht in Unicode.
oh. Danke. DAS wundert mich jetzt aber wirklich.
Ciao,
Martin
Hi,
Nein, pIqaD [KLI, Wikipedia] gibt’s nicht in Unicode.
oh. Danke. DAS wundert mich jetzt aber wirklich.
Würde ich sonst die lateinische Transkription verwenden?
Who knows? - Hierzulande wird ja in der Regel auch für russische, griechische oder arabische Namen die lateinische Transkription verwendet, obwohl es durchaus möglich wäre, sie in der Originalschreibweise wiederzugeben.
Ciao,
Martin
Sain baina uu!
oh. Danke. DAS wundert mich jetzt aber wirklich.
Mich nicht. Das hat das KLI selbst verbockt, indem es die (noch dazu ausgesprochen eNtsetZlIcHe) uMsCHrIft zur offiziellen klingonischen Schrift erklärt hat, anstatt zu einem Notbehelf, den man verwendet, wenn die richtige nicht zur Verfügung steht. Damit gibt es de facto keine nennenswerte Community mehr, die die eigentliche Schrift offiziell verwendet, und damit erfüllt sie eindeutig nicht mehr die Kriterien für die Aufnahme. Deswegen wurde der Antrag folgerichtig abgelehnt.
Leider ist dadurch der Präzedenzfall für erfundene Sci-Fi- und Fantasy-Scripte entfallen, und deswegen dauert die Diskussion bei Tengwar und Cirth jetzt so lange (dazu kommt, daß Tengwar technische Fragen aufwirft, die noch nicht vollständig behandelt sind). Wenn Tengwar und Cirth angenommen werden, hat pIqaD aber vielleicht auch noch mal eine Chance.
pIqaD kann man trotzdem halbwegs sicher verwenden, weil es eine Art Quasi-Standard gibt: Es hat sich eingebürgert, die letzten Codepoints der Private Use Area zu verwenden, und die Buchstaben in der Reihenfolge zu codieren, wie sie für Unicode vorgeschlagen waren.
Ich will sie auch irgendwann in Quivira einbauen, aber ein paar andere Blocks haben erstmal höhere Priorität.
Viele Grüße vom Længlich
Hi!
Ich habe eine utf-8 kodierte Seite, auf der ich alle Umlaute geändert habe - ä=ä etc.
[...] Bin ich verrückt?
Das kann ich nicht verneinen. Warum willst du die Umlaute unbedingt als Entity/NCR notieren, wo du doch mit UTF-8 die Möglichkeit hast, quasi alle Zeichen dieser Welt direkt zu notieren?
Toll, beim wieder nächsten Öffnen das gleiche Spiel. Wobei ich noch verrückter finde, dass er dann durchaus nicht ALLE Umlaute wieder zurückverändert.
Welchen verflixten Fehler mache ich???
Du beschreibst nicht nachvollziehbar. Beispielsweise "Öffnen" - wo? Und wer ist "er"?
Lo!
Hi!
Ich habe eine utf-8 kodierte Seite, auf der ich alle Umlaute geändert habe - ä=ä etc.
[...] Bin ich verrückt?Das kann ich nicht verneinen. Warum willst du die Umlaute unbedingt als Entity/NCR notieren, wo du doch mit UTF-8 die Möglichkeit hast, quasi alle Zeichen dieser Welt direkt zu notieren?
Weil sie auf der Site online falsch dargestellt wurden und ich keine andere Möglichkeit sah.
Toll, beim wieder nächsten Öffnen das gleiche Spiel. Wobei ich noch verrückter finde, dass er dann durchaus nicht ALLE Umlaute wieder zurückverändert.
Welchen verflixten Fehler mache ich???Du beschreibst nicht nachvollziehbar. Beispielsweise "Öffnen" - wo? Und wer ist "er"?
Öffnen im HTML-Editor. Er = der Editor.
Lo!
Öffnen im HTML-Editor. Er = der Editor.
Um es zu präzisieren: welcher?
Öffnen im HTML-Editor. Er = der Editor.
Um es zu präzisieren: welcher?
GoLive
Mahlzeit hurrah,
Öffnen im HTML-Editor. Er = der Editor.
Um es zu präzisieren: welcher?
GoLive
Kleiner Tipp: wenn Du so weitermachst (alle Informationen einzeln aus der Nase ziehen lassen), dann verliert irgendwann auch der letzte potentielle Helfer die Lust, in diesem Thread weiterzulesen und mitzudenken.
Wenn Du brauchbare Hilfe erhalten möchtest, ist es Deine Pflicht, zuerst eine brauchbare Problembeschreibung zu liefern.
Dazu gehört insbesondere, sich *VORHER* über den jeweiligen Themenkomplex (in Deinem Fall "Zeichencodierung") schlau zu machen und es gehört insbesondere *NICHT* dazu, den Lesern Informationen vorzuenthalten.
MfG,
EKKi
Hi!
Öffnen im HTML-Editor. Er = der Editor.
Um es zu präzisieren: welcher?
GoLive
Das da liest sich so, als ob GoLive weiß, was es da tut. Du solltest deine Anstrengungen nicht auf Entitys richten sondern darauf, dass die UTF-8-Zeichen einerseits richtig kodiert werden (macht der GoLive vermutlich so) und es andererseits auch richtig deklariert wird. Meta-Element und HTTP-Header. Letztere sind nachprüfbar mit beispielsweise der livehttpheaders-Extension für den Firefox.
Lo!
Hi!
Warum willst du die Umlaute unbedingt als Entity/NCR notieren, wo du doch mit UTF-8 die Möglichkeit hast, quasi alle Zeichen dieser Welt direkt zu notieren?
Weil sie auf der Site online falsch dargestellt wurden und ich keine andere Möglichkeit sah.
Dann hast du sie vermutlich gar nicht nach UTF-8 kodiert oder dein Server schickt im HTTP-Header eine anderslautende Angabe mit, die Vorrang vor der im Meta-Element hat.
Öffnen im HTML-Editor. Er = der Editor.
Welcher Editor? Und hast du dem auch gesagt, dass er UTF-8 beim Speichern verwenden soll?
Lo!
Uff.
Okay. Habe eben noch mal nachgesehen und folgendes festgestellt.
Die NICHT von mir erstellte Website hat im Head doch - hahahah, tschuldigung - charset=iso-8859-1 stehen. Na toll. Wenn ich sie in GoLive öffne, fragt mich der Editor, ob es es in utf-8 öffnen will. Ja, wollte ich. Ich Trottel. Ich bin automatisch davon ausgegangen, dass die Site in utf-8 programmiert ist. Das wird wohl das Problem gewesen sein. Oder????
Also stelle ich nun alle Seiten auf utf um... ??
BTW - nicht jeder ist ein Crack! Ich bin noch ein ziemlicher Anfänger, wie sicherlich einige, die hier Hilfe suchen.
DANKE!!!!!
Hi!
Also stelle ich nun alle Seiten auf utf um... ??
Das ist eine gute Idee.
BTW - nicht jeder ist ein Crack! Ich bin noch ein ziemlicher Anfänger, wie sicherlich einige, die hier Hilfe suchen.
Das macht doch nichts, Anfänger war jeder mal und dass jemand was nicht weiß ist doch bei jedem Fragenden der Fall, also nichts neues hier im Forum. Aber du musst auch mal die andere Seite berücksichtigen. Wir™ wissen zwar viel, aber wir können nicht hellsehen und sehen dein Problem nicht direkt (besonders wenn es nicht verlinkt ist) sondern nur aus deiner Beschreibung. Und die muss so gut wie möglich sein, damit du eine so gut wie mögliche Antwort bekommen kannst und man nicht zu viel rückfragen muss. Andererseits sind Rückfragen ganz normal, denn als Fragender weiß man oft nicht, worauf es konkret ankommt. Lass dich nicht abschrecken, der Ton hier ist meist sachlich bis rauh, aber die Antworten vorwiegend sachlich gut.
Lo!
Noch mal Hallooo!
Absolut! Ich verstehe das natürlich. Ich dachte wirklich, ich hätte die relevanten Infos alle aufgezählt. Ich gebe mir wirklich MÜHE, das nächste Mal noch mehr vorher abzuchecken und noch mehr Infos zu geben. Ehrlich gesagt, dachte ich, es nervt eher, wenn ich zuviel schreibe. Aber auch hier lerne ich gern!
Noch mehr Danke, ich stelle jetzt um auf utf! ;-)
Hi!
Absolut! Ich verstehe das natürlich. Ich dachte wirklich, ich hätte die relevanten Infos alle aufgezählt. Ich gebe mir wirklich MÜHE, das nächste Mal noch mehr vorher abzuchecken und noch mehr Infos zu geben.
Es geht nicht um Quantität sondern um Qualität. Überleg dir lieber (in deinem und unserem Interesse), was wirklich wichtig ist und ob das was du so schreibst verständlich und nachvollziehbar ist. Manchmal hilft es auch, sich jemanden vorzustellen, der von der Materie wenig Ahnung hat und dem man das Problem so beschreiben muss, dass er es versteht. Probleme zu beschreiben ist eine Fähigkeit, die nicht jedem von Haus aus gegeben ist, aber das kann man ja auch lernen. Und das ist uns das Wichtigste, dass du Lernwillen zeigst. Dann freuen wir uns und versorgen dich mit den notwendigen Informationen zur Lösungsfindung.
Lo!
Mahlzeit hurrah,
Weil sie auf der Site online falsch dargestellt wurden und ich keine andere Möglichkeit sah.
Was bedeutet dabei "falsch"? *Was genau* wurde dargestellt? In welchem Browser? Steht im HTML-Dokument eine entsprechende <http://de.selfhtml.org/html/kopfdaten/meta.htm#zeichenkodierung@title=<meta>-Angabe zur Zeichencodierung>? Liefert der Webserver die korrekten Informationen?
MfG,
EKKi
@@hurrah:
nuqneH
Ich habe ein - wie ich finde - verrücktes Problem. Ich habe eine utf-8 kodierte Seite, auf der ich alle Umlaute geändert habe - ä=ä etc.
Du hast hoffentlich das Original mit den richtigen Zeichen noch. Dieses solltest du verwenden. [ESCAPES]
Welchen verflixten Fehler mache ich???
Lies [WHAT-IS-ENCODING] und [CHANGING-ENCODING]
Evtl. auch [HTACCESS-CHARSET] und [UTF8-BOM]
Qapla'
PS: 5 auf einen Streich! ;-)
DANKE für die hilfreiche Lektüre!!!
Werde ich gleich mal alles genau durchforsten und nein, natüüürlich habe ich die Originaldateien nicht mehr. Selbst schuld... :-(
Hallo!
Ich habe ein - wie ich finde - verrücktes Problem. Ich habe eine utf-8 kodierte Seite, auf der ich alle Umlaute geändert habe - ä=ä etc.
»»
Ähnliches trieb mich schon zur Verzweiflung. Um den Zeichenraum oberhalb
der #128 zu kontrollieren verfasste ich folgende PHP-Funktion:
function lesen($wort)
{
$soll=Array(
'€','','‚','ƒ','„','…','†','‡','ˆ','‰','Š',
'‹','Œ','','Ž','','','‘','’','“','”','•',
'–','—','˜','™','š','›','œ','','ž','Ÿ',' ',
'¡','¢','£','¤','¥','¦','§','¨','©','ª','«',
'¬','­','®','¯','°','±','²','³','´','µ','¶',
'·','¸','¹','º','»','¼','½','¾','¿','À',
'Á','Â','Ã','Ä','Å','Æ','Ç','È','É','Ê',
'Ë','Ì','Í','Î','Ï','Ð','Ñ','Ò','Ó','Ô',
'Õ','Ö','×','Ø','Ù','Ú','Û','Ü','Ý','Þ',
'ß','à','á','â','ã','ä','å','æ','ç','è',
'é','ê','ë','ì','í','î','ï','ð','ñ','ò',
'ó','ô','õ','ö','÷','ø','ù','ú','û','ü',
'ý','þ','ÿ');
$erg = "$wort";
$serch = array("amp;",chr(92)."r",chr(92)."n",chr(10),chr(13));
$erg = str_replace ($serch,"",$erg);
$erg = str_replace (" "," ",$erg);
$erg = str_replace (" "," ",$erg);
$erg = str_replace (" "," ",$erg);
$erg = str_replace (" "," ",$erg);
$erx = "";
for($i=0;$i<strlen($erg);$i++){
$x=ord($erg[$i]);
if($erg[$i]=='€')$erx.='€';
if(($x>31)and($x<128))$erx.=$erg[$i];
if($x>127)$erx.=$soll[$x-128];}
return($erx);
}
Und mit dem PHP-Aufruf: ~~~php
$neuerText = lesen(htmlentities($alterText));
Komme ich auf die sichere Seite.
In den Zeilen:~~~php
$serch = array("amp;",chr(92)."r",chr(92)."n",chr(10),chr(13));
$erg = str_replace ($serch,"",$erg);
$erg = str_replace (" "," ",$erg);
$erg = str_replace (" "," ",$erg);
$erg = str_replace (" "," ",$erg);
$erg = str_replace (" "," ",$erg);
werden [amp;], [TAB], [CR], [LF] und Leerzeichenketten vernichtet. Das muß man für sich anpassen.
Apropos htmlentities()
oder was ich sonst nicht verstanden habe, hat ü
in:&uuml;
verwandelt!
Und hier das analoge für Formularfelder in javascript:
function umlaute(wort)
{
soll=new Array(
'€','','‚','ƒ','„','…','†','‡','ˆ','‰','Š',
'‹','Œ','','Ž','','','‘','’','“','”','•',
'–','—','˜','™','š','›','œ','','ž','Ÿ',' ',
'¡','¢','£','¤','¥','¦','§','¨','©','ª','«',
'¬','­','®','¯','°','±','²','³','´','µ','¶',
'·','¸','¹','º','»','¼','½','¾','¿','À',
'Á','Â','Ã','Ä','Å','Æ','Ç','È','É','Ê',
'Ë','Ì','Í','Î','Ï','Ð','Ñ','Ò','Ó','Ô',
'Õ','Ö','×','Ø','Ù','Ú','Û','Ü','Ý','Þ',
'ß','à','á','â','ã','ä','å','æ','ç','è',
'é','ê','ë','ì','í','î','ï','ð','ñ','ò',
'ó','ô','õ','ö','÷','ø','ù','ú','û','ü',
'ý','þ','ÿ');
var erg = "";
for(var i = 0; i < wort.length; i++)
{
z = true;
ch= wort.charAt(i);
x = wort.charCodeAt(i);
xy="&#"+x+";";
if((x>31)&&(x<128))erg+=ch;
else if((x>127)&&(x<256))erg +=soll[x-128];
else erg+=xy;
}
return(erg);
}
P.S. auf meiner Homepage:blitzauge.com
gibt es eine, noch versteckte Hilfe unter:Fremde Zeichensätze um nach der Beschreibung dafür zu suchen benutzt die Volltextsuche nach "fremde zeichen" auf blitzauge.com
hoffetlich klappt's
Opa Horst
Ähnliches trieb mich schon zur Verzweiflung. Um den Zeichenraum oberhalb
der #128 zu kontrollieren verfasste ich folgende PHP-Funktion:
html_entity_decode() wäre doch um so vieles einfacher :p