Hallo,
was ist der unterschied zwischen unicode und
htmtentities praktisch gesehen, also wenn es
im quelltext auftaucht, hinsichtlich lesbarkeit
und suchmaschinenverarbeitbarkeit?
Im Gegensatz du numerischen und hexadezimalen Angaben, müssen die benannten Maskierungen (wie auml, agrave, etc) in einer DTD festgelegt werden.
Problematisch wird es, wenn du XML-Dateien schreibst, denn die meisten Parser lesen die zugehörige DTD nicht ein und kennen daher die benannten Entities nicht.
Deshalb ist utf-8 als Zeichenkodierung empfohlen (dann können alle Zeichen im Reintext eingegeben werden) und nur die 5 besonderen Zeichen sollten maskiert werden: < (<), > (>), & (&), " (") und ' (eigentlich ' aber wegen HTML-Kompatibilität sollte man ' bzw. ' verwenden).
was ist besser? können alle gängigen broweser alles außer à?
Alle modernen Browser können unicode verarbeiten. Ob ein Zeichen auch angezeigt wird hängt aber davon ab, ob entsprechende Zeichensätze auf dem Betriebssystem installiert sind.
welche lösungen sind akzeptabel, sofern man n-u-r
den html quelltext bearbeiten will und keine
serveranweisungen (htaccess oder so was).
Keine bzw. die hexadeziale im Zweifelsfall.
Gruß;