Gregor: Charset auf UTF-8 ändern

Hallo!

ich habe mal eine Frage, ist es für eine Suchmachine eigentlich egal, welchen Charset eine Website verwendet?

ich möchte gerne von iso-8859-1 auf UTF-8 wechseln

Gregor

  1. Moin!

    ich habe mal eine Frage, ist es für eine Suchmachine eigentlich egal, welchen Charset eine Website verwendet?

    Heutzutage sicherlich, da der Anteil an nicht-englischen Webseiten doch signifikant gestiegen ist. Unicode ist von daher der einzig sinnvolle Weg, die Vielzahl existierender Zeichencodierungsarten einheitlich zu erfassen. Wichtig ist dabei nur, dass du deinen verwendeten Zeichensatz auch korrekt angibst, andernfalls kommen nicht nur Suchmaschinen ins Schleudern. Und zwar nicht nur im Meta-Tag, sondern auch seitens des Servers, denn die HTTP-Header-Angabe ist relevanter, als ein Meta-Tag.

    • Sven Rautenberg
    1. Hallo!

      das mit den Header ist mir bewusst :-)

      naja.. hoffe ich mal, dass bei der Umstellung alles klappt

      ps. hast du vielleicht noch ein Tipp, wie ich die vorhandenen Daten in der MySQL Datenbank UTF-8 kompatibel mache?

      mfg
      Gregor

      1. Moin!

        ps. hast du vielleicht noch ein Tipp, wie ich die vorhandenen Daten in der MySQL Datenbank UTF-8 kompatibel mache?

        Auslesen, konvertieren, neu reinschreiben. Sofern deine Datenbank kein besonderes Feature besitzt, welches es erlaubt, die Zeichencodierung der enthaltenen Datensätze zu definieren, bleibt dir nur übrig, global in der Tabelle, besser jedoch in der gesamten Datenbank auf Unicode zu setzen, wobei nicht zwingend UTF-8 Verwendung finden muß, es aber angesichts der Alternativen (UTF-16, UTF-32) doch die platzsparendste Methode sein dürfte.

        • Sven Rautenberg
  2. Hi,

    ich habe mal eine Frage, ist es für eine Suchmachine eigentlich egal, welchen Charset eine Website verwendet?

    schau doch einfach mal in Deine Adreßzeile, wenn Du einen Suchbegriff in Google eingibst:
    http://www.google.de/search?q=%C3%A4u%C3%9Fern ... &ie=utf-8&oe=utf-8 ...
    Zum einen ein UTF-8-codiertes ä und  ß und zum anderen ^^^^^    ^^^^^
    Oder sieh' in debn Quelltext einer Google-Seite. Zwar kein Doctype aber:
    <html><head><meta HTTP-EQUIV="content-type" CONTENT="text/html; charset=UTF-8">

    Und da fragst Du, ob UTF-8 nicht unterstützt werden könnte? ;-)

    freundliche Grüße
    Ingo

    1. Hallo!

      schau doch einfach mal in Deine Adreßzeile, wenn Du einen Suchbegriff in Google eingibst:
      http://www.google.de/search?q=%C3%A4u%C3%9Fern ... &ie=utf-8&oe=utf-8 ...

      meine Adresse sieht nur so aus, wenn ich etwas Suche
      http://www.google.de/search?hl=de&q=%22g%C3%BCltiges+HTML%22&btnG=Suche&meta=
      woher kommt dein utf-8?

      Gregor

      1. Hi,

        woher kommt dein utf-8?

        oops... wie ich gerade feststelle wohl vom Firefox, wo ich das Google-Suchfeld genutzt habe. Aber immerhin meckert Google dabei nicht und gibt seine Seiten ja auch wie gesagt selbst als UTF-8 aus.

        freundliche Grüße
        Ingo