Hi!
Wenn bspw. in einem utf-8-kodierten Suchformular der Suchbegriff "Hühner" eingegeben wurde und in der Tabelle "Hühner" steht, kannste lange suchen. Konsistenz heißt hier, gleiche Kodierung (Character Setting). Oder eine entsprechende Umwandlung, was freilich nicht immer möglich und überdies etwas CPU-intensiver ist.
Hühner haben im Gegensatz zu Hühnern in der Datenbank normalerweise nichts zu suchen, weil sie nicht nur das von dir angesprochene Suchproblem haben. Es mit einem htmlentities() zu beseitigen, ist wie den Teufel mit dem Belzebub auszutreiben. Konsistenz ist das eine und Minus × Minus ergibt auch Plus. Aber ü sind 6 Zeichen und nicht nur eins wie beim ü, das fällt einem dann auch bei anderen Stringfunktionen auf die Füße. Die Devise sollte nicht nur "Konsistenz" lauten sondern "Rohformat". Das beinhaltet Konsistenz _und_ einfache Verarbeitung.
Kodierung ist nochmal ein komplexes Thema für sich. Das habe ich absichtlich in dem Artikel ausgeklammert.
Lo!