RFZ: HTML Entities richtig verarbeiten

Beitrag lesen

Moin,
ich steh vor einem kleinen Denkproblem und möchte gern wissen, ob ich es richtig gelöst hab, bevor ich es auf einige tausend Datensätze anwende ;)

Ich habe Quelltexte in meiner Datenbank, die HTML Entities sowie HTML Tag enthaltn.
Um die Datenbank besser durchsuchen zu können, möchte ich HTML Entities wie ö in ö umwandeln. Würde ich aber auch & oder </> mit umwandeln würde es die Quelltexte verfälschen, aus "&" welches normal als "&" angezeigt werden würde, würde ja dann "&" werden, welches als "&" angezeigt wird.
Selbiges bei </> welches im Quelltext angezeigte HTML-Tags plötzlich in echte HTML-Tags umwandeln würde.

Daher habe ich beschlossen alle HTML-Entities bis auf &, > und < umzuwandeln.

Hab ich dabei irgendwo einen Denkfehler?

Ach ja, dass Sachen wie <img ... alt="&quot;Zitat&quot;"> betroffen sein könnten, will ich mal ignorieren, da sowas in den Quelltexten eigentlich nicht vorkommt, es sind nur simpel formatierte Texte...
Aber würde es denn auch dafür eine einfache Lösung geben?

greetz RFZ