PHP vernünftig escapen? von PsyCamari, 08.04.2013 12:00

PHP vernünftig escapen?

PsyCamari 08.04.2013 12:00

Sers,

ich versuche gerade Benutzereingaben für ein mini-selfmade Forum vernünftig zu escapen. Zum testen hab ich mal eine simple Funktion gebaut:

public function Escape($String) {  
		$String = $this->Link->real_escape_string($String);  
		$String = nl2br(htmlentities($String),ENT_QUOTES);  
		return $String;  
	}

$this->Link ist die mysqli-Instanz. Zur Erklärung: htmlentities encoded ja wirklich alle Entities, die es so gibt. real_escape_string encoded laut wiki NUL (ASCII 0), \n, \r, , ', ", and Control-Z und daher muss ich es benutzen, weil das nicht alles von htmlentities() abgedeckt wird. Jetzt habe ich folgendes Problem:

Ich gebe zum testen irgendeinen Schwachsinn ein.

EINS 
 
DREI
 <test>
FÜNF
<div></div> 
LOL
ACHT

Wenn real_escape_string drauf angewendet wird, sieht es so aus:

EINS 
\r\n 
\r\nDREI
\r\n <test>
\r\nFÜNF
\r\n<div></div> 
\r\nLOL
\r\nACHT

Und wenn htmlentities und nl2br drauf angewendet wird sieht es so aus:

EINS \r\n \r\nDREI \r\n <test> \r\nFÜNF \r\n<div></div> \r\nLOL \r\nACHT

Jetzt frage ich mich:

1. Wieso werden nicht alle Zeichen umgewandelt? zb. bleibt anstatt umgewandelt zu werden.
2. Die Sachen die encodet wurden zb. </div> sind doch richtig encodet, sie müssten mir doch im Forum als <div> angezeigt werden, oder? Tun sie aber nicht. Sie stehen dort genau so wie hier.

Was mache ich falsch?

Beitrag melden

– Informationen zu den Bewertungsregeln

PHP vernünftig escapen?
Jörg Reinholz 08.04.2013 12:22

php
– Informationen zu den Bewertungsregeln
Wenn real_escape_string drauf angewendet wird, sieht es so aus:

EINS 
\r\n 

...

Und wenn htmlentities und nl2br drauf angewendet wird sieht es so aus:

EINS \r\n \r\nDREI \r\n

...
Jetzt frage ich mich:
1. Wieso werden nicht alle Zeichen umgewandelt? zb. bleibt anstatt umgewandelt zu werden.
Das ist einfach: Du wendest erst real_escape_string() an. Dann htmlentities(). Hierbei werden die umgewandelt. Das findest Du auch in der Ausgabe: . Doch dann kommt nl2br und fügt neue Umbrüche ein. Du hast nichts falsch gemacht.
1. Die Sachen die encodet wurden zb. </div> sind doch richtig encodet, sie müssten mir doch im Forum als <div> angezeigt werden, oder?
Nur wenn die Anzeige als HTML (und also nicht als HTML-Quell-Text) erfolgt erfolgt und nur wenn der String nicht nochmals durch htmlspecialchars gejagt wird. Du hast den Text sozusagen falsch betrachtet, aber das liegt außerhalb der für uns sichtbaren Programmteile.

Jörg Reinholz
Beitrag melden

–
Informationen zu den Bewertungsregeln
PHP vernünftig escapen?
Der Martin 08.04.2013 12:24

php
– Informationen zu den Bewertungsregeln
Hallo,

ich versuche gerade Benutzereingaben für ein mini-selfmade Forum vernünftig zu escapen.

für welchen konkreten Zweck? Ein Escaping, eine Maskierung oder Codierung verwendet man normalerweise, wenn man Daten von einem Kontext in einen anderen überführen will, z.B. PHP-String zu mySQL. Einfach "auf Verdacht" irgendwas escapen ist aber nicht sinnvoll, manchmal sogar nachteilig.
public function Escape($String) {
```
 $String = $this->Link->real_escape_string($String); 
 $String = nl2br(htmlentities($String),ENT_QUOTES); 
 return $String; 
```
}
```
 
Hier kombinierst du schon zwei Dinge, die sich widersprechen. Einerseits real\_escape\_string(), das einen String für den SQL-Kontext aufbereitet, und andererseits nl2br(), das eindeutig auf die Übergabe in HTML zugeschnitten ist. 
 
Daher nochmal die Frage: Was genau willst du an dieser Stelle erreichen? 
 

> EINS 
> 
> DREI 
> <test> 
> FÜNF 
> <div></div> 
> LOL 
> ACHT 
> 
> Wenn real\_escape\_string drauf angewendet wird, sieht es so aus: 
> 
> EINS 
> \r\n 
> \r\nDREI 
> \r\n <test> 
> \r\nFÜNF 
> \r\n<div></div> 
> \r\nLOL 
> \r\nACHT 
 
Die Darstellung sieht ungewohnt aus, weil man \r\n normalerweise am Ende der Zeile notiert, aber das ist wirklich nur eine Frage der Darstellung. 
 

> Und wenn htmlentities und nl2br drauf angewendet wird sieht es so aus: 
> 
> EINS&lt;br&gt; \r\n&lt;br&gt;&lt;br&gt; \r\nDREI \r\n&lt;p&gt;&lt;br&gt;&lt;br /&gt;&lt;test&gt; \r\nF&Uuml;NF \r\n&lt;div&gt;&lt;/div&gt;&lt;span&gt;&lt;br&gt; \r\nLOL \r\nACHT 
 
Ja. Eine furchtbare Zeichenwurst. 
 

> 1. Wieso werden nicht alle Zeichen umgewandelt? zb. bleibt anstatt umgewandelt zu werden. 
 
Doch, es wird umgewandelt. \r\n wird von htmlentities() zu &lt;br /&gt;\r\n gewandelt, und von nl2br() schließlich zu &lt;br /&gt; \r\n. Es ist ein Trugschluss, dass nl2br() Zeilenumbrüche (\r) in \_umwandelt\_, stattdessen fügt es nur ein hinzu und lässt den eigentlichen Zeilenumbruch noch stehen. Auf diese Weise entsteht auch im HTML-Quellcode ein Zeilenumbruch nach dem . 
 

> 2. Die Sachen die encodet wurden zb. &lt;/div&gt; sind doch richtig encodet, sie müssten mir doch im Forum als <div> angezeigt werden, oder? Tun sie aber nicht. Sie stehen dort genau so wie hier. 
 
Dann machst du noch weitere Fehler, die aus dem gezeigten Code nicht hervorgehen. Beispielsweise einen weiteren Aufruf von htmlentities(), der die & noch zu &amp; konvertiert. 
 

> Was mache ich falsch? 
 
Wo fange ich an ...? 
 
Ciao, 
 Martin 

-- 
Lieber arm dran als Arm ab. 
Selfcode: fo:) ch:{ rl:| br:< n4:( ie:| mo:| va:) de:] zu:) fl:{ ss:) ls:µ js:(
```
Beitrag melden

–
Informationen zu den Bewertungsregeln
1. PHP vernünftig escapen?
 
 PsyCamari 08.04.2013 12:31
 
 php
 – Informationen zu den Bewertungsregeln
 für welchen konkreten Zweck? Ein Escaping, eine Maskierung oder Codierung verwendet man normalerweise, wenn man Daten von einem Kontext in einen anderen überführen will, z.B. PHP-String zu mySQL. Einfach "auf Verdacht" irgendwas escapen ist aber nicht sinnvoll, manchmal sogar nachteilig.
 
 Nunja, Sinn und Zweck ist es, dass man in diesem selfmade Forum etwas eingeben soll. Und damit da kein Murks eingegeben werden kann (SQLInjection etc.), hat man mir beigebracht muss ich das escapen. Und genau das tu ich doch.
 public function Escape($String) {
 $String = $this->Link->real_escape_string($String); $String = nl2br(htmlentities($String),ENT_QUOTES); return $String; }
```
> 
> Hier kombinierst du schon zwei Dinge, die sich widersprechen. Einerseits real\_escape\_string(), das einen String für den SQL-Kontext aufbereitet, und andererseits nl2br(), das eindeutig auf die Übergabe in HTML zugeschnitten ist. 
 
Gut, das habe ich jetzt verstanden. Also muss ich es so machen: 1. User gibt etwas ein, 2. real\_escape\_string(), damit der Kram ohne Probleme in die Datenbank geschrieben wird UND dabei keine Injection benutzt werden kann, 3. beim Auslesen aus der DB erst htmlentities & nl2br anwenden, da es ja jetzt erst an die HTML Anzeige geht und dementsprechend jetzt erst das ganze angezeigt werden soll. Richtig so? 
 

> > 1. Wieso werden nicht alle Zeichen umgewandelt? zb. bleibt anstatt umgewandelt zu werden. 
> 
> Doch, es wird umgewandelt. \r\n wird von htmlentities() zu &lt;br /&gt;\r\n gewandelt, und von nl2br() schließlich zu &lt;br /&gt; \r\n. Es ist ein Trugschluss, dass nl2br() Zeilenumbrüche (\r) in \_umwandelt\_, stattdessen fügt es nur ein hinzu und lässt den eigentlichen Zeilenumbruch noch stehen. Auf diese Weise entsteht auch im HTML-Quellcode ein Zeilenumbruch nach dem . 
 
Danke, hatte ich nicht gemerkt. 
 

> > 2. Die Sachen die encodet wurden zb. &lt;/div&gt; sind doch richtig encodet, sie müssten mir doch im Forum als <div> angezeigt werden, oder? Tun sie aber nicht. Sie stehen dort genau so wie hier. 
> 
> Dann machst du noch weitere Fehler, die aus dem gezeigten Code nicht hervorgehen. Beispielsweise einen weiteren Aufruf von htmlentities(), der die & noch zu &amp; konvertiert. 
 
Ja, das wars tatsächlich. Danke.
```
 Beitrag melden
 
 –
 Informationen zu den Bewertungsregeln
 Übersicht
 
 alle Foren
 
 SELFHTML-Forum
 
 anmelden
 
 Benutzerkonto erstellen
 
 Beitrag im Thread-Baum
 1. PHP vernünftig escapen?
 
 Der Martin 08.04.2013 12:49
 
 php
 
 – Informationen zu den Bewertungsregeln
 Hallo,
 
 für welchen konkreten Zweck? Ein Escaping, eine Maskierung oder Codierung verwendet man normalerweise, wenn man Daten von einem Kontext in einen anderen überführen will, z.B. PHP-String zu mySQL. Einfach "auf Verdacht" irgendwas escapen ist aber nicht sinnvoll, manchmal sogar nachteilig.
 Nunja, Sinn und Zweck ist es, dass man in diesem selfmade Forum etwas eingeben soll.
 
 das hatte ich schon verstanden; ich meinte die Frage konkreter: Welcher Zweck (welcher Zielkontext) soll es an genau dieser Stelle sein? Aber anscheinend hast du das trotzdem so verstanden, wie ich es meinte.
 
 Gut, das habe ich jetzt verstanden. Also muss ich es so machen: 1. User gibt etwas ein, 2. real_escape_string(), damit der Kram ohne Probleme in die Datenbank geschrieben wird UND dabei keine Injection benutzt werden kann, 3. beim Auslesen aus der DB erst htmlentities & nl2br anwenden, da es ja jetzt erst an die HTML Anzeige geht und dementsprechend jetzt erst das ganze angezeigt werden soll. Richtig so?
 
 Absolut richtig. Ich würde noch 'ne kleine Abweichung vorschlagen: Nimm htmlspecialchars() anstatt htmlentities(). Denn wie du selbst schon festgestellt hast, wandelt htmlentities() so ziemlich alles um, was als Entity-Referenz geschrieben werden kann. Das ist aber völlig unnötig - man möchte ja nachher nicht zahllose ä und " und ähnlichen Ramsch im HTML-Quellcode haben, sondern lesbare Zeichen. Dagegen ersetzt htmlspecialchars() nur die Zeichen, bei denen das nötig ist, weil sie in HTML eine besondere Bedeutung haben. Das sind AFAIR nur '<' (wird zu <), '>' (wird zu >) und '&' (wird zu &).
 
 Es ist ein Trugschluss, dass nl2br() Zeilenumbrüche (\r) in _umwandelt_, stattdessen fügt es nur ein hinzu und lässt den eigentlichen Zeilenumbruch noch stehen. Auf diese Weise entsteht auch im HTML-Quellcode ein Zeilenumbruch nach dem .
 Danke, hatte ich nicht gemerkt.
 
 Ich hatte früher auch gedacht, nl2br() würde \r oder \r\n durch ersetzen. Der Name der Funktion suggeriert das ja auch irgendwie.
 
 Dann machst du noch weitere Fehler, die aus dem gezeigten Code nicht hervorgehen. Beispielsweise einen weiteren Aufruf von htmlentities(), der die & noch zu & konvertiert.
 Ja, das wars tatsächlich. Danke.
 
 Okay, dann funktioniert die Glaskugel manchmal sogar, wenn sie trüb und fleckig ist. ;-)
 
 Ciao,
 Martin
 
 --
 Vater Staat bringt uns noch alle unter Mutter Erde.
 Selfcode: fo:) ch:{ rl:| br:< n4:( ie:| mo:| va:) de:] zu:) fl:{ ss:) ls:µ js:(
 Beitrag melden
 
 –
 Informationen zu den Bewertungsregeln
 
 Übersicht
 
 alle Foren
 
 SELFHTML-Forum
 
 anmelden
 
 Benutzerkonto erstellen
 
 Beitrag im Thread-Baum
 1. PHP vernünftig escapen?
 
 Gunnar Bittersmann Homepage des Autors 09.04.2013 00:58
 
 php
 
 – Informationen zu den Bewertungsregeln
 
 @@Der Martin:
 
 nuqneH
 
 Dagegen ersetzt htmlspecialchars() nur die Zeichen, bei denen das nötig ist, weil sie in HTML eine besondere Bedeutung haben. Das sind AFAIR nur '<' (wird zu <), '>' (wird zu >) und '&' (wird zu &).
 
 Und ggfs. einfache und doppelte Anführungszeichen*. [PHP]
 
 Qapla'
 
 * die Programmcode-Anführungszeichen, nicht Text-Anführungszeichen
 
 --
 „Talente finden Lösungen, Genies entdecken Probleme.“ (Hans Krailsheimer)
 
 Beitrag melden
 
 –
 Informationen zu den Bewertungsregeln
 
 Übersicht
 
 alle Foren
 
 SELFHTML-Forum
 
 anmelden
 
 Benutzerkonto erstellen
 
 Beitrag im Thread-Baum
PHP vernünftig escapen?
dedlfix 08.04.2013 12:48

php
– Informationen zu den Bewertungsregeln
Tach!

ich versuche gerade Benutzereingaben für ein mini-selfmade Forum vernünftig zu escapen.

Das ist nicht der richtige Ansatz. Nicht die Benutzereingaben sind das Problem, sondern dass Daten, egal welcher Herkunft, stets dem Ausgabekontext gerecht notiert/maskiert werden müssen.

Vergiss deine Funktion und betrachte in jeder Situation lediglich nur das jeweilige Ziel.
- Strings im MySQL-Statement: Escaping für MySQL (mysqli_real_escape_string())
- Zahlen im MySQL-Statement: innerhalb von Anführungszeichen wie Strings; außerhalb mit intval() o.ä. die Zahl sicherstellen
- HTML: htmlspecialchars() (htmlentities() macht viel zu viel)
- URL: ...
- Javascript: ...
- ...
Siehe Kontextwechsel-Artikel.

dedlfix.
Beitrag melden

–
Informationen zu den Bewertungsregeln

SELFHTML Forum - Ergänzung zur Dokumentation Übersicht

PsyCamari: PHP vernünftig escapen?