Das Ganze dreht sich darum, dass mittels PHP preg_match() diverse Header von diversen Webseiten ausgelesen werden. Leider weiß man am Anfang nie, in welcher Kodierung die Seiten vorgehalten werden.
Das steht im Response-Header Content-Type.
Kann. Sollte auch, muss aber nicht.