Buddelflinktier: merkwürdige Zeichen zwischen HTTP-Header und Content

Beitrag lesen

Hi

Hi,

wenn ich mittels Telnet unter Verwendung von HTTP zB www.heise.de aufrufe, erhalte ich die Raw-Ausgabe.

auf welche Weise - exakt! - erfolgt dieser Aufruf?

telnet www.heise.de 80
Trying 193.99.144.85...
Connected to www.heise.de.
Escape character is '^]'.
GET / HTTP/1.1
Host: www.heise.de

HTTP/1.1 200 OK
Date: Fri, 06 Jan 2012 15:29:37 GMT
Server: Apache
Expires: Fri, 06 Jan 2012 16:04:37 GMT
Etag: W/"87e2e7af1764565f4248758f728e703e"
Cache-control: max-age=300
Vary: Accept-Encoding,User-Agent
X-Powered-By: Perl http://www.perl.org/
Connection: close
Transfer-Encoding: chunked
Content-Type: text/html; charset=utf-8

11dc0
<!DOCTYPE ...

Auf mehreren Linux-Servern (Debian) erhalte ich identische Ergebnisse mit beschriebenem Problem.

Was bedeutet dabei "11f42" und am Ende "0"?

Zunächst einmal, dass Deine Ausgabe um "11f42" und "0" angereichert wird. Ich beispielsweise habe das nicht.

Erscheint auch nur, wenn der exakte Response betrachtet wird. Gängige Browser "optimieren" das raus. Das Problem betrifft auch nicht alle Websites. Dieser Sniffer http://www.rexswain.com/httpview.html reproduziert das Problem.

Ich entwickle derzeit ein Tool zum Abholen von Websites und habe nun das Problem wo das Dokument anfängt und aufhört.

Hier wären Details bzw. Programmcode sinnvoll.

C++, ist aber eigenlich nicht relevant. Dort ist mir das erst aufgefallen, dachte erst es liegt an meinem Quellcode, aber den Fehler konnte ich anderweitig reproduzieren.

Cheatah

Andreas