Hi,
ich könnte mir vorstellen, dass das Dokument welches du einzulesen versuchst invalides HTML beinhaltet und der Parser damit ein Problem hat.
Wenn " in einem Attributwert vorkommen sollten diese nämlich auch escaped sein.
also nicht so: <abbr title=""title"">foo</abbr>
sondern so: <abbr title=""title"">foo</abbr>
Als Beispiel-URL sollte man übrigens www.example.com oder www.example.org verwenden, die sind extra dafür frei gehalten.
~dave