dedlfix: Doppelt doppelte Anführungszeichen

Beitrag lesen

Tach!

Der Originalcode der zu lesenden Seite heißt z. B. <a href="http://XYZ.de....../4672/25097552/d5dd69/Wirtschaft-und-Opposition-kritisch.html" tabindex="-1" class="linkOrange" title=""Das wird so nichts"">[mehr]</a>

Das ist eindeutig falsch.

Also title enthält ein Zitat und hat deshalb hier zwei Doppel-QUotes vorne und zwei hinten.

Nee, das funktioniert so nicht, und keiner der großen 4 Browser zeigt in dem Fall einen Tooltip an. Ein String geht immer vom ersten Anführungszeichen bis zum nächsten gleichen Anführungszeichen. Wenn der Inhalt ebenfalls ein oder mehrere solcher Zeichen enthalten soll, müssen sie maskiert werden, sonst wird das erste als String-Ende erkannt und der Rest ist unvorhersagbar, meist jedoch ein Syntaxfehler.

Ich MUSS aber einen Weg finden, diese Seite auszulesen, mit dem Inhalt von href und dem von title - egal, ob sie HTML-valide ist oder nichtm, weil ich den Betreiber der Seite nicht beeinflussen kann (obwohl ich schon eine mail geschrieben habe.) Noch einen Tipp?

Ja. Wenn du den Seiteninhalt grad eben erst geholt hast, liegt er als String vor, und du kannst ihn mit Stringfunktionen bearbeiten. Nach der Korrektur bekommst du zwar noch die Warnungen wegen der mehrfachen Verwendung der ID-Werte, aber das title-Attribut sollte nun stimmen.

dedlfix.