Tim Tepaße: Geeignetes Script zum Auslesen von RSS-Feeds

Beitrag lesen

Hallo Tillmann,

schau doch mal hier (Link aus dem Forum): http://www.heise.de/ct/ftp/04/26/238/

Genau das meinte ich. Das ist eine schnell dahingeworfene Minimal-Lösung im SAX-Stil, die nur mit einer minimalen Untermenge von Userland-RSS (RSS 0.9x, RSS 2.0) umgehen kann. Sie bietet so gut wie keinen Zugriff auf die zusätzlichen Elemente von Userland-RSS (Timestamps, GUIDs, etc.), sie unterstützt nicht die gebräuchlichen Erweiterungen von RSS, sie unterstützt nicht die RDF-basierten RSS-Dialekte (RSS 0.9, RSS 1.0) und sie unterstützt nicht das Feed-Format Atom. Und das ist nur das, was mir beim Überfliegen des Quellcodes auffällt, Fehlerbehandlung wäre auch noch ein interessantes Thema.

Ich will nicht unbedingt sagen, dass der Beispiel-Parser der c't'  „schlecht“ sei,  er tut ja, was er anpreist. Nur ist er extrem minimal und nur auf eine Teilmenge einer Teilmenge der möglichen Feedformate begrenzt. Wenn man weiss, was man parsen will ein keinerlei Ansprüche hat, ist das durchaus in Ordnung. Wenn man aber den Anspruch hat, jeden Feed halbwegs parsen zu können, der einen unter der Nase her läuft, braucht man was richtiges. Und im Wilden Web weiss man nun mal nicht zwangläufig, was einen erwartet.

Tim