Geeignetes Script zum Auslesen von RSS-Feeds
Philipp Grashoff
- php
0 Tim Tepaße
0 Tillmann
Hallo,
es gibt ja einige vorgefertigte Lösungen zum Auslesen von NewsFeeds. Nun wollte ich euch fragen, mit welchen ihr positive/negative Erfahrungen gemacht habt und welche ihr mir empfehlen könnt.
mit freundlichen Grüßen
Philipp Grashoff
Hallo,
es gibt ja einige vorgefertigte Lösungen zum Auslesen von NewsFeeds. Nun wollte ich euch fragen, mit welchen ihr positive/negative Erfahrungen gemacht habt und welche ihr mir empfehlen könnt.
Ich mag den Universal Feed Parser; der hilft Dir aber nicht, da in Python geschrieben. ;)
In der PHP-Welt kenne ich mich weniger aus, früher war Magpie RSS sehr beliebt. Allerdings scheint der auch seine Lücken zu haben und spärlich weiter entwickelt zu werden, weswegen sich meiner Beobachtung nach die Euphorie in PHP-Land eher zum neueren SimplePie verlegt zu haben scheint. Ich würde allein deswegen zu letzterem greifen.
Ich rate Dir aber auf jeden Fall zu einer „vorgefertigten Lösung“, anstatt das XML der Feeds selber zu verarbeiten. Durch die extrem chaotische Entwicklungsgeschichte von RSS sind da diverse untereinander inkompatible Dialekte entstanden, zudem gibt es diverse Gotchas, die man beachten sollte. Eine vorgefertigte Lösung hat oftmals den Vorteil, dass all diese nervigen Randfälle für einen beachtet werden, wenn der Autor der vorgefertigten Lösung seine Arbeit ernst genommen hat. Man muss nicht unbedingt das Rad neu erfinden.
Tim
Hallo Tim,
schau doch mal hier (Link aus dem Forum):
http://www.heise.de/ct/ftp/04/26/238/
Ciao,
Tillmann
Hallo Tillmann,
schau doch mal hier (Link aus dem Forum): http://www.heise.de/ct/ftp/04/26/238/
Genau das meinte ich. Das ist eine schnell dahingeworfene Minimal-Lösung im SAX-Stil, die nur mit einer minimalen Untermenge von Userland-RSS (RSS 0.9x, RSS 2.0) umgehen kann. Sie bietet so gut wie keinen Zugriff auf die zusätzlichen Elemente von Userland-RSS (Timestamps, GUIDs, etc.), sie unterstützt nicht die gebräuchlichen Erweiterungen von RSS, sie unterstützt nicht die RDF-basierten RSS-Dialekte (RSS 0.9, RSS 1.0) und sie unterstützt nicht das Feed-Format Atom. Und das ist nur das, was mir beim Überfliegen des Quellcodes auffällt, Fehlerbehandlung wäre auch noch ein interessantes Thema.
Ich will nicht unbedingt sagen, dass der Beispiel-Parser der c't' „schlecht“ sei, er tut ja, was er anpreist. Nur ist er extrem minimal und nur auf eine Teilmenge einer Teilmenge der möglichen Feedformate begrenzt. Wenn man weiss, was man parsen will ein keinerlei Ansprüche hat, ist das durchaus in Ordnung. Wenn man aber den Anspruch hat, jeden Feed halbwegs parsen zu können, der einen unter der Nase her läuft, braucht man was richtiges. Und im Wilden Web weiss man nun mal nicht zwangläufig, was einen erwartet.
Tim