Henryk Plötz: SB-Werbung: bisher 50 Downloads ;-)

Beitrag lesen

Moin,

Oh, schön :) Da mir der IE und damit auch der SelfBrowser nicht wieder in's Haus kommt: Ist die Schnittstelle irgendwo halbwegs vernünftig dokumentiert oder muß ich da im Quelltext wühlen?

Zu der Schnittstelle die der Selfbrowser benutzt kann ich dir jetzt nichts direkt sagen, aber zu der vom SBU, die zumindest ähnlich arbeiten sollte.
Unter http://forum.de.selfhtml.org/cgi-bin/sbu_server.pl (absichtlich kein Link, kaum Menschenverwertbare Informationen) liegt eine komprimierte und vereinfachte Version der Forumshauptdatei. Die beginnt mit einem HTTP-Ähnlichen Header (beispielhaft):
200 Ok. Data Follows
CacheUsed: no
Version: 1.00

und danach kommen dann die komprimierten Daten. Wenn man die dekomprimiert (in PHP zum Beispiel mit gzuncompress()) erhält man die Hauptdatei in der Form:
[THREAD id='13510']
[POST id='74854']
answers:0
subject:Word Dokument ausdrucken
author:Frank
cat:HTML
level:0
time:1023109198
[THREAD id='13509']
[POST id='74853']
answers:4
subject:Beste Lösung für diese Abfrage
author:ThomasX
cat:PHP
level:0
time:1023109141
[POST id='74867']
....usw. usf.

Die Felder sind selbsterklärend und das Parsen sollte auch kein Problem sein. Wenn man dann die Hauptdatei hat, ist das Abholen der einzelnen Postings nur noch eine Fingerübung und das Zerlegen der Posting-HTML-Datei in ihre Bestandteile ist auch mit einem einfachen Regulären Ausdruck machbar.

(Da ich kein Perl kann, sind das alles nur experimentell bestätigte Vermutungen, bei mir funktioniert es aber)

--
Henryk Plötz
Grüße aus Berlin