Stefan Falz: website parsen, ISBN-Datenbank?

Beitrag lesen

Hallo zusammen,

ich versuche mit Perl einige Webseiten zu parsen (damit es keine Mißverständnisse gibt: mit Einverständniserklärung der Webmaster).
Nun würde mich interessieren, wie ich am effizientesten vorgehen sollte. Momentan wird jede website nach ca. 5 - 7 Begriffen durchsucht, was aber relativ lange dauert.
Aber da sich diese Daten nur in einem relativ kleinen Abschnitt der gesamten Homepage befinden wäre es vielleicht effizienter, zuerst diesen Abschnitt herauszufiltern und erst dann nach den Begriffen zu suchen, oder ist dies im Endeffekt genauso teuer?

Vielen Dank,
Tausch.

PS: Gibt es eine vollständige und ständig aktualisierte ISBN-Datenbank im Internet?

Hallo Tausch,

unter http://www.kno.de (Buchgroßhändler) findest Du eine
große Datenbank. Aber die werden die, wie wahrscheinlich alle
die eine solche DB haben, nicht so einfach rausgeben.

Tschau, Stefan