Daniel Reckling: DOM parsen und semantisch analyisieren

Beitrag lesen

Hallo, ich möchte gerne einen ähnlichen Service wie kaboodle.com realisieren. Kaboodle bietet mir eine Firefox-Toolbar, mit der ich beim Online-Shopping aus allen Shops heraus die Produkte auf einen eigenen Notizzettel legen kann.

Anhand eines Deeplinks in einen Shop erkennt das Script Name, Beschreibung, Preis und Foto des abgebildeten Artikels und arbeitet mit jedem beliebigen Shop überraschend reibungslos zusammen.

Eine Realisierung eines solchen Scripts kann meiner Meinung nach nur auf Basis bestimmter Heuristiken stattfinden. Zum Beispiel: <title>, <h1> und <h2> auf Produktname auslesen, größtes Bild = Produktfoto, im Text auftauchende Float-Zahl = Preis,...

Meine Frage ist dahingehend, ob noch wer Anregungen oder Tipps zu dieser Problematik hat. Ich will versuchen, das serverseitig mit PHP und dessen DOM-Funktionen umzusetzen - ist das sinnvoll? Oder wäre die Anbindung einer Gecko-Engine vielleicht nicht auch verkehrt?