daten / bilder aus html-seiten auslesen
dasa
- datenbank
hallo,
ich suche einen sinnvollen weg aus ähnlich aufgebauten html-dateien (ebay) gewisse informationen auszulesen (höchtgebot, datum, bilder..) und in eine datenbank zu übertragen.
wie komme ich an die gewünschten informationen?
welche software (datenbank) schlägt ihr vor?
gruß
Hi!
Zum Auslesen reicht schon JavaScript mit einem Schuss AJAX damits auch glaenzt.
Du kannst so einen beliebigen Link generieren und abschicken. Im xmlhttp Objekt sollte dann im response der komplette Quelltext des Seite vorhanden sein. Den kannst Du dann mit geeigneten Suchparametern auseinanderschneiden. Die gesuchten Daten werden ja immer in gleichen Elementen bzw. an den gleichen Stellen sein.
Geanuso gehts dann auch z.B. mit php, VBA, etc. Seite laden und analysieren. Welche Software Du benutzt liegt wohl bei Dir. Machst Du's online wirst Du ja wohl selbst am Besten wissen was du da hast. (php/mysql) willst du es lokal kannst du dir auch aussuchen was du willst. mysql und php oder ne MS Access Geschichte. Meinetwegen auch in Excel, oder Open Office, Java (nicht Tassenseitig...),... Was immer Du willst/am Besten kannst. Die Software spielt erstmal keine Rolle. Da nimm was dir am ehesten liegt.
Solltest du was bestimmtes damit vorhaben, solltest Du das erwaehnen. Allgmein ists egal.
Hi,
Zum Auslesen reicht schon JavaScript mit einem Schuss AJAX damits auch glaenzt.
Das geht aufgrund der same origin policy nur, wenn die Daten auf dem gleichen Server liegen.
Den anderen Vorschlägen kann ich nur zustimmen. Das geht wohl mit so ziemlich allen gängigen Programmiersprachen.
mfG,
steckl
Hoi,
Das geht aufgrund der same origin policy nur, wenn die Daten auf dem gleichen Server liegen.
Jain... Ich hab hier lokale Scripte mit denen ich meine Ausgaben auf dem Server teste. So muss ich bei Scriptaenderungen nicht immer alles laestig auf den Server kopieren. Bloed ist es, wenn ein serverseitiges Script nen Bug hat. Dann hab ich nicht den Status der Abfrage in meiner alertbox, sondern den HTML Code des Servers fuer die Fehlerseite. Ist immer etwas gross... -.-