Philipp Hasenfratz: Aktienkurse automatisch von Internetseite abfragen

Beitrag lesen

Halihallo Andreas

Ne, auf die DB kann man sicher nicht zugreifen. Wahrscheinlich hat er nur die HTML-Seiten ausgelesen und diese verarbeitet (RegularExpressions) und für seine Zwecke zurechtgepeppelt.

Wäre sowas den mit regulären ausdrücken möglich? Ich meine so ne Seite ist recht komplex, so kommt die WKN im Quellcode bestimmt 10 mal vor(links...), ist die Gefahr nicht groß, das da irgendwelche Sachen auf der Seite stehen, die das Ergebnis irgendwie verfälschen können?

Leider ja. Das automatische Extrahieren von Datein aus HTML Dateien ist keine leichte Angelegenheit. Der Arbeitsaufwand ist von Seite zu Seite verschieden, du musst einfach irgend ein gutes Kriterium finden, wonach du suchst (aber mir sind einige Finanz-Portale bekannt und ich kenne die Struktur der Pages, ei, ei, das gibt was zu beissen :-( ). Hatt es irgend um den WKN-Code eine Zeichnfolge, welche "mit grösser Wahrscheinlichkeit" nur einmal im Quelltext vorkommt und explizit auf diesen Wert verweist? - Du musst dem Computer irgendwie sagen, wie er die Spreu vom Weizen trennen kann. Je einfacher, desto besser.
RegularExpressions sind aber für diesen Anwendungszweck eine riesen grosse Hilfe! - Stell dir vor, du musst mit substr o. ä. arbeiten, uiui...

Tipp: Nach dem Ausschlussprinzip vorgehen. Immer mehr Daten, von welchen du mit Sicherheit weisst, dass sie deine Daten nicht enthalten, aus dem "input-stream" entfernen. Theoretisch hast du dann am Schluss genau den gewünschten Wert... Klingt zwar einfach, aber gibt schon noch ein bissle zu tun...

Eine andere Möglichkeit wäre auch denkbar, dass die Finanz-Portal ein öffentliches Interface bietet, wo die Daten schon in einer strukturierten Form bereitsgestellt werden bzw eine Datei, die nicht so stark von Meta-Informationen (wie in HTML) überfüllt ist (eg. Textdatei), wobei ich dies bezweifle, denn was sollte der Betreiber für einen Nutzen davon ziehen, wenn seine Datenbank so einfach abgesaugt werden kann.

Das kann ich mir auch nicht vorstellen, hab ich auch noch nbicht gehört bzw. gesehen.

Bietet das Finanz-Portal irgendwelche Dateien mit den benötigten Daten zum Download an? - Wenn ja, welches Format?

Aber Vorsicht: Günter Frhr.v.Gravenreuth hat dich auf die rechtlichen Risiken aufmerksam gemacht! - Ich bin IMHO der Meinung, dass die Daten auf dem DB-Server automatisch, ohne expliziten Hinweis des Betreibers dem Urheberrecht unterliegen, in diesem Fall müsstest du mit dem Betreiber eine Vereinbarung treffen... So viel zu meinem Verständnis des deutschen Rechtsystems, wenn wir schon mal dabei sind...

Naja, da hat er nicht gaz unrecht, aber die Frage ist - wo hört das auf und wo fängt das an? Leider kann sowas außer Ihm auch keiner beantworten hier :-)

Wahrscheinlich hast du recht. Aber wenn dich brennend interessieren sollte und dir das Geld keine Rolle spielt, kann ich ja mal meinen Anwalt fragen :-)
Vielleicht ist ja Günter Frhr.v.Gravenreuth so freundlich und nimmt hierzu nochmal Stellung, würde mich auch interessieren.

Ich frage mich nur, wo der Unterschied ist, ob ich mir die Infornation für mich über die Webseite hole, oder über ein Script? Sicher wollen die lieber die Leute auf der Seite haben, und ich könnte mir die Information ja auch zu Fuß über die Seite holen, und dann in meine DB eingeben, wobei das sehr viel schwerer nachzuweisen ist, als wenn da 10.000 mal am Tag meine url im Referer steht und die nur nachgucken müssen, dann bekäme ich garantiert nach kurzer Zeit Post von den Rechtsabteilung :-)

Das abholen der Daten ist ja nicht strafbar, aber das weiterverwenden/veröffentlichen. Es spielt hierbei IMHO keine Rolle, ob du sie manuell in deine DB einfügst, oder über ein Script. Strafbar würdest du dich machen, wenn du diese unter deinem Namen (sprich als Copy-Paste in deine Website) veröffentlichst (und diese kommerziell nutzt). Aber wie gesagt, ich glaube nicht, dass du diese Infos kommerziell verwendest und deshalb hast du auch nix zu befürchten (ohne Gewähr! - Vielleicht sollte ich künftig einen Haftungsausschluss unten an meine Postings hängen :-))...

Viele Grüsse

Philipp

0 48

Aktienkurse automatisch von Internetseite abfragen

Andreas
  • programmiertechnik
  1. 0
    Günter Frhr.v.Gravenreuth
    1. 0
      Philipp Hasenfratz
    2. 0
      Andreas
      1. 0
        Philipp Hasenfratz
        1. 0
          Rol
          1. 0
            Philipp Hasenfratz
          2. 0
            Philipp Hasenfratz
          3. 0
            Matti Maekitalo
            1. 0
              Philipp Hasenfratz
            2. 0

              Spreadsheet::WriteExcel erzeugt "kaputte" xls-Datei!?

              Andreas
              1. 0
                Philipp Hasenfratz
                1. 0
                  Andreas
                  1. 0
                    Philipp Hasenfratz
                    1. 0
                      Andreas
                      1. 0
                        Philipp Hasenfratz
                        1. 0
                          Rol
                          1. 0
                            Philipp Hasenfratz
                            1. 0
                              Andreas
                              1. 0
                                Philipp Hasenfratz
                                1. 0
                                  Andreas
                                  1. 0

                                    Wanted: Linux-Specialist

                                    Philipp Hasenfratz
                                  2. 0
                                    Matti Maekitalo
                                    1. 0
                                      Andreas
                                      1. 0
                                        Matti Maekitalo
                                        1. 0
                                          Andreas
                  2. 0

                    ich liebe dieses Modul ;)

                    Philipp Hasenfratz
                    • software
    3. 0
      Reiner
  2. 0
    Philipp Hasenfratz
    1. 0
      Andreas
      1. 0
        Philipp Hasenfratz
  3. 0
    Matti Maekitalo
  4. 0
    Michael Schröpl
    1. 0
      Andreas
  5. 0

    Brauche Hilfe bei regulärem Ausdruck!

    Andreas
    1. 0
      Philipp Hasenfratz
      1. 0
        Andreas
        1. 0
          Andreas
          1. 0
            Andreas
            1. 0
              Philipp Hasenfratz
              1. 0
                Andreas
                1. 0
                  Philipp Hasenfratz
                  1. 0
                    Andreas
                    1. 0

                      wieder vertippt ;-)

                      Andreas
                      • menschelei
                      1. 0
                        Philipp Hasenfratz
                    2. 0
                      Philipp Hasenfratz
          2. 0
            Philipp Hasenfratz
        2. 0
          Philipp Hasenfratz