MaCcrack: Wie arbeitet ein Bot?

Hallo!

Ich möchte einen bot baut, der auf bestimmten Internetseiten, bestimmte Dinge regelmäßig ausführt, um mir gewisse Arbeitsabläufe zu erleichtern. (Nichts Illegales!!!)

Suche schon seit einiger Zeit nach einem Ansatzpunkt, hab aber keinen gefunden.

Kann mir jemand verraten wie ein Programm überhaupt auf eine Internetseite zugreifen und mit Ihr kommunizieren kann?

Welche Sprache würdet Ihr verwenden? Java?

Vielen Dank für eure Ideen

Gruss Miro

  1. hi,

    Kann mir jemand verraten wie ein Programm überhaupt auf eine Internetseite zugreifen und mit Ihr kommunizieren kann?

    So, wie dein Browser das auch tut: Über HTTP.

    Ob Browser oder Bot - beide sind aus der Sicht des Servers absolut das gleiche: Clients.

    gruß,
    wahsaga

    --
    /voodoo.css:
    #GeorgeWBush { position:absolute; bottom:-6ft; }
    1. So, wie dein Browser das auch tut: Über HTTP.

      Is ja schon mal ein Ansatz, d.h. ich müsste mich mit den Tiefen des HTTP-Protokolls auseinandersetzen und diese "Befehle etc" z.B. mit Java oder C++ "ansteuern"?

      Oder kenn jemand andere Möglichkeiten?

      1. Hi,

        Is ja schon mal ein Ansatz, d.h. ich müsste mich mit den Tiefen des HTTP-Protokolls auseinandersetzen und diese "Befehle etc" z.B. mit Java oder C++ "ansteuern"?

        Oder kenn jemand andere Möglichkeiten?

        Java bietet bereits fertige Klassen und Methoden für die Kommunikation mittels HTTP. Darüber geht das eigentlich recht einfach. Einfach mal in einer Java-Doku danach stöbern, auswendig weis ichs leider nicht mehr so genau (ist schon n bischen her, dass ich das mal benutzt hab).

        Gruß,

        Harlequin

        1. Java bietet bereits fertige Klassen und Methoden für die Kommunikation mittels HTTP.

          Vielen Dank!

      2. Hallo,

        Is ja schon mal ein Ansatz, d.h. ich müsste mich mit den Tiefen des HTTP-Protokolls auseinandersetzen und diese "Befehle etc" z.B. mit Java oder C++ "ansteuern"?

        Genau. Is' natürlich Geschmackssache, aber ich würde C nehmen.  :-)

        Oder kenn jemand andere Möglichkeiten?

        Du kannst es natürlich auch in PHP scripten (Hinweis: PHP muss nicht unbedingt unter einem Webserver laufen). Da hast du die nötigen Funktionen zum Teil auch schon fertig drin.

        Ciao,
         Martin

        --
        F: Was ist eigentlich aus deinem schlimmen Durchfall geworden?
        A: Mein Arzt hat mir Valium verschrieben.
        F: Und das hilft?
        A: Naja, ich mach mir immer noch in die Hose. Aber inzwischen ist es mir egal.
        1. Hallo,

          Genau. Is' natürlich Geschmackssache, aber ich würde C nehmen.  :-)

          Na in C muss man meiner Meinung nach zu viel selbst machen, und für HTTP ist der Geschwindigkeitsvorteil jetzt auch nicht sooo wichtig.

          Ich würde eine Sprache die solche sachen schön abstrakt schon bereithält nehmen, zum Beispiel Python, das ist relativ schnell, einfach zu erlernen und hat fertig eingebaute Module die das ganze unglaublich einfach machen:

          # Modul laden  
          import urllib2  
            
          # HTTP-Request vorbereiten  
          request = urllib2.Request('http://de.selfhtml.org')  
          request.add_header('User-agent', 'Mein Bot / v1.0')  
            
          # Request ausführen  
          html_file = urllib2.urlopen(reqequest)  
            
          # Die HTML/XML/TXT oder was auch immer Datei ausgeben  
          print html_file.read()
          

          Grüße
          Jeena Paradies

          --
          Fußball ist unser Leben zumindest wärend der WM ;-) | Jlog | Gourmetica Mentiri
          1. Hi Jeena,

            Genau. Is' natürlich Geschmackssache, aber ich würde C nehmen.  :-)
            Na in C muss man meiner Meinung nach zu viel selbst machen, ...

            tja, das *ist* doch grade das Schöne.  :-)
            Ehrlich, für mich überwiegt nicht den Nachteil, dass man viel selbst machen *muss*, sondern der Vorteil, dass man viel selbst machen *kann*.

            und für HTTP ist der Geschwindigkeitsvorteil jetzt auch nicht sooo wichtig.

            Nee, aber das gute Gefühl: "Ich hab's selbst hinbekommen, ohne auf einen Bausatz zurückgreifen zu müssen."

            Ich würde eine Sprache die solche sachen schön abstrakt schon bereithält nehmen, zum Beispiel Python, das ist relativ schnell, einfach zu erlernen und hat fertig eingebaute Module die das ganze unglaublich einfach machen

            Ja klar (auch wenn ich Python bisher nur dem Namen nach kenne), aber wo bleibt denn da der Spaß an der Sache - oder gar das Erfolgserlebnis, wenn man's dann doch geschafft hat?

            Abgesehen davon kann ich nach gut 10 Jahren aktiver C-Programmierung auch auf einige Bausteine für verschiedene Zwecke zurückgreifen - und zwar selbstgeschriebene Bausteine, bei denen ich auch wirklich genau weiß, was sie tun, was sie können und was nicht. Dadurch bin ich schnell in der Lage, diese Module -wenn nötig- auch wieder zu erweitern. Bei einer Bibliothek, die jemand anders geschrieben hat, wäre das sehr viel aufwendiger, weil ich mich erst in den Programmcode hineindenken muss. Da bin ich mit Neu-Schreiben oft besser bedient. Und bis ich endlich den Code analysiert habe und weiß, an welcher Stelle ich ihn aufbohren muss, hab ich's oft auch schon selbst neu geschrieben.

            Schönes Wochenende noch,
             Martin

            --
            You say, it cannot be love if it isn't for ever.
            But let me tell you: Sometimes, a single scene can be more to remember than the whole play.
      3. Hallo

        So, wie dein Browser das auch tut: Über HTTP.

        Is ja schon mal ein Ansatz, d.h. ich müsste mich mit den Tiefen des HTTP-Protokolls auseinandersetzen und diese "Befehle etc" z.B. mit Java oder C++ "ansteuern"?

        Oder kenn jemand andere Möglichkeiten?

        C#, Perl, PHP, Python, VB-Script, ein Skript Deiner bevorzugten Shell und noch viele andere mehr.

        Freundliche Grüße

        Vinzenz