os: Was tun, wenn der Such-Spider spinnt? [Fortsetzung]

Fortsetzung von http://forum.de.selfhtml.org/archiv/2002/1/3721/

...

Danke Sven und 'Der Linke Setzer'! Mit dem .htaccess-file

deny from 189.139.155.30

konnte ich die Website dann vor der IP 189.139.155.30 schützen.
Damit wäre das Thema eigentlich abgehandelt.

DIE GESCHICHTE GEHT ALLERDINGS NOCH WEITER! - und weil's wirklich spannend wird, erzähl ich noch ein wenig :(Schade, dass man den Thread nicht im Archiv weiterführen kann!)

Nach dem Rat von Michael benachrichtigte ich am 31.1. meinen Provider. In der E-Mail (mit hoher Dringlichkeitsstufe) erzählte ich meine Geschichte (siehe oben), zitierte die Antworten von Sven und Michael, schickte noch jeweils einen Auszug der aktuellsten Statistik der beiden Websites mit und bat im gegenseitigen Interesse um die Sperrung der beiden IPs 189.139.155.30 und 196.139.155.7. Nachmittags war der Server meiner Website (Website2) mal wieder down. Abends stellte ich fest, dass in meiner Statistik exakt und eindeutig der Teil rausgeschnitten war, den ich in der E-Mail zitiert hatte (bzw. 2 von 20 Einträgen wurden nicht gelöscht). Die Daten hatte ich über den Web-Browser, also von einer statischen HTML-Seite kopiert (versehentliches Löschen ausgeschlossen!). Das wäre nicht weiter schlimm, denn es handelte sich dabei um temporäre Einträge der letzten 40 Besucher (deshalb ärgern mich ja auch diese IPs, die ständig alle anderen Einträge überschreiben). Mittlerweile wären die Daten lägst überschrieben und dennoch - alle Einträge zwischen dem 30.01.2002 20:28 Uhr und dem 31.01.2002 17:27 Uhr waren ausgeschnitten und weg.
Hat mein Provider meine Daten zur Kontrolle geöffnet und die Einträge vielleicht versehentlich ausgeschnitten, statt kopiert? Hat der ein Recht darauf Kundendaten zu öffnen? Bevor ich mich ans SELFHTML-Forum wandte stellte ich dieses Thema in ein aderes *schäm* Forum. Interessant ist in diesem Zusammenhang folgende Antwort (die einzige):

#####################################
Hoffender  01.02.2002

Hi also ich glaub ich kann dir zwar auch nicht weiter helfen, aber das ist echt ne heiße angelegenheit, der man unbedingt auf den grund gehen sollte, ich bin ja schon fast der meinung das das gar kein suchmaschienen-robot ist, sondern irgendso ne art robot der markenrechtsverletzungen auf der spur ist, oder noch schlimmer - ich hab da mal was von ner firma gehört, die behauptet haben das komplette internet indexieren + kartographieren zu können, vielleicht sind das diese spinner? - dann gibts n problem, da die meines wissens vom fbi unterstützt werden, die penner sind auf solche sachen ja auch ziemlich heiß....

ich weiß nicht wie das mit htaccess ist eigentlich müßte man mit nem htaccess-file und 'deny 198.139.155.30' das problem lösen können..........schreit, wenn ich was falsches sage.....sicher bin ich mir da nicht....

scheiße das ist echt n bisschen krass
eine bitte hätt ich: wenn jmd näheres erfährt, haltet mich auf dem laufenden

thx
:)
#####################################

Muss ich womöglich schon aufpassen, was ich sage (schreibe)?? (Wenn ich diese Geschichte nicht zu Ende erzähle, wurde mir das Maul gestopft! <g>)
Mein Provider jedenfalls hat bisher weder die IPs gesperrt noch geantwortet (der Service beim _preisgünstigsten_ Provider ist halt etwas träge; geantwortet wird - nach einer gewissen Zeit - jedoch normalerweise zuverlässig).
Die Sperrung der IPs hätte allerdings auch wenig genutzt:

Heute rief ich noch einmal die Statistik der Website1 auf und traute meinen Augen nicht. Statt 198.139.155.30 prahlt nun die IP 198.139.155.31 mit der höchsten Trefferquote (natürlich nahezu stündlich!). Ich versuchs jetzt mal mit

deny from 198.138.0.0-198.139.255.255

mfg,os

  1. Moin!

    DIE GESCHICHTE GEHT ALLERDINGS NOCH WEITER! - und weil's wirklich spannend wird, erzähl ich noch ein wenig :(Schade, dass man den Thread nicht im Archiv weiterführen kann!)

    Wirklich lustig, das ganze. Ich würde mich wegen der ominösen Zugriffe aber nicht wirklich beunruhigt fühlen. Eher schon hinterfragen, warum denn die Logfiles ausgeschnitten wurden.

    Heute rief ich noch einmal die Statistik der Website1 auf und traute meinen Augen nicht. Statt 198.139.155.30 prahlt nun die IP 198.139.155.31 mit der höchsten Trefferquote (natürlich nahezu stündlich!). Ich versuchs jetzt mal mit

    deny from 198.138.0.0-198.139.255.255

    Mit diesem großen Bereich sperrst du möglicherweise mehr Leute aus, als du beabsichtigst. Bzw: Es scheint, du hast recherchiert, welche Netzmaske der Provider hat, und selektiv genau dieses Subnetz rausgeworfen. Es könnte nicht schaden, irgendeine eigene Fehlerseite zu entwerfen, sollte doch mal jemand aus diesem Netz "berechtigt" zugreifen wollen.

    - Sven Rautenberg

    1. Hummel, Hummel,

      Wirklich lustig, das ganze. Ich würde mich wegen der ominösen Zugriffe aber nicht wirklich beunruhigt fühlen. Eher schon hinterfragen, warum denn die Logfiles ausgeschnitten wurden.

      Ist sicherlich wirklich halb so wild, wie es scheinen möchte. Nicht auszuschließen ist z.B. ein Programmierfehler im Tool. Bis ich das ausgetestet habe ist dieses Posting allerdings schon wieder im Archiv und ein neues Thread möchte ich nun wirklich nicht mehr beginnen ;-)

      Ich versuchs jetzt mal mit
      deny from 198.138.0.0-198.139.255.255
      Mit diesem großen Bereich sperrst du möglicherweise mehr Leute aus, als du beabsichtigst.

      Davon abgesehen, dass "deny from IP-IP" nicht funktioniert, werde ich die "GaGaIPs" gezielt mit
      deny from IP1
      deny from IP2
      ...
      abblocken.

      Es könnte nicht schaden, irgendeine eigene Fehlerseite zu entwerfen, sollte doch mal jemand aus diesem Netz "berechtigt" zugreifen wollen.

      ErrorDocument 404 http://www.domain.de/not_found_error.html
      http://selfhtml.teamone.de/diverses/htaccess.htm#optionen

      mfg,
      os

      1. Hummel, Hummel,

        Moin, Moin! :)

        Es könnte nicht schaden, irgendeine eigene Fehlerseite zu entwerfen, sollte doch mal jemand aus diesem Netz "berechtigt" zugreifen wollen.

        ErrorDocument 404 http://www.domain.de/not_found_error.html
        http://selfhtml.teamone.de/diverses/htaccess.htm#optionen

        Damit wird ein Redirect ausgelöst, der Client kriegt aber niemals den Code 404 zu sehen (bzw. er wird auch in den Logfiles nicht aufgeführt). Besser:
        ErrorDocument 404 /not_found_error.html

        - Sven Rautenberg

  2. Hallo,

    ich vermute hier liegt was anderes vor. Und zwar ist doch www.vario.net ein Domain- und Hosting-Firma, hm  ... ?

    Also, ich vermute, dass es ein Script es das vielleicht ueberprueft ob Deine Domain aktiv ist. D.h. jemand moechte Deinen guten Domainnamen haben?

    Was dran?

    Ciao Micha

    1. Hallo Micha,

      Also, ich vermute, dass es ein Script es das vielleicht ueberprueft ob Deine Domain aktiv ist. D.h. jemand moechte Deinen guten Domainnamen haben?
      Was dran?

      Das mit dem Domainnamen kann nicht sein.
      Ein Script, welches die Aktivität der Domain überprüft scheint mir plausibler. Gestern hab ich *siedendheiß* festgestellt, dass so ein Script, und zwar von internetseer.com, die Performance überprüft. Dieses Checking wird sehr warscheinlich automatisch aktiviert, indem man die Site bei einer bestimmten Suchmaschine anmeldet. Dies läßt sich dann genau so einfach auch wieder abstellen, was ich jetzt auch getan hab. Ein Ping*^1 hat allerdings ergeben, dass die IP von internetseer.com (66.150.40.10) aus einem völlig anderen Netblock stammt. Eine E-Mail bzw. ein erneutes Aufrufen der Statistik (leider ist der Server schon wieder down*^2) dürfte Klärung verschaffen.

      mfg,
      os

      *1 Wer die IP (> ursprünglicher, maschinenfreundlicher Domainname, bestehend aus Zahlenblöcken) seiner Internetadresse (modifizierter, menschenfreundlicher Domainname, bestehend aus Buchstaben und/oder evt. Zahlen) herausbekommen will, kann sich die Anfrage beim Provider ersparen indem er über die "(Start>Programme>)MS-DOS-Eingabeaufforderung" bei aktiver Internetverbindung

      ping Domainname

      eingibt.

      *2 Das gehört eigentlich nicht hier hin: Suche einen marktbeständigen Provider der mit PHP, CGI, etc. wenig teurer ist und dafür auch weniger Serverausfälle hat als Netbeat.

  3. Hi Michael,

    deny from 198.138.0.0-198.139.255.255

    syntaktisch korrekt müßte das einfach

    deny from 198.138

    heißen.

    Viele Grüße
          Michael