Christian: Durchsuchen crawler auch *.txt Dokumente im web?

Hallo,
mal eine Frage, die mich sehr interessiert: Durchsuchen die crawler der Suchmaschinen alle Dateitypen die sich im Netz befinden?
Ich habe nämlich eine (nicht- verlinkte) txt- Datei offen auf meinem server, kann die gefunden werden??

christian

  1. Hiho,

    solange die datei nicht verlinkt ist sollte es durch crawler keine Probleme geben (ich glaube kaum das die adressen raten). Viel grössere Probleme sollte es mit echten personen geben die nämlich schon mal ne adresse versuchen zu erraten. wenn in der txt irgendwelche wichtigen Informationen sind dann solltest du sie noch weiter (serverseitig) schützen.

    Grüsse

    Marc

  2. Hallo Christian,

    mal eine Frage, die mich sehr interessiert: Durchsuchen die crawler der Suchmaschinen alle Dateitypen die sich im Netz befinden?

    Mehrere Millionen Suchtreffer bei Google dürften als Beweis reichen:
    http://www.google.com/search?q=inurl%3Atxt+filetype%3Atxt

    Ich habe nämlich eine (nicht- verlinkte) txt- Datei offen auf meinem server, kann die gefunden werden??

    Solange die Datei nirgends verlinkt ist (auch nicht auf fremden
    Internetseiten), dürfte kein Robot diese indizieren, voraus-
    gesetzt, sie wurde nicht explizit dort angemeldet. Es ist
    auch möglich, dass Browser die TXT-Datei (fälschlicherweise) als
    Referrer in Statistiken eintragen oder, was weitaus realistischer
    ist, die Datei in den servereigenen Statistiken auftaucht, was
    sie dann praktisch öffentlich macht. Aus diesem Grund habe ich
    eben auch die /devmail.txt auf selfhtml.org gelöscht, war
    ein peinlicher Lapsus meinerseits, daran habe ich nicht
    gedacht, als ich kürzlich die Statistik von selfhtml.org
    öffentlich zugänglich gemacht habe ;-)

    Viele Grüße,
    Stefan

    1. Hi,

      Solange die Datei nirgends verlinkt ist (auch nicht auf fremden
      Internetseiten), dürfte kein Robot diese indizieren,

      einige Robots fordern aber auch das Verzeichnis an. und wenn der Server das zuläßt...

      Überigens geht Google außer auf txt, doc und pdf auch - wie ich jetzt bei mior festgstellt habe - auf xls und sogar exe-dateien (die xls bekam dabei übrigens eine -leider- hervorragende Platzierung und sogar eine -nicht sehr brauchbare- html-vorschau).

      freundliche Grüße
      Ingo