frankx: noindex bringts das?

Hallo,

wisst ihr, ob mit

<meta name="robots" content="noindex, nofollow">

die Suchmaschinen wirklich die index.htm bzw. diese Datei in dem Verzeichnis und alle verlinkten in Ruhe lassen?

Dank und Gruß,

Frankx

  1. Hallo frankx.

    wisst ihr, ob mit

    <meta name="robots" content="noindex, nofollow">

    die Suchmaschinen wirklich die index.htm bzw. diese Datei in dem Verzeichnis und alle verlinkten in Ruhe lassen?

    Du hast soeben in deine Antwort gepostet.

    Einen schönen Dienstag noch.

    Gruß, Ashura

    --
    Selfcode: sh:( fo:} ch:? rl:( br: n4:~ ie:{ mo:| va:) de:> zu:} fl:( ss:) ls:[ js:|
    30 Days to becoming an Opera8 Lover -- Is Opera9 what Firefox 2 should be?
    Meine Browser: Opera 8.50 | Firefox 1.0.7 | Lynx 2.8.5 | Konqueror 3.3.2 | Netscape 4.7 | IE 6.0
    Use OpenOffice.org
    1. Hallo Ashura,

      Du hast soeben in deine Antwort gepostet.

      mag heißen, dass es eben so ist, ist es so?

      Auch schönen Dienstag ganz semikolonlos,

      Dank Frankx

      1. Hallo frankx.

        Du hast soeben in deine Antwort gepostet.

        mag heißen, dass es eben so ist, ist es so?

        Offensichtlich.

        Einen schönen Dienstag noch.

        Gruß, Ashura

        --
        Selfcode: sh:( fo:} ch:? rl:( br: n4:~ ie:{ mo:| va:) de:> zu:} fl:( ss:) ls:[ js:|
        30 Days to becoming an Opera8 Lover -- Is Opera9 what Firefox 2 should be?
        Meine Browser: Opera 8.50 | Firefox 1.0.7 | Lynx 2.8.5 | Konqueror 3.3.2 | Netscape 4.7 | IE 6.0
        Use OpenOffice.org
  2. Tach,

    wisst ihr, ob mit
    <meta name="robots" content="noindex, nofollow">
    die Suchmaschinen wirklich die index.htm bzw. diese Datei in dem Verzeichnis und alle verlinkten in Ruhe lassen?

    gute Suchmaschinen tun das. Ich finde die Regelung per robots.txt jedoch noch einfacher und übersichtlicher.

    mfg
    Woodfighter

    1. Hi,

      Ich finde die Regelung per robots.txt jedoch noch einfacher und übersichtlicher.

      für die index-Datei ok, aber stelle Dir vor, eine Suchmaschine folgt einem Backlink zu einer Unterseite. Hierin sind andere Seiten verlinkt. Wenn jetzt wird die robots.txt angefordert, sind die Links bereits aufgenommen. Davon abgesehen gibt es in der robots.txt kein Äquivalent für noindex oder nofollow alleine.

      freundliche Grüße
      Ingo

      1. Tach,

        aber stelle Dir vor, eine Suchmaschine folgt einem Backlink zu einer Unterseite. Hierin sind andere Seiten verlinkt. Wenn jetzt wird die robots.txt angefordert, sind die Links bereits aufgenommen.

        ich gehe davon aus, dass die robots.txt zuerst geladen wird, ansonsten würde das Konzept ja recht sinnlos sein.

        Davon abgesehen gibt es in der robots.txt kein Äquivalent für noindex oder nofollow alleine.

        Da hast du wiederum recht.

        mfg
        Woodfighter

        1. Hi,

          ich gehe davon aus, dass die robots.txt zuerst geladen wird, ansonsten würde das Konzept ja recht sinnlos sein.

          das kommt drauf an ... Wenn Google auf meine Seiten kommt, dann wird in der Tat meist zuerst /robots.txt angefordert. Aber was ist, wenn Google einem Link auf eine Unterseite (auch noch in enem Unterverzeichnis) folgt?
          Gerade habe ich mal in den noch überschaubaren Logs der neuen Seite andrealenzing.de nachgeschaut:

          60: Googlebot/2.1 (+http://www.google.com/bot.html) *g
                Ref: -
          [07:26:40] 404 /robots.txt
          [07:26:41]     /
          [07*45*57]     /ich.html
          [08:13:28]     /koepfe.html
          [07*48*44]     /ausstellungen.html
          [08*13*14]     /torsi.html

          aber danach:

          66: Googlebot/2.1 (+http://www.google.com/bot.html) *g
                Ref: -
          [07:46:30]     /zeichnung.html
          [07*47*05]     /plastik.html
          [07:54:28]     /malerei.html
          [07*48*45]     /kontakt.html

          Das heißt: Google fordert tatsächlich zuerst /robots.txt an, bei wiederholten Besuchen jedoch nicht mehr bzw. (wie ich bei meinen Seiten sehe) nur noch innerhalb eines bestimmten Intervalls.

          freundliche Grüße
          Ingo

          1. Tach,

            das kommt drauf an ... Wenn Google auf meine Seiten kommt, dann wird in der Tat meist zuerst /robots.txt angefordert. Aber was ist, wenn Google einem Link auf eine Unterseite (auch noch in enem Unterverzeichnis) folgt?

            robots.txt gilt doch für die gesamte Domain, dementsprechend sollte es egal sein, wo der Googlebot sich gerade rumtreibt.

            Das heißt: Google fordert tatsächlich zuerst /robots.txt an, bei wiederholten Besuchen jedoch nicht mehr bzw. (wie ich bei meinen Seiten sehe) nur noch innerhalb eines bestimmten Intervalls.

            Es wäre ja auch unsinnig die Datei nicht zu cachen.

            mfg
            Woodfighter