Schuer: Website von Google indizieren lassen... Nur wie?!

Hallo zusammen,

ich hab mal als Studienprojekt eine Webseite für ein mittelständisches Unternehmen gemacht. Mal abgesehen davon, daß Yahoo sie bis heute noch nicht ins Verzeichnis aufgenommen hat (Hallo Yahoo, arbeitet da auch jemand bei euch, oder daddelt ihr den ganzen Tag über Moorhuhn 3?!) weigert sich Google strickt, sie zu indizieren (der Robot ist schon ein paarmal vorbeigekommen, aber ich hab ihn immer verpaßt, sonst hätte ich ihn zur Rede gestellt oder versucht, ihn mit Hundekeksen zu bestechen!).

Jetzt hab ich mir mal mal ein paar Infos zu Google angelesen und festgestellt, daß Google die Seite scheinbar nicht aufnimmt, weil keinerlei Links von außen darauf zeigen, und diese Link ja scheinbar die Qualität einer Webseite bestimmen.

Meine Frage nun : Hab ich eigentlich Chancen, daß Google die Page mal irgendwann aufnimmt, oder muß ich jetzt zusehen, daß ich 2499 Links von außen darauf hinbekomme (Erinnert mich irgendwie an www.helft-kai.de *g*)?!

Ist doch irgendwie albern, daß die Page nicht indiziert wird. Es handelt sich nunmal um eine ganz einfache Unternehmenswebseite, wer soll schon auf sowas linken?

Gruß,
_Dirk
(der mal ein paar Robotfallen aufstellen geht. Roadrunner muß doch zu fassen sein..... möööööt mööööööööööt!)

P.S. : Chräcker, kannst Du mir mal Deine Mail an Google ausleihen? Dann muß ich da nicht selbst rumformulieren... ;-)))

  1. Hallo Schuer:

    Jetzt hab ich mir mal mal ein paar Infos zu Google angelesen und festgestellt, daß Google die Seite scheinbar nicht aufnimmt, weil keinerlei Links von außen darauf zeigen, und diese Link ja scheinbar die Qualität einer Webseite bestimmen.

    Google indiziert sowieso nach eignen Kritierien und nicht völlig nachvollziehbar, und Googles Nutzung oder Nichtnutzung von robots.txt ist ja sowieso schon legendär :-)

    Meine Frage nun : Hab ich eigentlich Chancen, daß Google die Page mal irgendwann aufnimmt, oder muß ich jetzt zusehen, daß ich 2499 Links von außen darauf hinbekomme

    Wahrscheinlich.
    Bei meiner - nicht besonders repräsentativen und deshalb nicht mit einem Link bedachten - Seite warte ich jedenfalls schon etwas lange auf eine Indizierung von Google.

    Ist doch irgendwie albern, daß die Page nicht indiziert wird. Es handelt sich nunmal um eine ganz einfache Unternehmenswebseite, wer soll schon auf sowas linken?

    Du auf deinen Seiten vielleicht?

    emu
    [google seit einem kleineren projekt eher schief anschauend]
    [unqualifiziert über google schimpfend]

  2. Mahlzeit!

    Also wenn es die angegebene Ulrich-Krampe-Seite ist, dann könnte es an dem Robot-Meta-Tag auf der index-Seite liegen: "noindex, follow".

    Schreib` da mal "index, follow" hin und dann müsste es klappen.

    Gruß

    Philipp

    1. Hi Philipp,

      Also wenn es die angegebene Ulrich-Krampe-Seite ist, dann könnte es an dem Robot-Meta-Tag auf der index-Seite liegen: "noindex, follow".
      Schreib` da mal "index, follow" hin und dann müsste es klappen.

      Die index.htm steht auf "index, follow", leitet allerdings sofort auf index-js (javascript) oder index-nonjs (kein javascript) weiter, und DIE widerum stehen auf noindex.

      Vielleicht mag Google ja nicht, daß auf der index.htm eigentlich kein Inhalt steht... *amKopfkratz*

      Gruß,
      _Dirk

      1. Mahlzeit 3.!

        Ok, hatte meine P.S. Message früher angefangen zu schreiben, als Du Deine Antwort gepostest hattest.

        Nachdem ich mir jetzt mal die Index-Seite angeschaut habe, fällt mir eigentlich nur noch ein:

        a) kein Inhalt

        b) keine Links wo es weitergeht.

        Gruß

        Philipp

        1. Hi Philipp,

          a) kein Inhalt

          b) keine Links wo es weitergeht.

          Mag sein, daß Google mir das übelnimmt. Was soll eine Suchmaschine auch mit einer Seite, auf der nix steht und wo's (scheinbar) nicht weitergeht?

          Danke für den Hinweis!

          Gruß,
          _Dirk
          [der sich überlegt, den Text von "Krieg und Frieden" auf der index-Seite einzufügen :-)]

          1. ... oder wie wäre es mit dem 26-bändigen Brockhaus?

            Ich wette, die Seite würde bei jeder Suchanfrage egal zu welchem Thema ganz oben als Nummer 1 stehen!

            :-)  :-)

            Gruß

            Philipp

          2. Hallo,

            [der sich überlegt, den Text von "Krieg und Frieden" auf der
            index-Seite einzufügen :-)]

            Oh, ein wunderbares Buch, haben viel zu viele Leute "Angst" vor, viel leichter zu lesen als sein Ruf.... äh, nur so am Rande erwähnt ;-))))

            Chräcker

    2. Mahlzeit zum zweiten!

      Vielleicht liegt es auch daran, das es auf der index Seite überhaupt keinen (Text)content gibt?

      Schreib doch wenigstens mal ein paar Meta-Tags rein "description" und "keywords".

      Mit "follow ist wahrscheinlich nicht viel, weil der Link ein Javascript-Link ist und die meisten Robots (hab`ich mal irgendwo gelesen) Javascript-Links nicht folgen (können).

      So long

      Philipp

  3. ^^^^^^^^^^^^^^^^^^^^^^^

    Hi, Dirk

    Meine Frage nun : Hab ich eigentlich Chancen, daß Google die Page mal irgendwann aufnimmt, oder muß ich jetzt zusehen, daß ich 2499 Links von außen darauf hinbekomme

    2497, s. oben ;-)

    Wäre interessant zu wissen, was der Googlebot gemacht hat, als er die erste Seite überhaupt indizierte...

    LG Orlando

    1. Hi Orlando,

      2497, s. oben ;-)

      *g*...Danke! ;-)

      Wäre interessant zu wissen, was der Googlebot gemacht hat, als er die erste Seite überhaupt indizierte...

      Das wüßte ich auch gern.

      7 Googlebot/2.1 (+http://www.googlebot.com/bot.html) 2 3.08 87 0.05   <--- aus den Logs

      Wahrscheinlich hat er ein Häufchen gemacht und ist weitergezogen...

      Gruß,
      _Dirk
      (will den Googlebot lebend fangen)

      P.S. : 2496 ;-)

      1. Hi Dirk,

        7 Googlebot/2.1 (+http://www.googlebot.com/bot.html)
        2 3.08 87 0.05   <--- aus den Logs

        und was genau wollte er dort? Das steht auch in den Logs.

        Viele Grüße
              Michael

        1. Hi Michael,

          und was genau wollte er dort? Das steht auch in den Logs.

          Er kam, sah und siegte ;-)
          Hat / und /robots.txt angefordert, und dann naserümpfend die Arena verlassen. Anscheinend mag er weder Javascript noch Weiterleitungen.

          Gruß,
          _Dirk

          1. Hi, Dirk

            Hat / und /robots.txt angefordert, und dann naserümpfend die Arena verlassen. Anscheinend mag er weder Javascript noch Weiterleitungen.

            Das betrifft nicht nur Google, sondern alle Suchmaschinen, da mit beiden Methoden extensiv Schindluder betrieben wurde (wird). Was spricht denn gegen etwas Inhalt auf der Startseite? Ist diese Firma denn soo uninteressant? *scnr*

            LG Orlando ;-)

            1. Hi Orlando,

              Was spricht denn gegen etwas Inhalt auf der Startseite? Ist diese Firma denn soo uninteressant? *scnr*

              Nein, Du hast ja recht, nur hab ich bisher noch nie darüber nachgedacht. Ist ja auch alles in Arbeit jetzt, allerdings wohl erst morgen... *gäääääähn*

              Gruß,
              _Dirk
              (der jetzt nur noch irgendwie Yahoo ködern muß)

          2. Hi Dirk,

            Hat / und /robots.txt angefordert, und dann naserümpfend die Arena
            verlassen. Anscheinend mag er weder Javascript noch Weiterleitungen.

            Das hat nichts mit "mögen" zu tun.
            Ein Robot ist einfach kein Browser. Er _kann_ JavaScript nicht so aus-
            werten wie ein Browser. Woher soll er beispielsweise ein Cookie-Gedächtnis
            haben?

            Allerdings werten viele Robots auch nicht alles aus. Sie _könnten_ neben
            <a href> auch <script>, <link>, <frame>, ... verstehen - aber viele tun
            es nicht.

            Insofern wäre in einem <noscript>-Bereich ein ganz harmloser kleiner Link
            auf die Weiterleitungsseite scho ausreichend, um Deinem Gast auf die
            Sprünge zu helfen.

            Noch besser wäre ein Link auf eine Seite, in welcher Du Links auf sämtliche
            Seiten Deiner Site anbietest (natürlich programmgeneriert). Denn der Robot
            hat ja noch anderes zu tun, als Deine Site bis in ihre tiefsten Ecken aus-
            zuloten - die Welt ist voller anderer Sites, die ebenfalls darauf warten,
            indexiert zu werden.
            Manch ein Robot könnte also auf die Idee kommen "Was der Besucher nicht mit
            drei Mausklicks erreichen kann, das kann ja nicht so wichtig sein" und bei
            der Traversierung Deines Link-Baums nur ein paar Schritte weit auf unent-
            decktes Territorium vordringen. Da wäre es doch schön, wenn er schon im
            zweiten Schritt alles finden würde, was es zu entdecken gibt ...

            Viele Grüße
                  Michael

            1. Hi Michael,

              Das hat nichts mit "mögen" zu tun.
              Ein Robot ist einfach kein Browser. Er _kann_ JavaScript nicht so aus werten wie ein Browser. Woher soll er beispielsweise ein Cookie-Gedächtnis haben?

              Ok, mit "mögen" hab ich's vielleicht falsch ausgedrückt. Klar hatte er auf meiner Page nicht viele Chancen : Es gab kein Link, dem er folgen konnte, noch gab es für ihn irgendeinen brauchbaren Inhalt. Nur wußte ich nicht, daß der Bot in der Hinsicht so konsequent ist, was ja sicherlich kein Nachteil ist.

              Insofern wäre in einem <noscript>-Bereich ein ganz harmloser kleiner Link auf die Weiterleitungsseite scho ausreichend, um Deinem Gast auf die Sprünge zu helfen.

              Hat sich schon besser gelöst. Siehe mein Endposting oben.

              Noch besser wäre ein Link auf eine Seite, in welcher Du Links auf sämtliche Seiten Deiner Site anbietest (natürlich programmgeneriert)

              Also ein Link von der Indexseite auf eine Sitemap, so daß der Robot innerhalb von 3 Ebenen sämtliche Inhalte der Page erfassen kann? Gute Idee...

              Na ja, hab das Problem ja hoffentlich jetzt gelöst. Danke für Deine Hilfe!

              Gruß,
              _Dirk

              1. Tach auch,

                Noch besser wäre ein Link auf eine Seite, in welcher Du Links auf sämtliche Seiten Deiner Site anbietest (natürlich programmgeneriert)

                Also ein Link von der Indexseite auf eine Sitemap, so daß der Robot innerhalb von 3 Ebenen sämtliche Inhalte der Page erfassen kann? Gute Idee...

                Das scheint wirklich recht gut zu funktionieren. Ich habe gerade mal getestet wieviel Google von meiner "World Tour of Scotland" Site hat: Die Site habe ich glaube ich irgendwann Anfang Januar angemeldet (Die erste Seite ist seit Dezember online). Der Googlebot scheint das letzte Mal so Ende Januar dagewesen, zumindest ist das der Zeitraum laut dem Google Cache (Aktualisierungsdatum steht auf den Seiten). Gleich von der Startseite geht ein Link zur Sitemap und alle Seiten die zu dem Zeitpunkt existierten habe ich bei Google gefunden. Sind zugegebenermassen noch nicht viele, aber das Prinzip scheint zu stimmen.

                Gruss,
                Armin

                1. Hallo Armin!

                  aber das Prinzip scheint zu stimmen.

                  Obwohl (old) Atomic Eggs in einem Frameset daher kommt, hatte ich nie Probleme mit der Indexierung in Suchmaschinen, vor allem kann ich mich über Google nicht beklagen:

                  Von zur Zeit 15 ausgewerteten Suchmaschinen kamen insgesamt 1861 Besucher, davon:

                  1527 Besucher über Google!
                  97 Besucher über Lycos!
                  86 Besucher über Yahoo!
                  62 Besucher über Google-Yahoo!
                  44 Besucher über Web.de!
                  15 Besucher über Fireball!
                  14 Besucher über MSN-Search!
                  10 Besucher über AllTheWeb!
                  4 Besucher über MetaGer (Uni Hannover)!
                  2 Besucher über Excite!
                  Noch keine Besucher über GoTo!
                  Noch keine Besucher über Altavista!
                  Noch keine Besucher über MetaCrawler.de!
                  Noch keine Besucher über Infoseek!
                  Noch keine Besucher über MetaCrawler.com!

                  Als ich Atomic Eggs mit Frames baute, hatte ich mich als Navigation für den leider vom Autor Ivan Peters aufgrund der Browservielfalt und aus Zeitmangel nicht mehr gepflegten Joust Outliner entschieden. Im "Paket" war eine "robots.htm", welche ermöglichte, wenn man sie im fertige Frameset mit dem Joust Outliner geladen hatte, mit einem Click eine Liste der im Outliner verlinkten (also "besuchbaren") Seiten der Site zu erstellen, die man dann lediglich im noscript-Bereich (Joust-Frameset wird ja mit JS generiert) einzufügen brauchte: http://www.atomic-eggs.com/idxstart.html?page=robots.htm - Ich habe den Link zu dieser robots.htm zusätzlich im noframes-Bereich der Tunnelseite (auch ein Frameset) notiert.

                  So werden alle Unterseite gefunden (sind auch alle "Standalone" für Frame-Hasser aufrufbar)!

                  Grüße,
                  Patrick

                  1. Hi Patrick,

                    Ich habe den Link zu dieser robots.htm zusätzlich im noframes-Bereich
                    der Tunnelseite (auch ein Frameset) notiert.

                    In der Tunnelseite (der Domain-Wurzel, wo meine Besucher die Wahl zwischen
                    Frames und normaler Navigation haben) habe ich nix drin, was den Robot
                    sonderlich interessieren könnte.
                    Per Suchmaschine möchte ich die Leute auf substantielle Seiten führen.

                    Im Haupt-Frame habe auch ich im <noframes>-Bereich einen Link auf
                       http://www.schroepl.net/_tools/files/
                    drin; dafür habe ich mir ein kleines Perl-Skript geschrieben, das ich
                    jedesmal laufen lassen, bevor ich irgendwas neu hoch lade.

                    Die frameslose Startseite enthält ohnehin Links auf alle Hauptbereiche,
                    aber insbesondere auch den Link auf die Dateiliste.

                    So werden alle Unterseite gefunden (sind auch alle "Standalone" für
                    Frame-Hasser aufrufbar)!

                    Ich hoffe, daß das bei mir auch der Fall ist. Ich habe das mal gebaut,
                    als ich endlich SSI hatte (die ganzen Inhalte habe ich alle nicht doppelt),
                    aber schon seit Ewigkeiten nicht mehr getestet.

                    Viele Grüße
                          Michael

  4. Hallo zusammen,

    ich hab mal als Studienprojekt eine Webseite für ein mittelständisches Unternehmen gemacht. Mal abgesehen davon, daß Yahoo sie bis heute noch nicht ins Verzeichnis aufgenommen hat (Hallo Yahoo, arbeitet da auch jemand bei euch, oder daddelt ihr den ganzen Tag über Moorhuhn 3?!) weigert sich Google strickt, sie zu indizieren (der Robot ist schon ein paarmal vorbeigekommen, aber ich hab ihn immer verpaßt, sonst hätte ich ihn zur Rede gestellt oder versucht, ihn mit Hundekeksen zu bestechen!).

    Moin,
    es gibt ja auch noch andere Suchmaschinen - und wenn man in vielen Suchmaschinen verzeichnet ist - wirkt sich das auch wieder positiv auf die Eintragung bei Google aus.
    Ich habe gute Erfahrungen mit "Fireball" gemacht. Bisher war es meistens so, dass sie relativ schnell eintragen. So kann man am nächsten Tag schon nachsehen, ob die Eintragung erfolgreich war, und ob man unter den erwünschten Themen gefunden wird. ... und dann geht es ans Nachbessern (wenn die anderen Firmen eine bessere Eintragungs-Strategie haben).
    Die ganz grobe Einteilung, ob man die Seiten richtig strukturiert hat, findet man (auch Frau) vielleicht hier: http://www.webmasterplan.com
    Einfach mal ausprobieren. Wenn man zu lange allein in der Kammer herumprobiert, kann es doch sein, dass man einige Dinge übesieht, und die webmasterplanseite überprüft die Eintragung, die Links und auch noch andere Dinge online.
    Dann würde ich mir auch mal andere Suchmaschinen ansehen. Ich meine wirklich "ansehen", denn bei einigen lohnt sich der Eintrag wirklich nicht. Sie haben insgesamt sehr weníg Einträge und sicherlich auch nicht mehr Zugriffe als der Keitumer Angelverein.
    Eintragung in Suchmaschinen bedeutet richtig Arbeit - auch nachher für die Optimierung. Google macht da keine Ausnahme!
    Viel Erfolg
    CPG

  5. Hallo,

    ;-) woher wißt Ihr nur, daß ich Threads mit dem begriff Google so gerne lese? ;-)

    Ich könnte Dir, das würde die Sache für Dich vereinfachen, eine der ersten gleichlautenden Antworten von google weiterleiten, aber die wirst Du sinngemäß schon kennen: "wir haben PageRanking, PageRanking ist patentreif und bewertet die Wichtigkeit einer Seite auch und viel anhand der Anzahl der links" - (nur natürlich alles in Englisch)

    Chräcker

    1. Hallo Chräcker!

      ;-) woher wißt Ihr nur, daß ich Threads mit dem begriff Google so gerne lese? ;-)

      Ja, ich habe mich schon gefragt, wo Du die ganze Zeit bleibst ;-)

      Grüße,
      Patrick

      1. Hallo,

        Ja, ich habe mich schon gefragt, wo Du die ganze Zeit bleibst ;-)

        wollte mich nicht von meiner Statstik trennen, die Östereicher haben meine Seite überfallen ,-)))

        Chräcker

  6. Hallo nochmal,

    also, ich denke, ich habe jetzt eine Lösung für das Problem. Da auf der index-Seite nichts weiter ist als eine Weiterleitung für JS und Nicht-JS, und ansonsten keinerlei Inhalt, scheint Google die Page dezent übersehen zu wollen.

    Ich werde jetzt einfach den Non-JS-Bereich auf die index-Seite verlegen, da das in Sachen Usability sowieso der freundlichere Variante ist. Somit kriegen auch Nicht-JS-Benutzer endlich einen Inhalt zu sehen (Hab ich mich bisher drum gedrückt, ist nicht gerade die feine Art gewesen).

    Damit sollten dann wohl alle Probleme mit Google gelöst sein. Danke euch allen für die Hinweise!

    Gruß,
    _Dirk

    1. Und nochmal Hallo!

      Wollte ja eigentlich schlafen gehen, aber es ließ mich nicht los ;-)
      Jetzt hab ich also die index-Seite mit Inhalt versehen, so daß auch Besucher mit deaktiviertem Javascript was zu sehen bekommen. Weiterleitung nur noch, wenn JS aktiviert ist.

      http://www.ulrich-krampe.de

      Dadurch sollte mein Freund Googlebot nun auch endlich zufriedengestellt sein, hoffe ich! Ich werd mich mal verstecken und ihn vorsichtig anlocken... ;-)

      Nochmal danke euch allen!

      Gruß,
      _Dirk