Jnnbo: URL bei Google entfernen

Moin,

eine Unterseite von mir ist plötzlich bei Google gelistet, die dafür nie vorgesehen war. Ich habe ehrlich gesagt auch vergessen in meiner htaccess Datei dieses Google mitzuteilen. Ich könnte jetzt natürlich einfach das Verzeichnis auf dem Server ändern, aber ich würde gerne den kompletten Eintrag gelöscht haben.

Ist dieses irgendwie möglich?

  1. Hallo und guten Abend,

    eine Unterseite von mir ist plötzlich bei Google gelistet, die dafür nie vorgesehen war. Ich habe ehrlich gesagt auch vergessen in meiner htaccess Datei dieses Google mitzuteilen. Ich könnte jetzt natürlich einfach das Verzeichnis auf dem Server ändern, aber ich würde gerne den kompletten Eintrag gelöscht haben.

    Wenn die Seite nicht mehr existiert: HTTP-Status 410

    Wenn allerdings beim normalen, also erlaubten Request noch Content mit Status 200 geliefert wird, hast Du fast keine Chance. Du kannst zwar eine Robots.txt speziell für diesen Request anlegen und/oder parametrisieren, aber was einmal in den Suchmaschinen drin ist, wandert dann auch schnell zu den andren Suchmaschinen, usw.

    Alternativ kannst du die Ressource ja noch mit AUTH beleegen, wenn sie denn online bleiben soll, aber nicht für Jeden.

    Grüße
    TS

    1. Hallo TS,

      danke für deine Antwort.

      [...] aber was einmal in den Suchmaschinen drin ist, wandert dann auch schnell zu den andren Suchmaschinen, usw.

      Daran habe ich noch gar nicht gedacht, ich schau gleich mal bei Bing nach ob diese dort schon vorhanden ist.

      Alternativ kannst du die Ressource ja noch mit AUTH beleegen, wenn sie denn online bleiben soll, aber nicht für Jeden.

      Wäre natürlich eine Lösung, allerdings möchte ich diese Seite (eine Seite von meiner Freundin mit Bildern von ihrem Urlaub usw.) nicht in Verbindung mit meinem Verkauf von Toner bringen. Sie hat nichts zu verbergen aber ich finde es etwas unseriös wenn jemand nach meiner Firma googelt und dann auf die besagte Seite kommt.

      Deshalb wollte ich diese irgendwie komplett löschen lassen.

      1. Hallo und guten Abend,

        Alternativ kannst du die Ressource ja noch mit AUTH beleegen, wenn sie denn online bleiben soll, aber nicht für Jeden.

        Wäre natürlich eine Lösung, allerdings möchte ich diese Seite (eine Seite von meiner Freundin mit Bildern von ihrem Urlaub usw.) nicht in Verbindung mit meinem Verkauf von Toner bringen. Sie hat nichts zu verbergen aber ich finde es etwas unseriös wenn jemand nach meiner Firma googelt und dann auf die besagte Seite kommt.

        Deshalb wollte ich diese irgendwie komplett löschen lassen.

        Vergiss es!

        Bitte gib uns doch mal einen Hínweis darauf, wie die Ressourcen im Domainbaum liegen.

        Du könntest dafür eventuell ja auch eine Subdomain aufmachen und für den derzeitigen Pfad ein Rewriting oder eine Umleitung einrichten.

        Grüße
        TS

        1. Hallo TS,

          Bitte gib uns doch mal einen Hínweis darauf, wie die Ressourcen im Domainbaum liegen.

          auf meinem Server gibt es ein Ordner /html in diesem habe ich weitere Ordner liegen. Ein Ordner zu meiner Hauptseite und einer eben für die Subdomain. Wenn ich eine Subdomain anlege habe ich die Möglichkeit zu sagen, in welchen Ordner geschaut werden soll.

        2. Hallo und guten Abend,

          Moin!

          Vergiss es!

          Zumindest bei Google kann man die Seite durchaus löschen, wenn man ein Konto für die Webmaster-Tools hat:

          Bitte die kleine Feinheit beachten, dass ich nicht grundlos anonym poste. Ich will Wissen teilen, welches ich offiziell nicht zu haben beabsichtige.

          1. (Bild hochladen ging nicht... Dann Absturz des Browsers....)

            Zumindest bei Google kann man die Seite durchaus löschen, wenn man ein Konto für die Webmaster-Tools hat:

            Statt Bild:

            Webmaster-Tools, Menü links
            - Search-Console
            -- Google-Index
            --- Urls entfernen
            
            1. Hallo,

              Webmaster-Tools, Menü links
              - Search-Console
              -- Google-Index
              --- Urls entfernen
              

              danke dir, habe ich mal eingetragen

              Alternativ-Text

              1. Hallo,

                Webmaster-Tools, Menü links
                - Search-Console
                -- Google-Index
                --- Urls entfernen
                

                danke dir, habe ich mal eingetragen

                Alternativ-Text

                Jetzt noch:

                Eintragung der URL in die robots.txt Datei,

                Verwendung des Meta Robots Noindex Befehl oder

                Den Inhalt nur nach erfolger Anmeldung auf der Website verfügbar machen

                sonst ist, wenn es schlecht läuft, die Seite nach 90 Tagen wieder im Index.

                1. Hallo Kay,

                  Jetzt noch: Eintragung der URL in die robots.txt Datei, Verwendung des Meta Robots Noindex Befehl oder Den Inhalt nur nach erfolger Anmeldung auf der Website verfügbar machen sonst ist, wenn es schlecht läuft, die Seite nach 90 Tagen wieder im Index.

                  hab von Google gerade die Rückmeldung erhalten, die Domain ist erfolgreich aus dem Index gelöscht: http://forum.selfhtml.org/self/2015/aug/1/url-bei-google-entfernen/1646992#m1646992

                  Jetzt werde ich die Subdomain löschen. Meine Freundin hat eine eigene URL erhalten, da kann sie hochladen was sie will :)

                  Hoffentlich bekomme ich dieses bei Bing.com genauso einfach geregelt.

        3. Hallo TS,

          Vergiss es!

          so schnell sollte man es nicht vergessen :)

          Gerade von Google die Rückmeldung erhalten, dass die Domain erfolgreich aus dem Index gelöscht wurde.

          Alternativ-Text

          1. Hallo und guten Morgen,

            Vergiss es!

            so schnell sollte man es nicht vergessen :)

            Gerade von Google die Rückmeldung erhalten, dass die Domain erfolgreich aus dem Index gelöscht wurde.

            Alternativ-Text

            Und was ist mit den anderen 50 - 100 Suchmaschinen? Nehmen die das auch automatisch aus ihrem Index? Vielleicht ist der URL heute noch gar nicht drin im öffentlichen Teil und in zwei bis drei Wochen kommt er dann hoch?

            Das einfachste wird sein:
            ALten URL mit Header 410 belegen, Content verlegen unter neuem URL in einen Bereich, wo er nicht stört.

            Grüße
            TS

            1. Hallo TS,

              Und was ist mit den anderen 50 - 100 Suchmaschinen? Nehmen die das auch automatisch aus ihrem Index? Vielleicht ist der URL heute noch gar nicht drin im öffentlichen Teil und in zwei bis drei Wochen kommt er dann hoch?
              Das einfachste wird sein:
              ALten URL mit Header 410 belegen, Content verlegen unter neuem URL in einen Bereich, wo er nicht stört.

              auf Bing kann ich noch Einfluss nehmen auf die anderen, die mir @Matthias Apsel gezeigt hat, kann ich leider kein Einfluss nehmen, was aber auch nicht ganz so schlimm ist. Für mich ist es erstmal wichtig, dass ich bei Google und Bing raus komme.

              Wie in einem anderen Beitrag vorhin geschrieben, die Subdomain habe ich komplett gelöscht, meine Freundin hat eine eigene Domain erhalten. Ich hoffe die anderen merken auf dieser "nicht mehr vorhanden Subdomain" gibt es nichts zu sehen und löschen dann den Eintrag irgendwann raus.

  2. Hallo Jnnbo,

    eine Unterseite von mir ist plötzlich bei Google gelistet, die dafür nie vorgesehen war. Ich habe ehrlich gesagt auch vergessen in meiner htaccess Datei dieses Google mitzuteilen.

    hier verwechselst du wahrscheinlich .htaccess mit robots.txt

    Ich könnte jetzt natürlich einfach das Verzeichnis auf dem Server ändern, aber ich würde gerne den kompletten Eintrag gelöscht haben.

    Das geht, wenn persönliche Daten betroffen sind. Aber auch dann nur unvollständig. Aktuelle Nachrichten dazu findest du bestimmt. Der EuGH soll sich wieder damit beschäftigen (google.de vs. google.com)

    Ansonsten würde ich das Verzeichnis ändern, die robots.txt anpassen, dann erledigt sich das mit der ursprünglichen Seite von selbst.

    Bis demnächst
    Matthias

    --
    Signaturen sind bloed (Steel) und Markdown ist mächtig.
    1. Hallo Matthias,

      hier verwechselst du wahrscheinlich .htaccess mit robots.txt

      danke dir, genau ich habe mich vertan. Auf http://wiki.selfhtml.org/wiki/Grundlagen/Robots habe ich gelesen, dass ich mit

      User-agent: *
      Disallow: /
      

      alle Suchmaschinen aussperren kann. Halten diese sich auch wirklich daran und wenn ich diesen Eintrag bei einer Subdomain einfüge, ist meine Hauptdomain davon nicht betroffen?

      1. Hallo und guten Abend,

        danke dir, genau ich habe mich vertan. Auf http://wiki.selfhtml.org/wiki/Grundlagen/Robots habe ich gelesen, dass ich mit

        User-agent: *
        Disallow: /
        

        alle Suchmaschinen aussperren kann. Halten diese sich auch wirklich daran und wenn ich diesen Eintrag bei einer Subdomain einfüge, ist meine Hauptdomain davon nicht betroffen?

        Wo wohnt der Weihnachtsmann ?

        Grüße
        TS

        1. Hallo TS,

          Wo wohnt der Weihnachtsmann ?

          willst du mich jetzt verarschen oder willst du meine Frage ins lächerliche ziehen? Oder verstehe ich dich einfach nur falsch?

          1. Hallo Jnnbo,

            Wo wohnt der Weihnachtsmann ?

            willst du mich jetzt verarschen oder willst du meine Frage ins lächerliche ziehen? Oder verstehe ich dich einfach nur falsch?

            Er/Sie möchte damit zum Ausdruck bringen, dass

            a) es naiv wäre zu glauben, Suchmaschinen interessieren die Verbote in der robots.txt und
            b) jede Information, die abgegriffen werden kann auch abgegriffen wird.

            Bis demnächst
            Matthias

            --
            Signaturen sind bloed (Steel) und Markdown ist mächtig.
            1. Hallo Matthias,

              Er/Sie möchte damit zum Ausdruck bringen, dass a) es naiv wäre zu glauben, Suchmaschinen interessieren die Verbote in der robots.txt und
              b) jede Information, die abgegriffen werden kann auch abgegriffen wird.

              es ist irgendwie traurig, dass Suchmaschinen sich scheinbar alles erlauben dürfen :/ Wenn es nach mir ginge dürfte eine Suchmaschine gar nichts, erst mit ausdrücklicher Genehmigung darf die Seite aufgenommen werden,

              Wie sieht es mit Bildern aus, die ich auf meiner Seite nutzten, aber nicht an dritter weiter geben darf (wir reden hier nicht von der Cloud :-) )?. Plötzlich werden die Bilder in den Suchmaschinen gefunden, wer ist der Arsch? Bestimmt ich?

              1. Hallo Jnnbo,

                Wie sieht es mit Bildern aus, die ich auf meiner Seite nutzten, aber nicht an dritter weiter geben darf (wir reden hier nicht von der Cloud :-) )?. Plötzlich werden die Bilder in den Suchmaschinen gefunden, wer ist der Arsch? Bestimmt ich?

                Das ist eine gute Frage. Mein Rechtsempfinden sagt mir, dass die Indizierung deiner Inhalte (und damit auch der Bilder) keine unerlaubte Weitergabe deinerseits im Sinne des UrhG ist. Ob der Suchmaschinenbeitreiber dabei einen Rechtsverstoß begeht, steht auf einem anderen Blatt.

                Bis demnächst
                Matthias

                --
                Signaturen sind bloed (Steel) und Markdown ist mächtig.
              2. Tach,

                es ist irgendwie traurig, dass Suchmaschinen sich scheinbar alles erlauben dürfen :/ Wenn es nach mir ginge dürfte eine Suchmaschine gar nichts, erst mit ausdrücklicher Genehmigung darf die Seite aufgenommen werden,

                das würde das Prinzip der Suchmaschine ad absurdum führen, angefangen damit, dass du die Suchmaschine, die ich primär nutze, nichtmal kennst. Deswegen gibt es ja den Standard zur robots.txt, um dir zu ermöglichen, das indexen zu steuern.

                Wie sieht es mit Bildern aus, die ich auf meiner Seite nutzten, aber nicht an dritter weiter geben darf (wir reden hier nicht von der Cloud :-) )?.

                Wenn du sie nicht weitergeben darfst, haben sie nichts im frei verfügbaren Netz zu suchen, sondern nur in Bereichen, die eine Authentifizierung erfordern. Security by Obscurity funktioniert nicht.

                mfg
                Woodfighter

      2. Tach,

        Halten diese sich auch wirklich daran und wenn ich diesen Eintrag bei einer Subdomain einfüge, ist meine Hauptdomain davon nicht betroffen?

        ja (also die gutartigen), es führt auch dazu, dass die Dateien bei der nächsten Indexaktualisierung rausfliegen und nein (sofern du es nur für die Subdomain auslieferst).

        mfg
        Woodfighter

      3. Hallo Jnnbo,

        danke dir, genau ich habe mich vertan. Auf http://wiki.selfhtml.org/wiki/Grundlagen/Robots habe ich gelesen, dass ich mit

        User-agent: *
        Disallow: /
        

        alle Suchmaschinen aussperren kann. Halten diese sich auch wirklich daran

        im verlinkten Artikel heißt es: „[Es] besteht auch keinerlei Garantie, dass sich Suchmaschinen an die Verbote in robots.txt halten. Ordentlich programmierte Robots beachten die Datei, aber Robots, die mit bösen Absichten das Web durchsuchen, halten sich vermutlich nicht daran. Wenn Sie Informationen sicher vor allen Augen verstecken wollen, richten Sie z.B. einen Passwortschutz ein.“

        und wenn ich diesen Eintrag bei einer Subdomain einfüge, ist meine Hauptdomain davon nicht betroffen?

        Die robots.txt hat nur Auswirkungen auf „ihre“ Domain, von übergeordneten Domains „weiß“ sie nichts.

        Bis demnächst
        Matthias

        --
        Signaturen sind bloed (Steel) und Markdown ist mächtig.
        1. Hallo Matthias,

          im verlinkten Artikel heißt es: „[Es] besteht auch keinerlei Garantie, dass sich Suchmaschinen an die Verbote in robots.txt halten. Ordentlich programmierte Robots beachten die Datei, aber Robots, die mit bösen Absichten das Web durchsuchen, halten sich vermutlich nicht daran. Wenn Sie Informationen sicher vor allen Augen verstecken wollen, richten Sie z.B. einen Passwortschutz ein.“

          ich gehe mal davon aus, dass Google und Bing sich daran halten werden. Ehrlich gesagt kenne ich keine weite Suchmaschinen.

          Die robots.txt hat nur Auswirkungen auf „ihre“ Domain, von übergeordneten Domains „weiß“ sie nichts.

          Ok, hab eine robots.txt in das Verzeichnis für die Subdomain gelegt.

        2. Hi,

          im verlinkten Artikel heißt es: „[Es] besteht auch keinerlei Garantie, dass sich Suchmaschinen an die Verbote in robots.txt halten. Ordentlich programmierte Robots beachten die Datei, aber Robots, die mit bösen Absichten das Web durchsuchen, halten sich vermutlich nicht daran.

          Ich könnte mir durchaus vorstellen, daß ein bösartiger Robot sich sehr genau an die Robots.txt hält - ist doch eine tolle Anleitung zum Auffinden der interessanten Sachen ;-)

          cu,
          Andreas a/k/a MudGuard

          1. Hallo MudGuard,

            Ich könnte mir durchaus vorstellen, daß ein bösartiger Robot sich sehr genau an die Robots.txt hält - ist doch eine tolle Anleitung zum Auffinden der interessanten Sachen ;-)

            in der Tat.

            Bis demnächst
            Matthias

            --
            Signaturen sind bloed (Steel) und Markdown ist mächtig.
      4. Liebe Mitdenker, liebe Wissende, liebe Neugierige,

        hier verwechselst du wahrscheinlich .htaccess mit robots.txt

        danke dir, genau ich habe mich vertan. Auf http://wiki.selfhtml.org/wiki/Grundlagen/Robots habe ich gelesen, dass ich mit

        User-agent: *
        Disallow: /
        

        alle Suchmaschinen aussperren kann. Halten diese sich auch wirklich daran und wenn ich diesen Eintrag bei einer Subdomain einfüge, ist meine Hauptdomain davon nicht betroffen?

        Dazu müssten sie ja zumindest danach suchen. Wenn ich so in unsere Logs gucke, dann tummeln sich da so zwischen 30 und 50 sogenannte Suchmaschinen, aber nur zwei davon gucken überhaupt nach der robots.txt.

        Spirituelle Grüße
        Euer Robert
        robert.r@online.de

        --
        Möge der wahre Forumsgeist ewig leben!
        1. Hallo robertroth,

          Dazu müssten sie ja zumindest danach suchen. Wenn ich so in unsere Logs gucke, dann tummeln sich da so zwischen 30 und 50 sogenannte Suchmaschinen, aber nur zwei davon gucken überhaupt nach der robots.txt.

          es gibt so viele Suchmaschinen? :O OK, von diesen 30 - 50 sind vielleicht 3 - 5 wirklich bekannt? Mir fallen derzeit nur Google, Bing, Yahoo, Lycos und Fireball (war meine erste Suchmaschine die ich überhaupt kannte und die damals sehr bekannt war) ein.

          1. Hallo Jnnbo,

            es gibt so viele Suchmaschinen?

            http://t3n.de/news/google-alternative-474551/

            Bis demnächst
            Matthias

            --
            Signaturen sind bloed (Steel) und Markdown ist mächtig.
          2. Hallo und guten Morgen,

            Dazu müssten sie ja zumindest danach suchen. Wenn ich so in unsere Logs gucke, dann tummeln sich da so zwischen 30 und 50 sogenannte Suchmaschinen, aber nur zwei davon gucken überhaupt nach der robots.txt.

            es gibt so viele Suchmaschinen? :O OK, von diesen 30 - 50 sind vielleicht 3 - 5 wirklich bekannt? Mir fallen derzeit nur Google, Bing, Yahoo, Lycos und Fireball (war meine erste Suchmaschine die ich überhaupt kannte und die damals sehr bekannt war) ein.

            Hir eine kleine Liste, nicht mehr aktuell, abe die meisten gibt es noch
            http://www.weihenstephan.de/~schlind/suchmaschinen.html

            Grüße
            TS

    2. Hallo und guten Abend,

      Ansonsten würde ich das Verzeichnis ändern, die robots.txt anpassen, dann erledigt sich das mit der ursprünglichen Seite von selbst.

      Wo wohnt der Weihnachtsmann ?

      Ich suche noch Mitstreiter für den Aufbau einer solchen Seite. Diese fand ich letztens beim Stöbern. Leider tut sich dort nichts :-?

      Grüße
      TS

      1. Hallo TS,

        http://weihnachten-nicht-allein.de

        Ich suche noch Mitstreiter für den Aufbau einer solchen Seite. Diese fand ich letztens beim Stöbern. Leider tut sich dort nichts :-?

        klingt interessant. Was schwebt dir vor?

        Bis demnächst
        Matthias

        --
        Signaturen sind bloed (Steel) und Markdown ist mächtig.