Karl Heinz: URL-Parameter - Majestic MJ12bot - Link Research Tools

Beitrag lesen

Hallo,

ich habe eine Frage zu URL-Parametern.

In Google Analytics-Accounts können die Besucher einer Webseite, sortiert nach den URL-Parametern (utm_source und utm_medium), gelistet werden.

Im Google Analytics Account eines Kunden (www.noni-mode.de) ist mir eine Besucherquelle aufgefallen, deren URL-Parameter ich nicht nachvollziehen kann.

Irgend jemand, der die Webseite meines Kunden aufruft, hat folgende URL-Parameter verwendet:

  • utm_source = noni Webseite
  • utm_medium = link

Was ich nicht nachvollziehen kann ist der Wert für utm_source. Wenn eine Webseite auf meinen Kunden verlinkt, dann wäre doch der Name der verlinkenden Webseite als utm_source sinnig und nicht die Webseite wohin gelinkt wird. Bei utm_source sollte man die Quelle angeben und nicht das Ziel wohin der Link geht (wie oben passiert).

Weil uns unklar war, was genau hier passiert ist, haben wir die Log-Datei des Web-Servers nach der seltsamen Quelle wie folgt durchsucht:

grep utm_source=noni -rin noni-mode.de-2018-01-*

Hier das Ergebnis:

noni-mode.de-2018-01-26:14720:54.236.1.15 - - [26/Jan/2018:08:59:38 +0100] "GET /kollektion/brautkleider-2018-jetzt-entdecken/brautkleid-kurz-alternativ-mit-spitze?utm_source=noni HTTP/1.1" 200 17203 "-" "Mozilla/5.0 (compatible; Pinterestbot/1.0; +http://www.pinterest.com/bot.html)"

noni-mode.de-2018-01-26:61949:167.114.1.124 - - [26/Jan/2018:15:53:34 +0100] "GET /kollektion/noni-brautkleider-2018/braut-pullover-mit-farbigem-tuellrock?utm_source=noni%20Website&utm_medium=link&utm_campaign=Kleid HTTP/1.1" 301 5223 "-" "Mozilla/5.0 (compatible; MJ12bot/v1.4.8; http://mj12bot.com/)"

noni-mode.de-2018-01-26:61959:167.114.1.124 - - [26/Jan/2018:15:54:03 +0100] "GET /kollektion/brautkleider-2018-jetzt-entdecken/braut-pullover-mit-farbigem-tuellrock?utm_source=noni%20Website&utm_medium=link&utm_campaign=Kleid HTTP/1.1" 200 15660 "-" "Mozilla/5.0 (compatible; MJ12bot/v1.4.8; http://mj12bot.com/)"

noni-mode.de-2018-01-26:61965:167.114.1.124 - - [26/Jan/2018:15:54:32 +0100] "GET /kollektion/noni-brautkleider-2018/brautkleid-kurz-alternativ-mit-spitze?utm_source=noni%20Website&utm_medium=link&utm_campaign=Kleid HTTP/1.1" 301 5223 "-" "Mozilla/5.0 (compatible; MJ12bot/v1.4.8; http://mj12bot.com/)"

noni-mode.de-2018-01-26:62059:167.114.1.124 - - [26/Jan/2018:15:54:51 +0100] "GET /kollektion/brautkleider-2018-jetzt-entdecken/brautkleid-kurz-alternativ-mit-spitze?utm_source=noni%20Website&utm_medium=link&utm_campaign=Kleid HTTP/1.1" 200 17354 "-" "Mozilla/5.0 (compatible; MJ12bot/v1.4.8; http://mj12bot.com/)"

noni-mode.de-2018-01-26:62063:167.114.1.124 - - [26/Jan/2018:15:55:13 +0100] "GET /kollektion/noni-brautkleider-2018/brautkleid-mit-tuellrock-und-braut-bluse?utm_source=noni%20Website&utm_medium=link&utm_campaign=Kleid HTTP/1.1" 301 5226 "-" "Mozilla/5.0 (compatible; MJ12bot/v1.4.8; http://mj12bot.com/)"

noni-mode.de-2018-01-26:62065:167.114.1.124 - - [26/Jan/2018:15:55:40 +0100] "GET /kollektion/brautkleider-2018-jetzt-entdecken/brautkleid-mit-tuellrock-und-braut-bluse?utm_source=noni%20Website&utm_medium=link&utm_campaign=Kleid HTTP/1.1" 200 16905 "-" "Mozilla/5.0 (compatible; MJ12bot/v1.4.8; http://mj12bot.com/)"

noni-mode.de-2018-01-29:63719:89.1.122.247 - - [29/Jan/2018:14:42:49 +0100] "GET / HTTP/2.0" 200 21142 "https://shop.noni-mode.de/?utm_source=noni%20website&utm_medium=link&utm_campaign=menu" "Mozilla/5.0 (Windows NT 6.3; Win64; x64; rv:57.0) Gecko/20100101 Firefox/57.0"

Was auffällt ist, dass fast immer der MJ12bot (der Crawler von Majestic) für den seltsamen utm_source Parameter verantwortlich ist.

Bei Majestic handelt es sich, ähnlich bei bei den "Link Research Tools", um ein System mit dessen Hilfe die Linksstruktur von Webseiten analysiert und bewertet wird.

Demnach ist es logisch, dass Mejestic mit seinem MJ12bot-Crawler ständig die Verlinkungen zu Webseiten aufruft.

Was ich allerdings nicht verstehen kann ist, warum der MJ12bot diesen unlogischen utm_source Parameter nutzt.

Meines Erachtens ist:

utm_source=noni%20website

falsch, während

utm_source=majestic-mj12bot

richtig wäre.

Soweit zum meinem Verständnis. Ich befürchte ich habe da einen Denkfehler drin, vielleicht arbeitet der MJ12bot ganz anders und utm_source ist korrekt gesetzt bzw. vielleicht interpretiere ich die Log-Datei falsch und die Anfrage kommt gar nicht vom MJ12bot?

Weiß hier jemand Rat bzw. kann mir jemand sagen was genau hier seitens des MJ12bots passiert?

Ist der MJ12bot überhaupt für die Anfragen mit dem seltsamen utm_source Parameter verantwortlich?

Viele Grüße

--
"Die Deutsche Rechtschreibung ist Freeware, sprich, du kannst sie kostenlos nutzen. Allerdings ist sie nicht Open Source, d.h. du darfst sie nicht verändern oder in veränderter Form veröffentlichen."

akzeptierte Antworten