Anja Gessner: Manipulation von Trefferlisten und Semantic Web

Hallo liebe Forumsteilnehmer,

ich arbeite an einer juristischen Doktorarbeit zum Thema Werbung und Marketing im Internet.
Dabei behandle ich auch die Fälle der Optimierung bzw. missbräuchlichen Manipulation von Webseiten zum Zwecke des Erreichens eines guten
Rankings in den Trefferlisten von Suchmaschinen.

Die Bedeutung einfacher Metatags für das Ranking von Suchmaschinen hat in den letzten
Jahren ja nachgelassen. Wegen der Manipulationsgefahr (viele Metatags, etwa
fremde Marken, wurden missbräuchlicherweise nur dazu verwendet, um Nutzer
auf die jeweilige Seite zu locken) stellen Suchmaschinen heutzutage eher auf manipulations-
unempfindlichere Kriterien ab, die vom Seiteninhalt unabhängig sind (so etwa auf die Link Popularity).

Jetzt ist ja das semantische Web der Zukunft in der Diskussion.

Dazu meine Fragen:

  1. Ist es korrekt, davon auszugehen, dass bei Verwirklichung des semantischen Webs die sogenannten
    Metadaten und damit Metatags (insbesondere Dublin-Core-Tags) auch für das Ranking von Suchmaschinen
    wieder vermehrt an Bedeutung gewinnen, d.h. von Suchmaschinen wie google und Co. wieder (stärker) gewichtet werden?

und 2) Könnte der Ersteller einer Webseite das Ranking in Trefferlisten von Suchmaschinen auch in einem zukünftigen
semantischen Web manipulieren, etwa dadurch, dass er wissentlich falsche Tags oder Definitionen verwendet?

Beispiel: Könnte ein Ersteller einer Pornosite, der es darauf anlegt, in der Trefferliste einer Suchmaschine gefunden zu
werden, die Triples innerhalb des RDF bewusst falsch kodieren und die XML-Tags so gestalten, dass seine Site auch
zukünftig noch in Trefferlisten von Suchmaschinen erscheint, wenn ein Nutzer nach dem Popstar "Madonna" sucht?

Für jede Antwort und jeden Hinweis bin ich sehr dankbar!

Viele Grüße

Anja Gessner

  1. Hallo Anja,

    Dazu meine Fragen:

    1. Ist es korrekt, davon auszugehen, dass bei Verwirklichung des semantischen Webs die sogenannten
      Metadaten und damit Metatags (insbesondere Dublin-Core-Tags) auch für das Ranking von Suchmaschinen
      wieder vermehrt an Bedeutung gewinnen, d.h. von Suchmaschinen wie google und Co. wieder (stärker) gewichtet werden?

    und 2) Könnte der Ersteller einer Webseite das Ranking in Trefferlisten von Suchmaschinen auch in einem zukünftigen
    semantischen Web manipulieren, etwa dadurch, dass er wissentlich falsche Tags oder Definitionen verwendet?

    zu 1)
    auch wenn es wünschenswert wäre - wenn jeder sich in "ehrenwerter" Form dran halten würde - Meta-Tags verlieren an Bedeutung.
    Eben auch wie in Deiner 2. Frage angesprochen, weil sie u.U. nichts mit dem Inhalt der Seite zu tun haben. Eine Gewichtung im Bezug auf Volltext erscheint im Moment sinnvoller.
    _Wenn_ sich die Leute daran halten würden (das kann aber jeder machen wie er will und das ist auch gut!), würde es sehr viel Sinn machen! Es gibt derzeit einfach keine Möglichkeiten, Texte nach Qualität zu suchen. Ich meine, wenn ich eine wissenschaftliche eine Bauanleitung für Möbel... will ich nicht auf eine Seite von Ikea gelenkt werden, sondern eher auf private Seiten/Praktikerseiten, wo jemand mal dokumentiert, wie dies und das bewerkstelligt hat.
    Aber das liegt im Prinzip an der Struktur des Netzes.

    zu 2)
    ist vielleicht schon beantwortet, aber im Prinzip ist es immer das gleiche Spiel: klar, man kann manipulieren, die Suchmaschine versucht das u.U. zu unterbinden. Letztendlich ist es wie überall, ein hin- und her.... ;-)

    Gruß
    Reiner

    1. ... Ich meine, wenn ich eine eine Bauanleitung für Möbel suche... will ich nicht auf eine Seite von Ikea gelenkt werden,...

      meinte ich

    2. Oi,

      1. Ist es korrekt, davon auszugehen, dass bei Verwirklichung des semantischen Webs die sogenannten
        Metadaten und damit Metatags (insbesondere Dublin-Core-Tags) auch für das Ranking von Suchmaschinen
        wieder vermehrt an Bedeutung gewinnen, d.h. von Suchmaschinen wie google und Co. wieder (stärker) gewichtet werden?
        und 2) Könnte der Ersteller einer Webseite das Ranking in Trefferlisten von Suchmaschinen auch in einem zukünftigen
        semantischen Web manipulieren, etwa dadurch, dass er wissentlich falsche Tags oder Definitionen verwendet?
        zu 1)
        auch wenn es wünschenswert wäre - wenn jeder sich in "ehrenwerter" Form dran halten würde - Meta-Tags verlieren an Bedeutung.[...]

      sie fragte nach Bedeutung von Metadaten im _Semantic Web_ - nicht nach den belächelnswerten Versuchen der Ich-mach-mit-FrontPage-Klicki-Bunti-Seiten-und-nenne-mich-deshalb-Webdesigner-Webdesigner, ihre Ergüsse bei Google durch sogenannte "Tricks" nach oben zu ranken.

      Soweit ich das überblicken kann, ist im Semantic Web ein Ranking eher für Software Agents relevant denn für mich als Surfer. Aber in gleicher Weise wird es auch dort für die entsprechenden Algorithmen der Suchmaschinen gleichwertige Suchergebnisse geben, die in einer gewissen Reihenfolge geordnet sein wollen. Daher wird zwangsläufig - wie von Thomas dargelegt - eine Problematik analog zur aktuellen Meta-Tag-Misere die Folge sein. Möglicherweise ist der einzige Weg zu einem halbwegs manipulationsarmen Ergebnis die Nutzung moderierter Systeme à la dmoz...

      HTH Robert

  2. Hallo Anja,

    ich arbeite an einer juristischen Doktorarbeit zum Thema Werbung und Marketing im Internet. [...]

    Das alles hast Du schon mal vor ein paar Stunden geschrieben:
    Dieser Thread ist etwas weiter unten im Forum noch wunderbar zu sehen.
    Kein Grund zur Panik. Wenn jemand dazu etwas schreiben will,
    wird er das frueher oder spaeter tun. Und zwar dort:
    [pref:t=58434&m=327985]

    Doppelpostings sind hier nicht beliebt, steht auch in der FAQ:
    </faq/#Q-06c>

    Gruesse,

    Thomas

    1. Hallo Thomas,

      Das alles hast Du schon mal vor ein paar Stunden geschrieben:

      Danke für den Hinweis, da es dort noch keine Antworten gab, habe ich den anderen Thread gelöscht.

      Grüße
      Thomas

  3. Hallo Anja,

    Dazu meine Fragen:

    Alle deine Fragen sind in dem Sinne hier unbeantwortbar, als außer den Suchmaschinenbetreiben dir niemand sagen kann, was und wie die Suchmaschinen implementieren werden.

    1. Ist es korrekt, davon auszugehen, dass bei Verwirklichung des semantischen Webs die sogenannten
      Metadaten und damit Metatags (insbesondere Dublin-Core-Tags) auch für das Ranking von Suchmaschinen
      wieder vermehrt an Bedeutung gewinnen, d.h. von Suchmaschinen wie google und Co. wieder (stärker) gewichtet werden?

    Auf a) kürzere Sicht vieleicht, b) auf mittelfristige sich sicher nicht, c) auf längerfristige Sicht vielleich.

    a) ich denke, dass die Suchmschinen die DublinCore Elemente auswerten werden (einige machen das bei einigen Elementen bereits heute) ob sie diese jedoch in ihrem Rankin-Algorithmen miteinbeziehen ist wirklich schwer zu sagen.

    b) so wie die "normalen" Metatags heute wegen Missbrauch zum größten Teil ignoriert werden, werden auch die DC-Metatags das selbe Schicksal erleiden

    c) zusammen mit anderen Auswertungskriterien (z.B. Domain, URL etc der verlinkten und/oder beschriebenen Resource) werden auch die DC-Metatags sicherlich eine größere Rolle spielen.

    und 2) Könnte der Ersteller einer Webseite das Ranking in Trefferlisten von Suchmaschinen auch in einem zukünftigen
    semantischen Web manipulieren, etwa dadurch, dass er wissentlich falsche Tags oder Definitionen verwendet?

    Jein.
    Falsche Tags kann er nicht verwenden, denn die Spezifikationen schreiben vor, was für Elemente im RDF oder im DC exisitieren.
    Er kann höchstens die in den DC-Metatags erhaltene Informationen verfälschen: so wie er heute bei "normalen" Metatags dies tun kann.

    Beispiel: Könnte ein Ersteller einer Pornosite, der es darauf anlegt, in der Trefferliste einer Suchmaschine gefunden zu
    werden, die Triples innerhalb des RDF bewusst falsch kodieren und die XML-Tags so gestalten, dass seine Site auch
    zukünftig noch in Trefferlisten von Suchmaschinen erscheint, wenn ein Nutzer nach dem Popstar "Madonna" sucht?

    Mit RDF: nein.
    --------------
    The Resource Description Framework (RDF) is a language for representing information about resources in the World Wide Web. It is particularly intended for representing metadata about Web resources, such as the title, author, and modification date of a Web page, copyright and licensing information about a Web document, or the availability schedule for some shared resource
    --------------

    Da eben Web-Resourcen beschrieben werden, kann er da nichts machen:
    Entweder er gibt seine URL an, oder nicht. (gut, man kann natürlich unverfängliche Domains mit Weiterleitung benutzen: deshalb siehe 1c!)
    Mit anderen Sprachen wie Web Ontology Language werden sie schon gar nichts anfangen können.

    Summa summarum: so wie die Programmierer von Suchmschinen immer neuere Ranking-Alogrithmen schreiben, wird es immer wieder andere geben, die versuchen ebendiese zu unterwandern.

    Grüße
    Thomas

  4. Hallo Anja,

    zur technischen Bewertung können Dir hier andere sicher besser helfen.
    Bei mir wird es bis zu einer eventuellen Promotion noch dauern, mich interessiert der Bereich auch eher aus anderen Gesichtspunkten. Dennoch würde ich die Arbeit, wenn sie fertig ist, gern lesen. Wird es die im Netz geben bzw. wo wird sie denn veröffentlicht werden?

    Gruss, Thoralf

    --
    Sic Luceat Lux!
    1. Hallo Thoralf,

      Wird es die im Netz geben bzw. wo wird sie denn veröffentlicht werden?

      Vermutlich hier: http://www.jura.uni-wuerzburg.de/Lehrstuehle/Scherer/betreute_dissertationen1.htm#p44

      Grüße
      Thomas