Hörnchen: Auswirkungen barrierefreier Webseiten auf SEO und KI Crawler

Hallo liebe Community,

barrierefreie Webseiten werden immer wichtiger, da es Menschen mit Erkrankungen, Behinderungen und anderen Einschränkungen gibt, die es schwer machen Webseiten zu lesen oder auch ein Screenreader nicht leicht hat. Daher finde ich es wichtig indem Bereich mehr aktiv zu sein.

Meine Frage ist aber eine andere. Wir hatten beim Selfhtml-Treffen das Thema barrierefreie Webseiten und die Rolle von Suchmaschinen, insbesondere KI. Welche Rolle spielt eine barrierefreie Webseite die semantisch aufgebaut ist, aria-Attribute nutzt und weitere Lösungen, für das crawlen von Webseiten bzw. Erfasung von Content einer Webseite in Suchmaschinen und KI?

Ich würde mich über eure Antworten freuen. Falls in meiner Frage ein Denkfehler, Fehler auftritt, könnt ihr mich gerne berichtigen.

Euer Hörnchen

  1. Hallo Hörnchen,

    Ich würde die Einleitung umformulieren:

    Es wird immer wichtiger Webseiten so zu erstellen, dass ihre Inhalte für alle zugänglich sind:

    • für die Menschen, die sie anschauen und lesen, aber auch …
    • für Maschinen, die Inhalte erfassen, um sie weiterzuverarbeiten; z.B. für SEO.

    Meine Frage ist aber eine andere.

    Welche Rolle spielt eine barrierefreie Webseite die semantisch aufgebaut ist, aria-Attribute nutzt und weitere Lösungen, für das crawlen von Webseiten bzw. Erfasung von Content einer Webseite in Suchmaschinen und KI?

    Welchen Einfluss hat eine barrierefreie, semantisch korrekt aufgebaute Webseite – einschließlich der Verwendung von ARIA-Attributen und anderen Accessibility-Techniken – auf das Crawling und die Inhalts­erfassung durch Suchmaschinen und KI?

    Die Algorithmen der großen Firmen sind so geheim wie die Coca Cola-Rezeptur.
    Und trotzdem kann man sagen: Eine Webseite, deren Inhalte nicht verständlich , bzw. nicht relevant sind, wird nur kurz angeklickt.
    Stock Fotos, die nicht unterscheidbar von denen meiner direkten Konkurrenten sind, haben keinen Effekt auf mögliche Kunden.

    Ein LLM (Large Language Model)[1] indiziert ja nicht nur einzelne Begriffe[2], sondern kann Sprache in Zusammenhang setzen und auswerten.

    Und hier kommt mangels harter Fakten anekdotische Evidenz in's Spiel. Patrick hatte uns ja berichtet, dass Kunden mit undurchsichtigen Geschäftsmodellen plötzlich aus den Rankings fielen, weil der Inhalt (=die Preisstruktur und das Abo-Modell) für die LLM keinen Sinn ergaben.

    Da das nicht mein Thema ist, kann ich persönlich hierzu nicht mehr viel sagen.


    Was mir in der Schule und im Kontakt mit den Eltern auffällt: Das sinnerfassende Lesen stellt immer mehr Menschen vor große Hürden.
    Deshalb versuche ich Elternbriefe, Berichte und auch Texte im Wiki so weit es geht zu vereinfachen.
    Leichte Sprache[3] ist mir zu einfach, um komplexe Inhalte zu erklären - die Regeln dazu versuche ich jedoch zu beherzigen.

    Bei der Überarbeitung unserer Schul-Homepage bat ich einige Kollegen um Texte.
    Ein „Schreib du halt irgendetwas!“ führt hier imho nicht zum Erfolg.[4]

    Warum dieser Exkurs? Barrierefreiheit ist eben nicht das Vollpflastern einer Webseite mit aria-Attributen[5], sondern das Verfassen guter Inhalte.

    Herzliche Grüße
    Matthias Scharwies


    1. Large Language Model (wikipedia.org) ↩︎

    2. Erinnert ihr euch an die Meta keywords, bei denen Baumärkte Akkuschrauber mit keywords wie porno versahen, um häufiger in Suchen zu erscheinen? ↩︎

    3. Barrierefreiheit/leichte_Sprache (SELF-Wiki) ↩︎

    4. Ist euch aufgefallen, dass ich innerhalb von Absätzen trotzdem einen Zeilenumbruch bei Satzanfängen mache?
      Ich hoffe, dass das einigen hilft, den Satz in einem Stück lesen zu können ohne am Ende der Zeile erst einmal den Anfang der nächsten Zeile suchen zu müssen. ↩︎

    5. Die 5 ARIA-Regeln:
      1 Verwende kein ARIA, wenn du die gleiche Semantik mit einem nativen HTML-Element oder -Attribut erreichen kannst! ↩︎

  2. Lieber Hörnchen,

    Welche Rolle spielt eine barrierefreie Webseite die semantisch aufgebaut ist, aria-Attribute nutzt und weitere Lösungen, für das crawlen von Webseiten bzw. Erfasung von Content einer Webseite in Suchmaschinen und KI?

    Suchmaschinen lieben semantisch strukturierte Webseiten, damit sie die Relevanz des Contents in Bezug zur Suchanfrage einschätzen können. Die Barrieren für Benutzer interessieren Suchmaschinen herzlich wenig, denn Suchmaschinen parsen alles, auch JavaScript.

    Was KI aus dem Content von Webseiten macht, funktioniert völlig anders. KI möchte die Inhalte je nach Bedarf nachahmen, damit es für den Benutzer so aussieht, als wäre das Ergebnis so ziemlich das, was sich der Benutzer so vorgestellt hat. Dazu ist wahrscheinlich sogar die Semantik des Codes egal.

    Falls in meiner Frage ein Denkfehler, Fehler auftritt, könnt ihr mich gerne berichtigen.

    Frag' doch mal ChatGPT, wie Internetseiten aufgebaut sein sollten, damit ChatGPT optimal die jeweiligen Inhalte zum Trainieren verarbeiten kann!

    Liebe Grüße

    Felix Riesterer