molily: Google und Flash

Beitrag lesen

Wenn das so weitergeht, dass Google auch diverse proprietaere Formate indiziert, muss man wohl bald ein &as_filetype=html bzw. ein +filetype:html an jede Query anhaengen, damit man von all dem binaeren Schrott verschont bleibt

Ob du es toll findest oder nicht, ein Großteil des Wissens im WWW ist dem Format nach solcher »binärer Schrott«. Ja, es sind wertvolle Informationen. Was glaubst du, wieviele wissenschaftliche Arbeiten in PDF, DOC usw. vorliegen. Das mag dir egal sein, aber es gibt verwundernswerterweise einen Rest der Welt, auf den deine absoluten Aussagen verwundernswerterweise nicht zutreffen müssen. Und ja, auch Flash-Filme haben Inhalte, die sich textuell beschreiben lassen und von Menschen gefunden werden wollen. Nein, die Flashwelt besteht nicht nur aus wenig ergiebigen Intros, Navigationen, Logoanimationen usw., auch wenn das momentan die meisten .swfs im Googleindex sind.

Die Aufgabe von Google ist es, den Benutzern relevante Suchergebnisse zu liefern. Der Dateityp ist dabei erst einmal zweitrangig. (*) Die Aufgabe von Google ist es nicht, die Webautoren dazu zu erziehen, von den manchen Formaten abzusehen und auf im WWW angemessenere gleichwertige Formate umzusteigen, indem solche Ressourcen ignoriert werden. Dass z.B. viele PDFs im Web besser als HTML angeboten werden sollten, ist für die Frage, ob es sinnvoll ist, dass eine Suchmaschine PDFs indiziert, überhaupt nicht relevant. Eine Suchmaschine bietet Zugang zu relevanten Informationen zu den gegebenen Suchbegriffen, ganz gleich, ob sie als HTML-Dokument oder in einem anderen, gar einem sogenannten proprietären Format vorliegen. Dass diese eventuell nicht geöffnet werden können, ist ärgerlich. Aber die hier in Frage kommenden Formate sind in den meisten Fällen lesbar. Für alle anderen Fälle bietet Google eine HTML-Version an, sodass die Quellen hinsichtlich der grundlegenden Zugänglichkeit gleichwertig sind. Würde Google mit Macromedia kungeln, wären HTML-Versionen auch bei Flash möglich.

(*) Google nimmt sowieso alle möglichen halbwegs aus Text bestehenden Quellen in den Index auf. Zum Beispiel Millionen XML-Dokumente, darunter XHTML, RDF, RSS, Atom, SVG, FOAF, XSL. Bei allen wird momentan noch »Dateiformat: Unerkennbar« angezeigt, durchsuchbar sind sie trotzdem.

Mathias