Marc Haunschild: Trau schau wem - wie sich die Tech-Giganten beim Datensammeln unterscheiden

Beitrag lesen

Derzeit geht es in der Presse rum: Sprachschnipsel werden von Apple (und den Konkurrenten Google und Amazon) an externe Firmen weitergegeben, um den Sprachassistenten zu verbessern. Dort überprüfen Menschen die Fehler der AI und korrigieren diese gegebenenfalls. Dabei kann auch auf einige Sprecher zurückgeschlossen werden.

Apple wirbt mit Datenschutz. Das dürfte wohl vielen inzwischen aufgefallen sein. Dennoch sind zu recht viele Menschen skeptisch. Leider ist bei vielen ein gesundes Misstrauen aber auch einer resignativen Ansicht gewichen: "Die sind doch eh alle gleich".

Meiner Meinung nach lässt sich das so pauschal nicht sagen und ich habe hier mal meine Gründe für diese Meinung zusammen gefasst.

Zunächst das beste: Apple hat diese Praxis Siri-Sprachschnipsel von Menschen in Drittfirmen auswerten zu lassen, mit sofortiger Wirkung weltweit ausgesetzt.

Hier sieht man schon einen ersten Unterschied zu Konkurrent Google, der diese Praxis auch betrieben und schon einen Monat früher ausgesetzt hat. Aber gezwungenermaßen, nur in der EU und nur bis Oktober.

Apple muss seinen Assistenten selbstverständlich auch weiter verbessern um von der Konkurrenz nicht abgehängt zu werden, das Training der AI wird aber erst wieder aufgenommen, wenn Updates von iOS und macOS vorliegen, die vor der Auswertung der Mitschnitte die Erlaubnis der Nutzer einholen.

Was lässt sich aus den veröffentlichten Informationen herauslesen?

Der Leak belegt, dass

  1. die Gesprächsschnipsel nicht mit einer Apple-ID verknüpft sind
  2. keine Auswertung seitens Apple stattfindet
  3. bei Apple selbst keine Zuordnung von Personen stattfindet
  4. anscheinend nicht (wie bei Google) transkribiert wird
  5. die Weitergabe aller enthaltenen Informationen aufgrund von entsprechenden Verträgen illegal wäre

Der Leak belegt aber auch, dass

  1. externe Mitarbeiter anhand von Informationen in den Gesprächen manchmal auf einzelne Sprecher rückschließen können
  2. die enthaltenen Informationen sehr privater Natur sind
  3. einige der Aufnahmen entstanden sind, weil die AI "Hey Siri" gehört haben will, obwohl etwas anderes gesagt wurde (und somit gar nicht hätte übertragen werden sollen)
  4. Apple diese Praxis nicht ausreichend transparent gemacht hat
  5. dass Apple nicht auf den Umstand hingewiesen hat, dass Sprachassistenten nicht ohne menschliche Unterstützung trainiert werden können

Apple gibt zwar lägst selbst an, auch im Zusammenhang mit dem Sprachassistenten Siri nicht näher spezifizierte Daten zu sammeln, allerdings war das konkrete Ausmaß wohl den wenigstens bewusst. Dass dies nicht früher bekannt wurde, könnte daran liegen, dass Apple auf diese Möglichkeit in der Vergangenheit (weitgehend) verzichtet hat oder das Training nur selbst (nicht mithilfe von Drittfirmen) durchgeführt hat - das würde auch erklären, warum die Konkurrenz in so kurzer Zeit so viel größere Fortschritte erzielt hat.

Ich werfe Google, Facebook und Co. ja vieles vor, aber dass sie ihren Sprachassistenten durch Training verbessern, gehört nicht zu den Dingen, die ich kritisiere. Das ist in meinen Augen eine technische Notwendigkeit, an der auch Apple nicht vorbeikommt, trotz der immensen Anstrengungen, die der Technik-Gigant aus Florida in Bezug auf Datenschutz unternimmt.

chip.de: Apple setzt voll auf Datenschutz: Warum man dabei mächtig Ärger riskiert

Im Übrigen ist Apple die einzige Firma der großen vier (Google, Facebook, Amazon, Apple) deren Geschäftsmodell nicht vom Sammeln von Daten, sondern vom Verkauf selbst entwickelter Hardware abhängt. Allein das iPhone hat am Umsatz von 84 Milliarden Dollar einen Anteil von 52 Milliarden. Dazu kommen Macs, iPads, iPods, Kopfhörer, Geräte von Drittherstellern, Gebühren für Abos und Dienste (z.B. iCloud).

Apple kann es sich daher leisten, in Sachen Datenschutz eine Vorreiter-Rolle einzunehmen, und es ist in meinen Augen geschickt, das zu nutzen, da Google und Facebook mit einem effektiven Datenschutz in der wirtschaftlichen Bedeutungslosigkeit verschwinden würden.

Ebenso wie man einen Sprachassistenten nicht ohne Auswertung der Fehler verbessern kann, kann man keine Werbe- oder soziale Netzwerke ohne Datenanalyse lukrativ betreiben.

Apple tut das nicht, Facebooks und Googles Geschäftsmodelle basieren dagegen ausschließlich auf der Sammlung und Analyse von Nutzerdaten (im Fall von Facebook sogar teilweise auf deren Weitergabe z. B. an die Trumpschen Wahlhelfer).

Bei Amazon bin ich mir da nicht so sicher. Das Kerngeschäft von Amazon ist ein anderes, aber die sind in der Vergangenheit durch sehr „hemdsärmelige“ Geschäftspraktiken aufgefallen, was die Aushebelung von Einfuhrregelungen in die EU und europäische Richtlinien, CE-Zeichen usw angeht. Warum sollten die beim Thema Datenschutz plötzlich Skrupel bekommen?

Ich denke aber es ist wichtig, dass sich nicht das Gefühl breit macht „die sind eh alle gleich“ - denn das stimmt nicht. Es gibt da prinzipielle Unterschiede.

Während Apple Routen-Anfragen anonymisiert und in kurze Teilstücke zerlegt, um nicht zu wissen zu können, wer von wo nach wo fährt, tut Google nach allem was öffentlich erfahrbar ist anscheinend das genaue Gegenteil in seiner eigenen Karten-App (und allen anderen Anwendungen) - die Tatsache, dass Google allgegenwärtig ist (Android, Suche, Werbenetzwerk, Youtube, Assistant, NEST-Heimautomation, Android Car …) spült denen auch genug Daten in die hauseigene AI, um Menschen eindeutig zu identifizieren, die keinen einzigen dieser Dienste nutzen oder jemals einer Datenschutzerklärung oder AGB von Google zugestimmt haben.

Noch mehr gilt das für Facebook, die nicht nur mit like-Buttons oder „einloggen mit Facebook“ sehr offensiv Menschen verfolgen (auch solche, die nicht im Netzwerk aktiv sind) und die eigenen Nutzer auffordern, Adressdaten und persönliche Informationen über sämtliche Bekannte dem Netzwerk bereit zu stellen (auch aus den anderen Diensten WhatsApp, Instagram usw.), sondern diese Daten dann auch noch weiterverkaufen.

Fazit

Apple wertet Sprachschnipsel aus, um den hauseigenen Sprachassistenten zu verbessern. Für ein absichtliches oder gar systematisches Sammeln und Auswerten der in den Sprachschnipseln enthaltenen Daten durch Apple gibt es keine Hinweise.

Dennoch bleibt ein mulmiges Gefühl bei dem Gedanken, dass wildfremde Menschen - unter denen auch mal ein entlassener Mitarbeiter sein kann, der sich an seiner ehemaligen Firma rächen möchte - auf intimste Aussagen von Apple-Kunden Zugriff haben.

Das ist wohl der Preis für Siri, Alexa, Google Assistant und Cortana.

In manchenSituationen, vor allem im Auto, ist für mich klar, dass der angemessen ist. Da bin ich meist allein unterwegs, rede kaum und bekomme einen hohen Gegenwert: ich kann die Augen beim Verkehrsgeschehen lassen.

Zu Hause ist das ständige Mithören eher nicht nötig.

Ich habe „Hey Siri“ daheim jedenfalls abgeschaltet und halte statt dessen die Hometaste gedrückt um etwas zu diktieren. Das kann dann zwar auch analysiert werden, sollte aber nur Befehle enthalten wie „Füge Gurken zu meiner Einkaufsliste hinzu“ und keine Mitschnitte von Gesprächen, in denen das iPhone fälschlicherweise ein „Hey Siri“ gehört haben will.

Weiterlesen