Haben deine Gmail-Daten die KI Bard trainiert?

Bard selbst behauptet, dass Ihre E-Mails in Gmail die KI trainiert haben. Google bestreitet dies und sagt, Bard habe einen Fehler gemacht.

by Hanna

Published on: 2023-03-30

Letzte Woche ging ein Tweet viral, in dem gefragt wurde, ob Googles KI Bard mit Gmail-Daten trainiert wurde. Die Frage wurde durch die Tatsache unterstrichen, dass Bard selbst sagte, es sei mit Daten der "Google-Suche, von Gmail und anderen Daten" trainiert worden.

Hat Gmail Bard trainiert?

Letzte Woche ging dieser Tweet viral, in dem Googles KI Bard behauptete, sie sei mit Gmail-Daten trainiert worden.

Umm, anyone a little concerned that Bard is saying its training dataset includes… Gmail?

I’m assuming that’s flat out wrong, otherwise Google is crossing some serious legal boundaries. pic.twitter.com/0muhrFeZEA
— Kate Crawford (@katecrawford) March 21, 2023

Bard selbst sagt, dass es mit Gmail-E-Mails geschult wurde

Google antwortete schnell und erklärte:

“Bard ist ein frühes Experiment, das auf Large Language Models basiert und Fehler machen wird. Es wird nicht mit Gmail-Daten trainiert.”

Gegenüber dem Tech-Nachrichtenportal The Register gab Google eine längere Erklärung ab:

“Wie alle LLMs kann Bard manchmal Antworten generieren, die ungenaue oder irreführende Informationen enthalten, diese aber selbstbewusst und überzeugend präsentieren. Dies ist ein Beispiel dafür. Wir verwenden keine persönlichen Daten aus Ihrem Gmail oder anderen privaten Apps und Diensten, um Bard zu verbessern.”

Wenn du dir Sorgen machst, dass deine privaten E-Mails Bard trainiert haben, schau dir die Gmail-Alternative Tutanota an.

Welche Daten werden für das Training von Bard verwendet?

Es ist nicht so einfach, herauszufinden, welche Daten tatsächlich zum Trainieren von Bard verwendet wurden. Solange Google nicht veröffentlicht, welche Datensätze verwendet werden, kann niemand mit Sicherheit sagen, wer richtig liegt: Bard oder Google.

Blake Lemoine, ein ehemaliger Google-Mitarbeiter, der gefeuert wurde, weil er Google-Geheimnisse verraten hatte, und der glaubt, dass Googles großes Sprachmodell (LLM) LaMDA empfindungsfähig war, antwortete auf den Tweet mit den Worten:

“Der LaMDA-Engine, der Bard zugrunde liegt, treibt auch die Autovervollständigung und die automatische Antwort in Gmail an, also … ja, die Trainingsdaten von Bard enthalten Gmail. FWIW, sie [Google] geben sich viel Mühe, um sicherzustellen, dass LaMDA keine persönlichen Informationen über Einzelpersonen in seinen Antworten verwendet.”

Meredith Whittaker, Präsidentin von Signal, lenkt das Gespräch in eine ganz andere Richtung, indem sie sagt:

“KI” ist ein Produkt konzentrierter Macht, und wir blicken nicht auf die politisch-ökonomischen Realitäten. Anders ausgedrückt: Ob BARD mit Gmail trainiert wird oder nicht, ist weniger skandalös als die Tatsache, dass nur Google und ein paar andere Überwachungskos einen BARD herstellen können.”

Deine Daten sind das neue Öl

Das Sprichwort gilt schon seit Jahrzehnten: Deine Daten sind das neue Öl.

Der Aufstieg von KI-Software, die von großen Technologiekonzernen entwickelt wird, zeigt dies einmal mehr: Microsoft, Google und Baidu sind nur deshalb in der Lage, ihre KI-Modelle ChatGPT, Bard und Ernie zu entwickeln, weil sie über eine riesige Menge an Daten verfügen, mit denen sie diese KI-Chatbots trainieren können.

Das Problem ist jedoch, dass diese Unternehmen nicht gerade für den Schutz der Privatsphäre der Nutzer bekannt sind. Das ist auch der Grund, warum es vielen Menschen schwerfällt, Gmail und Co. zu vertrauen, und warum ChatGPT kürzlich als “Datenschutz-Alptraum” bezeichnet wurde.

Du bezahlst mit deinen Daten

Einer der beliebtesten kostenlosen E-Mail-Dienste: Gmail.

Wann immer du das Internet nutzt, insbesondere wenn du einen “kostenlosen” Dienst in Anspruch nimmst, bezahlst du mit deinen Daten.

In Zeiten von Big Data und KI sind deine Daten das neue Öl. Daten sind ein Goldesel für Google, Microsoft, Baidu und andere. Du bezahlst diese Dienste zwar nicht direkt, aber du zahlst, indem dir Werbung angezeigt wird, die dich dazu bringt, Dinge zu kaufen, die du nicht unbedingt brauchst oder die du ohne die ständige Bombardierung mit Werbung nicht zu diesem Preis gekauft hättest.

Darüber hinaus nutzen diese Unternehmen deine Daten, um völlig neue, millionenschwere Produkte wie KI-Chatbots zu entwickeln. Und hier hat Meredith Whittaker von Signal völlig recht: Es ist nicht in Ordnung, dass nur Big-Tech-Überwachungskapitalisten über so große Datensätze verfügen, dass sie Bard oder ChatGPT entwickeln können.

Die Politik muss ein wachsames Auge auf diese Entwicklung haben und dafür sorgen, dass diese großen Tech-Unternehmen ihre monopolistische Macht über die Daten aller Menschen nicht missbrauchen können.

Wechsel zu Privatsphäre

Wenn du selbst etwas ändern möchtest, kannst du aufhören die Überwachungsmonopolisten im Internet mit Daten zu füttern, indem du dich bei der Nutzung des Internets für Dienste entscheidest, bei denen die Privatsphäre im Vordergrund steht.

Um sicherzustellen, dass deine privaten E-Mails nicht zum Trainieren von Bard - oder einer anderen KI - verwendet werden können, kannst du eine sichere E-Mail-Adresse bei Tutanota erstellen. Bei Tutanota werden alle Daten Ende-zu-Ende verschlüsselt, um zu garantieren, dass deine privaten E-Mails privat bleiben und niemand deine Daten missbrauchen kann.