Os seus dados do Gmail treinaram o Bardo AI?

O próprio Bard afirma que os seus e-mails no Gmail treinaram a IA, o Google nega isto, dizendo que o Bard cometeu um erro.

by Hanna

Published on: 2023-03-30

Na semana passada um tweet ficou viral perguntando se o bardo AI Bard do Google foi treinado em dados do Gmail. A questão foi sublinhada pelo facto de o próprio Bard ter dito que tinha recebido formação sobre "Pesquisa Google, Gmail e outros dados".

O Gmail treinou o Bardo?

Na semana passada, este tweet tornou-se viral, no qual o Bardo do Google afirmou ter recebido formação sobre dados do Gmail.

Umm, anyone a little concerned that Bard is saying its training dataset includes… Gmail?

I’m assuming that’s flat out wrong, otherwise Google is crossing some serious legal boundaries. pic.twitter.com/0muhrFeZEA
— Kate Crawford (@katecrawford) March 21, 2023

Bard selbst sagt, dass es mit Gmail-E-Mails geschult wurde

Os próprios Google foram rápidos a responder explicando que

”O bardo é uma experiência precoce baseada em Modelos de Grandes Línguas e cometerá erros. Não é treinado em dados do Gmail”.

O Google fez uma declaração mais longa ao The Register, um canal de notícias tecnológicas:

“Como todos os LLMs, Bard pode por vezes gerar respostas que contêm informações imprecisas ou enganosas, ao mesmo tempo que as apresenta de forma confiante e convincente. Este é um exemplo disso mesmo. Não utilizamos dados pessoais do seu Gmail ou outras aplicações e serviços privados para melhorar o Bard”.

Se está preocupado com o facto de os seus e-mails privados treinarem o Bard, consulte a Tutanota alternativa do Gmail.

Que dados são utilizados para treinar o Bardo?

Não é assim tão fácil descobrir que dados foram realmente utilizados para treinar Bardo. Desde que o Google não publique que conjuntos de dados estão a ser utilizados, ninguém pode saber ao certo quem está correcto: Bard ou Google.

Blake Lemoine, um antigo funcionário da Google que foi despedido por ter divulgado segredos da Google e que acredita que o modelo de linguagem grande da Google (LLM) LaMDA era sensível respondeu ao ditado do tweet:

“O motor LaMDA subjacente a Bard é também o que conduz o Gmail autocompleto e auto-resposta, portanto … sim, os dados de formação de Bard incluem o Gmail. FWIW, eles esforçaram-se muito para garantir que o LaMDA não utiliza dar informações pessoais sobre indivíduos nas suas respostas”.

Meredith Whittaker, Presidente da Signal, muda a conversa para uma direcção completamente diferente ao dizer:

“AI” é um produto de poder concentrado, e tiramos os olhos das realidades económicas políticas por nossa conta e risco. Colocando de outra forma, BARD ser ou não treinado no Gmail é menos escandaloso do que o facto de apenas o Google e alguns outros custos de vigilância poderem fazer um BARD”.

Os seus dados são o novo BARD

O ditado já é verdade há décadas: Os seus dados são o novo petróleo.

A ascensão do software de IA desenvolvido por grandes corporações tecnológicas mostra-o mais uma vez: A Microsoft, Google, e Baidu só conseguem desenvolver os seus modelos de IA ChatGPT, Bard, e Ernie porque têm uma vasta quantidade de dados que podem utilizar para treinar estes bots de IA chat.

O problema, porém, é que estas empresas não são particularmente conhecidas por protegerem a privacidade dos utilizadores. Esta é também a razão pela qual muitas pessoas têm dificuldade em confiar no Gmail and Co e também porqueo ChatGPT tem sido descrito recentementecomo um “pesadelo de privacidade”.

O utilizador paga com os seus dados

Einer der beliebtesten kostenlosen E-Mail-Dienste: Gmail.

Sempre que utiliza a Internet, particularmente quando utiliza um serviço “gratuito”, está a pagar com os seus dados.

Em tempos de Grandes Dados e IA os seus dados são o novo petróleo. Os seus dados são uma vaca de dinheiro para o Google, Microsoft, Baidu, e outros. Embora não pague estes serviços directamente, paga com anúncios que o fazem comprar coisas que não precisa necessariamente ou que não teria comprado a esse preço sem o constante bombardeamento de anúncios.

Além disso, estas empresas utilizam os seus dados para criar produtos completamente novos que valem milhões como os bots de conversação AI. E aqui, Meredith Whittaker da Signal tem toda a razão: não está certo que apenas os capitalistas de vigilância da Big Tech tenham conjuntos de dados tão grandes que possam fazer um Bard ou um ChatGPT.

Os políticos devem estar atentos a este desenvolvimento e certificar-se de que estas grandes empresas de tecnologia não podem abusar do seu poder monopolista sobre os dados de todos.

Escolher a privacidade

Se você mesmo quiser fazer uma mudança, pode deixar de alimentar os monopolistas de vigilância na Internet, escolhendo os serviços privacy-first ao utilizar a web.

Para garantir que os seus e-mails privados não possam ser utilizados para treinar o Bard - ou qualquer outra IA - pode criar um endereço de e-mail seguro com a Tutanota. Em Tutanota todos os seus dados são encriptados de ponta a ponta, assegurando que as suas mensagens de correio electrónico privadas permanecem privadas e que ninguém pode abusar dos seus dados.