あなたのGmailのデータは、AIバルドを訓練したのでしょうか？

バルド自身は、GmailにあるあなたのメールがAIを訓練したと主張しているが、グーグルはこれを否定し、バルドがミスを犯したと述べている。

by Hanna

Published on: 2023-03-30

先週、GoogleのAI「Bard」はGmailのデータで訓練されたのか、というツイートが拡散されました。この疑問は、Bard自身が「Google検索、Gmail、その他のデータ」で学習させたと述べていることで強調されました。

GmailはBardを訓練したのか？

先週、GoogleのAI「Bard」がGmailのデータで訓練されたと主張するツイートが拡散されました。

Umm, anyone a little concerned that Bard is saying its training dataset includes… Gmail?

I’m assuming that’s flat out wrong, otherwise Google is crossing some serious legal boundaries. pic.twitter.com/0muhrFeZEA
— Kate Crawford (@katecrawford) March 21, 2023

Bard selbst sagt, dass es mit Gmail-E-Mails geschult wurde

Googleはすぐに次のように説明しました。

“BardはLarge Language Modelsに基づく初期の実験であり、間違いを犯すでしょう。Gmailのデータで訓練されているわけではありません。“

Googleは、テック系ニュースのThe Registerに対して、より長い声明を発表しました：

「すべてのLLMがそうであるように、Bardも時には不正確な情報や誤解を招く情報を含む回答を生成することがありますが、自信に満ちた説得力のある回答を提示します。これはその一例です。私たちは、Bardを改善するために、あなたのGmailやその他のプライベートなアプリやサービスの個人データを使用することはありません。“

プライベートなメールがバルドを訓練しているのではないかと心配な方は、Gmailの代替ツール「Tutanota」をチェックしてみてください。

どのようなデータがBardの訓練に使われているのでしょうか？

Bardの訓練に実際に使われたデータを調べるのは、それほど簡単ではありません。Googleがどのようなデータセットを使用しているかを公表しない限り、BardとGoogleのどちらが正しいかは誰にもわからない。

Googleの機密を漏らしたとして解雇された元Google社員で、Googleの大規模言語モデル（LLM）LaMDAが知覚を持つと信じているBlake Lemoineは、このツイートにこう返信した：

“Bardの基盤となっているLaMDAエンジンは、Gmailのオートコンプリートやオートリプライを駆動するものでもあるので、…そう、BardのトレーニングデータにはGmailが含まれている。” ちなみに、LaMDAが個人に関する個人情報を回答に使用しないように、彼らは多くの努力を払っています。

Signal社の社長であるMeredith Whittaker氏は、こう言って話を全く違う方向に変えています：

“AI “は集中した権力の産物であり、政治経済の現実から目を離すことは危険である。別の言い方をすれば、BARDがGmailで訓練されているかどうかは、Googleと他のいくつかの監視会社だけがBARDを作ることができるという事実よりスキャンダラスではない。“

あなたのデータが新しい石油になる

このことわざは、もう何十年も前から真実です：あなたのデータは新しい石油です。

巨大テック企業が開発したAIソフトウェアの台頭は、このことを改めて示しています：マイクロソフト、グーグル、バイドゥがAIモデルChatGPT、Bard、Ernieを開発できるのは、これらのAIチャットボットを訓練するために使用できる膨大なデータを保有しているからです。

しかし、問題は、これらの企業が特にユーザーのプライバシーを保護することで知られていないことです。これは、多くの人がGmailとCoを信頼するのが難しいと感じる理由でもあり、また、ChatGPTが最近「プライバシーの悪夢」と評される理由でもあります。

あなたのデータで支払う

Einer der beliebtesten kostenlosen E-Mail-Dienste: Gmail.

インターネットを利用するとき、特に「無料」のサービスを利用するときは、必ず自分のデータで支払っていることになります。

ビッグデータとAIの時代には、あなたのデータは新しい石油です。あなたのデータは、Google、Microsoft、Baiduなどにとって、現金のようなものです。これらのサービスに直接お金を払っているわけではありませんが、広告を見せられることによって、必ずしも必要でないものを買わされたり、広告の絶え間ない爆撃がなければその値段では買わなかったであろうものを買わされたりしています。

さらに、これらの企業は、あなたのデータを使って、AIチャットボットのような数百万円の価値がある全く新しい製品を作り出します。そしてここで、SignalのMeredith Whittakerは完全に正しい：Big Techの監視資本家だけが、BardやChatGPTを作れるほど大きなデータセットを持っているのはダメなんです。

政治家はこの発展を注視し、これらの大企業がすべての人のデータに対する独占的な力を乱用できないようにしなければなりません。

プライバシーを選ぶ

もしあなた自身が変化を起こしたいのであれば、ウェブを利用する際にプライバシーを優先したサービスを選ぶことで、インターネット上の監視独占者に餌を与えるのをやめることができます。

あなたの個人的な電子メールがバルドや他のAIの訓練に使われないようにするには、Tutanotaで安全な電子メールアドレスを作成することができます。Tutanotaでは、すべてのデータがエンドツーエンドで暗号化されるため、プライベートな電子メールは非公開のまま、誰もあなたのデータを悪用することはできません。