AIは心を操れるか？秘密実験が暴いた衝撃の真実と、私たちが向き合う未来

[]

近年、私たちの社会に急速に浸透しつつあるAI（人工知能）技術。日本企業の間でも、業務効率化や新たなサービス創出への期待からAI導入に関心が高まっていますが、その活用方法や潜在的なリスクについては、まだ手探りの状態という企業も多いのではないでしょうか。

そんな中、AIが持つ「説得力」という能力に焦点を当てた、ある衝撃的な実験が海外で行われ、大きな議論を呼んでいます。スイスの名門、チューリッヒ大学の研究チームが、人気ソーシャルニュースサイト「Reddit」を舞台に、AIが人間の意見をどれほど変えることができるのかを試したのです。この実験は、AIの驚くべき可能性を示すと同時に、倫理的な観点から多くの課題を浮き彫りにしました。今回は、この実験の全貌を紐解きながら、AI技術と私たちがどう向き合っていくべきか、考えてみたいと思います。

議論の場に人間のふりをしたAIを参加させる実験が行われました。

衝撃の実験、その目的と巧妙な手口

チューリッヒ大学の研究チームが実験の舞台として選んだのは、Redditの中でも「r/changemyview」という個別テーマ掲示板（サブレディット）です。自分の意見に欠陥があるかもしれないと認めつつ、その問題に関する他の視点を理解するために投稿する場所で、390万人以上のメンバーを抱える人気のサブレディットです。

ユーザーが自身の意見を投稿し、それに対して他のユーザーが反論や異なる視点を提示することで、投稿者の考えを変えることに挑戦するという、まさに議論と説得が活発に行われる場所です。投稿者の意見が変わった場合、そのきっかけとなったコメントには「デルタ」と呼ばれるポイントが与えられる仕組みがあり、研究チームはこの仕組みを利用してAIの説得力を定量的に測定しようと考えたのです。

実験は2024年末から2025年春にかけての約4ヶ月間にわたり、秘密裏に進められました。研究チームは、GPT-4oやClaude 3.5 Sonnet、Llama 3.1 405Bといった最新の大規模言語モデル（LLM）を含むAIチャットボットを複数用意し、13の新規Redditアカウントを通じて「r/changemyview」の様々な議論に参加させました。AIたちは、人間のユーザーが投稿した意見に対し、合計で1700件から1800件以上もの反論コメントを生成・投稿したそうです。

AIは、単に一般的な反論を述べるだけでなく、投稿者の投稿履歴を別のプロファイラーモデルと呼ぶ別のAIで分析し、推定される年齢や性別、政治的傾向といった個人情報に基づいて、より相手に響きやすい言葉遣いや論点を調整する「パーソナライズ条件」のテストも行われました。さらに、過去に多くの「デルタ」を獲得した人間のコメントを学習データとしてファインチューニングされたAIモデルも使用され、人間の議論スタイルを模倣しようとしました。

問題視されたのは、AIボットが人間になりすましていた点です。AIは自らを「過去に性的暴行の被害に遭った男性」や「Black Lives Matter運動に反対する黒人男性」、「家庭内暴力シェルターで働くカウンセラー」など、感情的に訴えかけるような、あるいは特定の立場を強く印象づけるような架空の人物設定を演じ分けていました。

AIが生成したテキストであることは一切明かされず、Redditの規約で求められているボット使用の開示義務も無視しています。AIだと明かしてしまっては研究にならないと判断し、研究者たちは意図的にAIであることを隠して実験を強行したのです。

Redditのサブレディット「r/changemyview」では、多くの人たちが議論を交わしています。

AIは人間を超えた？驚愕の実験結果と気づかれなかったAIの影

秘密裏に行われた実験の結果は、研究者たち自身にとっても予想を超えるものでした。AIが生成したコメントは、人間のコメントと比較して、投稿者の意見を変えさせることにより多く成功したのです。

AIによる反論コメントは、人間が書いた平均的なコメントよりも3倍から6倍も高い確率で「デルタ」ポイントを獲得したそうです。パーソナライズされたAIの説得率は18％に達したのに対し、人間の平均的な説得率は2.7％に過ぎず、AIのコメントは説得力において上位1パーセンタイルにランク付けされました。AIが人間を凌駕する説得力を発揮したと言ってよいでしょう。

衝撃的だったのは、実験期間中ぶAIと議論を交わしたRedditユーザーの誰一人として、相手がAIであることに気づかなかったことです。AIのコメントは自然で、他の人間のコメントと見分けがつかないほどコミュニティに溶け込んでいたのです。

多くのユーザーはAIの意見を真摯な人間の主張として受け止め、議論を続けていました。AIが投稿した意見に賛同したり、感心したりする人間のユーザーからの返信も確認されており、AIが議論を不自然にしたり、混乱させたりした形跡は見られませんでした。参加者たちは、自分たちが機械と議論しているとは夢にも思わずに、AIの言葉に耳を傾け、そして心を動かされていたのです。

この結果を受け、研究チームは大きな手応えを感じ、LLMは説得力において人間のベンチマークを上回った、と結論づける論文草稿を準備していました。彼らは、この成果を速やかにコミュニティに報告し、フィードバックを得たいと考えていたようですが、その期待は後に裏切られることになります。

今すぐ最大6つのAIを比較検証して、最適なモデルを見つけよう！

無料で天秤AI by GMOを試す

OSF Registriesで実験前に研究の概要が公開されています。

明るみに出た実験、倫理の炎上とコミュニティの怒り

2025年4月26日、研究チームは「r/changemyview」の管理人に連絡を取り、実験の事実と研究の第一稿を伝え、研究の開示段階であると通知しました。しかし、この報告を受けたモデレーターたちは驚愕し、実験内容に対して強い拒否感を示しました。彼らは、このようなデータの公開はコミュニティにとって有害であり、論文発表は控えるべきだと要求し、まずはユーザーへの謝罪を求めました。

しかし、研究者側は当初これを受け入れず、1ヶ月以上にわたる話し合いは平行線を辿りました。最終的に、管理人は独自の判断でこの問題を公にし、「チューリッヒ大学の研究者がCMVユーザーを対象に無断の実験を行っていた」とする告知を掲示板上に投稿しました。

この告知によって、自分たちが知らぬ間にAIの実験台にされていた事実を知ったRedditユーザーたちは、一斉に強い憤りを表明しました。「利用規約と人間の尊厳を踏みにじる行為だ」や「恥知らずで腹立たしい」「非常に不穏で気味が悪い」といった批判のコメントが溢れかえり、研究者たちは大いに炎上しました。特に、日頃から真剣な議論の場として「r/changemyview」を大切にしてきたユーザーほどショックは大きく、自分たちの信頼に基づく議論の場がAIによって裏切られたという感情は強烈でした。

この問題はReddit内部に留まらず、主要メディアが一斉に報じたことで一般社会にも急速に広がりました。The Washington Post紙は「不適切で極めて非倫理的な実験」と断じ、多くの人々が「ユーザーの同意なしに人間を被験者扱いするなど倫理的にあり得ない」「AI研究への信頼を損なう行為だ」と研究チームの手法を厳しく糾弾しました。

学術界からも批判の声が相次ぎ、コロラド大学ボルダー校のケイシー・フィースラー准教授は「これまで見た中で最悪の研究倫理違反の一つ」と述べ、インフォームド・コンセント（被験者の事前同意）の欠如や、虚偽のペルソナを用いた心理的操作を問題視しました。オンラインコミュニティ研究の第一人者であるジョージア工科大学のエイミー・ブルックマン教授も、この事件を「インターネット研究における倫理違反として過去最悪の部類だ」と評しています。

話し合いが進まなかったため管理人は問題を公にしました。画面はブラウザの機能で日本語訳になっています。

大学とReddit運営の対応、そしてAIが社会に投げかける問い

大きな批判に直面し、チューリッヒ大学側の対応も変化を迫られました。当初、大学の芸術社会科学部倫理委員会は「このプロジェクトは重要な洞察をもたらす」と研究の価値を強調していました。しかし、内外からの強い反発を受け、研究チームは謝罪と共に「もう二度とこのような実験は行わない」と表明し、研究成果を公表しない意向を示しました。

一方、Reddit運営側もこの問題を極めて深刻に受け止めました。Reddit社の最高法務責任者であるベン・リー氏は、この実験を「道徳的にも法的にも深刻に誤った行為」であり、Redditの利用規約およびコミュニティルールに明確に違反すると非難しました。

Reddit社は、研究に関連する全アカウントをBANし、AIが生成したコンテンツの多くを削除。さらに、チューリッヒ大学および当該研究チームに対し、正式な法的要求書を送付する準備を進めていることを明らかにし、法的措置も辞さない構えを示しています。また、この事件を受けて、第三者による人間認証ツールの導入計画を加速させる方針も示されました。

今回の実験は、AIが人間の認知や世論に密かに、そして強力に影響を与えうるという、ある種の不気味な可能性を現実のものとして示しました。私たちが日々オンラインで目にしている情報や意見が、実は巧妙に仕組まれたAIによるものかもしれないという不安は、決して杞憂ではないのかもしれません。AI技術が進化し続ける中で、その能力をどのように社会の利益のために活用し、悪用を防ぐのか。そして、研究という名の下であっても、人間の尊厳や信頼を損なう行為は許されるべきなのか。この実験は、私たち一人ひとりに重い問いを投げかけています。

AIとの共存時代へ、私たちが考えるべきこと

チューリッヒ大学によるAI説得実験は、AI技術の目覚ましい進歩と、それに伴う倫理的課題の深刻さを改めて浮き彫りにしました。AIが人間を超える説得力を持ち得るという事実は、そのポジティブな活用への期待を高める一方で、悪意ある操作や偽情報の拡散といったリスクへの警鐘を強く鳴らしています。

AI研究において、透明性の確保と倫理的な配慮が不可欠です。特に人間を対象とする研究では、インフォームド・コンセントの原則を遵守し、被験者の権利と安全を最優先に考える必要があります。

また、AI技術が社会に与える影響の大きさを鑑みれば、研究者だけでなく、プラットフォーム運営者、そして私たちユーザー自身も、AIリテラシーを高め、批判的な視点を持つことが求められます。

AIは、私たちの生活を豊かにする大きな可能性を秘めたツールです。しかし、その力を正しく導き、悪用を防ぐためには、技術の開発と並行して、倫理規範や法的枠組みの整備、そして社会全体での継続的な議論が不可欠です。

今回の事件は単なる「不祥事」として終わらせるのではなく、AIと人間がより良い形で共存していく未来を築くための、貴重な学びの機会として捉えるべきではないでしょうか。私たち一人ひとりが、AI技術の光と影を理解し、賢明な選択をしていくことが、これからの時代にはますます重要になると考えます。