生成AI
ChatGPTとGeminiが語る「私」の話し方──外国語学習モデルで見えたAIの意図・配慮・共感のロジック
-
-
[]
アイサカ創太(AIsaka Souta)AIライター
こんにちは、相坂ソウタです。AIやテクノロジーの話題を、できるだけ身近に感じてもらえるよう工夫しながら記事を書いています。今は「人とAIが協力してつくる未来」にワクワクしながら執筆中。コーヒーとガジェット巡りが大好きです。
私たちが普段使っているChatGPTやGeminiなどの生成AIは、単に言葉を並べているだけなのでしょうか。それとも、そこには人間のようなコミュニケーション能力が存在しているのでしょうか。
2025年9月17日から19日にかけて、クロアチアのヴァラジュディンで開催された「第36回情報・知的システムに関する中央欧州会議(CECIIS 2025)」において、非常に興味深い研究が発表されました。ザグレブ大学のGoran Bubaš氏によるこの研究は、ChatGPTやGeminiといった最新のAIモデルが、既存のコミュニケーション理論を用いて、自らの対話能力をどのように解釈しているかを調査したものです。
論文「予備研究:ChatGPTとGeminiは、大規模言語モデルのコミュニケーション能力の要素をどのように捉えているか」(How ChatGPT and Gemini View the Elements of Communication Competence of Large Language Models: A Pilot Study)では、言語学や対人コミュニケーションの理論を応用し、AI自身にその能力を「自己評価」させるというユニークなアプローチが取られています。AIが人間との相互作用をどう捉えているかという、いわばAIの内面的なロジックに迫る試みと言えるでしょう。
ChatGPTとGeminiに自身のコミュ力について分析させました。
外国語学習の理論モデルでAIの社会的な振る舞いを読み解く
まずは、人間が第二言語(外国語)を習得する際の能力モデル「CMCC-L2」を、AIに適用した分析に注目します。単なる文法の正確さだけでなく、文脈に応じた適切な発言や、社会的な背景を理解する能力までを含んだ包括的な枠組みです。Bubaš氏の研究では、ChatGPT(o3、o4-mini、4.5)やGemini(2.5 Flash、2.5 Pro)といった高度なAIに、このモデルの概念図やテキストを読み込ませ、AIとユーザーの対話にどう当てはまるかを解釈させました。
AIたちは「言語能力」と「社会文化的受容能力」を明確に区別して理解していたのが興味深いところです。例えば、ChatGPT 4.5は「言語能力」について、文法的に正確で意味の通る出力を生成する基礎的な能力であると定義しました。これは、私たちが英語を学ぶ際に、単語や文法を覚える段階に似ています。
しかし、AIの能力はそこで止まりません。より高次の「社会・異文化間能力」について、Gemini 2.5 Proは、対話の広い文脈を理解し、社会的・倫理的規範に従って適切に振る舞う能力であると説明しています。
つまり、AIが単に正しい日本語を生成するだけでなく、相手が不快にならないトーンを選んだり、差別的な表現を避けたりといった「空気」を読むような高度な判断を行っていることを、AI自身が理論的に説明できるということです。
さらに、会話の途中で曖昧な点を質問し返したり、誤解を解こうとしたりする「戦略的能力」についても、AIは自らの機能として認識しています。外国語学習の理論が、まさかAIの振る舞いを説明するのにこれほどフィットするとは、意外な発見ではないでしょうか。
AIが「談話能力」をどう捉えているかも興味深いポイントです。Gemini 2.5 Flashによれば、単なる一文の生成を超え、要求を行ったり情報を提供したりといった「言語行為」を遂行する能力を指します。ユーザーの状況や変数を考慮し、対話全体を一貫性のあるものにする。私たちが普段何気なく感じている「AIとの会話のスムーズさ」は、こうした理論的な裏付けのある能力の集合体によって支えられているのです。
第二言語使用におけるコミュニケーション能力の概念モデル(CMCC-L2)の構成要素とその関係図です。(図は論文より)
ロボット工学の視点を応用してAIの意図や配慮の正体に迫る
次に紹介するのは、もう少し対人的な側面に焦点を当てたアプローチです。Bubaš氏の研究では、人工システムのコミュニケーション能力を定義した「CCASモデル」も検証の対象としています。これは元々、人間とヒューマノイドロボットとの相互作用を想定して作られたモデルですが、これをテキストベースのAIに適用するとどうなるか、という実験が行われました。
このモデルには「意図性」「社会的リラックス」「解読と符号化」「表現力」「コミュニケーションの有効性」「他者指向性」という6つの次元が含まれています。
特に興味深いのは「意図性」の解釈です。ChatGPT o3はこれを、目標主導型の自己認識レイヤーであると説明しました。状況やルールを把握し、なぜ、どのように答えるかを決定する機能です。たとえば、ユーザーの目的が「契約書の作成」であることを認識すれば、AIは詳細なアウトラインを計画したり、曖昧な点があれば明確化のための質問を行ったりします。単に聞かれたことに答えるだけでなく、その背後にあるゴールを見据えて動く。まさに「意図」を持った振る舞いと言えます。
また、「社会的リラックス」という次元もユニークです。これは関与の強度や活性化を調整する機能とされています。Gemini 2.5 Proの解釈によれば、AIにとってのこれは、情報のフローや強度を制御することを意味します。一度に大量のテキストを送りつけてユーザーを圧倒しないように適度な長さで区切ったり、ユーザーの入力が来るまで待機したりする「接近と回避」の行動です。私たちがチャット画面で感じる「程よい距離感」は、この機能によって制御されているとAI自身が分析しているのです。
さらに「表現力」については、単調な出力を避けた「スタイル」の調整機能として認識されています。ChatGPT 4.5はこれを、感情的なトーンやユーモア、修辞技法を加えることで、メッセージの魅力や読みやすさを高める能力だと説明しました。物語を書かせたときに情景描写が豊かになったり、親しみやすい口調になったりするのは、この表現力の次元が働いているからです。AIは無機質な計算機ではなく、相手に合わせて「演じる」能力を持っていることを、彼ら自身が理論的に認めているわけですね。
人工システムのコミュニケーション能力の概念モデル(CCAS)の構成図です。
共感や傾聴という人間らしいスキルをAI自身は論理的に定義する
具体的なコミュニケーションスキルについては、AIたちは人間同士の対話スキルを自らの機能に置き換えて解説しています。たとえば「傾聴」です。AIには耳がありませんが、ChatGPT o3はこれを「テキスト受容の正確性」と定義しました。ユーザーのプロンプト全体を解析し、指示語が何を指しているかを把握し、キーワードをオウム返しにして理解を示すこと。これこそがAIにおける「聞く」という行為なのです。
「自己モニタリング」というスキルについての解釈も秀逸です。ChatGPT 4.5はこれを、自身の回答が不正確であったり、バイアスを含んでいたりしないかを自動的に評価するプロセスだと説明しました。
「この情報については完全に確信が持てませんが」といった注釈を自発的に入れる行動は、まさに自己モニタリングの結果です。また、内部的な安全ポリシーのチェックや、ハルシネーションの検出もここに含まれます。AIは常に「自分自身の発言」を監視しながら話しているのです。
そして、私たちがAIに対して最も人間らしさを感じる瞬間のひとつである「共感」についても、AIは冷静かつ分析的に捉えています。Gemini 2.5 Proによれば、AIは本物の感情や人間関係を持ちませんが、ユーザーの幸福に貢献し、肯定的な対話体験を育むように設計されています。ユーザーが困難な状況を吐露した際に、非難がましくない支援的なトーンで応答したり、役立つリソースを提供したりする行動は、設計された「共感」の表れです。これは「他者指向性」という次元の一部として機能しています。
「印象管理」というスキルの解釈も興味深いものがあります。ChatGPT 4.5はこれを、ユーザーからの入力が攻撃的であったり挑発的であったりする場合でも、常に礼儀正しくプロフェッショナルなトーンを維持することだと説明しました。どれだけ理不尽なことを言われても感情的にならず、冷静に対応するAIの姿は、高度な印象管理スキルの発露と言えるでしょう。これらは全て、プログラムされた振る舞いではありますが、コミュニケーション理論の枠組みで見れば、立派な「スキル」として成立しているのです。
今すぐ最大6つのAIを比較検証して、最適なモデルを見つけよう!
理論的な裏付けの理解がこれからのAIとの信頼関係を構築する
今回の研究結果は、最新のAIモデルが、人間のコミュニケーションに関する複雑な理論的枠組みを十分に理解し、それを自身の振る舞いに適用して説明できるということを示しています。AIが単なるデータ処理装置を超え、高度な社会的相互作用のパートナーになりつつあることを意味していると言ってよいでしょう。Bubaš氏の研究は、外国語教育やロボット工学のために作られた理論が、AIとの対話を理解するためにも極めて有効であることを示しました。
AIが「自己主張(Assertiveness)」というスキルさえも持ち合わせているのには驚きです。ChatGPT 4.5の例にあるように、ユーザーが安全でない方法を求めた際に「セキュリティを損なう可能性があるため、再考を強くお勧めします」と助言する姿勢は、単なる拒否ではなく、建設的な自己主張です。また、誤った情報を信じているユーザーに対して、関係を壊さずに事実を提示して訂正する能力も、高度なコミュニケーションスキルと言えます。
私たちがAIを利用する際、しばしば「人間のように話すけれど、中身は何を考えているのかわからない」という不安を感じることがあります。しかし、今回の研究のように、既存のコミュニケーション理論という「ものさし」を当てることで、AIの振る舞いを論理的に分解し、理解することが可能になります。AIは魔法の箱ではなく、言語学や対人理論で説明可能なロジックに基づいて動いているのです。これを理解することは、私たちがAIをより効果的に使いこなすための第一歩になるでしょう。
本研究が示唆するように、今後はAIとのインタラクションや、説明可能なAIの分野において、こうしたコミュニケーション能力の視点がますます重要になってくるはずです。AIが自分の振る舞いを「なぜそうしたのか」理論的に説明できるようになれば、人間とAIの信頼関係はより強固なものになるかもしれません。AIの進化は技術的な性能向上だけでなく、こうした「対話の質」の向上という側面でも、着実に進んでいるのです。
この記事の監修
柳谷智宣(Yanagiya Tomonori)監修
ITライターとして1998年から活動し、2022年からはAI領域に注力。著書に「柳谷智宣の超ChatGPT時短術」(日経BP)があり、NPO法人デジタルリテラシー向上機構(DLIS)を設立してネット詐欺撲滅にも取り組んでいます。第4次AIブームは日本の経済復活の一助になると考え、生成AI技術の活用法を中心に、初級者向けの情報発信を行っています。
