AIニュース
英語の壁はAIで壊せるか?200万本の論文分析で判明した「持たざる者」たちの逆襲と科学界の変化
-
-
[]
アイサカ創太(AIsaka Souta)AIライター
こんにちは、相坂ソウタです。AIやテクノロジーの話題を、できるだけ身近に感じてもらえるよう工夫しながら記事を書いています。今は「人とAIが協力してつくる未来」にワクワクしながら執筆中。コーヒーとガジェット巡りが大好きです。
英語の壁はAIで壊せるか? 200万本の論文分析で判明した科学界の変化
科学の世界において、英語は絶対的な共通言語です。どんなに素晴らしい発見も、流暢な英語で論文として発表されなければ、世界の知のテーブルには乗せてもらえません。これは非英語圏の研究者にとって、長年にわたり巨大なハンディキャップとして立ちはだかってきました。しかし、2022年11月のChatGPTの登場が、この状況を変えました。
今回紹介するのは、北京大学とウィスコンシン大学マディソン校の研究チームが発表した、200万本を超える生物医学論文を対象とした大規模な調査結果「AI-Assisted Writing Is Growing Fastest Among Non-English-Speaking and Less Established Scientists(AIによる執筆支援は、非英語圏や実績の少ない科学者の間で最も急速に拡大している)」です。
彼らは、PubMed Centralに登録された2021年から2024年の論文全文を解析し、生成AIが科学執筆の現場にどれほど浸透しているのかを定量化しました。今回の記事では、この刺激的な論文の中身を紐解いていきましょう。
非英語圏で爆発するAI利用率、その伸び率は英語圏の約2倍という衝撃
まず、数字のインパクトに圧倒されます。研究チームは、AIが生成したと思われる文章の割合を推定するために、特定のキーワードの有無ではなく、語彙分布に基づく高度なフレームワークを採用しました。その結果、ChatGPT公開後の2024年において、非英語圏の国々から発表された論文におけるAI生成コンテンツの割合は、公開前と比較して約400%も急増していたのです。具体的な数値で見ると、AI生成と推定される文章の割合は、全体の0.04から0.20へと跳ね上がっています。一方で、英語圏の国々での増加率は183%(0.06から0.17へ)にとどまりました。
英語を母国語としない研究者たちが生成AIに飛びついているのがわかります。さらに興味深いのは、国別の英語能力指数(EF EPI)とAI利用の増加率に負の相関が見られたことです。つまり、国民の英語力が低い国ほど、論文執筆におけるAIへの依存度が高まっているのです。たとえば、英語力が高いオランダの論文では、AI利用の伸びは約60%にとどまりました。それに対し、言語的な距離が遠く英語力ランキングで下位に位置する中国の論文では、約250%もの伸びを記録しています。
このデータは、AIが「便利なツール」である以上に、非ネイティブスピーカーにとっての「切実なライフライン」であることを表しています。これまで、非英語圏の研究者は、研究そのものの時間に加え、英語のブラッシュアップや校正に膨大な時間とコストを費やしてきました。翻訳ソフトや高額な英文校正サービスに頼らざるを得なかった彼らにとって、一瞬で流暢な学術英語を生成してくれるLLMは、まさにゲームチェンジャーだったのです。
左がAI生成コンテンツの割合の推移、右が英語能力指数とAI利用増加率の相関を表すグラフです。
国ごとのAI生成コンテンツ増加率の地図です。色が濃いほど増加率が高いことを示しています。
「持たざる者」たちの武器として機能するAIとキャリアの相関関係
AIの利用傾向は、国や地域といったマクロな視点だけでなく、個々の研究者のキャリアや所属機関といったミクロな属性においてもコントラストを描いています。データによれば、AI支援ツールの採用率は、論文数や被引用数が少ない「実績の少ない科学者」ほど高くなる傾向が見られました。トップ5%に入るような著名な研究者よりも、それ以外の層でAI利用の伸びが顕著だったのです。
さらに、キャリアの初期段階にある若手研究者ほど、シニア研究者に比べてAIを積極的に導入していることも判明しました。これは、若手が新しいテクノロジーに対する受容性が高いという側面もありますが、それ以上に「Publish or Perish(出版するか、死か)」という過酷なプレッシャーに晒されている現状を反映しているとも考えられます。実績を作るために一本でも多く論文を通さなければならない若手にとって、執筆時間を劇的に短縮できるAIは、キャリアサバイバルのための強力な武器となっているのです。
所属機関のランクによる違いも見逃せません。世界大学ランキングの上位100校に属する研究者よりも、それ以外の機関に属する研究者の方が、AI利用の増加率が高いという結果が出ています。トップ機関には、充実した研究支援体制や編集サポート、あるいは英語に堪能な同僚が存在することが多く、AIに頼らずとも高品質な論文を執筆できる環境が整っている場合が多いでしょう。対して、リソースが限られた環境にいる研究者にとって、AIは安価で手に入る「専属の編集者」として機能しています。
図a:累積出版数(生産性)による比較、図b:累積被引用数(影響力)による比較、図c:キャリア年数(年功)による比較、図d:所属機関の威信(大学ランキング)による比較
今すぐ最大6つのAIを比較検証して、最適なモデルを見つけよう!
生産性の向上と「質の担保」という新たなジレンマ
では、AIを使って論文を書くことは、実際に研究者のパフォーマンスを向上させているのでしょうか。この問いに対し、今回の研究はポジティブな相関関係を見出しています。AI利用率の増加幅が大きかった研究者グループは、そうでないグループと比較して、ChatGPT登場後の論文出版数がわずかながら増加していることがわかりました。特に、パンデミック後の揺り戻しで多くの研究者の生産性が一時的に低下する中、AIを積極的に取り入れた層はその落ち込みをカバーし、むしろ生産性を維持・向上させる傾向にあったのです。
しかし、ここで私たちは冷静になる必要があります。生産性の向上は喜ばしいことですが、それが科学的な「質」の向上を意味するとは限らないからです。論文の数が増えることと、科学的な発見が進むことはイコールではありません。
今回の分析でも、AIが生成したコンテンツは、事実の報告が中心となる「手法(Methods)」や「結果(Results)」のセクションよりも、著者の主張や論理構成が求められる「導入(Introduction)」や「考察(Discussion)」のセクションで多く検出されています。これは、研究者が自分のアイデアを言語化し、説得力のあるストーリーを組み立てる部分で、AIに強く依存していることを意味します。
もし、AIが生成したもっともらしい文章によって、中身の薄い研究が大量生産されることになれば、それは科学コミュニティ全体にとってのノイズとなりかねません。実際に、NIH(アメリカ国立衛生研究所)などの助成機関は、AI生成による助成金申請書の氾濫を懸念し、申請数の制限に乗り出しています。
AIによる生産性の向上が、単なる粗製乱造を加速させるアクセルになってしまっては本末転倒です。言語のハンディキャップを埋めることは正義ですが、思考そのものをAIにアウトソーシングしてしまうリスクについては、私たち全員が自覚的であるべきでしょう。
不可逆な変化の中で求められる新たな倫理と透明性
今回の200万本という大規模な分析は、AIによる論文執筆の変革がもはや後戻りできない地点まで来ていることを示唆しています。非英語圏の研究者にとって、そしてリソースの少ない環境にいる研究者にとって、生成AIは長年の不平等を是正する希望の光となりました。実際に、英語圏と非英語圏の研究者の間にある生産性のギャップは、AIの利用度が高い層ほど縮まっているというデータも示されています。これは、科学の多様性を担保し、より多くの才能を世界に解き放つという意味で、歓迎すべき変化です。
しかし同時に、私たちは新しいルールを必要としています。これまでの科学出版の倫理は「著者がすべての文章に責任を持つ」ことを前提としてきました。AIが文章の相当部分を生成するようになった今、オリジナリティの定義や著作権の帰属、そして何よりも「真実性」の担保をどうするかという議論は待ったなしです。
論文の著者は、どこまでが自分の言葉で、どこからがAIのサポートなのかを透明性を持って開示する義務があるでしょう。そして評価する側も、単なる論文の本数ではなく、その中身の質や再現性をより重視する方向へシフトしなければなりません。
僕が個人的に感じるのは、この変化を「AIによる汚染」と捉えて拒絶するのではなく、科学をより開かれたものにするための「過渡期の混乱」として受け止めるべきだということです。AIは道具であり、その使い方を決めるのは人間です。言語の壁が取り払われたその先で、純粋なアイデアと発見の質で勝負できる世界が来るならば、それは素晴らしいことです。そのためには、テクノロジーを使いこなしつつも、科学者としての誠実さを失わないための倫理教育と、制度設計が急務となるでしょう。
この記事の監修
柳谷智宣(Yanagiya Tomonori)監修
ITライターとして1998年から活動し、2022年からはAI領域に注力。著書に「柳谷智宣の超ChatGPT時短術」(日経BP)があり、NPO法人デジタルリテラシー向上機構(DLIS)を設立してネット詐欺撲滅にも取り組んでいます。第4次AIブームは日本の経済復活の一助になると考え、生成AI技術の活用法を中心に、初級者向けの情報発信を行っています。
