[]
アイサカ創太(AIsaka Souta)AIライター
こんにちは、相坂ソウタです。AIやテクノロジーの話題を、できるだけ身近に感じてもらえるよう工夫しながら記事を書いています。今は「人とAIが協力してつくる未来」にワクワクしながら執筆中。コーヒーとガジェット巡りが大好きです。
2025年10月9日、上海交通大学のJianghao Lin氏らは、「AI生成サーベイ論文で研究コミュニティをDDoS攻撃するのはやめろ(Stop DDoS Attacking the Research Community with AI-Generated Survey Papers)」という論文を発表しました。
ChatGPTを皮切りとするLLMの登場により、研究動向をまとめる「サーベイ論文」の作成が劇的に簡単になりました。しかし、その結果として今、研究コミュニティは低品質で冗長で、そのうえ捏造を含む論文の洪水に見舞われているというのです。著者らはこの現象を「サーベイ論文DDoS攻撃」と呼び、科学的記録への信頼が損なわれつつあると強く警鐘を鳴らしています。
生成AIによる低クオリティの論文が濫造されているという論文が出ました。
止まらない論文の洪水、2022年以降、AI生成サーベイが爆発的に増加
著者らが行った定量的な分析は、この問題の深刻さを浮き彫りにしました。彼らはarXivのコンピュータサイエンス分野における2020年から2024年までのサーベイ論文、合計10,063本を調査しました。その結果、サーベイ論文の数は近年、爆発的に増加していることが判明しました。グラフを見ると、2020年に1,421本だった論文数は、2024年には2,868本へと、わずか4年で倍増しています。特に注目すべきは、2022年後半のChatGPTの登場以降、その増加が著しく加速している点です。
この増加がAIと関連していることは、他のデータからも明らかです。AIコンテンツ検出器による「AI生成スコア」の平均値は、2022年の0.29から2023年には0.49、2024年には0.64へと急上昇しています。さらに憂慮すべきは、「異常な著者」の増加です。ここでいう異常な著者とは、「1ヶ月に3本以上のサーベイ論文を、2人未満の共著者で投稿する」といった、通常では考えにくい活動パターンを示す研究者を指します。この数も2020年の171人から2024年には366人へと増加しており、中には自身の専門分野外の論文を短期間に乱発するケースも見られるといいます。
この「DDoS攻撃」と名付けられた現象は、単に論文の量が増えたというだけではありません。AIが生成した、あるいはAIの助けを借りて書かれたサーベイ論文が、研究コミュニティの処理能力を圧倒し始めているのです。まさに、サーバーに過剰なリクエストを送りつけてサービスを停止させるDDoS攻撃のように、研究者という「サーバー」が、低品質な情報の洪水によって「サービス停止」の危機に瀕している。これが論文の核心的な主張です。
生成AIの登場により、サーベイ論文の数が爆発的に増加しました。
「コピペの再構成」か? AIサーベイが抱える深刻な品質問題
数が増えるだけなら、まだ良いのかもしれません。しかし、著者らが指摘する最大の問題は、濫造される論文の品質の低さです。本来、サーベイ論文とは、その分野の専門家が膨大な文献を読み解き、批判的に吟味し、新たな分類法(タクソノミー)を提示することで、後続の研究者に洞察と権威ある指針を与える価値ある作業でした。しかし、AIによって自動生成された疑いのあるサーベイの多くは、そうした本質的な価値を欠いています。
例えば、分野の概念構造を無視した単なるトピックの羅列であったり、Wikipediaや既存の論文の分類を模倣するだけで、何の新規性もないものが目立っているのです。最も深刻なのは、引用と内容の不正確さです。AIはキーワードマッチングに基づいて文献を収集する傾向があり、その結果、分野の基礎となった重要な論文を見落とす一方で、関連性の低い論文を過剰に引用してしまうのです。さらに恐ろしいのは、LLMのハルシネーション(幻覚)によって、存在しない論文を引用するフェイク引用すら発生している点です。
こうしたAI生成サーベイは、異なる著者による論文であっても、内容や表現が酷似している冗長性も問題視されています。ある機械学習のトピックに関する最近のサーベイ10本を分析したところ、任意の2論文間で平均60%から70%もの引用文献が重複していたという報告もあります。これは、AIが同じような情報源から似たようなテキストを生成している可能性を示唆しています。研究者は、本質的に同じ内容の論文を、何度も読まされる羽目になっているのです。
研究者を疲弊させ、信頼を蝕む「文献汚染」という新たな脅威
この「サーベイ論文DDoS攻撃」は、研究文化そのものに深刻な悪影響を及ぼしています。まず、最前線の研究者たちは「文献の混乱」に直面しています。特にキャリアの浅い研究者にとって、溢れかえるサーベイ論文の中から、どれが本当に信頼できる権威あるものなのかを見分けるのは至難の業です。また、論文を審査する査読者の負担も激増しています。彼らは、疑わしい論文に捏造された引用がないかを確認するため、余計な検証作業に時間を奪われています。AIが自動生成したと疑われる中身のない論文の査読は、査読者たちの意欲をも削いでいます。
事態を重く見た学術誌の編集者たちも対策に乗り出しています。多くのトップジャーナルは、AIの使用を開示することを著者に義務付け、LLMを「著者」として認めることを明確に禁止しました。著名な「Science」誌の編集長は、「ChatGPTは楽しいが、著者ではない」と題した論説を発表し、AIには学術的な責任を負うことができないと断じています。AIが人間のツールであることは間違いありませんが、その責任の所在は常に人間にあるべきです。
しかし、著者らが最も危惧するのは、この現象が引き起こす「文献汚染(Literature Poisoning)」です。arXivのようなオープンなプラットフォームで簡単にアクセスできる低品質なAIサーベイが、そのアクセスのしやすさ故に他の論文(多くはまた別のAIサーベイ)に引用されてしまうのです。このループが繰り返されることで、本来評価されるべき質の高い研究が埋もれ、質の低い情報ばかりが目立つようになってしまうのです。これは学術的な知識の質そのものを歪め、科学全体の信頼性を損なう、危険な兆候と言えるでしょう。
今すぐ最大6つのAIを比較検証して、最適なモデルを見つけよう!
AIとの共存は可能か? 提案される「ダイナミック・ライブ・サーベイ」という未来
では、私たちはこの「DDoS攻撃」にどう立ち向かえばよいのでしょうか。短期的な対策としては、まず「透明性の確保」が挙げられます。著者はAIの使用を明確に開示し、査読者はサーベイ論文に対して「新たな洞察や分類法を提示しているか」といった、より厳格な基準を適用すべきだと主張します。また、高品質なサーベイ論文を正しく評価するため、「ベストサーベイ論文賞」のようなインセンティブを設けることも提案されています。
さらに、著者らはより長期的かつ革命的なアイデアとして、「協調的かつ動的なライブ・サーベイ」というフレームワークを提案しています。これは、従来の「一度出版したら終わり」という静的な論文の在り方そのものを見直すものです。このフレームワークでは、まずAIエージェントがarXivなどの最新情報を常時監視し、新しい論文の要約やデータを自動でリポジトリに取り込みます。
そして、人間の専門家がそのAIが集めた情報を「キュレーション」するのです。AIが生成した要約を検証し、文脈を与え、批判的な解釈を加え、分類を洗練させる。まさに、AIと人間が協調するわけです。このシステムは、ソフトウェア開発におけるGitHubのようにバージョン管理され、誰がどのような貢献をしたかが透明に記録されます。AIに単純作業(情報の収集と一次要約)を任せ、人間はより高度な知的作業(解釈と統合)に集中する。これこそが、AI時代の新しい学術コミュニケーションの形かもしれません。
サーベイ論文のDDoS攻撃とその対応策の提案です。
「量」から「意味」へ、AI時代の研究に求められる誠実さ
この論文は、AIがもたらす負の側面を指摘しつつも、AIの可能性を否定しているわけではありません。著者らは、自分たちの提案が「反AI(anti-AI)」ではなく、「誠実さのため(pro-integrity)」であると述べています。目指すべきは、AIによって人間の洞察を置き換えることではなく、強化することです。安易な論文の量産は、研究コミュニティ全体を疲弊させ、信頼を失墜させるだけ。それはAIの未来にとっても不幸なことです。
コンテンツが無限に自動生成されうる時代において、私たちが本当に価値を置くべきは、もはや「量」ではありません。論文が指摘するように、真の課題は「意味、深さ、そしてコミュニティとしてのアカウンタビリティ(説明責任)」をいかに維持していくか、です。AIの力を信じるからこそ、私たちはこうしたネガティブな情報にも真摯に目を向け、技術を正しく導くための議論を続けなければならない。そう強く感じさせられる、非常に重要なレポートでした。
この記事の監修
柳谷智宣(Yanagiya Tomonori)監修
ITライターとして1998年から活動し、2022年からはAI領域に注力。著書に「柳谷智宣の超ChatGPT時短術」(日経BP)があり、NPO法人デジタルリテラシー向上機構(DLIS)を設立してネット詐欺撲滅にも取り組んでいます。第4次AIブームは日本の経済復活の一助になると考え、生成AI技術の活用法を中心に、初級者向けの情報発信を行っています。
