AI生成論文が学術誌を侵食。チューリッヒ大が量産の実態を追跡

「引用されすぎる」論文の正体

チューリッヒ大学再現性科学センターの博士研究員ピーター・デーゲンに、指導教官から奇妙な依頼が届いた。2017年に発表した疫学データの統計手法に関する論文が、突如として数百回も引用され始めたという。学術界において引用は業績の通貨だが、この急増には不自然なパターンがあった。

デーゲンが調査したところ、引用元の論文はすべて同じ構造を持っていた。ワシントン大学が公開する「世界疾病負荷研究（Global Burden of Disease）」のデータセットを使い、「20歳以上の脳卒中リスク」「若年層の精巣がんリスク」「中国の高齢者の転倒リスク」といった予測を次々と量産するものだ。The Vergeの報道によれば、デーゲンはGitHubでコードを追跡し、中国のSNS「Bilibili」にたどり着いた。そこでは広州の企業が「2時間以内に出版可能な論文を作成する」チュートリアルを販売していたという。

公開データ×AIが生む「論文工場」

この現象はデーゲンの発見に限らない。サリー大学講師で学術誌『Scientific Reports』の副編集長を務めるマット・スピックも、米国の公開データセット（NHANES）を分析した酷似する論文が3本同時に投稿されてきたことで異変に気づいた。Google Scholarで検索すると、NHANESを引用する同一パターンの論文が爆発的に増加していたという。

学術出版は過去10年、「論文工場（paper mill）」と呼ばれる闇市場と戦ってきた。論文を大量生産し、業績が欲しい研究者や医師に著者枠を販売するビジネスだ。生成AIの登場で、盗用検知を回避する完全新規のテキストや画像の生成が容易になった。かつてはAI特有の破綻——巨大な生殖器を持つラットの図表や、「AIアシスタントとして」という消し忘れの文言——が手がかりだった。だが現在のAIは、そうした明白な痕跡をほとんど残さない。

OpenAI社内講演で米ベストセラー作家、ChatGPTが若者世代の書く力を「沈黙させる」と断罪

「そこそこの品質」が最も厄介である理由

問題の核は、AIが「そこそこ良い」論文を書けるようになったことにある。かつての粗悪な偽論文は検知できた。だが今のAI論文は、個々にエラーや曲解を含みつつも「明らかに偽物」とは言い切れないグレーゾーンに位置する。頭痛に関するAI量産論文を分析した研究者たちは多数の誤りを発見したが、それでも一見すると正規の論文と区別がつかなかったという。

「査読システムはすでに限界にある」とデーゲンは指摘する。論文の投稿数に対して査読者が足りない状態は慢性化しており、AIによる量産がこれに拍車をかけた。出版社が一つの脆弱性を塞いでも、論文工場は別の手口を見つけてくる。今やAIが個人レベルでの論文量産を可能にし、組織的な工場すら不要になりつつあるようだ。

「数」から「問いの質」へ——評価基準の転換が始まる

状況は深刻だが、対抗策も動き始めている。「科学探偵（science sleuths）」と呼ばれる不正研究の専門家たちは、統計的な異常パターンやデータセットの使い回しを検知する手法を磨いてきた。出版社側も、投稿論文のメタデータ分析や類似構造の論文を自動フラグする仕組みの導入を模索しているという。

より本質的な変化の兆しもある。論文の「量」ではなく「質」で研究者を評価する制度への転換だ。引用数や出版数に過度に依存する現行の業績評価が、そもそも論文工場の需要を生んできた。AIが量産コストをほぼゼロにした今、評価基準そのものを見直す圧力はかつてないほど高まっている。2時間で量産される論文と、それを追跡する科学探偵たちのいたちごっこの先に、「数」ではなく「問いの質」で研究者を測る学術界が生まれるのかもしれない。

AI生成論文が学術誌を侵食。チューリッヒ大が量産の実態を追跡

「引用されすぎる」論文の正体

公開データ×AIが生む「論文工場」

OpenAI社内講演で米ベストセラー作家、ChatGPTが若者世代の書く力を「沈黙させる」と断罪

「そこそこの品質」が最も厄介である理由

「数」から「問いの質」へ——評価基準の転換が始まる

バルブがSteam Deckのバッテリー供給を継続、iFixitが来週にも純正在庫を復活

アンソロピックはAIが痛みを感じるか研究する会社。Claudeの隠れた「思考空間」を新発見

元OpenAI幹部のThinking Machines、初AIモデル「Inkling」でアンソロピックの知性ブランドに割って入る

W杯のペドリのスパイクに使われたナノ素材。同じ技術が大腸の傷を縫わずに治す