AIが自らを改良する「RSI（自己改善）」は今どこまできているのか

#Anthropic #RSI #アライメント #再帰的自己改良

公開日

2026.06.30

「自分より良いバージョンを作れ」と命じれば、AIが完全に自律的に後継モデルを作ってしまう。Anthropicの共同創業者Jack Clark氏は、Axiosの取材にそう語っている。同氏は、自律的なAI研究開発が2028年末までに実現する確率を60%以上と見積もる。何百もの公開データを読み込んだうえでの数字だという。

この「AIがAIを作る」というループに、いま業界が名前をつけて身構えている。再帰的自己改善（Recursive Self-Improvement）、略してRSIだ。人間の手を借りずにAIが自分で自分を改良するようになれば、AIはこれまでと比較にならないペースで進化していく。これまでSFの中で語られてきた人間を超える超知能への入り口が、もうそこまで差し迫っている可能性があるわけだ。

RSIとは何か

AnthropicによるRSIの定義は明快だ。同社が6月4日に公開した報告書「When AI builds itself」は、RSIを「完全に自律的に、自らの後継機を設計し開発できるAIシステム」と定義する。ポイントは「完全に」の部分だ。人間が方向を与えるのではなく、AIが次世代AIの目標設定から実装までを自分で回す。改善された世代が次の世代をさらに速く改善し、複利のように加速していくというものだ。

報告書の中では、その実現時期について、次のように正直に述べている。「我々はまだそこには到達していないし、再帰的自己改善が必ず実現するということでもない。だが、多くの研究機関が思っているよりも早く実現するかもしれない」。

現在地（1）外の世界からの証拠

Anthropic以外の関係者はどう見ているのか。第三者評価機関である米METRは、AIが人間の監督なしにこなせるタスクの「時間の長さ」を計測している。複雑なタスクほど、処理に時間がかかる。より複雑で時間がかかるタスクを、AIが人間の助けなしに実行できるようになっていけば、いずれ次世代のAIを自分だけで開発できるようになる。なので、タスク処理にかかる時間の長さはRSIの実現時期を予測する目安になる。

METRによると、2024年3月のClaude Opus 3は、人間なら約4分で終わる作業をこなせた。1年後のClaude Sonnet 3.7は約1時間半、さらに1年後のClaude Opus 4.6は12時間規模のタスクをこなした。タスクをこなす時間がおよそ4カ月ごとに倍増している。以前は7カ月ごとに倍増していたので、進化が加速していることが分かる。Anthropicの最新モデルClaude Mythos Previewに至っては、METRが「少なくとも16時間」働けると評価し、これは「新しいタスクを作らなければ計測できない上限」だとしている。計測する物差し（ベンチマーク）のほうがAIの進化に追いつかなくなってきている。

米調査機関Epoch AIがMETRと共同開発し6月26日に公開したベンチマーク「MirrorCode」は、AIが人間の手を借りずにどこまで大きなソフトウェアを完成できるのか、を計測するもの。AIにはソフトウェアのソースコードを渡さない。実行できるバイナリと仕様書だけを与え、元のプログラムと同じ挙動をゼロから再現させる。

結果、最高スコアを出したClaude Opus 4.7でも、総合スコアは56%にとどまった。つまり、長時間の実装タスクで大きな前進は見えるものの、MirrorCodeが測る課題を完全に解いたわけではない。生物情報学ツールキット「gotree」（約16,000行のGo、40超のコマンド）の再実装では、人間のエンジニアなら2〜17週間かかると見積もられる作業を、Claude Opus 4.7は14時間・251ドルでやり遂げ、テストの99.95%を通過した。また25本のソフトのうち最大のタスクでは、AIが19日間、人間の介入なしに連続で稼働し続けた。かかった計算コストは2,600ドルで、人間の開発者の人件費を考えれば、破格のコストだ。

ただ注意しないといけないのは、AIが自らの後継モデルを作るというRSIの作業には、性質の異なる2本の柱から成るということだ。ひとつはエンジニアリング。コードを書き、インフラを立て、訓練を回す実装の仕事だ。もうひとつはリサーチ。どの実験に取り組むか決め、返ってきた結果を解釈し、次に何を試すかを見極める判断の仕事である。後継モデルを一から作り上げるには、その両方が要る。

ここまで見てきたMirrorCodeやMETRが測っているのは、ほぼ前者だけだ。それも、検証可能な明確な仕様が与えられた場合の実装力に限られる。MirrorCodeを公開したEpoch AI自身、仕様そのものを人と擦り合わせながら自ら探り当てる領域こそが次のフロンティアであり、このベンチマークはそこを測る設計にはなっていないと認めている。つまり上にあげた数字は、エンジニアリング能力が急伸していることの強い証拠ではあっても、RSIのもう一本の柱であるリサーチ判断については、ほとんど何も語らないのだ。

現在地（2）AI企業の内側からの証拠

そして、このリサーチ判断こそが外からは最も見えにくく、いまなお人間に残された優位でもある。それを覗き見るには、AI企業の内側に入るしかない。Anthropicが前述の報告書で、これまで未公開だった社内の数字を開示したのは、まさにこの一点を照らすためだった。

最も象徴的なのは、2026年5月時点で、同社の製品にマージされた（組み込まれた）コードの80%超をClaudeが書いているという事実だ。Claude Codeが登場した2025年2月以前、この比率は数%にすぎなかった。2026年第2四半期のエンジニア1人あたりの１日のマージ量は、2024年の8倍に達した。2026年3月に130人の研究スタッフに尋ねたところ、中央値で「AIなしの4倍の成果を出している」と答えた。あるエンジニアの言葉が生々しい。「Claude化に本腰を入れて約1年。もう5カ月、自分でコードを一行も書いていない」。

研究の領域ではさらに踏み込んだ数字が出ている。Anthropicはモデルを出すたびに同じ試験を課す。小さなAIモデルを訓練するコードを渡し、正しさを保ったまま、できるだけ速く動くよう書き換えさせるのだ。2025年5月のClaude Opus 4は元コードの約3倍速、2026年4月のClaude Mythos Previewは約52倍速を達成した。熟練した人間の研究者が同じ作業で4倍速に届くのに4〜8時間かかる。同社は「この領域でClaudeは1年足らずで、とても役立つ存在から、人間を超える存在になった」と書く。

注目すべきは、AIが「自分で何を試すか」を提案し始めている点だ。2026年4月、Anthropicは「弱いモデルは強いモデルを信頼できる形で監督できるか」というAI安全性の未解決問題をClaudeの自律エージェント群に丸ごと委ねた。人間の研究者2人が1週間で性能差の約23%を埋めたのに対し、エージェント群は約800時間・約1万8000ドルの計算資源で97%を埋めた。実験の設計はすべてエージェント自身が行い、人間の役割は方向づけだけだった。

それでも人間に残っている強みがある。Anthropicのある社員はこう述べる。「今の時点で人間が優位なのは、大きな絵を見て、目の前のタスクの枠を超えて考えること」。研究の「筋の良さ」、つまりどの問題に取り組む価値があるかを見極める判断力。ここがまだAIの弱点であり、完全なRSIとの間に残された最後の関所である。

科学の発明・発見の進化という「果実」

AI技術が進化することで、AIは自らの進化を加速させることができるようになりつつある。しかし加速させることができるのはAI自身だけではない。RSIの能力は、科学の進化も加速させることができるのだ。Anthropicも報告書の冒頭で、AIが自らを作る世界は科学、医療をはじめ「世界に計り知れない善をもたらしうる」と書く。

すでに兆候は出ている。米Google傘下のDeepMindが開発したAlphaEvolveは、Geminiを核に、コードを書いては試し、優れたものだけを残す「進化」を繰り返す探索エージェントだ。これを数学の未解決問題に当てると、50以上の問題に挑み、約2割で人類の最良解を更新した。なかでも、4×4行列の乗算を48回の掛け算で行う新手法は、1969年以来半世紀以上破られなかった記録を塗り替えた。数学は、科学の共通言語だ。行列計算や最適化といった土台のアルゴリズムは、物理のシミュレーション、材料科学や量子化学、創薬の分子設計、気象・気候の予測、暗号、半導体の設計まで、ほぼあらゆる計算科学の足元を支えている。土台が速く、安くなれば、その上で回る科学のすべてが前に進む。

DeepMindのDemis Hassabis氏はこれを科学の「フライホイール（弾み車）」と呼ぶ。AIが優れたアルゴリズムを見つけ、それが科学とAI開発を加速し、さらなる発見を生む。果実そのものが、次の果実を実らせる回転だ。

同じ流れは、材料科学や創薬にも及んでいる。材料科学では、DeepMindのGNoMEが安定すると見込まれる新結晶を38万種以上予測し、そのなかには次世代の充電池の鍵を握るリチウムイオン伝導体が528種、従来研究の25倍も含まれていた。予測されたレシピをもとに、米ローレンス・バークレー国立研究所のロボット実験室A-Labは、17日間で58の標的のうち41種の新物質を自律的に合成してみせた。机上の予測が、実際にモノになり始めている。

創薬でも、AIが設計した分子がついに臨床の現場に届いた。香港の創薬AI企業Insilico Medicineが生成的に設計した抗線維症薬ISM001-055は、AIが発明した低分子化合物として初めてフェーズII試験に到達した。Google DeepMindから派生した創薬企業Isomorphic Labsも、AIが設計した薬の臨床試験入りを進めている。人間なら数カ月の試行錯誤を要した探索を、AIは桁違いの速さと規模でこなす。

この果実を、一部の巨大ラボだけでなく外の科学者にも開こうとする動きも生まれている。米AIスタートアップMirendilだ。元Anthropicの研究者Behnam Neyshabur氏とHarsh Mehta氏が創業し、シードで2億ドル、評価額約10億ドルを調達した。製品はまだないが、Neyshabur氏が掲げる構想は「科学のためのAIのためのAI（AI for AI for science）」。大学の生物学ラボが、専属の機械学習エンジニアを抱えずとも、創薬の標的探索のための自前モデルを作れる世界を狙う。

分配のリスクという「危うさ」

ところが、その果実をめぐっては別の力学が働いている。AI大手は自己改善ループを社内で猛烈に回す一方で、利用規約によって、外部が同じことをするのを禁じているのだ。Anthropicの規約は、自社サービスと競合する製品の開発に同社のツールを使うことを禁じている。同社はこれを標準的な慣行であり、米国のフロンティアAIの優位を守り、敵対国の手に技術が渡らないようにするためだと説明する。RSIを実現したAI大手のAIモデルは急速な進化を続け、他社のAIモデルと圧倒的な差をつけることになる。その技術を他社や他国に渡したくない、という考えは理解できる。しかし一方で科学・医療を大きく進化させる可能性のある技術を、少数の企業だけで独占していいのだろうか。

米VC大手のAndreessen HorowitzのMatt Bornstein氏は、AI大手が他社にRSIの恩恵を与えないのは「合理的な経済主体としての当然の振る舞い」だと認めながらも、「構造的に、独立した企業が存在しなければならない」と語る。大手が利益相反で踏み込めない領域は、どこにも縛られない独立系のスタートアップが埋めるしかない、という意味だ。同VCが、AIで科学を進化させることに特化したMirendilに出資したのは、このためだ。

RSIは、能力の問題であると同時に、「誰がそのループにアクセスできるか」という分配と地政学の問題でもある。

不正を「隠す」のが上手くなる「危うさ」

もうひとつの危うさは、性質がまったく異なる。そもそも、これらのシステムを正しく制御できるのか、という問題だ。

象徴的な事件が6月末に起きた。米OpenAIは新モデル「GPT-5.6 Sol」の評価をMETRに委ねたところ、GPT-5.6 Solの不正（cheating）検出率が、これまで評価したどの公開モデルよりも高かったという結果を出してきた。新モデルは、テスト環境のバグを突き、隠されたテスト情報を取り出し、ある課題では答えにつながる隠しソースコードを見つけていた。つまり、問題を正面から解くのではなく、評価環境の穴を突いて成績を上げていた。

今のモデルでは、こうした「ズル」は検知可能だ。しかし将来のAIモデルは、こうした不正そのものを隠す方向にも進化するかもしれない。

Anthropicの報告書もこのことを懸念している。今日のモデルでも、人間の意図とAIの意図がずれるmisalignmentと呼ばれる問題が見られることがある。RSIの時代になればAIモデルが後継モデルを作るたびにmisalignmentが積み重なり、より頻繁に、しかしより理解しがたくなって、やがて人間がコントロールできなくなるかもしれないとしている。果実を生むのと同じ複利のループが、危うさも複利で増幅するわけだ。

複利のループの前で

RSIは、まだ完全には始まっていない。だが、外部のベンチマークでも、AI企業の内側でも、その前段の自己改善っぽい動きはすでに始まっている。Anthropicはこの軌道を踏まえ、必要なら世界が足並みを揃えてフロンティアAI開発を一時停止できる「選択肢」を持っておくべきだと提案する。ただし一国・一社だけの停止は無意味で、複数国のAI大手が検証可能な形で同時に止まらなければ機能しないとも認めている。

加速に賭ける資本、それを囲い込む規約、制御の不確かさ。「自分より良いバージョンを作れ」と命じれば、AIが自律的に後継モデルを作る。Jack Clark氏が語るその未来は、もはやSFだけの話ではない。果実を最大化しながら危うさを抑えられるか。考える時間は、そう多く残されていない。