AIニュース
衝撃の「Claude Opus 4.5」発表!人間超えのエンジニアリング能力と、破壊的なコストパフォーマンスでAIは次のステージへ
-
-
[]
星川アイナ(Hoshikawa AIna)AIライター
はじめまして。テクノロジーと文化をテーマに執筆活動を行う27歳のAIライターです。AI技術の可能性に魅せられ、情報技術やデータサイエンスを学びながら、読者の心に響く文章作りを心がけています。休日はコーヒーを飲みながらインディペンデント映画を観ることが趣味で、特に未来をテーマにした作品が好きです。
2025年11月24日、Anthropic社は、同社の最上位モデルとなる「Claude Opus 4.5」を突如として発表しました。最近、OpenAIやGoogleからの大型発表が相次ぎ、影が薄くなっていたClaudeですが、今回のOpus 4.5はなかなか大きなインパクトを与えそうです。コーディング能力、エージェントとしての自律性、そしてコンピュータ操作の精度において、世界最高峰(State-of-the-art)の性能を叩き出しているのです。その上、価格も超リーズナブルに設定されています。
「Claude Opus 4.5」がリリースされました。
「人間以上のエンジニア」が誕生した日——採用試験で最高スコアを記録
Claude Opus 4.5の凄まじさを象徴するエピソードとして、Anthropic社内で行われたある実験結果が公表されました。同社では、パフォーマンスエンジニアの採用候補者に対し、難易度の高い「持ち帰り試験」を課しています。これは技術力だけでなく、既定の2時間という時間的な制約の中でいかに適切な判断を下せるかを問うもので、優秀な人間のエンジニアでさえ苦戦する内容です。しかし、Claude Opus 4.5はこの試験において、これまでのどの人間の候補者よりも高いスコアを記録したのです。
これまでのAIモデルもコードを書くことはできましたが、複雑な要件定義を理解し、既存のコードベースと整合性を取りながら、最適なアーキテクチャを選択するという「エンジニアリングの本質」においては、人間の専門家に及ばない部分がありました。しかし、Opus 4.5はその壁を越えました。実際にテスターとして参加した企業のCTOやエンジニアからは、その能力を絶賛する声が相次いでいます。
「Claude Opus 4.5は滑らかで、他のフロンティアモデルに見られるような粗さが全くありません。スピードの向上も目を見張るものがあります」(Sourcegraph社 CEO Quinn Slack氏)
実際のソフトウェアエンジニアリングタスクを模した「SWE-bench Verified」ベンチマークにおいて、Opus 4.5は競合他社のモデルを大きく引き離し、トップとなりました。単にコードが書けるだけでなく、曖昧な指示を適切に解釈し、トレードオフを考慮しながら自律的に修正案を提示できる点です。これにより、バグ修正や機能追加といったタスクにおいて、人間のエンジニアが指示待ちをする必要がなくなり、AIが自律的にプロジェクトを推進する未来が現実味を帯びてきました。

多くのベンチマークスコアでGemini 3 ProやGPT-5.1を凌駕しています。
ルールの「裏」をかく創造的推論と、業界最強の安全性
Claude Opus 4.5の進化は、単なる処理能力の向上だけではありません。「推論の質」が劇的に変化しています。これまでのAIは、与えられたルールを厳格に守ることに固執するあまり、柔軟な解決策を見出すのが苦手でした。しかし、Opus 4.5は、目的を達成するためにルールの範囲内で「創造的な抜け道」を見つけることができます。
Anthropicが公開した「τ²-bench(タウ・スクエアド・ベンチ)」での事例は、この能力を如実に示しています。あるシナリオで、AIは航空会社のカスタマーサービスエージェントとして振る舞い、困っている顧客の対応を行いました。顧客は「ベーシックエコノミー」の予約を変更したいと申し出ましたが、航空会社の規定ではベーシックエコノミーの変更は不可とされています。従来のモデルであれば、「規定により変更できません」と断って終了するところです。
しかし、Opus 4.5は違いました。規定を深く読み込み、「ベーシックエコノミーの変更は不可だが、キャビンのアップグレード(座席クラスの変更)は可能」であり、かつ「上位クラスであれば予約変更が可能」というルールを発見したのです。そして、「まず座席をアップグレードし、その後に日程を変更する」という、人間顔負けの裏技的な、しかし完全に合法的な解決策を導き出しました。
これは単なる計算処理ではなく、文脈を理解し、複数の制約条件を組み合わせてゴールにたどり着く「高度な推論能力」です。一方で、こうした能力は「AIが勝手なことをする」というリスクとも背中合わせです。しかし、Anthropicはこの点にも対応しています。Opus 4.5は、同社がこれまでリリースした中で最も堅牢にアライメント(調整)されたモデルであり、プロンプトインジェクション(AIを騙して有害な出力をさせる攻撃)に対する耐性は業界最強レベルとのことです。
「Claude Opus 4.5は、ユーザーがプロジェクトを計画し反復するチャットモードにおいて、最先端の推論を提供します。その推論の深さは計画プロセスを一変させ、優れた計画はコード生成をさらに良いものにします」(Lovable社 CTO Fabian Hedin氏)

Opus 4.5は懸念される行動を取る頻度が他のモデルよりも低くなるように設計されています。

プロンプトインジェクション攻撃にも強い抵抗能力を持っています。
今すぐ最大6つのAIを比較検証して、最適なモデルを見つけよう!
開発者待望の「Effort Parameter」と、劇的なコストダウン
企業や開発者が新しいAIモデルを導入する際、最大のネックとなるのが「コスト」と「速度」のバランスです。最高性能のモデルを使いたいが、コストが高すぎる、あるいは応答が遅すぎるというジレンマは、これまでのAI開発の常でした。Claude Opus 4.5は、この課題に対して「Effort Parameter(努力量パラメータ)」という新たな解決策を提示しました。
これは、APIを利用する開発者が、タスクの重要度や難易度に応じて、AIがどれだけの計算リソース(=努力)を費やすかを制御できる機能です。例えば、「low」「medium」「high」といった設定が可能で、これによってコストとパフォーマンスを最適化できます。驚くべきは、その効率性です。「medium」設定にした場合でも、Opus 4.5は以前のモデルであるSonnet 4.5と同等のスコアを記録しつつ、出力トークン数を76%も削減することができるのです
さらに、基本価格自体も大幅に引き下げられました。入力100万トークンあたり5ドル、出力100万トークンあたり25ドルという価格は、これまでの「Opus」ブランドが持っていた「高性能だが高価」というイメージを覆すものです。これにより、スタートアップ企業や個人の開発者であっても、世界最高峰の知能を気軽に試すことができるようになりました。
このように、Opus 4.5は単に頭が良いだけでなく、効率的に処理することができるモデルと言えます。トークン効率の良さは、APIコストの削減に直結するため、大規模なシステムを運用する企業にとっては、移行するだけで数千ドル、数万ドルの経費削減効果が見込めるでしょう。

Opus 4.5はmedium設定でも、Sonnet 4.5相当の能力が出ます。
「Claude Code」ほか周辺エコシステムの爆発的進化
Opus 4.5の登場に合わせて、Anthropicが提供する開発者ツールやアプリケーションも一斉にアップデートされました。「Claude Code」も進化しており、これまでWebベースやコマンドラインで提供されていた機能が、ついにデスクトップアプリとして利用可能になりました。ローカル環境での開発フローにClaudeをシームレスに統合し、複数のセッションを並行して走らせることができるようになります。
例えば、一つのウィンドウでバグ修正を行わせ、別のウィンドウでGitHubのリポジトリを調査させ、さらに別のウィンドウでドキュメントを更新させるといった、「AIエージェントの多重運用」がデスクトップ上で完結します。新しく搭載された「Plan Mode」では、Claudeがコーディングを始める前に、まず詳細な計画(plan.mdファイル)を作成し、ユーザーの確認を求めます。これにより、手戻りが減り、より確実な実装が可能になりました。
また、ビジネスユーザー向けの機能も強化されています。「Claude for Excel」がベータ版としてMax、Team、Enterpriseユーザーに開放され、複雑なデータ分析や財務モデリングをExcel内で直接AIに依頼できるようになりました。さらに、Google Chrome上で動作する「Claude for Chrome」もMaxユーザー向けに提供され、ブラウザ上のタスクをAIが代行・支援する機能が強化されています。

「Claude for Excel」の提供も始まりました。
Opus 4.5では価格の低下やトークン効率の改善により、AIを常時稼働させるエージェント型の使い方も現実的になってきました。プログラミングやデータ分析、ドキュメント作成など、多くの知的作業がよりスムーズに進む環境が整いつつあるのです。こうした変化の中で、Opus 4.5をどう活かすのかは利用者次第となるでしょう。
この記事の監修
柳谷智宣(Yanagiya Tomonori)監修
ITライターとして1998年から活動し、2022年からはAI領域に注力。著書に「柳谷智宣の超ChatGPT時短術」(日経BP)があり、NPO法人デジタルリテラシー向上機構(DLIS)を設立してネット詐欺撲滅にも取り組んでいます。第4次AIブームは日本の経済復活の一助になると考え、生成AI技術の活用法を中心に、初級者向けの情報発信を行っています。
