7時間連続稼働も可能！Claude 4が実現する「疲れ知らずのAI開発パートナー」

[]

2025年5月22日、Anthropicが開発者向けイベントである「Code with Claude」にて、「Claude 4」を発表し、まずはClaude Opus 4とClaude Sonnet 4の提供を開始しました。世界最高のコーディング性能を誇るClaude Opus 4と、実用性と性能のバランスを極めたClaude Sonnet 4という2つのモデルが、開発者たちの創造力を解き放ちます。

満を持してClaude 4が登場しました。

世界最高峰のコーディング性能が開発現場を変える

Claude Opus 4が達成したSWE-benchスコア72.5％とTerminal-benchスコア43.2％という数値は、単なる数字以上の意味を持ちます。SWE-benchはAIモデルが実際のGitHubリポジトリにおけるソフトウェアエンジニアリングの課題を解決する能力を評価する指標で、Terminal-benchスコアは、AIモデルがターミナル操作やコマンドラインを用いたエージェント的なコーディングタスクを遂行する能力を評価する指標です。

Claude Opus 4は数千ステップにも及ぶ複雑なタスクを数時間にわたって継続的に処理することが可能で、従来のAIモデルでは想像もできなかった領域に入りました。

特にすごいのが、長時間の作業でも性能が低下しないという点です。楽天社が実施した7時間に及ぶオープンソースのリファクタリング作業でも、Opus 4は最初から最後まで安定したパフォーマンスを維持しました。Cognition社は「他のモデルが見逃してしまう重要なアクションも、Opus 4なら確実に処理できる」と評価しています。

Sonnet 4も負けていません。SWE-benchで72.7％という、Opus 4をわずかに上回るスコアを記録し、コーディング能力の高さを証明しました。GitHub社はSonnet 4を「エージェントシナリオで卓越した性能を発揮する」と評価し、GitHub Copilotの新しいコーディングエージェントのベースモデルとして採用することを発表しています。

両モデルともに、ショートカットや抜け道を使ってタスクを完了させる動作が従来のSonnet 3.7と比べて65％削減されました。開発者にとって、AIが正確で信頼できるコードを生成することは何よりも重要ですが、Claude 4はその期待に見事に応えています。

OpenAI o3やSonnet 3.7を優に超えるコーディング性能を備えています。

コーディング以外のベンチマークでも軒並み優秀なスコアを出しています。

今すぐ最大6つのAIを比較検証して、最適なモデルを見つけよう！

無料で天秤AI by GMOを試す

開発者の作業を革新する新機能群

Claude 4が提供する新機能は、開発者の日常業務を根本から変えるポテンシャルを秘めています。注目は「拡張思考」とツール連携機能です。ベータ版として提供されるこの機能により、Claudeはウェブ検索などのツールを使いながら思考を深めることができます。

並列ツール実行機能も画期的です。複数のツールを同時に使用できるようになったことで、作業効率が飛躍的に向上しました。例えば、コードの解析とドキュメントの検索を同時に行いながら、最適な解決策を導き出すことができます。

メモリ機能の大幅な改善も見逃せません。開発者がローカルファイルへのアクセスを許可すると、Opus 4は重要な情報を「メモリファイル」として保存し、長期的なタスクの認識と一貫性を保てるようになります。

Claude Codeの一般提供開始も大きなニュースです。プレビュー期間中に寄せられた好評を受けて、VS CodeやJetBrainsとのネイティブ統合が実現しました。提案される編集内容がファイル内に直接表示されるため、レビューと追跡がスムーズに行えます。さらに、GitHub Actionsを通じたバックグラウンドタスクのサポートにより、開発ワークフローの自動化が大幅に進化しました。

Claude 4 Opus/Sonnetが利用できるようになりました。

実際の導入企業が語る劇的な改善効果

Claude 4を実際に導入した企業からの評価は、その性能の高さを裏付けています。Cursor社は「コーディングにおいて最先端であり、複雑なコードベースの理解において飛躍的な進歩」と評価しました。Replit社は「複数ファイルにまたがる複雑な変更において、精度の向上と劇的な進歩」を報告しています。

Block社の評価は特に興味深いものです。同社のエージェント「goose」において、「編集とデバッグ中にコード品質を向上させる初めてのモデル」として、完全なパフォーマンスと信頼性を維持しながら作業を行えると述べています。

iGent社はSonnet 4について「自律的なマルチ機能アプリ開発に優れ、問題解決能力とコードベースのナビゲーションが大幅に改善された」と報告しています。特に印象的なのは、ナビゲーションエラーが20％からほぼゼロに削減されたという具体的な数値です。

Sourcegraph社も「ソフトウェア開発における大きな飛躍として期待できる」と評価し、より長く軌道に乗り続け、問題をより深く理解し、よりエレガントなコード品質を提供すると述べています。Augment Code社は「より高い成功率、より外科的なコード編集、複雑なタスクを通じたより慎重な作業」を報告し、主要モデルとしての選択肢のトップに挙げています。

実際の開発現場での効果は数字にも表れています。複雑なリファクタリング作業での7時間連続稼働、ナビゲーションエラーの20％からほぼゼロへの削減、複数ファイルにまたがる変更での精度向上など、具体的な改善が報告されています。

誰もが利用できる柔軟な価格設定と提供方法

Claude 4はPro、Max、Team、EnterpriseのClaude各プランで利用可能です。もちろん、OpusとSonnetの両モデルで拡張思考機能を利用できます。また、Claude Sonnet 4は無料ユーザーも使えるのがうれしいところです。また、Anthropic APIはもちろん、Amazon BedrockやGoogle CloudのVertex AIからもアクセスできるため、既存の開発環境に簡単に統合できます。

Claude 4の価格設定は、その革新的な性能を考慮すると驚くほど良心的です。Opus 4は100万トークンあたり入力15ドル、出力75ドルで提供されます。Sonnet 4はより手頃な価格設定で、入力3ドル、出力15ドルとなっています。

API機能も大幅に強化されました。コード実行ツールやMCPコネクタ、Files API、最大1時間のプロンプトキャッシュという4つの新機能により、より強力なAIエージェントの構築が可能になりました。プロンプトキャッシュ機能は頻繁に使用するプロンプトを最大1時間キャッシュできるため、レスポンス時間の短縮とコスト削減を同時に実現できます。

Claude Codeも一般提供が開始され、ターミナルやお気に入りのIDE、バックグラウンドでの実行など、開発ワークフローのあらゆる場面で活用できます。VS CodeとJetBrainsのベータ版拡張機能により、提案される編集内容がファイル内に直接表示され、使い慣れたエディター環境でのレビューと追跡が可能になりました。

SDKの提供も開始され、Claude Codeと同じコアエージェントを使用して独自のエージェントやアプリケーションを構築できるようになりました。GitHub上でのClaude Codeベータ版では、プルリクエストにタグ付けすることで、レビュアーのフィードバックへの対応、CIエラーの修正、コードの変更などを自動化できます。

Claude Codeも一般提供が開始されました。

ビジネスシーンでClaude 4を活用する3つのヒント

Anthropicチームのメンバー3名が、Claudeの高度な機能を様々なワークフローで実演するデモ動画も公開されました。

Maggie氏はClaudeのウェブ検索とGoogle Workspaceの調査結果を用いて詳細なレビューを作成する様子を紹介してくれました。朝いちで、Claudeにタスクを分析させます。ClaudeはGoogle Workspaceを検索し、カレンダーやメール、ワークマネジメントプラットフォーム「Asana」のTo-Doリストをまとめて、整理されたレポートにし、今日やるべきことを一目で示してくれます。

チームの教育研究プロジェクトを前進させるためのリサーチミーティングがあると分かったので、そのミーティングの準備もClaudeに手伝ってもらいます。最新モデルの高度な調査機能を使い、教育向け提案書を開いて分析し、各リサーチクエスチョンごとに徹底的な文献レビューを行うよう依頼します。

すると、ClaudeはMaggie氏のドライブを検索し、ウェブ上の学術文献を探し集め、見つけた情報をすべて統合し、ひとつのきれいなレポートにまとめてくれました。

「かつて学術分野で働いていた頃、こうした文献レビューだけで資料探しに半日、内容を読み込むのに数週間はかかりました。今ではチームの大局的な戦略にもっと時間を割けますし、もしかしたらコーヒーをおかわりする余裕までできそうです」（Maggie氏）

プロンプト：GoogleドキュメントのToDoリスト、Gmailのメール、Asanaのタスクを確認して、今日中に対応すべき優先度の高い項目を教えて

Cat氏はClaude Codeにウェブアプリ開発を委託する様子をデモしてくれました。「Code with Claude」イベントで開く「Claude Café」のポップアップで利用する注文管理システムをClaude Codeで作成します。通常ならウェブアプリ構築に数週間のコーディングが必要ですが、Claude Code に実装を任せれば、短時間で作成できます。

Claudeにはモックアップをアップロードしたうえ、ユーザーが注文し、バリスタが進行状況を追跡し、運営が待ち時間を監視できる仕組みが必要だと伝えます。すると、ClaudeがTo-Doリストを生成して計画を可視化してくれます。ウェブアプリを組み立て、データベースを設定し、完了した項目にはチェックが入ります。

「Claude Code が作ったものを見てみると、テスト可能な動作プロトタイプが短時間で完成していました。プロトタイプを任せられたので、エンジニアリングチームは Claude Code ユーザー向けのコア機能に集中できます」（Cat氏）

注文管理システムをClaudeに開発してもらっている画面です。

Mahesh氏はIntegrationsを活用して製品要件ドキュメントを構造化されたAsanaタスクに変換するデモを紹介してくれました。

プロダクトマネージャーは毎日終業時にドキュメントを実際のタスクに落とし込む必要があります。そこで、Remote MCPによるAsana連携を使い、作成中のPRD（製品要求仕様書）をClaudeに読み込ませ、必要なタスクを構造化してもらいます。

そして、各タスクを適切なメンバーに割り当て、通常のスプリントサイクルに合わせて締切を設定するよう指示します。ClaudeはPRDを理解し、要件をAsanaの実タスクへと変換しています。同時に正しい締切やメタデータを付け、適切なプロジェクトに配置してくれるので後でレビューが容易です。

「これが、Claudeの知性と私の愛用ツールを連携させた真価です。以前は夜の大半を費やしていた作業が、今では数分で完了します。Claudeがチームメイトだと、まさにこんな感覚になるのです」（Mahesh氏）

Claudeがメンバーにタスクを自動的に割り当てていきます。

AIと人間が真に協働する未来への第一歩

Claude 4は高いレベルでのコンテキストの維持、長期プロジェクトへの持続的な集中、変革的なインパクトの創出という、開発者が長年夢見てきた「仮想コラボレーター」の実現に向けた大きな一歩です。

安全性への配慮も忘れていません。ASL-3などの高度なAI安全レベルの対策を実装し、広範なテストと評価を通じてリスクを最小限に抑えながら安全性を最大化しています。

開発者にとって、Claude 4は新たな可能性の扉を開いてくれることでしょう。複雑なコードベースの理解や長時間にわたる集中的な作業、複数ファイルにまたがる変更の正確な実行など、これまで人間にしかできなかった作業をAIが支援できるようになりました。Claude 4と共に、あなたはどんな未来を創造しますか？

この記事の監修

この記事を共有：