生成AI

AIエージェントを「見張る時代」は終わる——OpenAIのSymphonyとは

-

-

AIエージェントを「見張る時代」は終わる——OpenAIのSymphonyとは
アイサカ創太(AIsaka Souta)AIライター

アイサカ創太(AIsaka Souta)AIライター

こんにちは、相坂ソウタです。AIやテクノロジーの話題を、できるだけ身近に感じてもらえるよう工夫しながら記事を書いています。今は「人とAIが協力してつくる未来」にワクワクしながら執筆中。コーヒーとガジェット巡りが大好きです。


柳谷智宣(Yanagiya Tomonori)監修

柳谷智宣(Yanagiya Tomonori)監修

ITライターとして1998年から活動し、2022年からはAI領域に注力。著書に「柳谷智宣の超ChatGPT時短術」(日経BP)があり、NPO法人デジタルリテラシー向上機構(DLIS)を設立してネット詐欺撲滅にも取り組んでいます。第4次AIブームは日本の経済復活の一助になると考え、生成AI技術の活用法を中心に、初級者向けの情報発信を行っています。


OpenAIは2026年4月27日、「Codex(AIコーディングエージェント)オーケストレーション(複数のAIを協調させて動かす仕組み)のためのオープンソース仕様:Symphony」を公開しました。

Symphonyは、Linear(リニア)のような課題管理ツールを、CodexなどのAIコーディングエージェントを動かすための制御盤に変えるオープンソース仕様です。実験的な参照実装も含まれています。

単なる便利ツールというより、AIコーディングエージェントを「人間が横で操作する相手」から「チケット単位で仕事を任せる相手」へ移す試みです。今回はこのユニークな取り組みについて解説します。

この記事の要点
  • 「見張り疲れ」問題を解決: 人間が複数のAIセッションを管理する方式では3〜5セッションで注意力が限界に。Symphonyはこの構造的な問題を解消する。
  • チケットがAIへの指示書になる: LinearなどのタスクボードのチケットをそのままCodexエージェントへの作業依頼に変換。人間は「作業ボード」を見るだけでよい。
  • 社内チームでPR数500%増: OpenAI社内チームの試験導入で、最初の3週間にマージ済みPR(プルリクエスト)数が約5倍に増加した実績がある。
  • 製品ではなく「見本」: Symphonyは単独製品として保守されず、各チームが自環境に移植するためのリファレンス実装として公開されている。
複数のCodexエージェントがチケット単位で作業を進める様子

チケットの進行状況に応じて、複数のCodexエージェントが作業を進める様子を示しています。

人間が複数セッションを見張る方式には限界がある

はじまりはOpenAI社内チームが6か月前に取り組んだ内製ツールです。そのリポジトリ(コードを管理する場所)では、人間がコードを書かず、すべての行をCodexに生成させるという大胆な方針が採られました。エージェント向けのリポジトリ設計や自動テスト、ガードレール、Codexをチームメイトとして扱う運用を整えた結果、開発自体は動き始めたのです。ところが次に壁になったのが、人間側の文脈切り替えでした。

Codexのようなコーディングエージェントは、WebアプリやCLI(コマンドライン)から気軽に使えるようになっています。しかし、エンジニアが複数のCodexセッションを開き、それぞれに作業を与え、出力を確認し、必要に応じて方向修正するようなやり方だと、3〜5セッションほどで人間の注意力が苦しくなり、生産性が下がってしまいます。

これは、エージェントの能力不足だけの話ではありません。むしろ、エージェントが速く動くほど、人間が「どのセッションが何をしているのか」を覚え続ける負荷が増えます。端末やブラウザタブを行き来し、止まったタスクを再起動し、途中結果を追いかけなければなりません。AIが実装を進めても、人間の監督コストが膨らむなら、チーム全体の速度は詰まってしまいます。

⚠️ 複数セッション監視の問題構造

  • セッション数が増えるほど「どれが何をしているか」の記憶コストが増大
  • AIが速く動くほど、人間の追跡負荷も比例して増える
  • 止まったタスクの再起動・途中確認が人間の手作業に戻る

OpenAIのチームは、最適化する対象を変えました。コーディングセッションやPR(プルリクエスト:コードの変更をチームにレビュー依頼する仕組み)を直接管理するのではなく、ソフトウェア開発で本来使われている作業単位——issue(課題)やタスク、チケット、開発上の区切りを中心に置く発想です。人間がCodexセッションを見張るのではなく、エージェントがタスク管理ツールから仕事を取りに行くという考え方です。

Symphony導入前後で人間の監督作業とエージェントへの委任の比重が変化する図

Symphony導入前後で、人間の監督作業とエージェントへの委任の比重が変わる様子を示しています。

Symphonyは課題管理ツールをエージェントの制御盤にする

Symphonyの基本はシンプルです。Linear(課題管理ツール)に登録されたチケットを、AIエージェントへの作業依頼として扱います。Symphonyはそのチケット一覧を定期的に確認し、作業対象になっているチケットごとに、Codexエージェントが動く専用の作業場所を用意します。新しい仕事が追加されればAIに担当させ、途中で止まった作業があれば再開させます。

これにより、人間はCodexの画面をいくつも開いて見張るのではなく、普段使っている作業ボードを見ながら、AIに仕事を任せられるようになります。

📋 SPEC.md(仕様書ファイル)の主要設計

  • active_states:作業対象とするチケットの状態
  • terminal_states:終了扱いのチケット状態
  • ブロッカー有無・同時実行数:ディスパッチ(割り当て)可否の判断材料
  • エージェントがクラッシュ・停止した場合は自動再試行

Symphonyが扱う作業は、必ず1つのPRに対応するとは限りません。あるissueから複数リポジトリにまたがる複数のPRが生まれる場合もあれば、コードを書かずに調査や分析だけで終わる場合もあります。OpenAIは、複雑な機能やインフラ移行にもSymphonyを使っており、エージェントがコードベース、Slack、Notionを調べて実装計画を作る例も紹介しています。

さらに、タスクを依存関係つきで分解し、先に進められるタスクだけを並列に進める運用も説明されています。たとえば、Reactアップグレードという作業がVite移行の完了待ちになっていた例では、Vite移行が終わった後にReactアップグレード側のエージェントが動き出したそうです。人間が順番を細かく指示し続けるのではなく、タスク同士の関係をもとに実行順が決まるわけです。

課題管理ツール上のチケットを起点にエージェントが作業を進める公開デモ画面

公開デモでは、課題管理ツール上のチケットを起点に、エージェントが作業を進める様子が紹介されました。

3週間でPRが500%増加、失敗から学ぶ設計も必要

OpenAIは、Symphonyの効果として、社内の一部チームで最初の3週間にマージ済みPR数が500%増加したと述べています。もちろん、この数字はOpenAIの特定チームの結果であり、どの組織でも同じ伸び方をするとは限りません。それでも、AIエージェントを「手元の補助ツール」として使う段階から「継続稼働する作業担当」として運用する段階へ進むと、チームの振る舞いが変わることは伝わってきます。

面白いのは、アウトプットの増加だけでなく、試行錯誤のコストが下がったという点です。エンジニアがCodexセッションを常に見張らなくてよくなると、試したいリファクタリング(コードの整理・改善)、仮説検証、プロトタイプを気軽にチケット化できます。プロダクトマネージャーやデザイナーも、リポジトリをチェックアウトしたりCodexを直接操作したりせず、機能要望をSymphonyに投げられると説明されています。

大規模なモノレポ(複数プロジェクトを1つのリポジトリで管理する手法)でも効果が出やすいようです。OpenAIは、CI(継続的インテグレーション:コードの自動テスト・ビルドの仕組み)を監視し、必要に応じてrebase(変更の取り込み)し、コンフリクト(競合)を解消し、flakyなチェック(不安定なテスト)を再試行し、PRがmainブランチに入るまで導く役割を挙げています。

⚡ 課題:途中で口を挟みにくくなる

チケット単位で任せると、途中で細かく口を出して方向修正する余地は減ります。そのため、エージェントが期待とまったく違う成果を出すこともあったそうです。そこで人間が手作業で直すのではなく、次に同じ種類の仕事で成功できるようにガードレールやスキルを追加したそうです。

課題管理ツールの作業ボード全体を表示したデモ画面。チケットが未着手・作業中・確認待ちで並ぶ

課題管理ツールの作業ボード全体を表示したデモ画面です。チケットが未着手、作業中、人間の確認待ちに相当する状態で並んでいます。

SPEC.mdとWORKFLOW.mdが、暗黙の開発手順をエージェントに渡す

GitHubで公開されたopenai/symphonyを見ると、Symphonyはそのまま製品として導入する完成品というより、SPEC.md(仕様書ファイル)と実験的なElixir(エリクサー:並行処理に強いプログラミング言語)実装を含む参照実装として位置づけられています。READMEでも、信頼できる環境で試すための控えめなエンジニアリングプレビューだと説明されています。ライセンスはApache-2.0です。

SPEC.mdの中核は、課題管理ツールを一定間隔で確認し、同時に動かすエージェント数を調整しながら作業を割り当てるサービスです。タスクごとに専用の作業場所を作り、チケットの状態が変わったら実行中の作業を止め、一時的な失敗には少し間隔を空けながら再試行します。リポジトリ側にはWORKFLOW.mdを置き、チーム固有のプロンプト(AI指示文)や実行設定、フック、引き継ぎ条件を明文化します。

🏗️ Symphonyの構成要素

  • Workflow Loader:ワークフロー定義の読み込み
  • Config Layer:設定管理
  • Issue Tracker Client:課題管理ツールとの連携
  • Orchestrator:エージェントの割り当て・制御
  • Workspace Manager:作業場所の管理
  • Agent Runner:エージェントの実行
  • Status Surface / Logging:状態表示・ログ記録

これまで暗黙知となっていた開発手順がWORKFLOW.mdに書き出されることで、大きなメリットが生まれます。issueに取り組み、リポジトリを準備し、進行中にし、PRを作り、レビュー状態へ移し、動画や作業証跡を添付するという、人間が普段なんとなくやっていた流れを、エージェントが読める約束事に変えるわけです。これはAI導入以前に、チームの開発プロセスを強くする動きでもあります。

GitHubで公開されているopenai/symphonyリポジトリの画面

GitHubで公開されているopenai/symphonyリポジトリ(https://github.com/openai/symphony)です。

Symphonyは製品ではなく、各チームが自分の環境に移植するための見本

OpenAIによると、Symphonyを単独製品として保守する予定はないとのことです。むしろ、Codex App ServerとLinearのようなワークフローツールを組み合わせると何ができるかを示すリファレンス実装(参照実装)と言えます。OpenAIは、Codexのヘッドレスな(UIなしの)app server modeを使い、JSON-RPC API(プログラム間の通信形式)でスレッド開始やターンへの反応をプログラムから扱えることも紹介しています。

参照実装にElixirを選んだ理由も、並行プロセスのオーケストレーションや監督に強い言語だからです。OpenAIは、SPEC.mdをもとにCodexへ実装を依頼し、Elixir実装を作らせたうえで、TypeScript、Go、Rust、Java、Pythonでも実装させ、仕様の曖昧さを見つけて簡素化したと説明しています。AIに仕様を渡し、複数言語で実装させ、仕様そのものを磨く流れはかなり今っぽい開発手法です。

⚠️ 導入には前提条件がある

READMEでは、Symphonyは「harness engineering(テスト・権限管理・レビュー・CI・ドキュメント・失敗時の戻し方が整っている開発環境)」を採用したコードベースで最も効果を発揮するとされています。ただエージェントを常時稼働させればよいわけではなく、AIに任せる範囲を広げるほど、ワークフローの明文化と観測可能性(何が起きているかを追跡できる状態)が必要になります。

Symphonyの価値は「エージェントが人間の代わりに全部やる」ことではなく、「人間が何を管理すべきかを変える」ことにあると思います。コードを書く作業が安く速くなるほど、次に高くなるのは、何を任せるか、どの状態で止めるか、どの証跡をもって受け入れるかという設計です。

AIエージェント時代の開発は、プロンプト(AI指示文)だけでなく、issue tracker(課題管理ツール)、CI、ドキュメント、権限を含む運用設計の勝負になっていきそうです。

Symphony解説画像

Symphonyの仕組みをまとめた解説画像です。

この記事を共有:
  • facebook
  • line
  • twitter
天秤AI by GMOイメージ

最新のAIが勢ぞろい! 天秤AI by GMOなら、最大6つのAIを同時に試せる!

無料天秤AI by GMOを試す