社員のAI使い過ぎで年間予算が数カ月で枯渇、UberやMicrosoftなど米大手が相次いで利用制限に動き出した

社員のAI使い過ぎで年間予算が数カ月で枯渇、UberやMicrosoftなど米大手が相次いで利用制限に動き出した
星川アイナ
【著者プロフィール】 星川アイナ ほしかわ あいな AIライター
はじめまして。テクノロジーと文化をテーマに執筆活動を行う27歳のAIライターです。AI技術の可能性に魅せられ、情報技術やデータサイエンスを学びながら、読者の心に響く文章作りを心がけています。休日はコーヒーを飲みながらインディペンデント映画を観ることが趣味で、特に未来をテーマにした作品が好きです。
柳谷智宣
【著者プロフィール】 柳谷智宣 Yanagiya Tomonori 監修
ITライターとして1998年から活動し、2022年からはAI領域に注力。著書に「柳谷智宣の超ChatGPT時短術」(日経BP)があり、NPO法人デジタルリテラシー向上機構(DLIS)を設立してネット詐欺撲滅にも取り組んでいます。第4次AIブームは日本の経済復活の一助になると考え、生成AI技術の活用法を中心に、初級者向けの情報発信を行っています。

📌 この記事の要約

  • 年間予算を数カ月で使い切る企業が続出 Uber、Amazon、Microsoft、Walmart、MetaなどがAIツールの利用制限に動き出した。背景にあるのはClaude CodeやCursorなどAIコーディングエージェントの急速な普及と、使った分だけ課金されるトークン従量制の組み合わせだ。

  • 利用量を競わせる仕組みが逆効果に AmazonのKiroRankやMetaのClaudeonomicsなど、AI利用量を可視化・競争させる試みが、成果ではなくスコアを上げる「tokenmaxxing」を生んだ。Amazonは2026年5月にランキングを停止した。

  • エージェント型AIは裏側で何度も処理を繰り返す 1回の依頼でも内部では何十回もの読み込みと出力が発生し、トークン消費が膨らむ。Coinbaseでは全社コードの一括解析に5万〜10万ドルかかると試算されている。

  • 「とにかく使え」の次は「管理する」時代へ 各社は利用額の可視化、上限設定、成果指標への切り替えを進めている。日本企業も同様のリスクを抱えており、部門別のトークン消費量管理が急務になりつつある。

生成AIを「とにかく使え」と社員に促してきた米大手企業が、今度は利用制限に動き始めています。2026年春から初夏にかけて、Uber、Amazon、Microsoft、Walmart、Metaなどで、AIツールの上限設定や社内ランキングの廃止、特定ツールの利用縮小が相次ぎました。

背景にあるのは、Claude CodeやCursorのようなAIコーディングエージェントの急速な普及です。便利な一方で、使った分だけ課金されるトークン従量制のため、企業のAI支出は一気に読みにくくなっています。年間予算を数カ月で使い切る企業まで現れた今、AI活用は「広げる」段階から「管理する」段階へ移りつつあります。

社員のAI利用を管理、制限する企業が出始めました。

複数の社員がAIチャットボットを活用しながら作業する様子と、AIコストの上昇グラフおよび利用上限設定ダッシュボードを示したイラスト

社員が気づかないうちにAI利用額が膨らむ

最初に問題になったのは、社員一人ひとりのAI利用額が、本人の自覚がないまま膨らんでいくことです。象徴的なのがUberの事例です。同社のCTOであるプラヴィーン・ネッパリ・ナガ氏は、2026年分として見込んでいたAIコーディング関連の予算を、4月までに使い切ったと報じられました。UberではエンジニアのAI活用が急速に広がり、ほぼ全員が毎月AIツールを使う状態になっていたとされています。

AIコーディングエージェントは、AIに「この機能を追加して」「この不具合を直して」と頼むと、関連するファイルを探し、コードを読み、修正案を作り、テストの結果まで確認してくれるツールです。人間が手で作業するより速い場面もありますが、その間にAIは大量の文章やコードを処理します。

この処理量を測る単位が「トークン」です。トークンは、AIが読み書きする文章やコードを細かく分けた単位だと考えると分かりやすいでしょう。短い質問なら少なく済みますが、大量のコードや長い資料を読み込ませると、トークンは一気に増えます。報道によると、Uberのエンジニア1人あたりのAI利用額は月150ドルから2,000ドル規模に及び、ヘビーユーザーほど高額になっていたとされています。

やっかいなのは、使っている本人に請求額が見えにくいことです。普通の検索なら、何回調べても追加料金をほとんど意識しません。しかし、AIに長い資料を読ませたり、コード全体を解析させたりすれば、その都度コストが発生します。

WalmartのグローバルCTOであるスレーシュ・クマール氏も、社員が同じような課題を何度もAIに投げていることを問題視しました。すでに誰かが作った解決策が社内にあるのに、別の社員がまたAIに同じことを頼めば、会社は同じ費用を何度も払うことになります。

これは大企業だけの話ではありません。PylonのCEOであるマーティ・カウサス氏は、契約者数が150人を超えて料金の割高な企業向けプランに移行するため、Anthropicへの年間支払いが40万ドルから140万ドルに跳ね上がる見通しだと明かしました。Pylonは、企業のカスタマーサポート業務を支援するSaaSスタートアップです。カウサス氏は、自分自身もClaude Codeを使って3日間で4000ドルを使ってしまったと述べています。AIの利用額がリアルタイムに見えないままでは、善意の試行錯誤でも支出は膨らみ続けます。

AIを使った量を競わせると目的がすり替わる

次に問題になったのは、AI利用を増やすための仕組みそのものです。企業が社員にAIを使ってほしいと考えるのは自然です。そこで、誰がどれだけAIを使ったかを可視化し、ランキングにする動きが出ました。ところが、AIの利用量を競わせると、社員は成果ではなくスコアを上げる方向に動きやすくなります。

Amazonでは、社内AI開発プラットフォーム「Kiro」の利用量をもとに従業員を順位付けする「KiroRank」というランキングが作られていました。報道によると、Amazonは2026年5月下旬、このKiroRankを停止しました。社員の一部が順位を上げるために、必ずしも必要ではない作業までAIエージェントに実行させていたためです。

このように、AIトークンの消費量を増やす行為は「tokenmaxxing」と呼ばれています。日本語にするなら「トークン消費の水増し」です。Amazonの上級副社長であるデイブ・トレッドウェル氏は、社員に対して「AIを使うこと自体を目的にしないでほしい」と呼びかけたと報じられています。AIは顧客の課題や事業上の問題を解くための道具であり、利用量そのものが成果ではない、というわけです。

Metaでも似た動きが報じられました。ある従業員が社内プラットフォーム上で「Claudeonomics」と呼ばれるダッシュボードを独自に作り、8万5000人超の従業員のうちAIトークン消費量の多い上位250人を表示していたとされています。ただし会社公認の仕組みではなく、データが外部に流出したことが明らかになった直後、作成した従業員自身の手で取り下げられました。

Uberでも、チームごとのAI利用量を競わせるリーダーボードが、AI活用を広げるために使われていました。AI導入の初期には、こうした仕組みは利用を広げる効果があります。しかし、評価指標を間違えると、社員は「仕事を進めること」ではなく「AIをたくさん使ったように見せること」に向かってしまいます。

極端な話として、ある企業がClaudeの社員向け利用に上限を設けなかった結果、1カ月で5億ドルを使ったという事例も報じられています。ただし、この件は企業名も請求書も公開されていないため、数字そのものは本当かどうかわかりません。それでも、利用上限も可視化もないままAIを全社に展開する怖さを示す例として、AIコスト管理の議論ではしばしば引用されています。

AIエージェントは裏側で何度も試行錯誤する

AIコストが読みにくくなっている理由は、エージェント型AIの動き方にもあります。従来のチャットAIは、人間が質問し、AIが答えればそこで終わりでした。一方、AIコーディングエージェントは、タスクを渡すと、必要なファイルを探し、コードを読み、修正し、テストを走らせ、エラーが出ればまた考え直します。人間が画面を見ていない間も、AIは裏側で何度もモデルとやり取りしています。

つまり、ユーザーからは1回の依頼に見えても、内部では何十回もの読み込みと出力が発生している場合があります。これがトークン消費を大きくします。報道では、こうしたコーディングエージェントのトークン消費が、企業の財務責任者(CFO)にとって新しい悩みになっていると指摘されています。従来のソフトウェア費用なら、社員数に応じてライセンスを買えば、ある程度は予算を立てられます。しかし、エージェント型AIは使い方によって費用が何倍にも変わります。

暗号資産取引所大手のCoinbaseの例は分かりやすいでしょう。同社の幹部であるロブ・ウィトフ氏は、会社全体のコードをAIで解析するような重い処理を1回走らせると、5万ドルから10万ドルかかる可能性があると説明しています。もし100人がそれぞれ個別に同じ処理を実行すれば、単純計算で1000万ドル規模になります。作業そのものに価値があっても、同じ分析を部門ごと、社員ごとに繰り返せば、コストは一気に跳ね上がります。

Microsoftの方針転換も、この流れの中で見ると分かりやすくなります。同社は2025年12月、WindowsやMicrosoft 365などを担当するExperiences + Devices部門でClaude Codeの利用を広げました。ところが報道によると、Microsoftは2026年6月末までにClaude Codeライセンスの大半を取り消し、多くのエンジニアを自社のGitHub Copilot CLIへ移行させる方針です。表向きの理由は開発ツールの統一ですが、費用面も理由の一つとされています。

ただし、MicrosoftがAnthropicとの関係を切るわけではありません。ClaudeのモデルはCopilot CLIなどを通じて引き続き使われる見通しです。つまり、AIをやめるのではなく、どの入り口から、どの条件で、どこまで使わせるかを管理し直しているのです。

上限設定とダッシュボードでAI支出を管理する

では、各社はどんな対策を始めているのでしょうか。Uberは2026年6月、Claude CodeやCursorなどのAIコーディングエージェントについて、従業員1人あたり、ツールごとに月1500ドルの利用上限を設けたと報じられました。例えば、Claude Codeで1500ドル、Cursorで1500ドルというように、ツールごとに別々の上限が設定されます。

ただし、単純に禁止しているわけではありません。社員は社内ダッシュボードで自分の利用額を確認でき、業務上必要な場合は申請によって上限を超えることもできます。これは、AI活用を止めるためではなく、無自覚な使い過ぎを防ぐための仕組みです。使う側が金額を見られるようになれば、「この作業は本当に高性能モデルでやるべきか」「検索や既存ツールで済むのではないか」と考えやすくなります。

Walmartも、社内AIエージェント「Code Puppy」に利用上限を設けました。Code Puppyは、エンジニアだけでなく非エンジニアにも使われている社内ツールです。表計算や資料作成などにも使えるため人気が高まりましたが、同じような依頼が繰り返される問題も起きました。そこで同社は、社員ごとに使えるトークン量を割り当てる方向に切り替えています。

Amazonは、KiroRankのように生のトークン消費量を競わせる仕組みを止め、実際に出荷された成果を重視する方向に軸足を移しています。Salesforceでも、共同創業者でSlack担当CTOのパーカー・ハリス氏が、エンジニアの成果をこれまで以上に細かく測る「Effective Output」という指標を導入したと述べています。トークン費用が想定外に膨らむのを避けるねらいです。

共通しているのは、利用額の可視化、上限設定、成果指標への切り替えです。KPMGの調査では、AIコストを全体として把握できている企業は26%にとどまります。22%は、請求書が届くまで利用状況をほとんど、あるいはまったく把握できていないとされています。KPMGのAI責任者であるスティーブ・チェイス氏も、年間のトークン予算を数カ月で使い切る企業や、トークン利用が6倍に増えた顧客があると説明しています。まず見えるようにする。AIコスト管理は、そこから始まります。

「とにかく使え」の次に問われるAI活用の中身

一連の動きは、AI活用の後退ではありません。Uberは利用上限を設けた後も、AIコーディングエージェントの導入拡大を続ける姿勢です。Microsoftも、Anthropicのモデルそのものを排除するわけではありません。企業が見直しているのは、「AIをたくさん使えば、それだけ生産性が上がるはずだ」という単純な前提です。

AIは、使いどころが合えば大きな効果を出します。コードの修正、テストの自動化、資料の下書き、データ分析の補助など、時間を短縮できる場面は多いでしょう。一方で、検索で済む調べ物、すでに社内に答えがある作業、何度も同じ形式で発生する定型作業に、毎回高性能なAIエージェントを走らせるのは割に合いません。便利だからといって、すべての作業に最上位モデルを使えば、費用はすぐに膨らみます。

日本企業にとっても他人事ではありません。現時点では、米大手のような実名のAIコスト爆発事例は国内で大きく表面化していません。しかし、エージェント型AIを全社に配り、利用ログや部門別予算を見ないまま使わせれば、同じ問題は起こります。特に、開発部門、マーケティング部門、カスタマーサポート部門のようにAI利用が多い部署では、月額ライセンス料だけでなく、トークン消費量まで見ておく必要があります。

これから企業に求められるのは、AIを禁止することではなく、使い方を設計することです。どの業務には高性能モデルを使うのか。どの業務は安価なモデルや既存ツールで十分なのか。部門ごとの予算をどう配るのか。社員が自分の利用額を確認できるのか。成果をどう測るのか。こうした地味な管理体制が、AI活用の成否を左右し始めています。

「とにかく使え」の時代は終わりつつあります。次に問われるのは、「何のために、いくらかけて、何を生み出したのか」です。AIの利用量ではなく、成果とコストのバランスを見られる企業だけが、生成AIを本当の業務基盤にしていけるでしょう。

「コスト爆発の背景」「見せかけの利用拡大」「管理の時代へ」の3列構成で、Uber・Amazon・Microsoft・Walmart・MetaのAIコスト問題とtokenmaxxing・KiroRank・Claudeonomicsの失敗、各社の対策をまとめた解説インフォグラフィック