MAI-Thinking-1とは?Microsoft初の推論AIを徹底解説

MAI-Thinking-1とは?Microsoft初の推論AIを徹底解説
筆者 天秤AIメディア編集部 / GMO天秤AI株式会社
筆者 天秤AIメディア編集部 / GMO天秤AI株式会社

生成AIの最新情報や使い方ガイド、活用事例などを紹介するメディアです。 AI初心者の方向けの情報からニッチな情報まで発信中!

📌 この記事の要約

  • MAI-Thinking-1はMicrosoft初の自社推論モデル
    2026年6月2日のMicrosoft Build 2026で発表。ゼロ・ディスティレーション・クリーンデータ学習・MoEアーキテクチャという三つの特徴を持ち、企業導入を意識した設計になっている。

  • 7つのMAIモデルが一挙登場
    推論・コーディング・画像生成・音声認識・音声合成など幅広いカテゴリをカバーする7モデルを同時発表。Foundry経由の配布に加え、OpenRouterやFireworksなど外部プラットフォームでの提供も予定。

  • 主要ベンチマークで競合モデルと互角以上の評価
    AIME 2025で97.0%、SWE-bench ProでClaude Opus 4.6と同等の結果を示した。ただし評価はMicrosoft側によるものが中心で、第三者検証はこれから。

  • 現在はプライベートプレビュー段階
    Microsoft Foundryで先行提供中。MAI Playgroundでのパブリックプレビューも近日公開予定で、開発者がモデルの重みを直接チューニングできる点も新しい。

Build 2026で発表された7つのMAIモデル群

今回の発表はMicrosoft AI CEOのMustafa Suleyman氏が主導し、同社が掲げる「ヒューマニスト・スーパーインテリジェンス(人間中心の超知能)」というビジョンのもとで開発されたモデル群として紹介されました。 発表された7モデルの正確なラインナップは以下のとおりです。

  • MAI-Thinking-1:推論特化のフラッグシップモデル
  • MAI-Code-1-Flash:GitHub Copilot・VS Code向け軽量コーディングモデル
  • MAI-Image-2.5:テキスト→画像生成と画像編集の両方に対応
  • MAI-Image-2.5 Flash:MAI-Image-2.5の高速・低コスト軽量版
  • MAI-Transcribe-1.5:43言語対応の音声認識モデル
  • MAI-Voice-2:15言語以上対応の自然音声生成モデル
  • MAI-Voice-2 Flash:MAI-Voice-2の高速・低コスト軽量版(近日公開予定)
Microsoft Build 2026の登壇者がスクリーンに「7 New Microsoft AI Models」として7モデルのラインナップを紹介している様子

これらのモデルはFoundry経由の配布・自社製品への統合に加え、Open Router・Fireworks・Basetenでも開発者向けに提供される予定です。また今回初めて、開発者がモデルの重みを自分でチューニングできるようになります。

OpenAI依存からの脱却という戦略的意図

これまでOpenAIのモデルに大きく依存してきたMicrosoftにとって、今回の発表は重要な転換点となります。 Microsoft AIは自社製AIアクセラレーター「Maia 200」との共同設計を進めており、すでに1.4倍の効率向上を実現しています。これはMicrosoftおよびパートナー企業の長期的な自立を目指した取り組みです。

ゼロディスティレーションとクリーンデータ学習

MAI-Thinking-1が特に注目される理由のひとつが「ゼロディスティレーション」という学習アプローチです。ディスティレーション(蒸留)とは、大規模モデルの出力を教師データとして小規模モデルを訓練する手法のことを指します。

MAI-Thinking-1は第三者モデルからの蒸留を一切行わず、エンタープライズグレードのクリーンで商用ライセンス済みデータのみを使って一からトレーニングされています。さらに、プレトレーニングからAI生成コンテンツを除外しており、これはデータの品質・出所・制御性の観点から重要な取り組みとされています。

AIの学習データをめぐる著作権訴訟が増加している現在、このアプローチは企業導入を検討する担当者にとって大きな安心材料となります。

MoEアーキテクチャと256Kトークンコンテキスト

MAI-Thinking-1はスパースなMoE(Mixture of Experts:専門家混合)設計を採用しており、アクティブパラメータ数35B(約350億)、総パラメータ数は約1兆(1T)という構成です。タスクごとに必要なサブネットワークのみを起動する仕組みにより、より大規模なモデルと比較してより小さな推論フットプリントを実現しています。

コンテキストウィンドウは256Kトークンで、600ページ相当のドキュメントを1プロンプトで処理できる容量に相当します。関数呼び出し・多層的な指示フォロー・Chat Completions APIとの互換性も備えており、既存システムへの統合コストを低減できます。

SWE-bench Pro・AIME 2025/2026での評価結果

コーディングベンチマーク「SWE-bench Pro」では、はるかに大規模なモデルであるClaude Opus 4.6と同等の性能を示しています。数学・科学推論ベンチマーク「AIME 2025」では97.0%、「AIME 2026」では94.5%を達成しました。

また、人間によるブラインド評価はパートナー企業「Surge」のプロ評価者を用いて実施されました。シングルターン・マルチターンを含む1,350件の評価において、MAI-Thinking-1はClaude Sonnet 4.6より高い支持を得ています。

主なベンチマーク・評価結果をまとめると以下のとおりです。

評価項目結果
SWE-bench Pro(コーディング)Claude Opus 4.6と同等
AIME 2025(数学推論)97.0%
AIME 2026(数学推論)94.5%
人間によるブラインド評価(Surge社・1,350件)Claude Sonnet 4.6より高評価

なお、これらの評価はMicrosoft発表のものであり、独立した第三者機関による完全な再現検証はまだ行われていない点には注意が必要です。

MAI-Thinking-1とSonnet 4.6・Opus 4.6・GPT 5.4・Kimi K2.6・DeepSeek V3.2/V4・GLM-5.1を比較したベンチマーク一覧表。STEM(AIME 2025/2026・HMMT・GPQA Diamond・LCB v6)およびAgentic Coding(Terminal Bench 2.0・SWE-Bench Verified・SWE-Bench Pro)の各スコアが記載されている

コーディングモデルMAI-Code-1-Flashも同時展開

推論モデルと合わせて、コーディング特化の軽量モデルも注目に値します。

MAI-Code-1-Flashは高品質なコーディング支援を効率よく提供することを目標に設計されており、コーディングベンチマークにおいてClaude Haiku 4.5を上回るコストパフォーマンスを実現しています。単純なリクエストには簡潔に対応し、複雑なタスクには推論予算を増やすアダプティブ思考が特徴です。

このモデルは5Bパラメータを持ち、GitHub Copilot・VS Code・Microsoftスタックに深く統合されています。また、GitHub CopilotのFree・Pro・Pro+・Maxすべてのプランへの展開がすでに開始されています。

現在の利用方法と今後の提供予定

MAI-Thinking-1は現在、Microsoft Foundryを通じてプライベートプレビューとして利用可能です。Foundryとは、Microsoftが提供するエンタープライズ向けAIモデルプラットフォームで、セキュリティ・コンプライアンス対応が標準で組み込まれています。

パブリックプレビューはMAI Playgroundで近日中に提供予定とされています。 開発者向けのアクセス手段をまとめると以下のとおりです。

  • Microsoft Foundry:プライベートプレビュー中(エンタープライズ向け)
  • MAI Playground:パブリックプレビュー近日公開予定
  • Open Router / Fireworks / Baseten:外部プラットフォームでの提供も予定

今回初めて、開発者がモデルの重みを自分でチューニングできるようになる点も大きな特徴です。プロンプトエンジニアリングにとどまらない、より深いカスタマイズが可能になります。

まとめ

2026年6月2日に発表されたMAIモデル群は、MicrosoftがOpenAI依存から自立した独自のAI研究開発体制を本格稼働させた重要な一手です。

特にMAI-Thinking-1は、ゼロディスティレーション・AI生成コンテンツを排除したクリーンデータ学習・MoEアーキテクチャという三つの特徴が組み合わさり、企業導入の障壁を下げることを意識した設計になっています。AIME 2025での97.0%、SWE-bench ProでのClaude Opus 4.6同等という評価も実務応用への期待を高めます。

一方で、発表されたベンチマーク結果はMicrosoft自身・パートナー企業による評価が中心です。今後の第三者検証の積み重ねが信頼性の鍵となります。エンジニアやIT担当者の方は、まずMicrosoft FoundryまたはMAI Playgroundのプレビューへの登録を検討してみてください。実際に触れて評価することが、AIモデル選定の最良の第一歩となるでしょう。


【参照ソース】