Microsoft、1T パラメータの推論モデル MAI-Thinking-1 を発表──35B 活性の MoE で Sonnet 4.6 超えを主張
1兆パラメータ規模の MoE アーキテクチャを採用し、GitHub Copilot 向けに最適化された軽量コード生成モデルと、Sonnet 4.6 級の推論性能を持つフラグシップモデルを同時投入した。
リリース: 2026-06-02 · 読了 3 分MAI-Thinking-1 は総パラメータ数 1T、推論時の活性パラメータ数 35B の MoE モデルであり、他社モデルからの蒸留なしでゼロから学習された。
Microsoft 内部のブラインド評価において、MAI-Thinking-1 は Claude Sonnet 4.6 よりも高いユーザー選好度を記録した。
MAI-Code-1-Flash は 137B パラメータ(5B 活性)のコード特化モデルで、GitHub Copilot および VS Code ユーザー向けにロールアウトが開始された。
学習データには 1.2 兆ページの独自クロールデータと Common Crawl を使用し、AI 生成コンテンツを識別・除外するフィルタリングを適用している。
1T 規模の巨大モデルを MoE で 35B まで軽量化して実用化する Microsoft の「内製 LLM」への本気度は、OpenAI への技術依存を戦略的に解消し始めていることを示す。
Sonnet 4.6 級の推論性能を 35B 活性で実現できるなら、将来的に Azure 上での推論コストが大幅に下がり、エンタープライズ RAG の経済合理性が劇的に改善される。
GitHub Copilot ユーザーは、VS Code 上でより低レイテンシかつ高精度なコード補完を享受できる。一方で、自社 RAG 構築者は MAI 系列の API 公開を待って、Sonnet 4.6 とのコストパフォーマンス比較を行う必要がある。
国内の大手 SIer や受託開発企業など、GitHub Copilot Enterprise を全社導入している組織は、モデル刷新による開発効率の変化を定量的 KPI で再測定すべき局面にある。