🧠Research🔥🔥

Xiaomi MiMo、MoE モデル MiMo-V2.5-Pro を公開──1T パラメータで 1M トークンの長文脈推論を実現

ハイブリッドアテンションと Multi-Token Prediction を採用し、1M トークン環境下でも高い推論精度を維持するエージェント特化型モデル。
リリース: 2026-04-27 · 読了 3

記事の要約

1. 核心(What)

  • 総パラメータ数 1.02T、アクティブパラメータ数 42B の MoE アーキテクチャを採用
  • 1M トークンのコンテキストウィンドウに対応し、GraphWalks ベンチマークで 1M トークン時に 0.37 BFS スコアを達成
  • Multi-Token Prediction (MTP) モジュールを搭載し、推論速度を 3 倍に高速化
  • 27T トークンのデータセットで事前学習を実施

2. 影響(Why)

  • 1M トークンという超長文脈において、従来のモデルが崩壊する領域でも推論精度を維持できるため、大規模コードベースの解析や複雑なエージェントタスクの実行基盤として実用的である。
  • SGLang や vLLM とのネイティブ連携が提供されており、FP8 量子化を活用した効率的な推論環境を即座に構築できる。
  • 開発者への影響: エージェント開発者は、複雑なツール呼び出しが数千回に及ぶタスクにおいて、本モデルの推論一貫性を利用することで、従来の手法よりもコンテキスト管理のオーバーヘッドを大幅に削減できる。
  • 日本への影響: 国内の Vertical SaaS 企業や大規模なコード解析ツールを運用する開発チームは、本モデルを VPC 内でホストすることで、機密性の高い長文脈データを外部 API に送信せず、セキュアかつ高精度な推論パイプラインを構築できる。

3. 根拠・詳細(How)

  • SWE Bench Pro: スコア 57.2
  • MMLU Pro: スコア 68.5
  • Gsm8k: スコア 99.6
  • XiaomiMiMo/MiMo-V2.5-Pro Hugging Face リポジトリ (2026-04-27 公開)