Xiaomi MiMo、MoE モデル MiMo-V2.5-Pro を公開──1T パラメータで 1M トークンの長文脈推論を実現
ハイブリッドアテンションと Multi-Token Prediction を採用し、1M トークン環境下でも高い推論精度を維持するエージェント特化型モデル。
リリース: 2026-04-27 · 読了 3 分記事の要約
1. 核心(What)
- 総パラメータ数 1.02T、アクティブパラメータ数 42B の MoE アーキテクチャを採用
- 1M トークンのコンテキストウィンドウに対応し、GraphWalks ベンチマークで 1M トークン時に 0.37 BFS スコアを達成
- Multi-Token Prediction (MTP) モジュールを搭載し、推論速度を 3 倍に高速化
- 27T トークンのデータセットで事前学習を実施
2. 影響(Why)
- 1M トークンという超長文脈において、従来のモデルが崩壊する領域でも推論精度を維持できるため、大規模コードベースの解析や複雑なエージェントタスクの実行基盤として実用的である。
- SGLang や vLLM とのネイティブ連携が提供されており、FP8 量子化を活用した効率的な推論環境を即座に構築できる。
- 開発者への影響: エージェント開発者は、複雑なツール呼び出しが数千回に及ぶタスクにおいて、本モデルの推論一貫性を利用することで、従来の手法よりもコンテキスト管理のオーバーヘッドを大幅に削減できる。
- 日本への影響: 国内の Vertical SaaS 企業や大規模なコード解析ツールを運用する開発チームは、本モデルを VPC 内でホストすることで、機密性の高い長文脈データを外部 API に送信せず、セキュアかつ高精度な推論パイプラインを構築できる。
3. 根拠・詳細(How)
- SWE Bench Pro: スコア 57.2
- MMLU Pro: スコア 68.5
- Gsm8k: スコア 99.6
- XiaomiMiMo/MiMo-V2.5-Pro Hugging Face リポジトリ (2026-04-27 公開)