Cohere、218B MoE モデル Command A+ を公開──25B アクティブパラメータでエージェント性能を強化
48 言語対応の Apache 2.0 ライセンス。128K コンテキストと画像入力を備え、推論プロセスを可視化する思考ログ生成と高精度なツール連携に特化している。
リリース: 2026-05-01 · 読了 3 分総パラメータ数 218B、推論時のアクティブパラメータ 25B の Sparse MoE アーキテクチャを採用している
128 個のエキスパートのうち 8 個を動的に選択し、さらに全トークンに適用される 1 個の共有エキスパートを併用する
日本語を含む 48 言語に対応し、128K トークンの入力と 64K トークンの長い出力長をサポートする
Apache 2.0 ライセンスで公開され、画像入力(Vision)や引用付きのツール実行、思考プロセスの出力が可能である
商用利用可能な Apache 2.0 で、エージェント実行に必要な「思考(Reasoning)」と「ツール連携」に特化した MoE モデルが選択肢に加わった
アクティブパラメータを 25B に抑えつつ 218B 規模の知識を保持しているため、推論コストと精度のバランスがエンタープライズ用途に最適である
エージェント開発者は、`<START_THINKING>` タグによる推論過程の抽出や、引用(Citations)付きの回答生成を API 経由で容易に実装できる。vLLM 等の推論サーバーで 25B モデル相当の VRAM 消費量(量子化時)で運用可能なため、自社インフラへのデプロイコストを抑制できる。
日本語対応が明記されており、国内の RAG 構築や業務自動化エージェントを開発する SaaS ベンダー(中規模以上の開発チーム)にとって、Llama 以外の大有力な OSS 選択肢となる。金融や法務など、回答の根拠(引用元)の提示が必須となる国内エンタープライズ向けソリューションの開発が加速する。