Google Magenta、2.4B 音楽生成モデル MRT2 を公開──Apple Silicon 上で 40ms の低遅延演奏を実現
MIDI や音声入力に 40ms で反応する 2.4B パラメータのオープンモデルで、MacBook の GPU を活用した MLX 推論により DAW 連携やライブ演奏がローカル環境で完結する。
リリース: 2026-06-04 · 読了 3 分記事の要約
1. 核心(What)
- 2.4B パラメータのオープンウェイトモデルで、MIDI・テキスト・音声のマルチモーダル入力をサポート。
- Apple Silicon に最適化された C++ 推論エンジンと MLX を採用し、MacBook GPU 上で高速に動作。
- 前バージョン比で約 15 倍の低遅延化を達成し、40ms 単位のフレームレベル自己回帰生成を実現。
- magenta-rt ライブラリの公開により、JAX や MLX を用いたカスタム楽器の開発が可能。
2. 影響(Why)
- 40ms という人間の演奏に対する違和感を払拭する低遅延推論がローカルで完結するため、AI をオフラインの生成ツールからライブ演奏に耐えうる楽器へと昇華させている。
- 開発者への影響: オーディオ信号処理を行うエンジニアは、Python と C++ の両面で提供される推論エンジンを利用し、既存の VST/AU プラグイン開発フローに LLM ベースの合成手法を低コストで組み込める。
- 日本への影響: 国内の電子楽器メーカーや制作ソフト開発者は、クラウドコストを度外視してハードウェア単体で完結する AI 合成エンジンを製品に組み込むための参照実装として活用できる。
3. 根拠・詳細(How)
- Control Latency: スコア 40(baseline 600)
- Magenta RealTime 2 公式ブログ (2026-06-04 公開)