Microsoft、エージェント用メモリフレームワーク Memora を発表──長期間の文脈保持と推論効率を両立
ICML 2026 採択の Memora は、記憶内容と検索構造を分離することで、従来比 98% のコンテキストトークン削減と SOTA 級の推論精度を実現した。
リリース: 2026-06-29 · 読了 3 分記事の要約
1. 核心(What)
- Microsoft Research が開発したエージェント向けメモリフレームワーク「Memora」を ICML 2026 で発表。
- 記憶内容(コンテンツ)と検索用インデックス(抽象化層)を分離するアーキテクチャを採用。
- LoCoMo および LongMemEval ベンチマークにおいて、Mem0 や既存の RAG 手法を上回る精度を達成。
- フルコンテキスト推論と比較して、コンテキストトークン消費量を最大 98% 削減。
2. 影響(Why)
- 長期間タスクのボトルネック解消: 数ヶ月単位のプロジェクトを追跡する AI エージェントにおいて、過去の意思決定の経緯を保持できない現状のステートレスな設計を根本から覆す。
- 国内 SaaS 開発への影響: [Vertical SaaS 業種] のような中規模事業者は、ユーザーごとの長期履歴を RAG で保持する際のトークンコストを大幅に抑制でき、月額課金モデルの収益性を改善できる。
3. 根拠・詳細(How)
- メモリ分離アーキテクチャ: リッチな記憶内容と軽量なインデックスを分離し、関連情報を安定した単位に統合。GitHub で公開されたリポジトリにて実装を検証可能。
4. 展望・課題(Next)
- 実運用に向けた検証: 長期間の自律エージェント運用におけるメモリの整合性維持と、大規模なデータセットへのスケール性能が今後の課題。