📜Papers🔥

Microsoft、エージェント用メモリフレームワーク Memora を発表──長期間の文脈保持と推論効率を両立

ICML 2026 採択の Memora は、記憶内容と検索構造を分離することで、従来比 98% のコンテキストトークン削減と SOTA 級の推論精度を実現した。
リリース: 2026-06-29 · 読了 3

記事の要約

1. 核心(What)

  • Microsoft Research が開発したエージェント向けメモリフレームワーク「Memora」を ICML 2026 で発表。
  • 記憶内容(コンテンツ)と検索用インデックス(抽象化層)を分離するアーキテクチャを採用。
  • LoCoMo および LongMemEval ベンチマークにおいて、Mem0 や既存の RAG 手法を上回る精度を達成。
  • フルコンテキスト推論と比較して、コンテキストトークン消費量を最大 98% 削減。

2. 影響(Why)

  • 長期間タスクのボトルネック解消: 数ヶ月単位のプロジェクトを追跡する AI エージェントにおいて、過去の意思決定の経緯を保持できない現状のステートレスな設計を根本から覆す。
  • 国内 SaaS 開発への影響: [Vertical SaaS 業種] のような中規模事業者は、ユーザーごとの長期履歴を RAG で保持する際のトークンコストを大幅に抑制でき、月額課金モデルの収益性を改善できる。

3. 根拠・詳細(How)

  • メモリ分離アーキテクチャ: リッチな記憶内容と軽量なインデックスを分離し、関連情報を安定した単位に統合。GitHub で公開されたリポジトリにて実装を検証可能。

4. 展望・課題(Next)

  • 実運用に向けた検証: 長期間の自律エージェント運用におけるメモリの整合性維持と、大規模なデータセットへのスケール性能が今後の課題。