News Articles Projects About

📜Papers🔥

Microsoft、エージェント用メモリフレームワーク Memora を発表──長期間の文脈保持と推論効率を両立

ICML 2026 採択の Memora は、記憶内容と検索構造を分離することで、従来比 98% のコンテキストトークン削減と SOTA 級の推論精度を実現した。

リリース: 2026-06-29 · 読了 3 分

LLM Agent Memory RAG ICML

Memora scales agent memory to boost long-horizon productivity (2026-06-29 公開)

記事の要約

1. 核心（What）

Microsoft Research が開発したエージェント向けメモリフレームワーク「Memora」を ICML 2026 で発表。
記憶内容（コンテンツ）と検索用インデックス（抽象化層）を分離するアーキテクチャを採用。
LoCoMo および LongMemEval ベンチマークにおいて、Mem0 や既存の RAG 手法を上回る精度を達成。
フルコンテキスト推論と比較して、コンテキストトークン消費量を最大 98% 削減。

2. 影響（Why）

長期間タスクのボトルネック解消: 数ヶ月単位のプロジェクトを追跡する AI エージェントにおいて、過去の意思決定の経緯を保持できない現状のステートレスな設計を根本から覆す。
国内 SaaS 開発への影響: [Vertical SaaS 業種] のような中規模事業者は、ユーザーごとの長期履歴を RAG で保持する際のトークンコストを大幅に抑制でき、月額課金モデルの収益性を改善できる。

3. 根拠・詳細（How）

メモリ分離アーキテクチャ: リッチな記憶内容と軽量なインデックスを分離し、関連情報を安定した単位に統合。GitHub で公開されたリポジトリにて実装を検証可能。

4. 展望・課題（Next）

実運用に向けた検証: 長期間の自律エージェント運用におけるメモリの整合性維持と、大規模なデータセットへのスケール性能が今後の課題。

← 日別ページに戻るカテゴリ一覧 (papers)