マルチエージェント間の通信を「行動と状態」に構造化し、SWE-agent のトークン消費を 50% 削減
自由形式の対話を排除し、PACT プロトコルでアクション中心の情報を抽出。性能を維持しつつ推論コストを大幅に低減。(原題: What Should Agents Say? Action-state Communication for Efficient Multi-Agent Systems)
リリース: 2026-06-03 · 読了 3 分何が起きた
複数エージェント間の自由な自然言語通信は、トークン消費を急増させ推論コストとコンテキスト窓の圧迫を招く。
提案手法 PACT は、エージェントの出力を共有履歴に送る前に、コンパクトなアクション・ステート・レコード(行動と状態の記録)に変換するプロトコルである。
ソフトウェア開発ベンチマーク SWE-agent において、タスク解決率を維持したまま入力トークンを 50% 削減することに成功した。
OpenHands において、解決率を向上させつつ、解決 1 件あたりのトークン消費を 10% 削減した。
なぜ重要
複数エージェントを連携させる際、"全履歴の受け渡し" はコストと精度の両面で限界がある。PACT を導入しないと、冗長な対話によってコンテキストが溢れ、本来必要な「次に何をすべきか」という情報が埋もれるリスクを放置することになる。
👁️ 開発者
マルチエージェントシステムを本番運用する開発者は、エージェント間の通信を「自由な会話」から「状態更新プロトコル」へ移行すべき。特に SWE-agent 等のコーディング支援ツールでは、PACT の適用により精度を落とさず推論コストを半減できる。
🇯🇵 日本
国内固有の追加文脈は限定的(汎用的に有用)。
著者
📊 BenchmarkiNLP-Lab
| Metric | Score | Δ |
|---|---|---|
| SWE-agent Input Token Reduction (%) | 50 | +50.0 |
| OpenHands Tokens-per-resolved Reduction (%) | 10 | +10.0 |