マルチエージェント間の通信を「行動と状態」に構造化し、SWE-agent のトークン消費を 50% 削減

自由形式の対話を排除し、PACT プロトコルでアクション中心の情報を抽出。性能を維持しつつ推論コストを大幅に低減。(原題: What Should Agents Say? Action-state Communication for Efficient Multi-Agent Systems)

リリース: 2026-06-03 · 読了 3
何が起きた
  • 複数エージェント間の自由な自然言語通信は、トークン消費を急増させ推論コストとコンテキスト窓の圧迫を招く。

  • 提案手法 PACT は、エージェントの出力を共有履歴に送る前に、コンパクトなアクション・ステート・レコード(行動と状態の記録)に変換するプロトコルである。

  • ソフトウェア開発ベンチマーク SWE-agent において、タスク解決率を維持したまま入力トークンを 50% 削減することに成功した。

  • OpenHands において、解決率を向上させつつ、解決 1 件あたりのトークン消費を 10% 削減した。

なぜ重要
  • 複数エージェントを連携させる際、"全履歴の受け渡し" はコストと精度の両面で限界がある。PACT を導入しないと、冗長な対話によってコンテキストが溢れ、本来必要な「次に何をすべきか」という情報が埋もれるリスクを放置することになる。

👁️ 開発者

マルチエージェントシステムを本番運用する開発者は、エージェント間の通信を「自由な会話」から「状態更新プロトコル」へ移行すべき。特に SWE-agent 等のコーディング支援ツールでは、PACT の適用により精度を落とさず推論コストを半減できる。

🇯🇵 日本

国内固有の追加文脈は限定的(汎用的に有用)。


著者
iNLP-Lab
📊 Benchmark
MetricScoreΔ
SWE-agent Input Token Reduction (%)50+50.0
OpenHands Tokens-per-resolved Reduction (%)10+10.0