ServiceNow、Deep Research エージェントの検索クエリによる機密漏洩を特定──漏洩率を 1/3 以下に抑える学習法 PA-DR を提案
社内文書と Web 検索を横断するエージェントが、検索クエリの断片から機密を漏らす「モザイク効果」を検証し、性能を維持しつつ漏洩を 9.9% まで抑える強化学習手法を開発した。
リリース: 2026-06-18 · 読了 4 分何が起きた
1,001 件のマルチホップ調査タスクで構成される、エージェントのプライバシー漏洩評価ベンチマーク「MosaicLeaks」を公開した。
単純な性能特化の学習では、検索精度向上のためにクエリへ詳細を詰め込む傾向が強まり、情報漏洩率が 34.0% から 51.7% へと大幅に悪化することを確認した。
提案手法 PA-DR は、Qwen3-4B を用いたリスク判定器を報酬系に組み込み、タスク成功率を 58.7% に高めつつ漏洩率を 9.9% まで低減することに成功した。
プロンプトによる「漏洩禁止」の指示は効果が限定的であり、Qwen3-4B では成功率が 4% 低下した一方で、依然として深刻な漏洩が残る結果となった。
なぜ重要
RAG や Deep Research を実装する際、「検索クエリそのものがデータ漏洩経路になる」という視点は盲点になりやすく、特に外部検索 API を利用するエンタープライズ製品において致命的なリスクを回避する指針となる。
👁️ 開発者
[AI エージェント開発] を行うエンジニアは、外部ツール呼び出し引数に機密情報が含まれないようフィルタリングするだけでなく、PA-DR のような報酬設計による「クエリの抽象化」を学習プロセスに組み込む設計が標準となる。
🇯🇵 日本
[国内 金融・製造業] のような機密保持が極めて厳しい業種の AI 導入において、検索ログからの情報推測リスクを定量化し、PA-DR 手法を適用することで、外部検索を伴う高度な調査エージェントの社内導入に向けた安全基準が明確になる。