Roundtable、AI エージェントを識別する「Process Turing Test」を提案──クリック挙動の統計差を利用
The Facts
- 画像認識 (VLM) による CAPTCHA 突破は容易だが、クリックの順序、方向転換、過剰選択などの「プロセス」には人間と統計的な有意差がある。
- 29 の認知心理学タスクと CAPTCHA を組み合わせた評価バッテリー「CogCAPTCHA30」を開発し、人間と AI の挙動を比較。
- GPT-4 や Claude 3.5 などのフロンティアモデルは、Qwen (1.5B) や認知科学特化モデル Centaur (70B) よりも「人間らしさ」のスコアが低い。
- 判別器の目的関数が未知の状況では、AI が人間らしい挙動を模倣してプロセス差を埋めることは困難であることが示された。
Why It Matters
- 「出力が正解か」ではなく「どう解いたか」で判定するため、LLM の性能向上そのものがボット検知回避に直結しない新たな防御レイヤーになる。
- エージェントによる自動操作を防ぎたいサービス開発者にとって、従来のパズル型 CAPTCHA に代わる「不可視の人間性証明」の実装指針となる。
For Developers
Web サービスの認証基盤を開発するエンジニアは、単なる画像認識の難化ではなく、マウス軌跡やクリック間隔のゆらぎを特徴量とした多層防御へのシフトを検討すべき。
For Japan
[国内 金融・チケット販売業種] のようなボット対策が急務な大規模プラットフォームにおいて、ユーザー体験を損なわずに AI エージェントのみを排除する「不可視の認証」の導入ハードルが下がる。