Alibaba、言語世界モデル Qwen-AgentWorld 公開──7領域のシミュレーションと強化学習を支援
1000万件超の環境相互作用データで学習し、エージェント環境をシミュレートする35B/397Bの言語世界モデル。
米研究者ら、エージェントAI向け動的レッドチーム評価ベンチマーク「RIFT-Bench」を開発
エージェントの内部構造をグラフ表現で自動抽出し、45種類もの異なる自律型システムに対して一貫した脆弱性スキャンを実行できる動的レッドチーム手法。