2026年6月5日 (金)

17件 · 57分

今日の主役は、LLMによる脆弱性診断の自律化と、それに伴うセキュリティ評価のベンチマーク標準化だ。Anthropicが公開したdefending-code-reference-harnessは検知から修正までを自動化する実用フェーズに入り、同日にセキュリティリサーチが発表したベンチマークではGPT-5.5が1,500ドルの検証コストで成功率70%を記録した。これは単なる性能向上ではなく、脆弱性診断のコスト構造が人手から計算資源へ完全にシフトしたことを意味する。周辺ではOpenAIがChatGPTに新メモリ機能「Dreaming」を導入し、長期的な文脈維持の自動化を強化している。開発者は、脆弱性診断の自動化による攻撃手法の高度化と、パーソナライズされたAIエージェントの運用負荷の両面を来週のロードマップに織り込んでおくのが賢明だろう。セキュリティと推論の自動化が同時進行する週として記録しておきたい。

Since yesterday

New 17

Ongoing 0

Ended 14

🔥🔥🔥2026-06-02

Anthropic、自律型脆弱性診断フレームワーク defending-code-reference-harness を公開──検知から修正までを自動化

Claude を活用してソースコードの脅威モデリングからパッチ生成までを自動化する、gVisor サンドボックス完備のリファレンス実装。

LLM Security Claude Agent

🔥🔥2026-06-04

ServiceNow、音声エージェント評価ベンチマーク EVA-Bench 2.0 を公開──3ドメイン・213シナリオに拡大

航空・IT・医療の3業種に特化した 121 個のツール操作を含む、実務レベルの音声 AI エージェント評価用オープンソースデータセット。

Voice Agent Benchmark Dataset Tool-use

🔥🔥2026-06-04

NVIDIA、マルチモーダル安全評価モデル Nemotron 3.5 Content Safety を公開──推論プロセスとカスタムポリシーに対応

Gemma 3 4B を基盤に、画像・テキスト・応答の三位一体評価と「思考プロセス」の出力により、金融や医療など特定ドメインの独自安全基準を動的に適用可能にした。

NVIDIA Gemma 3 Content Safety Multimodal

🔥🔥2026-06-03

NVIDIA、物理 AI 基盤モデル 3 種を公開──汎用把持・高速自動運転・仮想環境エージェント

ロボットの把持から自動運転の推論効率化まで、大規模シミュレーション学習により未知のデバイスや環境への適応能力を大幅に向上させた。

NVIDIA Physical AI Robotics Autonomous Driving

🔥🔥2026-06-03

Dharma AI、DPO を構造化 OCR に適用──テキストのループ発生率を平均 59.4% 削減

チャットの「好み」ではなく「正誤」を DPO の信号に使い、SFT では解消困難な自己ループ問題をモデル自身の失敗例から学習して抑制した。

DPO OCR LLM Fine-tuning

🔥🔥2024-01-31

OpenAI、AI 時代のバイオディフェンス戦略を発表──生物学的リスク評価と安全な研究枠組みを提言

AI による生物兵器転用リスクを定量化する評価手法を確立し、専門知識の悪用を防ぎつつ科学的発見を加速させるための多層的な防御策を提示した。

OpenAI Safety Biosecurity RedTeaming

🔥2021-07-04

ライブ配信後の録画視聴はライブ前より価格感度が低い──消費者の支払い意欲の変化を解明

大規模プラットフォームのデータからライブ配信の全ライフサイクルにおける需要を分析。録画販売の価格戦略やターゲティングへの応用を示唆。（原題: From Live to Recording: Consumer Demand and Response to Price Across the Livestreaming Lifecycle）

Livestreaming Pricing Strategy Consumer Behavior Economics

🔥🔥2026-06-03