Notable3 min · NVIDIA · Physical AI
NVIDIA、物理 AI 基盤モデル 3 種を公開──汎用把持・高速自動運転・仮想環境エージェント ロボットの把持から自動運転の推論効率化まで、大規模シミュレーション学習により未知のデバイスや環境への適応能力を大幅に向上させた。
The Facts GraspGen-X は 20 億件のシミュレーション把持データで学習され、未知の形状のグリッパーでもゼロショットで動作する初の把持基盤モデルである。 LCDrive は自動運転の推論プロセスをテキストから潜在空間表現に置き換えることで、軌道品質を維持したままトークン消費量を約 50% 削減した。 NitroGen は 1,000 以上のゲームと 4 万時間のインタラクションデータを用い、低データ環境でのエージェント性能を従来比最大 52% 向上させた。 これら 3 つの研究は CVPR 2026 で発表され、NitroGen は GitHub および Hugging Face で OSS として公開されている。 Why It Matters デバイスごとに個別の学習が必要だったロボティクスにおいて、ゼロショットの把持基盤モデルが登場したことで、ハードウェア選定の自由度が飛躍的に高まる。 自動運転の推論を「言語」ではなく「潜在空間」で行う手法は、計算リソースが限られる車載エッジデバイスでの高度な意思決定の実装を現実にする。 For Developers ロボット開発者は curoboV2 等のライブラリと GraspGen-X を組み合わせることで、グリッパーの物理特性に依存しない汎用的なピッキング処理を即座に実装できる環境が整った。
For Japan 製造業や物流倉庫向けのロボット SIer(システムインテグレーター)は、多種多様なワークやハンドへの対応コストを大幅に削減でき、多品種少量生産ラインの自動化が加速する。
Sources Notable3 min · DPO · OCR
Dharma AI、DPO を構造化 OCR に適用──テキストのループ発生率を平均 59.4% 削減 チャットの「好み」ではなく「正誤」を DPO の信号に使い、SFT では解消困難な自己ループ問題をモデル自身の失敗例から学習して抑制した。
SFT 後のモデルで頻発するテキストのループ(degeneration)に対し、DPO を適用することでテストした全モデルで発生率が減少した。
詳細を読む ▾
Notable3 min · Voice Agent · Benchmark
ServiceNow、音声エージェント評価ベンチマーク EVA-Bench 2.0 を公開──3ドメイン・213シナリオに拡大 航空・IT・医療の3業種に特化した 121 個のツール操作を含む、実務レベルの音声 AI エージェント評価用オープンソースデータセット。
航空カスタマーサービス (CSM)、エンタープライズ IT (ITSM)、ヘルスケア HR (HRSD) の 3 ドメインにわたり、213 の評価シナリオを収録。
詳細を読む ▾
Notable3 min · NVIDIA · Gemma 3
NVIDIA、マルチモーダル安全評価モデル Nemotron 3.5 Content Safety を公開──推論プロセスとカスタムポリシーに対応 Gemma 3 4B を基盤に、画像・テキスト・応答の三位一体評価と「思考プロセス」の出力により、金融や医療など特定ドメインの独自安全基準を動的に適用可能にした。
Google の Gemma 3 4B IT をベースに LoRA 調整を施し、8GB 以上の VRAM を持つ単一 GPU でのリアルタイム推論を実現した。
詳細を読む ▾
Notable5 min · OpenAI · Safety
OpenAI、AI 時代のバイオディフェンス戦略を発表──生物学的リスク評価と安全な研究枠組みを提言 AI による生物兵器転用リスクを定量化する評価手法を確立し、専門知識の悪用を防ぎつつ科学的発見を加速させるための多層的な防御策を提示した。
OpenAI が AI モデルの生物学的リスクを評価するための「Biodefense Program」および評価フレームワークを公開した
詳細を読む ▾
Brief4 min · Livestreaming · Pricing Strategy
ライブ配信後の録画視聴はライブ前より価格感度が低い──消費者の支払い意欲の変化を解明 大規模プラットフォームのデータからライブ配信の全ライフサイクルにおける需要を分析。録画販売の価格戦略やターゲティングへの応用を示唆。(原題: From Live to Recording: Consumer Demand and Response to Price Across the Livestreaming Lifecycle)
ライブ配信前の需要は、配信終了後の録画購入時と比較して価格に対してより敏感(Price-sensitive)である。
詳細を読む ▾