NVIDIA、物理 AI 基盤モデル 3 種を公開──汎用把持・高速自動運転・仮想環境エージェント
ロボットの把持から自動運転の推論効率化まで、大規模シミュレーション学習により未知のデバイスや環境への適応能力を大幅に向上させた。
リリース: 2026-06-03 · 読了 3 分何が起きた
GraspGen-X は 20 億件のシミュレーション把持データで学習され、未知の形状のグリッパーでもゼロショットで動作する初の把持基盤モデルである。
LCDrive は自動運転の推論プロセスをテキストから潜在空間表現に置き換えることで、軌道品質を維持したままトークン消費量を約 50% 削減した。
NitroGen は 1,000 以上のゲームと 4 万時間のインタラクションデータを用い、低データ環境でのエージェント性能を従来比最大 52% 向上させた。
これら 3 つの研究は CVPR 2026 で発表され、NitroGen は GitHub および Hugging Face で OSS として公開されている。
なぜ重要
デバイスごとに個別の学習が必要だったロボティクスにおいて、ゼロショットの把持基盤モデルが登場したことで、ハードウェア選定の自由度が飛躍的に高まる。
自動運転の推論を「言語」ではなく「潜在空間」で行う手法は、計算リソースが限られる車載エッジデバイスでの高度な意思決定の実装を現実にする。
👁️ 開発者
ロボット開発者は curoboV2 等のライブラリと GraspGen-X を組み合わせることで、グリッパーの物理特性に依存しない汎用的なピッキング処理を即座に実装できる環境が整った。
🇯🇵 日本
製造業や物流倉庫向けのロボット SIer(システムインテグレーター)は、多種多様なワークやハンドへの対応コストを大幅に削減でき、多品種少量生産ラインの自動化が加速する。