NVIDIA と Dell、次世代「Vera Rubin」搭載サーバー発表──推論コストを Blackwell 比 1/10 に削減
エージェント型 AI の爆発的普及を見据え、オンプレミスで商用級モデルを安全に動かす「Dell AI Factory」を大幅強化。
リリース: 2026-05-18 · 読了 3 分記事の要約
1. 核心(What)
- NVIDIA Vera Rubin NVL72 は、Blackwell 世代と比較してエージェント型 AI の推論コスト(Cost-per-token)を最大 10 分の 1 に削減する。
- 新型 Vera CPU は x86 プロセッサ比で 3 倍のメモリ帯域を実現し、エージェントのサンドボックス実行やコード生成ワークロードを 50% 高速化する。
- Dell の調査によると AI ワークロードの 67% がオンプレミスやエッジで稼働しており、機密保護推論(Confidential Computing)への需要が急増している。
- Google Gemini 3.0 や SpaceXAI、DeepSeek-V4 などの先端モデルを、Dell AI Factory 上でセキュアに実行するためのパートナーシップを締結した。
2. 影響(Why)
- 「チャット」から「自律エージェント」への進化で推論需要が 3,400% 増加すると予測される中、コスト 90% 削減は AI 実装を PoC から本格稼働へ押し上げる決定打となる。
- 開発者への影響: 開発者はクラウドの API 制限やデータ流出リスクを気にせず、Gemini 3.0 等の商用級モデルを自社インフラ上でセキュアに、かつ Blackwell 比 10 倍の効率でデプロイできる環境が整う。
- 日本への影響: 機密データ保持を最優先する国内の大手製造業や金融機関は、パブリッククラウドへのデータアップロードを回避しつつ、自社拠点内に「AI 工場」を構築する投資判断が現実的になる。
3. 根拠・詳細(How)
- NVIDIA 公式ブログ (2026-05-18 公開)