🧠Research🔥🔥🔥

NVIDIA と Dell、次世代「Vera Rubin」搭載サーバー発表──推論コストを Blackwell 比 1/10 に削減

エージェント型 AI の爆発的普及を見据え、オンプレミスで商用級モデルを安全に動かす「Dell AI Factory」を大幅強化。

リリース: 2026-05-18 · 読了 3
何が起きた
  • NVIDIA Vera Rubin NVL72 は、Blackwell 世代と比較してエージェント型 AI の推論コスト(Cost-per-token)を最大 10 分の 1 に削減する。

  • 新型 Vera CPU は x86 プロセッサ比で 3 倍のメモリ帯域を実現し、エージェントのサンドボックス実行やコード生成ワークロードを 50% 高速化する。

  • Dell の調査によると AI ワークロードの 67% がオンプレミスやエッジで稼働しており、機密保護推論(Confidential Computing)への需要が急増している。

  • Google Gemini 3.0 や SpaceXAI、DeepSeek-V4 などの先端モデルを、Dell AI Factory 上でセキュアに実行するためのパートナーシップを締結した。

なぜ重要
  • 「チャット」から「自律エージェント」への進化で推論需要が 3,400% 増加すると予測される中、コスト 90% 削減は AI 実装を PoC から本格稼働へ押し上げる決定打となる。

👁️ 開発者

開発者はクラウドの API 制限やデータ流出リスクを気にせず、Gemini 3.0 等の商用級モデルを自社インフラ上でセキュアに、かつ Blackwell 比 10 倍の効率でデプロイできる環境が整う。

🇯🇵 日本

機密データ保持を最優先する国内の大手製造業や金融機関は、パブリッククラウドへのデータアップロードを回避しつつ、自社拠点内に「AI 工場」を構築する投資判断が現実的になる。