News Articles Projects About

🧠Research🔥🔥🔥

NVIDIA と Dell、次世代「Vera Rubin」搭載サーバー発表──推論コストを Blackwell 比 1/10 に削減

エージェント型 AI の爆発的普及を見据え、オンプレミスで商用級モデルを安全に動かす「Dell AI Factory」を大幅強化。

リリース: 2026-05-18 · 読了 3 分

NVIDIA Dell Vera Rubin Agentic AI Confidential Computing

NVIDIA 公式ブログ (2026-05-18 公開)

記事の要約

1. 核心（What）

NVIDIA Vera Rubin NVL72 は、Blackwell 世代と比較してエージェント型 AI の推論コスト（Cost-per-token）を最大 10 分の 1 に削減する。
新型 Vera CPU は x86 プロセッサ比で 3 倍のメモリ帯域を実現し、エージェントのサンドボックス実行やコード生成ワークロードを 50% 高速化する。
Dell の調査によると AI ワークロードの 67% がオンプレミスやエッジで稼働しており、機密保護推論（Confidential Computing）への需要が急増している。
Google Gemini 3.0 や SpaceXAI、DeepSeek-V4 などの先端モデルを、Dell AI Factory 上でセキュアに実行するためのパートナーシップを締結した。

2. 影響（Why）

「チャット」から「自律エージェント」への進化で推論需要が 3,400% 増加すると予測される中、コスト 90% 削減は AI 実装を PoC から本格稼働へ押し上げる決定打となる。
開発者への影響: 開発者はクラウドの API 制限やデータ流出リスクを気にせず、Gemini 3.0 等の商用級モデルを自社インフラ上でセキュアに、かつ Blackwell 比 10 倍の効率でデプロイできる環境が整う。
日本への影響: 機密データ保持を最優先する国内の大手製造業や金融機関は、パブリッククラウドへのデータアップロードを回避しつつ、自社拠点内に「AI 工場」を構築する投資判断が現実的になる。

3. 根拠・詳細（How）

NVIDIA 公式ブログ (2026-05-18 公開)

← 日別ページに戻るカテゴリ一覧 (research)