NVIDIA と Google Cloud が提携強化──Vera Rubin 搭載 A5X インスタンスで推論コストを 10 倍削減
エージェント型 AI および物理 AI の実用化を目指し、次世代 NVIDIA Blackwell/Rubin GPU と Google Cloud インフラを統合したフルスタック環境を提供。
リリース: 2026-04-22 · 読了 3 分何が起きた
NVIDIA Vera Rubin 搭載の A5X インスタンスは、前世代比でトークンあたりの推論コストを最大 10 倍削減し、スループットを 10 倍向上させる
単一サイトで最大 80,000 基、マルチサイトで最大 960,000 基の NVIDIA Rubin GPU をスケーリング可能
Google Distributed Cloud 上で NVIDIA Blackwell/Blackwell Ultra GPU を用いた Google Gemini のプレビュー提供を開始
OpenAI が Google Cloud 上の NVIDIA GB300 および GB200 NVL72 システムで大規模推論を実行中
なぜ重要
エージェント型 AI やロボティクスなど、高度な推論と物理シミュレーションを要する次世代 AI ワークロードの基盤を確立する
Confidential Computing と Blackwell GPU の組み合わせにより、規制の厳しい業界でも機密性を保持したまま高性能 AI の利用が可能になる
👁️ 開発者
NVIDIA NeMo フレームワークや Nemotron モデルが Gemini Enterprise Agent Platform に統合され、エージェント開発環境が大幅に強化された。
🇯🇵 日本
国内の製造業や金融機関において、機密データを保護しつつ最新の frontier モデルを活用できるセキュアな AI 基盤の選択肢が拡大する。