NVIDIA、MLPerf Training 6.0 で Blackwell プラットフォームが全 7 カテゴリで最速を記録
GB300 NVL72 システムが GB200 比で最大 1.6 倍の学習速度を実現し、8,192 基の GPU スケールで DeepSeek-V3 などの MoE モデルを最短時間で学習した。
リリース: 2026-06-16 · 読了 3 分何が起きた
MLPerf Training 6.0 の全 7 ベンチマークにおいて NVIDIA Blackwell プラットフォームが最速を記録
GB300 NVL72 は GB200 NVL72 と比較して最大 1.6 倍の学習パフォーマンスを達成
8,192 基の GPU を使用し、DeepSeek-V3 (671B) の学習を 2.02 分で完了
Llama 3.1 405B の学習において、Microsoft Azure 環境で 7.07 分という最速記録を達成
なぜ重要
学習時間が分単位に短縮されることで、モデルのイテレーション回数が劇的に増え、R&D の試行錯誤コストが数分の一に圧縮される。
MoE アーキテクチャに最適化された NVLink スイッチングにより、大規模分散学習におけるボトルネックが解消され、数千 GPU 規模のクラスタ構築が現実的な選択肢となる。
👁️ 開発者
大規模モデルの事前学習やファインチューニングを行うエンジニアは、NVFP4 低精度学習の採用により、従来と同等の精度を維持しつつ学習時間を大幅に短縮できる。
🇯🇵 日本
国内の AI モデル開発を行う中堅以上のテック企業や研究機関は、GB300 NVL72 の導入により、数ヶ月単位だった frontier モデルの学習サイクルを週単位へ短縮するロードマップを描く必要がある。