🧠Research🔥🔥🔥

NVIDIA、MLPerf Training 6.0 で Blackwell プラットフォームが全 7 カテゴリで最速を記録

GB300 NVL72 システムが GB200 比で最大 1.6 倍の学習速度を実現し、8,192 基の GPU スケールで DeepSeek-V3 などの MoE モデルを最短時間で学習した。

リリース: 2026-06-16 · 読了 3
何が起きた
  • MLPerf Training 6.0 の全 7 ベンチマークにおいて NVIDIA Blackwell プラットフォームが最速を記録

  • GB300 NVL72 は GB200 NVL72 と比較して最大 1.6 倍の学習パフォーマンスを達成

  • 8,192 基の GPU を使用し、DeepSeek-V3 (671B) の学習を 2.02 分で完了

  • Llama 3.1 405B の学習において、Microsoft Azure 環境で 7.07 分という最速記録を達成

なぜ重要
  • 学習時間が分単位に短縮されることで、モデルのイテレーション回数が劇的に増え、R&D の試行錯誤コストが数分の一に圧縮される。

  • MoE アーキテクチャに最適化された NVLink スイッチングにより、大規模分散学習におけるボトルネックが解消され、数千 GPU 規模のクラスタ構築が現実的な選択肢となる。

👁️ 開発者

大規模モデルの事前学習やファインチューニングを行うエンジニアは、NVFP4 低精度学習の採用により、従来と同等の精度を維持しつつ学習時間を大幅に短縮できる。

🇯🇵 日本

国内の AI モデル開発を行う中堅以上のテック企業や研究機関は、GB300 NVL72 の導入により、数ヶ月単位だった frontier モデルの学習サイクルを週単位へ短縮するロードマップを描く必要がある。