News Articles Projects About

🧠Research🔥🔥🔥

NVIDIA、エージェント特化ベンチマーク AgentPerf で Blackwell の 20 倍の電力効率を実証

従来の単発 LLM 推論ではなく、ツール利用や推論の連鎖を伴う「エージェント型」の負荷において、H200 比で圧倒的なスループットとコスト効率を実現した。

リリース: 2026-06-12 · 読了 3 分

NVIDIA Blackwell AgentPerf DeepSeek V4 Pro LLM Benchmark

NVIDIA Blackwell Leads on First Agentic AI Infrastructure Benchmark (2026-06-12 公開)

記事の要約

1. 核心（What）

NVIDIA Blackwell Ultra NVL72 が、Artificial Analysis 社の初のエージェント特化ベンチマーク「AgentPerf」で首位を獲得した。
DeepSeek V4 Pro (MoE モデル) を使用したテストにおいて、NVIDIA HGX H200 システムと比較して 1MW あたり 20 倍のエージェント実行数を記録した。
AgentPerf は 12 以上のプログラミング言語における実際のコーディングエージェントの動作に基づき、ツール呼び出しや長いコンテキストをシミュレートする。
Together AI や DeepInfra などの推論プロバイダーが、Blackwell 上で DeepSeek V4 Pro の提供を既に開始している。

2. 影響（Why）

「単発の推論速度」ではなく「タスク完結までの総コスト」が評価軸になったことで、エージェントを大規模展開する際のインフラ選定基準が明確になった。
MoE モデルの分散実行に最適化された Blackwell のアーキテクチャが、複雑なツール連携を伴う実務ワークロードで H200 を大きく引き離すことが数値で示された。
開発者への影響: コーディングエージェントや自律型 RAG を開発するチームは、Blackwell 世代のインスタンスを選択することで、同一コストでサポートできる同時ユーザー数を大幅に増やし、ユニットエコノミクスを劇的に改善できる。
日本への影響: 顧客対応や事務処理の自動化を進める国内の BPO ベンダーや Vertical SaaS 企業は、推論コストの低下により、人間の介在を最小限にする「フル自律型エージェント」の商用化を加速させる。

3. 根拠・詳細（How）

NVIDIA Blackwell Leads on First Agentic AI Infrastructure Benchmark (2026-06-12 公開)

← 日別ページに戻るカテゴリ一覧 (research)