🛠Tools🔥🔥

Anthropic、エージェント特化モデル「Claude Sonnet 5」を公開──Opus 4.8 級の推論性能を低コストで実現

Sonnet 4.6 から推論・ツール利用・コーディング能力を大幅に引き上げ、Opus 4.8 に迫るエージェント性能を実用的な価格帯で提供する。
リリース: 2026-06-30 · 読了 3

記事の要約

1. 核心(What)

  • Anthropic はエージェント性能を強化した最新モデル「Claude Sonnet 5」を公開した。
  • API 価格は入力 100 万トークンあたり 2 ドル、出力 100 万トークンあたり 10 ドル(2026 年 8 月 31 日までの導入価格)。
  • BrowseComp や OSWorld-Verified ベンチマークにおいて、先行モデル Sonnet 4.6 を上回る性能を達成した。
  • Claude Code、Claude Platform、および全ての有料プランで即時利用可能。

2. 影響(Why)

  • 実務エージェントのコスト最適化: これまで Opus クラスのモデルが必要だった複雑なマルチステップ作業を、Sonnet 5 の価格帯で実行可能になるため、社内 RAG や自動化ワークフローの運用コストを大幅に削減できる。
  • 国内 SaaS 開発への影響: 国内の Vertical SaaS や自動化ツールを開発する中規模事業者にとって、推論精度の向上とコスト効率の両立は、API 連携による自動化機能の提供範囲を広げる重要な転換点となる。

3. 根拠・詳細(How)

  • ベンチマークと推論効率: BrowseComp および OSWorld-Verified において、Sonnet 4.6 比でエージェント性能を向上させ、Opus 4.8 と同等のパフォーマンスを一部タスクで実現。10M トークンの予算内でコンパクションとプログラム的なツール呼び出しを行う標準手法で検証。
  • セキュリティと安全対策: Cyber Verification Pro に基づき、Claude Opus 4.7/4.8 と同等のリアルタイムサイバー保護機能をデフォルトで適用。Firefox の脆弱性エクスプロイト生成テストでは、Sonnet 4.6 より高い部分成功率を示すが、実用的な攻撃コード生成には至らない設計。

4. 展望・課題(Next)

  • 標準価格への移行: 2026 年 9 月 1 日以降、価格は入力 3 ドル、出力 15 ドル(いずれも 100 万トークンあたり)へ改定される予定。