Anthropic、エージェント特化モデル「Claude Sonnet 5」を公開──Opus 4.8 級の推論性能を低コストで実現
Sonnet 4.6 から推論・ツール利用・コーディング能力を大幅に引き上げ、Opus 4.8 に迫るエージェント性能を実用的な価格帯で提供する。
リリース: 2026-06-30 · 読了 3 分記事の要約
1. 核心(What)
- Anthropic はエージェント性能を強化した最新モデル「Claude Sonnet 5」を公開した。
- API 価格は入力 100 万トークンあたり 2 ドル、出力 100 万トークンあたり 10 ドル(2026 年 8 月 31 日までの導入価格)。
- BrowseComp や OSWorld-Verified ベンチマークにおいて、先行モデル Sonnet 4.6 を上回る性能を達成した。
- Claude Code、Claude Platform、および全ての有料プランで即時利用可能。
2. 影響(Why)
- 実務エージェントのコスト最適化: これまで Opus クラスのモデルが必要だった複雑なマルチステップ作業を、Sonnet 5 の価格帯で実行可能になるため、社内 RAG や自動化ワークフローの運用コストを大幅に削減できる。
- 国内 SaaS 開発への影響: 国内の Vertical SaaS や自動化ツールを開発する中規模事業者にとって、推論精度の向上とコスト効率の両立は、API 連携による自動化機能の提供範囲を広げる重要な転換点となる。
3. 根拠・詳細(How)
- ベンチマークと推論効率: BrowseComp および OSWorld-Verified において、Sonnet 4.6 比でエージェント性能を向上させ、Opus 4.8 と同等のパフォーマンスを一部タスクで実現。10M トークンの予算内でコンパクションとプログラム的なツール呼び出しを行う標準手法で検証。
- セキュリティと安全対策: Cyber Verification Pro に基づき、Claude Opus 4.7/4.8 と同等のリアルタイムサイバー保護機能をデフォルトで適用。Firefox の脆弱性エクスプロイト生成テストでは、Sonnet 4.6 より高い部分成功率を示すが、実用的な攻撃コード生成には至らない設計。
4. 展望・課題(Next)
- 標準価格への移行: 2026 年 9 月 1 日以降、価格は入力 3 ドル、出力 15 ドル(いずれも 100 万トークンあたり)へ改定される予定。