Anthropic、Claude Sonnet 5 を公開──エージェント性能を強化し 1M トークンのコンテキストに対応
推論コストを据え置きつつ、ブラウザ・ターミナル操作に特化したエージェント機能を搭載し、CursorBench で 57% のスコアを記録した。
リリース: 2026-07-01 · 読了 3 分記事の要約
1. 核心(What)
- Anthropic は Claude Sonnet 5 を公開し、Claude Code、API、Managed Agents で即時利用可能とした。
- 価格は従来通り入力 $3/M、出力 $15/M であり、8 月末までの期間限定で入力 $2/M、出力 $10/M のキャンペーンを実施。
- 1M トークンのコンテキストウィンドウに対応し、ブラウザおよびターミナル操作の自律実行性能を向上させた。
- Claude Desktop の Linux 版(Ubuntu/Debian ベータ)をリリースし、開発環境の対応を拡充した。
2. 影響(Why)
- エージェント開発のコスト効率化: 従来はより高額なモデルでなければ不可能だった自律的なツール実行や計画立案が、Sonnet 5 では中位モデルの価格帯で実装可能となり、エージェント系プロダクトの月額インフラコストを大幅に抑制できる。
- 国内 SaaS における実装の現実解: 国内の Vertical SaaS や社内自動化ツールを開発するチームは、高コストな Opus 級から Sonnet 5 へ移行することで、精度を維持しつつ推論単価を最適化し、本番環境でのスケーラビリティを確保できる。
3. 根拠・詳細(How)
- 推論性能のベンチマーク: CursorBench において Sonnet 4.6 の 49% に対し、Sonnet 5 は 57% のスコアを記録し、コーディングおよびツール利用のタスクで実効性能が向上した。
- Managed Agents の機能拡張: Managed Agents API にストリーミングセッションデルタ、Webhook イベント、およびトークン・ツール使用量を可視化するオブザーバビリティタブを追加し、本番運用時のデバッグを強化した。
4. 展望・課題(Next)
- Fable 5 のリリース状況: 政府との調整により一旦停止されていた Fable/Mythos 5 のリリースが承認されたが、具体的な提供開始時期は未定。