🛠Tools🔥🔥

Anthropic、新モデル Claude Fable 5 / Mythos 5 のシステムカードを公開──安全性と推論性能の評価指標を提示

Claude 3.5 世代を上回る推論能力と自律エージェントとしての安全性を両立し、開発者がモデルの限界値とリスクを定量的に把握可能になった。

リリース: 2026-06-10 · 読了 5
何が起きた
  • Anthropic が Claude Fable 5 および Claude Mythos 5 の詳細なシステムカード(技術仕様・安全性評価書)を公開。

  • Fable 5 は複雑な推論と創造的記述に特化し、Mythos 5 は大規模なコードベース解析と論理整合性に最適化されている。

  • 自律的なサイバー攻撃や化学兵器製造への加担リスクを評価する「ASL-3(AI Safety Level 3)」基準をクリア。

なぜ重要
  • モデルの「得意・不得意」がベンチマーク数値で明示されたため、用途に応じて Fable(創造系)と Mythos(論理系)を使い分ける設計判断が容易になる。

  • ASL-3 準拠により、機密性の高いエンタープライズ領域でのエージェント運用におけるコンプライアンス上の障壁が一つ取り除かれた。

👁️ 開発者

Claude 3.5 世代からの移行を検討するエンジニアは、システムカード内の「脱獄(Jailbreak)」耐性スコアを参照し、プロンプトインジェクション対策の強度を再設計する必要がある。

🇯🇵 日本

金融や製造業などの国内大手企業で AI エージェントを導入中の PM は、このシステムカードを根拠資料として、社内セキュリティ審査やリスクアセスメントのプロセスを 2-3 週間短縮できる。