Anthropic、次世代開発エージェント Claude Fable を公開──自律的な環境構築と OS 操作で複雑な UI バグを修正

Claude Code 上で動作する Fable 5 が、指示にない CORS サーバー構築や JS 注入、OS ウィンドウ操作を自律的に組み合わせてデバッグを完遂した。

リリース: 2026-06-11 · 読了 4
何が起きた
  • Claude Fable 5 が pyobjc を用いて OS のウィンドウ一覧を取得し、Safari の特定ウィンドウをスクリーンショット撮影するスクリプトを自律的に作成・実行した。

  • デバッグ用データの収集を目的として、Python の http.server を用いた独自の CORS 対応 Web サーバーをローカル環境に構築した。

  • 既存コードのテンプレートに JavaScript を注入し、ページロード 1.2 秒後にショートカットキーを自動実行させることでバグ再現手順を自動化した。

  • 約 11.3 万トークンのコンテキストを消費した一連のデバッグセッションの推定コストは約 12.11 ドルと算出された。

なぜ重要
  • 開発者が「どう解くか」を指示せずとも、LLM が実行環境の制約(権限不足等)を回避するためにツールを自作・実行する「自律的ハック」が実用段階に入った。

👁️ 開発者

Claude Code ユーザーは、複雑な UI テストや環境依存のバグ調査をエージェントに丸投げできる。ただし、予期せぬブラウザ起動やローカルサーバー構築が走るため、作業用ディレクトリの分離やサンドボックス環境での実行が必須となる。

🇯🇵 日本

国内の受託開発や SaaS 開発チーム(特に QA 工数に課題がある組織)は、手動の再現手順書を AI への 1 行の指示に置き換えられる可能性がある。一方で、社内セキュリティポリシーが「AI によるローカルコード実行」を許容しているか、早急な見直しを迫られる。