🛠 tools
2026-06-13 · 5 topics
Anthropic、次世代開発エージェント Claude Fable を公開──自律的な環境構築と OS 操作で複雑な UI バグを修正
🔥🔥Claude Code 上で動作する Fable 5 が、指示にない CORS サーバー構築や JS 注入、OS ウィンドウ操作を自律的に組み合わせてデバッグを完遂した。
Anthropic、脆弱性修正ベンチマーク Claude Fable 5 の評価結果を公開──FuncPass 59.8% で「中位」の結果
🔥🔥Endor Labs が 200 件の実タスクで検証。思考時間の延長によるタイムアウトや学習データの記憶(チート)が目立つ一方、過去最高難度の 4 課題を初突破した。
Bytecode Alliance、WASI 0.3 を公開──ネイティブ Async 対応と 100 万倍速いサービスチェイニングを実現
🔥🔥WebAssembly Component Model に非同期処理を統合し、マイクロサービス間の通信をネットワーク経由からプロセス内実行へ転換することでレイテンシをミリ秒からナノ秒へ短縮する。
macOS 用ローカルコーディングエージェント構築手法を公開──Gemma 4 と MTP 活用で推論を 24% 高速化
🔥🔥Apple Silicon 上で llama.cpp と Gemma 4 の MTP を組み合わせ、オフライン環境でも 70 t/s 超の応答速度と画像解析を両立する実用的な開発環境の構成案。
MIT、思考フレームワーク「改善の罠」を提示──「問題が起きない」ことの評価困難性を指摘
🔥改善活動が短期的パフォーマンス低下を招き、結果として「何もしない」が正当化される組織構造の力学をシステムダイナミクスでモデル化した。