News Articles Projects About

🧠Research🔥🔥

研究チーム、エージェント型開発のトークン消費を分析──コードレビューが 59.4% を占めると判明

ChatDev と GPT-5 を用いた 30 件のタスク分析により、自動開発コストの 6 割が反復的なレビューに集中し、入力トークンの冗長性がボトルネックであることを実証した。

リリース: 2026-01-20 · 読了 3 分

LLM Multi-Agent Software Engineering Tokenomics GPT-5

Tokenomics: Quantifying Where Tokens Are Used in Agentic Software Engineering (2026-01-20 公開)

記事の要約

1. 核心（What）

ChatDev フレームワークと GPT-5 推論モデルを用い、30 件のソフトウェア開発タスクにおけるトークン消費を SDLC 段階別に定量化した。
全トークン消費のうち「Code Review（コードレビュー）」段階が平均 59.4% を占め、開発工程の中で最もコストが高いことが判明した。
トークンの種類別では入力トークンが平均 53.9% を占めており、エージェント間連携におけるコンテキストの再送が非効率の主因となっている。
コストの主因は初期のコード生成ではなく、その後の自動化された修正（Refinement）と検証（Verification）プロセスにリソースが集中する傾向を特定した。

2. 影響（Why）

エージェント開発のコスト削減には、モデルの高性能化よりも「過去のコンテキストをどう圧縮して渡すか」というプロトコル設計が最大のレバレッジポイントになる。
開発者への影響: エージェントワークフローを構築するテックリードは、初期生成のプロンプト調整よりも、レビュー・修正ループにおけるコンテキスト圧縮や KV キャッシュ再利用の実装を優先すべきだ。
日本への影響: 国内の受託開発企業や SaaS 開発スタートアップでエージェントによる自動コーディングを検証中のチームは、API コスト試算において「生成トークン量」ではなく「レビュー回数 × コンテキスト長」を主変数に置くことで予算精度の乖離を防げる。

3. 根拠・詳細（How）

Code Review Token Share: スコア 59.4
Input Token Share: スコア 53.9
Tokenomics: Quantifying Where Tokens Are Used in Agentic Software Engineering (2026-01-20 公開)

← 日別ページに戻るカテゴリ一覧 (research)