🧠Research🔥

コミュニティ、Qwopus-3.6-27B-Coder を公開──SWE-bench で解決率 67.0% を記録

Claude-4.7-Max の回答から思考プロセスを逆生成する Trace Inversion 手法により、27B サイズで商用モデル級のコーディング性能を実現した。

リリース: 2026-04-17 · 読了 3
何が起きた
  • SWE-bench Verified (500) において、GGUF Q5_K_M 版が思考オフ設定で解決率 67.0% (335/500) を達成した。

  • Claude-4.7-Max の出力を Trace-Inverter-4B で解析し、合成された思考トレースを学習データに組み込む Trace Inversion 手法を採用している。

  • 学習プロセスは、4,096 トークンのフォーマット学習から 32K トークンの長文脈学習まで、段階的に難易度を上げる三段階のカリキュラム学習で構成される。

なぜ重要
  • 27B という 24GB VRAM 級の GPU で動作可能なサイズで SWE-bench 67% を達成したことは、ローカル環境での高度なコード生成エージェント運用の現実味を大きく高める。

  • 高性能な商用モデルの「答え」から「思考過程」を逆算して蒸留する手法は、高品質な推論データセットが不足している特定ドメインのモデル開発における新たな定石となる。

👁️ 開発者

個人開発者や小規模な SaaS 開発チームは、高価な商用 API に依存せず、GGUF 形式のモデルをローカルまたはプライベートクラウドで動かすことで、セキュアかつ低コストなコーディング支援エージェントを構築できる。

🇯🇵 日本

[国内の受託開発・DX 支援企業] は、顧客のソースコードを外部 API に送信できない制約下において、オンプレミス環境で商用 LLM 級の解決率を持つ自動バグ修正・機能実装パイプラインを提供する際の技術的基盤として活用できる。