DeepReinforce、エージェント特化モデル Ornith-1.0 を公開──Gemma 4/Qwen 3.5 ベースの MIT ライセンスモデル
9B から 397B MoE まで 4 構成を展開し、エージェントのツール呼び出しとコーディングタスクにおいて同規模のオープンモデルで SOTA を記録した。
リリース: 2026-06-29 · 読了 3 分記事の要約
1. 核心(What)
- DeepReinforce が MIT ライセンスで公開した初のオープンウェイトモデル
- Gemma 4 および Qwen 3.5 をベースとした 9B から 397B パラメータまでの 4 構成
- コーディングタスクにおける同規模オープンモデル比較での SOTA 達成
- LM Studio 等のローカル推論環境での動作確認済み
2. 影響(Why)
- ライセンスの柔軟性: Gemma 4 と Qwen 3.5 の Apache 2.0 互換ライセンスを継承しており、商用プロダクトへの組み込みリスクを低減できる。
- ローカルエージェントの現実解: 35B MoE モデルが 20GB 程度の量子化サイズで動作するため、GPU リソースが限られる開発現場でもエージェント機能を実装できる。
3. 根拠・詳細(How)
- 推論環境と実装: LM Studio 上で ornith-1.0-35b-Q4_K_M.gguf(20GB)をロードし、エージェントハーネスを通じて複数ステップのツール呼び出しを完遂する挙動を確認。
4. 展望・課題(Next)
- DeepReinforce の動向: 同社による過去の CUDA 最適化研究(CUDA-L1)との関連性を含め、今後のモデル更新や最適化技術の公開が待たれる。