🧠Research🔥🔥

Hcompany、Computer Use Agent モデル Holo3.1 を公開──Android 性能 12% 向上とローカル推論対応

Qwen ベースの 0.8B から 35B までの 4 サイズを展開し、NVFP4 量子化による 2 倍の高速化と Android 操作精度の劇的向上をローカル環境で実現した。

リリース: 2026-06-02 · 読了 3
何が起きた
  • AndroidWorld ベンチマークにおいて、35B-A3B モデルの成功率が従来の 67% から 79.3% へと 12.3 ポイント向上した。

  • 0.8B、4B、9B、35B-A3B の 4 つのモデルサイズを揃え、FP8、Q4 GGUF、NVFP4 の量子化済み重みを公式に提供する。

  • NVFP4 量子化とエージェントハーネスの最適化により、1 ステップあたりの平均処理時間を 6.8 秒から 3.3 秒へと約 51% 短縮した。

  • 構造化 JSON 出力に加え、サードパーティ製エージェントフレームワークとの親和性を高めるネイティブ Function-calling に対応した。

なぜ重要
  • プライバシーや遅延の制約でクラウド API の利用が困難だった「PC・スマホ操作エージェント」が、Mac や Windows のローカル環境で実用的な速度で動作するようになった。

  • 量子化による性能劣化を OSWorld スコアでわずか 2 ポイントに抑えつつ、BF16 比で 1.74 倍のスループットを確保したことで、エッジデバイスでの自律エージェント運用が現実解となった。

👁️ 開発者

エージェント開発者は、高価なプロプライエタリ API に依存せず、Llama.cpp や vLLM を用いて OS 操作を伴う自動化ツールをローカル PC 内に閉じて構築できる。

🇯🇵 日本

国内の RPA ベンダーや中堅以上の情シス部門は、機密情報を扱う社内システム操作を外部 API に送ることなく、ローカル PC 完結型のエージェントで自動化する構成を検証すべきフェーズにある。