News Articles Projects About

🧠Research🔥

Google、6 月の AI 更新情報を発表──Gemma 4 12B や Gemini 3.5 Flash のコンピュータ操作機能など

Android 17 やローカル推論モデル、マルチモーダル API の拡充により、デバイス統合とエージェントの実用化を加速させる。

リリース: 2026-07-01 · 読了 3 分

Google Gemma Gemini Android LLM EdgeAI

Google AI Blog (2026-07-01 公開)

記事の要約

1. 核心（What）

ローカル推論モデル「Gemma 4 12B」を公開。16GB メモリ環境で動作し、視覚・音声処理を統合したアーキテクチャを採用。
Gemini 3.5 Flash にコンピュータ操作機能を統合。デスクトップ、モバイル、ブラウザ環境での自律的な推論とアクションが可能。
画像生成モデル「Nano Banana 2 Lite」およびマルチモーダルモデル「Gemini Omni Flash」の API 公開プレビューを開始。
Android 17 を発表。フローティングウィンドウ機能や生体認証による端末ロック機能などを追加。

2. 影響（Why）

ローカル AI の実用化: Gemma 4 12B が 16GB メモリで動作することで、機密データを外部 API に送信せず、ローカル環境で完結するエージェント構築が現実的な選択肢となる。
国内 SaaS への影響: [国内の業務自動化 SaaS 業種] のような中規模事業者は、Gemini 3.5 Flash のコンピュータ操作 API を活用することで、従来 UI 自動化ツールで困難だった非構造化データへの対応を低コストで実装可能になる。

3. 根拠・詳細（How）

Gemma 4 12B のアーキテクチャ: 視覚と音声の入力をネイティブで処理する統合アーキテクチャを採用し、120 億パラメータ規模ながら 16GB メモリ環境でのローカル推論を実現した。
Gemini 3.5 Flash のコンピュータ操作: デスクトップ、モバイル、ブラウザの各環境において、画面情報を認識し、推論を経てマウス・キーボード操作をエミュレートする一連のパイプラインを統合した。

4. 展望・課題（Next）

Android 17 の展開: Pixel デバイスから順次提供を開始し、2026 年を通じて他の対象 Android デバイスへ順次アップデートを拡大する。

← 日別ページに戻るカテゴリ一覧 (research)