Ideogram、画像生成モデル Ideogram 4 をオープン公開──9.3B で FLUX.2 を凌駕するデザイン・文字描画性能
93億パラメータの単一ストリーム DiT を採用し、JSON プロンプトによるレイアウト制御や 2k 解像度、最高峰の多言語文字描画を商用利用可能なオープンウェイトで実現した。
リリース: 2026-06-04 · 読了 3 分Ideogram 4 はスクラッチから学習された 9.3B パラメータの Diffusion Transformer (DiT) モデルであり、既存モデルの微調整ではない。
Design Arena 等のベンチマークにおいて、FLUX.2 [dev] (32B) や HunyuanImage 3.0 (80B) を上回るオープンモデル最高スコアを記録した。
テキストエンコーダーに Qwen3-VL-8B-Instruct を採用し、JSON 形式のプロンプトでバウンディングボックス指定やカラーパレットの制御が可能。
256px から 2048px までの可変解像度をネイティブサポートし、ポスターやバナー制作に適した高精細な文字レンダリングを実現している。
文字描画やレイアウトの正確性が求められるデザイン実務において、プロンプトの試行錯誤を JSON 構造化によって大幅に短縮できる。
FLUX.2 (32B) より大幅に軽量な 9.3B モデルでありながら、VRAM 24GB 級のコンシューマ GPU で最高峰のデザイン品質を生成できる運用効率の高さが際立つ。
画像生成ワークフローを構築するエンジニアは、ComfyUI 等で複雑な ControlNet を組まずとも、JSON プロンプト一つで要素配置をミリ単位で制御できる実装の簡素化を享受できる。
国内の広告制作・EC支援 SaaS を展開する事業者は、文字化けやレイアウト崩れの修正コストを 3 割以上削減し、日本語文字を含むバナー生成の自動化精度をデファクト級に引き上げられる可能性がある。