OpenAI、GPT-5.6 シリーズ 3 モデルを発表──推論コスト最大 5 倍減とキャッシュ制御を強化
フラッグシップの Sol、中位の Terra、軽量の Luna を展開し、プロンプトキャッシュの明示的制御を導入して API コストを最適化する。
リリース: 2026-06-26 · 読了 3 分記事の要約
1. 核心(What)
- OpenAI が GPT-5.6 シリーズとして Sol(旗艦)、Terra(中位)、Luna(軽量)の 3 モデルを限定プレビュー公開した。
- Terra モデルは GPT-5.5 と同等の性能を維持しつつ、価格を 2 倍安価に設定した。
- 価格体系は 100 万トークンあたり、Sol が入力 5 ドル/出力 30 ドル、Terra が入力 2.5 ドル/出力 15 ドル、Luna が入力 1 ドル/出力 6 ドルである。
- プロンプトキャッシュ機能に明示的なブレークポイント設定と 30 分間の最低保持期間を追加した。
2. 影響(Why)
- API コスト構造の劇的な変化: Luna モデルの登場により、従来の高精度モデルではコストが見合わなかったタスクを、安価な推論環境へ移行させることが可能になる。
- 国内 SaaS 事業者への影響: 国内の Vertical SaaS やチャットボット開発を行う中規模事業者は、Terra モデルへの移行で推論単価を半減させ、利益率を改善するロードマップを即座に引くべきである。
3. 根拠・詳細(How)
- キャッシュ制御の技術仕様: キャッシュ書き込み料金をモデルの非キャッシュ入力レートの 1.25 倍に設定し、読み出し時には 90% の割引を適用する設計を採用した。
- モデル階層の分離: Sol、Terra、Luna の 3 階層にモデルを分離し、用途に応じた計算リソースの割当を最適化することで、GPT-5.5 比でのコスト効率化を実現した。
4. 展望・課題(Next)
- 一般提供の開始: 現在は限定的なパートナー向けプレビュー段階だが、数週間以内に一般公開を予定している。