🧠Research🔥🔥🔥

OpenAI、GPT-5.6 シリーズ 3 モデルを発表──推論コスト最大 5 倍減とキャッシュ制御を強化

フラッグシップの Sol、中位の Terra、軽量の Luna を展開し、プロンプトキャッシュの明示的制御を導入して API コストを最適化する。
リリース: 2026-06-26 · 読了 3

記事の要約

1. 核心(What)

  • OpenAI が GPT-5.6 シリーズとして Sol(旗艦)、Terra(中位)、Luna(軽量)の 3 モデルを限定プレビュー公開した。
  • Terra モデルは GPT-5.5 と同等の性能を維持しつつ、価格を 2 倍安価に設定した。
  • 価格体系は 100 万トークンあたり、Sol が入力 5 ドル/出力 30 ドル、Terra が入力 2.5 ドル/出力 15 ドル、Luna が入力 1 ドル/出力 6 ドルである。
  • プロンプトキャッシュ機能に明示的なブレークポイント設定と 30 分間の最低保持期間を追加した。

2. 影響(Why)

  • API コスト構造の劇的な変化: Luna モデルの登場により、従来の高精度モデルではコストが見合わなかったタスクを、安価な推論環境へ移行させることが可能になる。
  • 国内 SaaS 事業者への影響: 国内の Vertical SaaS やチャットボット開発を行う中規模事業者は、Terra モデルへの移行で推論単価を半減させ、利益率を改善するロードマップを即座に引くべきである。

3. 根拠・詳細(How)

  • キャッシュ制御の技術仕様: キャッシュ書き込み料金をモデルの非キャッシュ入力レートの 1.25 倍に設定し、読み出し時には 90% の割引を適用する設計を採用した。
  • モデル階層の分離: Sol、Terra、Luna の 3 階層にモデルを分離し、用途に応じた計算リソースの割当を最適化することで、GPT-5.5 比でのコスト効率化を実現した。

4. 展望・課題(Next)

  • 一般提供の開始: 現在は限定的なパートナー向けプレビュー段階だが、数週間以内に一般公開を予定している。