OpenAI、Realtime API に GPT-5 級の音声モデル GPT-Realtime-2 など 3 種を追加

🎨Product🔥🔥🔥

GPT-5 クラスの推論力を備えた音声対話モデルに加え、70 言語対応のリアルタイム翻訳と Whisper 統合により、複雑な業務をこなす音声エージェントの実装が可能になった。

リリース: 2026-05-07 · 読了 3 分

何が起きた

なぜ重要

👁️ 開発者

開発者は、音声認識・推論・音声合成の各モデルを個別に繋ぎ合わせる手間を省き、単一の API エンドポイントで GPT-5 級の知能を持つ音声インターフェースを構築できる。

🇯🇵 日本

インバウンド需要の高い国内の宿泊施設や観光案内向け SaaS を開発するスタートアップは、翻訳と予約システムを直結させた『多言語対応の自動電話応対』を、追加のモデル開発なしに実装できる。