← 返回
OpenAI Blog2025年8月28日

OpenAI 发布 gpt-realtime 及 Realtime API 重大更新

OpenAI 推出了更先进的语音对语音模型,并为 Realtime API 增加了多项新功能,包括支持图像输入、SIP 电话呼叫以及 MCP 服务器集成。

发生了什么

OpenAI 更新了其实时 API(Realtime API),引入了更强大的语音模型,并新增了对图像输入的处理能力。此外,API 现在支持 SIP 协议,允许 AI 直接集成到电话系统中,并支持 MCP(模型上下文协议)以连接外部数据源。

为什么重要

这些更新显著扩展了 AI 的实用场景,特别是 SIP 支持让企业能更容易地构建 AI 语音客服,而图像输入则让实时视觉对话成为可能,进一步增强了 AI 的多模态交互能力。

相关背景

Realtime API 是 OpenAI 旨在提供低延迟、自然语音交互能力的接口;MCP 是由 Anthropic 发起的开放标准,旨在简化 AI 模型与各种数据源和工具的连接。

OpenAIgpt-realtimeRealtime API语音 AI多模态