OpenAI 推出了更先进的语音对语音模型,并为 Realtime API 增加了多项新功能,包括支持图像输入、SIP 电话呼叫以及 MCP 服务器集成。
OpenAI 更新了其实时 API(Realtime API),引入了更强大的语音模型,并新增了对图像输入的处理能力。此外,API 现在支持 SIP 协议,允许 AI 直接集成到电话系统中,并支持 MCP(模型上下文协议)以连接外部数据源。
这些更新显著扩展了 AI 的实用场景,特别是 SIP 支持让企业能更容易地构建 AI 语音客服,而图像输入则让实时视觉对话成为可能,进一步增强了 AI 的多模态交互能力。
Realtime API 是 OpenAI 旨在提供低延迟、自然语音交互能力的接口;MCP 是由 Anthropic 发起的开放标准,旨在简化 AI 模型与各种数据源和工具的连接。