首页 G803快讯 OpenAI发布实时语音API,交互体验全面升级

OpenAI发布实时语音API,交互体验全面升级

OpenAI近日推出名为“Realtime API”的语音交互工具,正式面向企业和开发者开放。该工具基于全新的“gpt-realtime”模型,采用端到端语音处理技术,响应更迅速,语音更自然,能理解复杂指令,并支持语言切换、语气调节和多种语音选择。 性能方面,新模型在多项测试中表现更优,工具对接也更顺畅。API新增图像输入功能,开发者可控制模型查看的图像范围,并设定token使用上限以控制成本。同时,使用成本降低了20%,并配备内容安全检测和数据本地存储功能,符合欧盟隐私保护要求。

相关文章