亚马逊发布新一代生成式AI模型Nova Sonic，语音处理能力媲美行业领先者

亚马逊近日推出名为Nova Sonic的新一代生成式AI模型，该模型能够高效处理和生成自然流畅的语音。据亚马逊介绍，Nova Sonic在速度、语音识别及对话质量等关键指标上表现优异，可与OpenAI和谷歌的前沿语音模型相媲美。

Nova Sonic通过亚马逊Bedrock开发者平台提供服务，采用全新双向流式API接入。其成本效益显著，价格比OpenAI的GPT-4o低约80%。此外，该模型已为亚马逊升级版语音助手Alexa+提供动力支持。

Nova Sonic具备出色的用户请求路由能力，可灵活调用互联网信息、专有数据源或外部应用程序工具完成任务。在多语言语音识别基准测试中，其平均单词错误率仅为4.2%，显著优于竞品。同时，其平均感知延迟仅1.09秒，响应速度领先行业。

亚马逊高级副总裁罗希特・普拉萨德表示，Nova Sonic是公司构建人工通用智能（AGI）战略的重要一步，未来还将推出更多跨模态AI模型，助力开发者构建多样化应用。

v2rayshare