
亚马逊近日推出名为Nova Sonic的新一代生成式AI模型,该模型能够高效处理和生成自然流畅的语音。据亚马逊介绍,Nova Sonic在速度、语音识别及对话质量等关键指标上表现优异,可与OpenAI和谷歌的前沿语音模型相媲美。
Nova Sonic通过亚马逊Bedrock开发者平台提供服务,采用全新双向流式API接入。其成本效益显著,价格比OpenAI的GPT-4o低约80%。此外,该模型已为亚马逊升级版语音助手Alexa+提供动力支持。
Nova Sonic具备出色的用户请求路由能力,可灵活调用互联网信息、专有数据源或外部应用程序工具完成任务。在多语言语音识别基准测试中,其平均单词错误率仅为4.2%,显著优于竞品。同时,其平均感知延迟仅1.09秒,响应速度领先行业。
亚马逊高级副总裁罗希特・普拉萨德表示,Nova Sonic是公司构建人工通用智能(AGI)战略的重要一步,未来还将推出更多跨模态AI模型,助力开发者构建多样化应用。