NovaSonic通过亚马逊Bedrock开发者平台提供服务,采用创新的双向流式API接口,为企业级AI应用开发提供了强大支持。亚马逊特别强调,该模型在成本效益方面具有显著优势,其价格比OpenAI的GPT-4o便宜约80%。堪称目前市场上最具性价比的AI语音解决方案。
与竞争对手的AI语音模型相比,NovaSonic在将用户请求路由到不同API方面表现出色。这一能力使得NovaSonic能够知晓何时需要从互联网获取实时信息、解析专有数据源,或者在外部应用程序中采取行动,并使用合适的工具来完成任务。
在双向对话中,NovaSonic会等待“合适的时机”发言,会考虑到说话者的停顿和打断等情况。此外,NovaSonic还能够为用户的语音生成文本记录,开发者可以将这些文本用于各种应用场景。
亚马逊AGI部门首席科学家罗希特?普拉萨德透露,NovaSonic的部分技术已经应用于升级版数字助手Alexa+。该模型的推出是亚马逊构建人工通用智能(AGI)战略的重要一步,未来还将推出支持多模态理解的AI模型,涵盖图像、视频及其他物理世界感知数据。

相关文章

头条焦点
精彩导读
关注我们
【查看完整讨论话题】 | 【用户登录】 | 【用户注册】