亚马逊的云计算部门亚马逊网络服务(AWS)在其re:Invent2024大会上宣布了一个名为Nova的新的生成式人工智能多模态模型系列。该系列共有四种以文本为重点的模型(可接收文本、图像或视频并输出文本的模型):Micro、Lite、Pro和Premier。RBX品论天涯网
亚马逊首席执行官安迪-贾西(AndyJassy)在台上说,Micro、Lite和Pro目前已面向AWS客户提供,而Premiere将于2025年第一季度推出。RBX品论天涯网
RBX品论天涯网
除此之外,还有一个图像生成模型NovaCanas和一个视频生成模型NovaReel。这两个模型目前都可以公开使用。RBX品论天涯网
贾西说:"我们正在继续研究我们自己的前沿模型,在过去的四五个月里,这些前沿模型取得了巨大进步。我们认为,如果我们发现了它们的价值,你们也可能会发现它们的价值。"RBX品论天涯网
基于文本的Nova模型主要根据其功能和大小来区分。RBX品论天涯网
AmazonNovaMicro-纯文本模型,具有最低的延迟响应,上下文长度为128K标记。它还支持微调和模型提炼,以提高准确性。目前已全面上线。RBX品论天涯网
AmazonNovaLite-一种成本极低的多模态模型,可处理图像、视频和文本输入,并生成文本输出。它支持长度达300K标记的输入,可在单次请求中分析图像或长达30分钟的视频。它还支持微调和模型提炼,以提高准确性。目前已全面上线。RBX品论天涯网
AmazonNovaPro-高性能多模态模型,可处理多达30万个输入词元。这款新模型在关键基准上实现了最先进的性能。它支持30万个代币的输入上下文,可作为教师模型,用于提炼亚马逊NovaMicro和Lite的自定义变体。目前已全面上线。RBX品论天涯网
AmazonNovaPremier-亚马逊即将推出的用于复杂推理任务的能力最强的多模态模型,目前仍在培训中。预计将于2025年初全面上线。RBX品论天涯网
AmazonNovaCanvas-一种图像生成模型,可根据提示中提供的文本或图像创建图像。它还支持使用文本输入和用于调整配色方案和布局的控件编辑图像。目前已全面上线。RBX品论天涯网
AmazonNovaReel-一种全新的先进视频生成模型,可根据文本和图像创建高质量的6秒视频。亚马逊将在2025年支持2分钟的视频。亚马逊NovaReel将支持控制视觉风格和节奏的功能,包括使用文本提示控制摄像机运动。它已于今日全面上线。RBX品论天涯网
Jassy说:"亚马逊正在开发语音到语音模型和"任意到任意"模型,应该会在2025年年中左右推出。您可以输入文本、语音、图像或视频,也可以输出文本、语音、图像和视频。"RBX品论天涯网
【查看完整讨论话题】 | 【用户登录】 | 【用户注册】