亚马逊宣布推出Nova多模态AI模型系列-品论天涯网

亚马逊的云计算部门亚马逊网络服务（AWS）在其re:Invent2024大会上宣布了一个名为Nova的新的生成式人工智能多模态模型系列。该系列共有四种以文本为重点的模型（可接收文本、图像或视频并输出文本的模型）：Micro、Lite、Pro和Premier。Q1u品论天涯网

亚马逊首席执行官安迪-贾西（AndyJassy）在台上说，Micro、Lite和Pro目前已面向AWS客户提供，而Premiere将于2025年第一季度推出。Q1u品论天涯网

Q1u品论天涯网

除此之外，还有一个图像生成模型NovaCanas和一个视频生成模型NovaReel。这两个模型目前都可以公开使用。Q1u品论天涯网

贾西说："我们正在继续研究我们自己的前沿模型，在过去的四五个月里，这些前沿模型取得了巨大进步。我们认为，如果我们发现了它们的价值，你们也可能会发现它们的价值。"Q1u品论天涯网

基于文本的Nova模型主要根据其功能和大小来区分。Q1u品论天涯网

AmazonNovaMicro-纯文本模型，具有最低的延迟响应，上下文长度为128K标记。它还支持微调和模型提炼，以提高准确性。目前已全面上线。Q1u品论天涯网

AmazonNovaLite-一种成本极低的多模态模型，可处理图像、视频和文本输入，并生成文本输出。它支持长度达300K标记的输入，可在单次请求中分析图像或长达30分钟的视频。它还支持微调和模型提炼，以提高准确性。目前已全面上线。Q1u品论天涯网

AmazonNovaPro-高性能多模态模型，可处理多达30万个输入词元。这款新模型在关键基准上实现了最先进的性能。它支持30万个代币的输入上下文，可作为教师模型，用于提炼亚马逊NovaMicro和Lite的自定义变体。目前已全面上线。Q1u品论天涯网

AmazonNovaPremier-亚马逊即将推出的用于复杂推理任务的能力最强的多模态模型，目前仍在培训中。预计将于2025年初全面上线。Q1u品论天涯网

AmazonNovaCanvas-一种图像生成模型，可根据提示中提供的文本或图像创建图像。它还支持使用文本输入和用于调整配色方案和布局的控件编辑图像。目前已全面上线。Q1u品论天涯网

AmazonNovaReel-一种全新的先进视频生成模型，可根据文本和图像创建高质量的6秒视频。亚马逊将在2025年支持2分钟的视频。亚马逊NovaReel将支持控制视觉风格和节奏的功能，包括使用文本提示控制摄像机运动。它已于今日全面上线。Q1u品论天涯网

Jassy说："亚马逊正在开发语音到语音模型和"任意到任意"模型，应该会在2025年年中左右推出。您可以输入文本、语音、图像或视频，也可以输出文本、语音、图像和视频。"Q1u品论天涯网