人工智能

Meta 发布新一代旗舰 AI 模型 Llama 4

字号+作者:cnBeta.COM 来源:cnBeta 2025-04-06 04:24 评论(创建话题) 收藏成功收藏本文

Meta于周六发布了其Llama家族的全新AI模型系列Llama4。总共有四种新模型:Llama4Scout、Llama4Maverick和Llama4Behemoth。Meta表示,所有模型都经过“大量'...

Meta于周六发布了其Llama家族的全新AI模型系列Llama4。总共有四种新模型:Llama4Scout、Llama4Maverick和Llama4Behemoth。Meta表示,所有模型都经过“大量未标记的文本、图像和视频数据”的训练,从而获得“广泛的视觉理解”。LvD品论天涯网

中国DeepSeek的开放模型取得了成功,其性能与Meta之前的旗舰Llama模型相当甚至更好,这推动了Llama的加速开发。据说Meta已经组建了作战室来解密DeepSeek如何降低运行和部署R1和V3等模型的成本。LvD品论天涯网

Scout和Maverick已在Llama.com和Meta的合作伙伴处公开提供,包括AI开发平台HuggingFace,而Behemoth仍在训练中。Meta表示,其跨WhatsApp、Messenger和Instagram等应用的AI助手MetaAI已更新,可在40个国家/地区使用Llama4。目前,多模式功能仅限于美国英语版本。LvD品论天涯网

一些开发人员可能对Llama4许可证提出异议。LvD品论天涯网

禁止在欧盟“注册”或“主要营业地点”为欧盟的用户和公司使用或分发这些模型,这可能是该地区人工智能和数据隐私法规定的治理要求的结果。(过去,Meta曾谴责这些法律过于繁琐。)此外,与之前的Llama版本一样,每月活跃用户超过7亿的公司必须向Meta申请特殊许可,Meta可自行决定授予或拒绝该许可。LvD品论天涯网

Meta在一篇博文中写道:“这些Llama4模型标志着Llama生态系统新时代的开始。这只是Llama4系列的开始。”LvD品论天涯网

LvD品论天涯网

Meta表示,Llama4是其第一批使用混合专家(MoE)架构的模型,该架构在训练和回答查询方面具有更高的计算效率。MoE架构基本上将数据处理任务分解为子任务,然后将其委托给较小的、专门的“专家”模型。 LvD品论天涯网

例如,Maverick总共拥有4000亿个参数,但在128位“专家”中只有170亿个活跃参数。(参数大致对应于模型的解决问题的能力。)Scout拥有170亿个活跃参数、16位专家和1090亿个总参数。LvD品论天涯网

根据Meta的内部测试,Maverick在某些编码、推理、多语言、长上下文和图像基准上超过了OpenAI的GPT-4o和Google的Gemini2.0等模型,该公司称Maverick最适合创意写作等“一般助理和聊天”用例。然而,Maverick还不如Google的Gemini2.5Pro、Anthropic的Claude3.7Sonnet和OpenAI的GPT-4.5等功能更强大的近期模型。LvD品论天涯网

Scout的优势在于文档摘要和大型代码库推理等任务。它的独特之处在于拥有非常大的上下文窗口:1000万个标记。(“标记”代表原始文本的片段—例如,“fantastic”一词可拆分为“fan”、“tas”和“tic”。)用简单的英语来说,Scout可以接收图像和多达数百万个单词,从而能够处理和处理非常长的文档。LvD品论天涯网

据Meta称,Scout可以在单个NVIDIAH100GPU上运行,而Maverick则需要NVIDIAH100DGX系统。LvD品论天涯网

Meta尚未发布的Behemoth将需要更强大的硬件。据该公司称,Behemoth拥有2880亿个活跃参数、16位专家和近2万亿个总参数。Meta的内部基准测试显示,在多项衡量STEM技能(如数学问题解决能力)的评估中,Behemoth的表现优于GPT-4.5、Claude3.7Sonnet和Gemini2.0Pro(但不是2.5Pro)。LvD品论天涯网

值得注意的是,Llama4模型中没有一个是像OpenAI的o1和o3-mini那样的真正的“推理”模型。推理模型会核实其答案,并且通常能更可靠地回答问题,但因此比传统的“非推理”模型需要更长的时间来给出答案。LvD品论天涯网

LvD品论天涯网

有趣的是,Meta表示,它对所有Llama4型号进行了调整,使其不再频繁地拒绝回答“有争议”的问题。据该公司称,Llama4会回应“有争议的”政治和社会话题,而之前的Llama型号不会回应。此外,该公司表示,Llama4的“平衡性大大提高”,它根本不会接受这些提示。LvD品论天涯网

Meta发言人表示:“你可以依靠Lllama4提供有用的、基于事实的回答,而不会做出任何评判。我们正在继续提高Llama的响应能力,以便它能够回答更多问题,能够回应各种不同的观点,并且不会偏袒某些观点。”LvD品论天涯网

这些调整是在白宫的一些盟友指责人工智能聊天机器人在政治上过于“觉醒”之际做出的。LvD品论天涯网

唐纳德·特朗普总统的许多密友,包括亿万富翁埃隆·马斯克和加密与人工智能“沙皇”大卫·萨克斯,都声称流行的人工智能聊天机器人 会审查保守派观点。萨克斯曾指出,  OpenAI的ChatGPT是“被编程为唤醒”的,并且在政治话题上不诚实。LvD品论天涯网

事实上,人工智能中的偏见是一个棘手的技术问题。马斯克自己的人工智能公司xAI一直在 努力 打造一款不会偏袒某些政治观点的聊天机器人。LvD品论天涯网

这并没有阻止包括OpenAI在内的公司调整他们的人工智能模型来回答比以前更多的问题,特别是涉及有争议话题的问题。LvD品论天涯网

本网除标明“PLTYW原创”的文章外,其它文章均为转载或者爬虫(PBot)抓取; 本文只代表作者个人观点,不代表本站观点,仅供大家学习参考。本网站属非谋利性质,旨在传播马克思主义和共产主义历史文献和参考资料。凡刊登的著作文献侵犯了作者、译者或版权持有人权益的,可来信联系本站删除。 本站邮箱service@pltyw.com

22
扫二维码添加收藏返回顶部