Meta已宣布其Llama系列生成式人工智能模型的最新成员:Llama3.370B。在X上的帖子中,Meta的生成式人工智能副总裁AhmadAl-Dahle表示,纯文本Llama3.370B以更低的成本提供了等效于Meta最大Llama模型Llama3.1405B的性能。
了解更多:
https://huggingface.co/meta-llama/Llama-3.3-70B-Instruct
Al-Dahle写道:"通过利用后训练技术的最新进展......该模型以显著降低的成本提高了核心性能。"图表显示,Llama3.370B在多项行业基准测试中的表现优于Google的Gemini1.5Pro、OpenAI的GPT-4o和亚马逊新发布的NovaPro,其中包括评估模型理解语言能力的MMLU。Meta发言人通过电子邮件表示,该模型能在数学、常识、指令遵循和应用程序使用等方面有所改进。
Llama3.370B(可从人工智能开发平台HuggingFace和包括Llama官方网站在内的其他来源下载)是Meta的最新力作,其目的是通过"开放"模型在人工智能领域占据主导地位,这些模型可用于各种应用并实现商业化。
Meta的条款限制了某些开发者使用Llama模型的方式:月用户超过7亿的平台必须申请特殊许可。但对许多人来说,Llama模型并非严格意义上的"开放",这并不重要。例如,根据Meta的数据,Llama的下载量已超过6.5亿次。
Meta在内部也利用了Llama。Meta首席执行官马克-扎克伯格(MarkZuckerberg)表示,该公司的人工智能助手MetaAI完全由Llama模型提供支持,目前已拥有近6亿月活跃用户。扎克伯格称,MetaAI有望成为全球使用人数最多的人工智能助手。
对于Meta来说,Llama的"开放"性质是福也是祸。11月,一份报告称,中国军方研究人员使用Llama模型开发了一款国防聊天机器人。对此,Meta向美国国防承包商提供了Llama模型。
Meta还对自己是否有能力遵守欧盟为人工智能制定法律和监管框架的法律《人工智能法》表示担忧,称该法律的实施"太难以预测"。该公司面临的问题是欧盟隐私法GDPR中有关人工智能训练的相关规定。Meta利用Instagram和Facebook用户的公开数据训练人工智能模型,这些数据在欧洲受GDPR保障。
今年早些时候,欧盟监管机构要求Meta停止对欧洲用户数据的训练,同时对该公司的GDPR合规性进行评估。Meta对此做出了让步,但同时也认可了一封公开信 ,呼吁对GDPR进行"现代解释",不要"拒绝进步"。
Meta也未能幸免于其他人工智能实验室面临的技术挑战,它正在加强计算基础设施,以训练和服务未来几代的Llama模型。该公司周三宣布,将在路易斯安那州建造一个价值100亿美元的人工智能数据中心,这是该公司有史以来建造的最大的人工智能数据中心。
扎克伯格在今年8月的Meta第四季度财报电话会议上表示,为了训练下一套主要的Llama模型(Llama4),公司需要的计算能力将是训练Llama3所需的计算能力的10倍。
训练大型语言模型是一项成本高昂的工作。在服务器、数据中心和网络基础设施投资的推动下,Meta公司2024年第二季度的资本支出从去年同期的64亿美元增至85亿美元,增幅近33%。
【查看完整讨论话题】 | 【用户登录】 | 【用户注册】