据《信息》杂志获取的一份内部备忘录显示,元宇宙平台公司(MetaPlatforms)对其新成立AI团队即将推出的首款核心大模型,态度愈发乐观。这份日期为1月20日的备忘录由Meta超级智能实验室(MetaSuperintelligenceLabs)产品经理梅根・傅(MeganFu)发布,其中明确指出,下一代大语言模型Avocado(牛油果)已完成预训练,是“Meta迄今能力最强的预训练基础模型”。预训练是AI模型开发的初始阶段,模型需接触海量数据,学习通用知识、模式与关联关系。
左为王士立(AlexandrWang)与马克・扎克伯格
备忘录称,Avocado的性能已超越当前最优的开源基础模型。(基础模型指仅完成预训练、尚未通过“后训练”阶段优化的大语言模型;后训练阶段会通过人类反馈强化学习等技术,针对特定任务对模型进行精调。)尽管Avocado尚未完成后训练,但其在知识储备、视觉感知及多语言能力上,已与顶尖的后训练模型持平。
在Avocado正式公开发布前,Meta内部对其AI模型进展的乐观评估,能否经受住外界检验,目前尚无定论。但考虑到Meta过去一年在AI领域的坎坷经历,即便在内部过度宣传这一进展,对公司而言也存在风险。
2025年,Meta旗下上一代大语言模型Llama4的表现未达预期,迫使公司推迟其发布时间。最终Meta推出Llama4的两个版本——Maverick(游侠)与Scout(侦察兵),但部分开发者对其实际表现感到失望。
这些挫折直接推动了Meta整体AI业务的大规模重组。重组包括:去年6月Meta以143亿美元收购ScaleAI,该初创公司CEO王士立(AlexandrWang)随之加入Meta,负责统领全新的AI综合组织——Meta超级智能实验室。此后,Meta向AI业务投入的资金创历史纪录:公司近期预测,2026年包含AI算力成本在内的资本支出,将较2025年增长约73%,达到1150亿至1350亿美元。
Meta在新模型上取得的技术进展,或有助于控制相关成本。去年12月中旬的另一份备忘录显示,在文本相关任务中,Avocado的计算效率较Maverick提升10倍,较Behemoth提升超100倍。Behemoth是Meta去年推迟发布、至今未公开的Llama4版本。
Meta表示,通过获取更高质量的数据、投入模型基础设施建设,以及采用确定性训练(该方法可确保模型在相同训练方式下输出稳定结果),成功实现了效率突破。这一效率提升有助于降低AI研发的能耗与成本——在Meta全力追赶竞争对手的当下,这是至关重要的因素。
Meta内部备忘录的积极基调,与近期高管的公开表态相呼应。上月Meta首席技术官安德鲁・博斯沃思(AndrewBosworth)在瑞士达沃斯世界经济论坛的新闻发布会上,也暗示了类似的效率提升,并称Meta的AI模型“表现非常出色”。博斯沃思还表示,要开发出面向消费者的可用模型,需要进行大量的后训练工作。
与此同时,在上周的财报电话会议上,Meta首席执行官马克・扎克伯格(MarkZuckerberg)谈及Meta超级智能实验室计划推出的首批大模型时表示:“我预计我们的首批模型会表现不错,但更重要的是,它们将展现出我们快速的发展轨迹。我还预计,今年我们将持续推出新模型,稳步推进技术前沿。”

相关文章

头条焦点
精彩导读
关注我们
【查看完整讨论话题】 | 【用户登录】 | 【用户注册】