人工智能

杨立昆:Meta新人满脑子都是大语言模型 但这是一条死胡同

字号+作者:环球市场播报 来源:环球市场播报 2026-01-04 15:07 评论(创建话题) 收藏成功收藏本文

自爆出将离开Meta的消息后,杨立昆(YannLeCun)的日程安排得极其紧凑。“这基本上迫使我们加快了日程,”他说。报道出炉后,法国总统马克龙给他发了一条WhatsAp'...

自爆出将离开Meta的消息后,杨立昆(YannLeCun)的日程安排得极其紧凑。“这基本上迫使我们加快了日程,”他说。报道出炉后,法国总统马克龙给他发了一条WhatsApp消息。杨立昆不愿透露总统具体说了什么,但暗示总统对这家新的“全球性”公司将与法国保持紧密联系感到高兴。eyx品论天涯网

eyx品论天涯网

杨立昆不会担任该公司的首席执行官,而是执行董事长,这让他能拥有与在Meta时相同的研究自由。eyx品论天涯网

报道称,杨立昆的新公司名为先进机器智能实验室(AdvancedMachineIntelligenceLabs),将由法国医疗人工智能初创公司Nabla的联合创始人兼首席执行官亚历克斯·勒布伦(AlexLeBrun)领导。eyx品论天涯网

“我是一名科学家,一个有远见的人。我能激励人们去研究有趣的事物。我很擅长判断哪种技术可行、哪种不可行。但我做不了首席执行官,”杨立昆说,“我既太缺乏条理,而且也年纪太大了!”eyx品论天涯网

数十年来,他一直在潜心构思如何让机器具备这样的智能。他也毫不讳言自己对大型语言模型的质疑态度,硅谷当下正痴迷于这类模型,认为它们有望实现超越人类的智能,但在他看来,大型语言模型虽有实用价值,其本质却受限于语言载体,存在根本性局限。要实现媲美人类的智能水平,机器还必须理解现实物理世界的运行规律。eyx品论天涯网

为达成这一目标,他提出了一套解决方案——基于V-JEPA架构的“世界模型”。这类模型不依赖语言文本,而是通过学习视频和空间数据来理解物理世界,同时具备规划、推理和长效记忆的能力。杨立昆将这种智能形态命名为高级机器智能(AMI)。eyx品论天涯网

杨立昆于1960年出生,在巴黎郊区长大,从小就对人类智能的起源问题充满好奇。eyx品论天涯网

正是他八、九岁时观看的电影《2001太空漫游》(2001:ASpaceOdyssey),为他指明了如今的道路。他比划着,形容当时自己的思想受到了极大震撼。eyx品论天涯网

杨立昆的父亲是一名航空工程师,同时也是个“业余发明家”,正是父亲培养了他动手制作、捣鼓各类物件的爱好。从小到大,他热衷于组装飞机模型,还吹奏木管乐器,比如竖笛,以及一种名为克鲁姆管的“古怪的文艺复兴时期乐器”——他曾加入一支文艺复兴舞曲乐队,演奏这种乐器。eyx品论天涯网

他表示,曾经有一位老师认为他数学太差,不适合在大学里学习数学,于是他决定攻读工程学。eyx品论天涯网

上世纪80年代,杨立昆就读于巴黎高等电子与电工技术工程师学院。正是在求学期间,他读到一本探讨“先天与后天”之争的著作——书中记录了语言学家诺姆・乔姆斯基与心理学家让・皮亚杰的辩论,这次阅读成了他的灵感迸发时刻。乔姆斯基主张人类天生具备语言能力,而皮亚杰则认为人类认知虽有先天框架,但绝大部分能力都源于后天学习。eyx品论天涯网

“说这话可能会得罪人……”他表示,“但我读这本书的时候,觉得乔姆斯基所说的一切都不可能是真的,我们所有的能力都是学来的。智能的核心在于学习。”eyx品论天涯网

彼时,人工智能研究——也就是当时所称的“神经网络”技术,一种大致模仿大脑工作机制的技术——在早期尝试受挫后,几乎成了一片无人问津的领域,甚至被科学界视为禁忌。但杨立昆主动寻找其他研究神经网络的学者,并与当时任职于卡内基梅隆大学的杰弗里・辛顿等人惺惺相惜,成为学术上的“知音”。eyx品论天涯网

后来,他以博士后研究员的身份加入了辛顿所在的多伦多大学。此后,两人与约书亚·本吉奥(YoshuaBengio)共同为深度学习和现代人工智能奠定了基础,并因此在2018年获得了计算机科学领域最负盛名的图灵奖。eyx品论天涯网

杨立昆是多项重要早期人工智能技术的核心开创者。上世纪80年代末至90年代,他任职于美国新泽西州的AT&T贝尔实验室——这座实验室曾被誉为全球顶尖的企业研究机构。在此期间,他研发出卷积神经网络架构,这种技术被广泛应用于图像识别领域。他还基于该架构搭建了一套系统,这套系统后来被各大银行普遍用于支票读取。eyx品论天涯网

这项研究的构想其实是他在多伦多大学时萌生的,但多亏贝尔实验室雄厚得近乎无限的资金支持和前沿技术储备,才得以将其落地应用于现实世界。eyx品论天涯网

杨立昆回忆起他刚加入时,当时的老板拉里·杰克尔(LarryJackel)对他说过的一句话:“他说,‘你知道吗?在贝尔实验室,省钱可不会让你出名。’”eyx品论天涯网

他最终与身为药剂师的妻子Isabelle以及他们的三个儿子在新泽西州定居下来,不过他大约每五周就会去一次巴黎。他说,美国给他带来了“文化冲击”。eyx品论天涯网

贝尔实验室的辉煌岁月注定走到了尽头。一场企业重组使得实验室的资金大幅缩水,还被拆分给了不同的子公司。杨立昆重返学术界,在纽约大学启动了一个专注于神经网络研究的新项目,课后常去格林尼治村的爵士俱乐部消遣。eyx品论天涯网

到2013年,深度学习的可行性已显而易见——其图像识别应用展现出了令人瞩目的成果。彼时谷歌刚启动“谷歌大脑”项目,一年后便收购了英国人工智能实验室DeepMind。eyx品论天涯网

也正是在这一年,马克・扎克伯格打来电话。他有意在脸书(Facebook)组建人工智能部门,为了招揽杨立昆,特意邀请他到自己位于加州的家中赴宴。杨立昆回忆道,当时有一位私人厨师掌勺,做了“鸡肉配口感醇厚的白葡萄酒”。eyx品论天涯网

杨立昆同意加盟,但提出了三个条件:第一,不必辞去纽约大学的教职;第二,无需迁居加州;第三,新实验室的研究成果必须对外公开。eyx品论天涯网

扎克伯格同意了,合作就此敲定。杨立昆正式加入全球顶尖科技企业之一的脸书,牵头成立了一家致力于基础研究的全新人工智能实验室,命名为脸书人工智能研究院(FAIR)。eyx品论天涯网

在杨立昆眼中,脸书就像“一张白纸,任其挥洒”。“资金显然不成问题。”eyx品论天涯网

2022年初,在聊天机器人ChatGPT问世之前,各大人工智能实验室其实都已研发出类似技术,只是当时普遍将其视为实验性项目。最终,是一家规模不大、名不见经传的人工智能实验室——OpenAI,悄然推出了一款易于使用的聊天机器人产品,由此引爆了如今的人工智能热潮。eyx品论天涯网

ChatGPT的横空出世,让Meta内部乱了阵脚。公司领导层决定全力押注大型语言模型Llama的研发。扎克伯格对公司架构进行重组,成立了生成式人工智能部门,专门负责加快相关技术的产品化进程。杨立昆则坚持,这款模型必须以开源形式发布。eyx品论天涯网

杨立昆表示,Llama2的发布堪称里程碑时刻,彻底改变了整个行业格局——它向所有用户开放了模型权重,任何人都可以免费下载、自由调整。这款模型一跃成为高性能开源大型语言模型的标杆,其所倡导的开源理念,与谷歌、开放人工智能研究中心推行的技术垄断路线形成了鲜明对比。一时间,Meta公司被视为人工智能研究领域的“良心企业”。eyx品论天涯网

杨立昆透露,去年Meta在人工智能战略上进行了大刀阔斧的调整。扎克伯格向生成式人工智能部门施压,要求其加快技术研发与落地速度,这一决策最终导致双方沟通彻底失灵。eyx品论天涯网

“我们团队其实有很多新颖且极具价值的想法,本该被投入应用。但公司管理层却只执着于那些稳妥的、已被验证可行的方案。”他说,“一旦陷入这种保守思维,只会渐渐落后于人。”eyx品论天涯网

此后推出的几款Llama系列模型均以失败告终。2025年4月发布的Llama4更是惨淡收场,公司还被指控操控测试基准,以此粉饰模型的性能表现。杨立昆坦承,当时团队确实“在数据结果上动了些手脚”——为了在不同的测试基准中取得更亮眼的成绩,他们针对不同测试采用了不同的模型版本。eyx品论天涯网

“马克对此勃然大怒,基本上对所有参与该项目的人都失去了信任。最终,整个生成式人工智能部门被彻底边缘化。很多人已经离职,那些还没走的,也迟早会离开。”eyx品论天涯网

去年6月,Meta向数据标注初创企业ScaleAI投资150亿美元,同时聘请该公司28岁的首席执行官兼联合创始人亚历山大・王(AlexandrWang)执掌帅印。亚历山大・王接手了Meta在人工智能领域的全新投资项目,以及旗下一家名为TBDLab的研究机构。该实验室的核心任务是研发新一代前沿人工智能模型。eyx品论天涯网

此前,Meta曾因以1亿美元签约奖金为筹码,从竞争对手处挖掘顶尖研究人才而登上新闻头条。“此举究竟是否明智,留待时间检验。”杨立昆面无表情地说道。eyx品论天涯网

对于这位受雇来领导该机构的亚历山大・王,杨立昆直言其“年纪尚轻”且“经验不足”。eyx品论天涯网

“他学得很快,也清楚自己的短板所在……但他既没有科研工作的相关经验,也不懂研究该如何开展、如何推进,更不知道什么因素能吸引研究人员,什么因素会让他们反感。”eyx品论天涯网

亚历山大・王同时还成了杨立昆的直属上司。被问及面对这种层级关系的转变作何感想,起初,他对此不以为意,表示自己向来习惯与年轻人共事。“当年脸书工程师的平均年龄只有27岁,我的年纪是他们的两倍。”eyx品论天涯网

“亚历山大(王)也没有对我指手画脚,”他回应道,“没人能命令研究人员该做什么,尤其是像我这样的研究人员。”eyx品论天涯网

谈及自己在Meta任职十余年后最终决定离职的原因,杨立昆直言不讳。他表示,继续留在公司已陷入难以调和的立场困境。尽管扎克伯格十分认可他在世界模型领域的研究,但公司为推动超级智能项目新招募的一批人,“满脑子都是大语言模型”。eyx品论天涯网

显然,这一状况让杨立昆深感格格不入。“我敢肯定,Meta内部有不少人,或许也包括亚历山大,都巴不得我不要对外宣称:就实现超级智能而言,大语言模型本质上是一条死胡同。”他说,“但我不会因为某些人认为我错了,就改变自己的观点。我本身并没有错。作为一名科学家,我的职业操守不允许我做出违心之举。”eyx品论天涯网

促使他离职的另一大原因是,他在世界模型与自主智能体(AMI)领域的研究成果,已展现出诸多潜在应用场景,例如航空发动机和重工业等,但这些领域均非Meta的关注重点。此外,杨立昆毫不费力便找到了愿意投资新一代人工智能技术的投资方。eyx品论天涯网

在职业生涯的全新阶段,杨立昆认为,创办一种“新型实验室”——也就是兼顾基础研究的初创企业——是当下最具发展潜力的新赛道。他以OpenAI前首席技术官米拉・穆拉蒂创办的思维机器公司(ThinkingMachines,“但愿投资方清楚他们在做什么”),以及开放人工智能联合创始人兼首席科学家伊利亚・萨茨凯弗创立的安全超级智能公司(SafeSuperintelligence,“这家我敢肯定,投资方完全搞不懂他们在做什么”)为例,称这两家企业就是很好的范本。eyx品论天涯网

他提出的全新模型架构,借助视频数据帮助人工智能模型理解现实世界的物理规律,从而使其能更精准地预测后续可能发生的事件。该模型还会依托“类情绪机制”——即过往的经验与评估结果——来指导预测过程。eyx品论天涯网

“如果我掐你一下,你会感到疼。这件事会进而影响你对我的认知模型。等到下一次我抬手靠近你时,你就会本能地退缩。这就是你的预测机制在发挥作用,而触发这一反应的‘情绪’,正是恐惧或是对疼痛的回避。”他解释道。eyx品论天涯网

杨立昆表示,未来12个月内,人们就能看到这一技术的“雏形版本”,而更大规模的落地应用将在几年内实现。尽管这还远算不上真正的超级智能,但已为其铺就了可行路径。“或许我们目前仍未察觉到某些潜在障碍,但至少未来可期。”eyx品论天涯网

被问及希望能留下怎样的人生遗产,他不假思索地答道:为世界增添更多智能。“智能,才是我们这个世界最需要去不断积累的东西。”他补充道,更多的智能意味着更少的人类苦难、更理性的决策,以及对世界和宇宙更深层次的认知。eyx品论天涯网

“人类的苦难源于愚昧。”eyx品论天涯网

本网除标明“PLTYW原创”的文章外,其它文章均为转载或者爬虫(PBot)抓取; 本文只代表作者个人观点,不代表本站观点,仅供大家学习参考。本网站属非谋利性质,旨在传播马克思主义和共产主义历史文献和参考资料。凡刊登的著作文献侵犯了作者、译者或版权持有人权益的,可来信联系本站删除。 本站邮箱[email protected]