现代人工智能领域最具影响力的研究人员之一、OpenAI联合创始成员安德烈·卡帕西(AndrejKarpathy)正式加入Anthropic,将专注于大语言模型(LLM)的核心研究与预训练工作。卡帕西早年是OpenAI的创始团队成员之一,曾在公司早期担任研究科学家,其研究领域涵盖计算机视觉、深度学习以及多模态人工智能,在当前LLM浪潮兴起之前,就已在图像描述和视觉—语义对齐等方向开展了广泛研究。
卡帕西在社交平台X上宣布了这一动向。他表示,自己已经加入Anthropic,并认为未来几年将是大模型前沿发展尤为关键的阶段,因此非常期待回到研发一线。他同时强调,自己依然对教育领域充满热情,计划在未来适当时机继续推进相关工作。
在加入Anthropic之前,卡帕西曾被埃隆·马斯克招募至特斯拉,担任AI总监并领导Autopilot视觉团队,是推动特斯拉从依赖雷达和激光雷达转向以摄像头为核心的自动驾驶路线的关键人物之一。他于2022年离开特斯拉。2023年,卡帕西重返OpenAI,参与与ChatGPT相关的人工智能研究,并于2024年再次离职。此后,他创办了专注AI教育方向的创业公司EurekaLabs,旨在打造一种面向未来的、“AI原生”的新型学习体验。
对于致力于开发前沿大模型的Anthropic来说,卡帕西的加盟被视为一项重要的人才引进。当前,Anthropic正在与OpenAI、GoogleDeepMind、xAI以及Meta等公司竞争更强大的前沿模型,其间对顶尖研究人员的争夺尤为激烈。从卡帕西公开表态来看,他将在Anthropic主要聚焦核心研发工作,并暂时搁置此前在教育方向的创业项目。
OpenAI内部人士也对这一人事变动作出回应。有人表示,原本希望卡帕西能够回到OpenAI,但依然为他选择加入任何一家前沿实验室、继续推动这一时代最重要技术的发展感到高兴。他强调,不应将各家实验室之间的竞争简单视为零和博弈,因为从整体上看,这些机构正在共同推进整个人工智能领域的进步。
在Anthropic内部,卡帕西将加入由NickJoseph领导的预训练团队,推动大语言模型预训练阶段的研究进展。预训练是大语言模型训练流程中的初始关键环节,模型会在这一阶段接触海量数据,从中学习语言模式、语法结构、语义联系以及世界知识,为随后的微调与对齐奠定基础。卡帕西的加入,被认为有望加速Anthropic在这一核心技术环节上的创新步伐。

相关文章

头条焦点
精彩导读
关注我们
【查看完整讨论话题】 | 【用户登录】 | 【用户注册】