人工智能

Gemini“灵魂人物”官宣加盟xAI 马斯克火速转推

字号+作者:新智元 来源:新智元 2025-09-21 14:04 评论(创建话题) 收藏成功收藏本文

Gemini核心开发者DustinTran昨天官宣从GoogleDeepMind跳槽到xAI,研发新一代Grok!马斯克也于第一时间转发推文,确认了这位新同事的加盟xAI消息属实:从官宣中'...

Gemini核心开发者DustinTran昨天官宣从GoogleDeepMind跳槽到xAI,研发新一代Grok!马斯克也于第一时间转发推文,确认了这位新同事的加盟xAI消息属实:vzS品论天涯网


vzS品论天涯网

从官宣中得知,DustinTran已经加入xAI至少几周了,参与了Grok4Fast的开发,但直到今天才修改自己的对外头衔介绍,甚至慢于马斯克转发推文。vzS品论天涯网

这也被眼尖的网友发现并调侃了:vzS品论天涯网


vzS品论天涯网

DustinTran的新同事,xAI创始成员,同时也是之前从GoogleDeepMind跳槽过来的TobyPohlen,也于第一时间转发推文欢迎新同事:vzS品论天涯网


vzS品论天涯网

也有网友关心竞业条款带来的限制:vzS品论天涯网


vzS品论天涯网

加州禁止竞业条款,得以让人才能在公司间自由流动,这也被普遍认为是加州的创新活力源泉的重要保障。vzS品论天涯网

DustinTran,Gemini核心开发者vzS品论天涯网

DustinTran,是Gemini从诞生之初到最新模型的核心开发者。vzS品论天涯网




vzS品论天涯网

2014年,他毕业于加州大学伯克利分校,取得数学与统计本科学位,随后进入哈佛大学攻读统计学博士学位,两年后又转入哥伦比亚大学攻读计算机科学博士,并于2018年取得了博士学位。vzS品论天涯网


vzS品论天涯网

他目前的论文总引用量已超过2.4万。vzS品论天涯网


vzS品论天涯网

他也在读博期间斩获了包括Google博士奖学金在内的多项大奖:vzS品论天涯网


vzS品论天涯网

他的工作履历相当简洁:2017年在OpenAI研究岗实习,同一年进入Google大脑研究岗实习并留任长达8年。vzS品论天涯网


vzS品论天涯网

在官宣离职的长推文中,他饱含深情地回顾了在Google的8年工作,从混沌中摸索出霸榜的Gemini的心路历程,以及因为xAI的海量算力而选择加入xAI:vzS品论天涯网


vzS品论天涯网

我正式告别GoogleDeepMind,结束了8年的旅程。这一路有满满的美好回忆——从最早在Google大脑参与一些奠基性的论文(和@noamshazeer、@ashvaswani、@lukaszkaiser一起做ImageTransformer、Tensor2Tensor、MeshTensorFlow),到后来负责Gemini的后训练评测,在100天内追赶并上线;接着带领团队实现跃升,拿下LMArena第一(并稳居榜首一年多!);最后还参与了Gemini在IMO和ICPC上斩获金牌的推理创新(和@HengTze、@quocleix一起)。vzS品论天涯网

Gemini的旅程跌宕起伏,不断经历范式的转变:最初,我们改造了LaMDA模型(第一个类指令式的聊天机器人!),让它从单纯的聊天机器人进化为能通过RLHF给出更长、更有内容的回答;之后,我们探索通过长链条思维训练、新颖环境和奖励头来增强推理和深度思考能力。刚开始时,外界普遍并不看好,很多人觉得Google会因为搜索的历史包袱和内部政治而注定失败。但如今,Gemini不仅在用户偏好上长期稳居第一,还不断推动新的科学突破,大家反而觉得Google赢是理所当然的。(以前每次Google有新成果时,OpenAI总会靠积压的想法先一步发布,从而抢占AI的新闻周期;但可以说,他们的“库存”如今已经耗尽了。)vzS品论天涯网

之后我加入了xAI。秘诀其实很清楚:算力、数据,以及大约O(100)个聪明又拼命努力的人,这就是拿下前沿级大语言模型所需的一切。xAI对此真的深信不疑。在算力方面,即使在Google,我也从没见过这种“人均芯片”的规模(而且Colossus2上还有10万+的GB200/30万+的GB300即将到来)。在数据方面,Grok4做出了RL和后训练规模化的最大押注。xAI现在则在数据扩展、深度思考和训练配方上下注。团队行动也极其迅速——在这么短的时间里,没有任何一家公司能在AI能力上达到xAI现在的水平。正如@elonmusk所说,一家公司的一阶和二阶导数才是最关键的:xAI的发展势头是最快的。vzS品论天涯网

我很兴奋地宣布,在加入的头几周,我们就推出了Grok4Fast。Grok4是一个出色的推理模型,依然在ARC-AGI和新基准(如FinSearchComp)上排名第一。但它运行较慢,本来也不是面向通用用户需求的。而Grok4Fast则是最好的轻量级模型之一——在LMArena上排名第8(Gemini2.5Flash是第18!),在核心推理评测(如AIME)上,它能与Grok4比肩,同时成本却低15倍。特别感谢@LiTianleli、@jinyilll、@ag_i_2211、@s_tworkowski、@keirp1、@yuhu_ai_。vzS品论天涯网

Gemini如今取得如此亮眼的成绩,也让我们对DustinTran能为Grok5带来的惊喜多了一份期待。vzS品论天涯网

Colossus2的海量算力vzS品论天涯网

召唤一个强大的Grok5vzS品论天涯网

我们在此前的文章中,也对马斯克在紧锣密鼓地建设中的Colossus2进行了详细剖析:马斯克狂烧14万亿,5000万H100算力五年上线!终极爆冲数十亿vzS品论天涯网


vzS品论天涯网

Colossus2的海量算力,体现着马斯克毫不掩饰的野心:实现AGI乃至ASI,是Grok5乃至xAI更后面的模型要追求的目标。vzS品论天涯网

马斯克作为世界首富,要用天文数字般的算力,让所有对手望而却步。vzS品论天涯网

最顶级的算力,吸引了最顶级的人才。vzS品论天涯网

建设断档式强大AI的所有生产要素,马斯克一样也不想落下。vzS品论天涯网

让我们拭目以待,DustinTran的加盟,能为我们带来多么强大的Grok5。vzS品论天涯网

本网除标明“PLTYW原创”的文章外,其它文章均为转载或者爬虫(PBot)抓取; 本文只代表作者个人观点,不代表本站观点,仅供大家学习参考。本网站属非谋利性质,旨在传播马克思主义和共产主义历史文献和参考资料。凡刊登的著作文献侵犯了作者、译者或版权持有人权益的,可来信联系本站删除。 本站邮箱[email protected]