人工智能

吴恩达点评DeepSeek:非常出色,中国AI正在赶超美国

字号+作者:BiaNews鞭牛士 来源:BiaNews鞭牛士 2025-01-31 16:54 评论(创建话题) 收藏成功收藏本文

1月31日消息,美国计算机科学家,DeepLearning.AI创始人吴恩达在X上撰文点评了DeepSeek,他认为国在生成AI领域正在赶超美国,这对AI供应链产生了影响。以下为'...

1月31日消息,美国计算机科学家,DeepLearning.AI创始人吴恩达在X上撰文点评了DeepSeek,他认为国在生成AI领域正在赶超美国,这对AI供应链产生了影响。以下为全文:UzV品论天涯网

UzV品论天涯网

本周DeepSeek的讨论让许多人认识到一些显而易见的重要趋势:UzV品论天涯网

(i)中国在生成AI领域正在赶超美国,这对AI供应链产生了影响。UzV品论天涯网

(ii)开放权重模型正在将基础模型层商品化,这为应用程序构建者创造了机会。UzV品论天涯网

(iii)扩大规模并不是AI进步的唯一途径。尽管人们对处理能力的关注和炒作如火如荼,但算法创新正在迅速降低培训成本。UzV品论天涯网

大约一周前,中国公司DeepSeek发布了DeepSeek-R1,这是一个非常出色的模型,其基准测试性能可与OpenAI的o1相媲美。此外,它是以开放权重模型的形式发布的,具有宽松的MIT许可证。上周在达沃斯,我收到了许多非技术商业领袖关于它的问题。周一,股市出现了“DeepSeek抛售”:Nvidia和其他一些美国科技公司的股价暴跌。(截至撰写本文时,一些公司股价有所回升。)UzV品论天涯网

我认为DeepSeek让很多人意识到了以下几点:UzV品论天涯网

中国在生成式人工智能方面正在赶超美国。2022年11月推出ChatGPT时,美国在生成式人工智能方面远远领先于中国。印象变化很慢,所以最近我听到美国和中国的朋友都说他们认为中国落后了。但实际上,这种差距在过去两年里迅速缩小了。借助Qwen(我的团队已经使用了几个月)、Kimi、InternVL和DeepSeek等来自中国的模型,中国显然正在缩小差距,而在视频生成等领域,中国似乎已经处于领先地位。UzV品论天涯网

我很高兴DeepSeek-R1以开放权重模型的形式发布,其技术报告分享了许多细节。相比之下,许多美国公司通过大肆宣传人类灭绝等假设的人工智能危险来推动监管以扼杀开源。现在很明显,开源/开放权重模型是人工智能供应链的关键部分:许多公司都会使用它们。如果美国继续阻碍开源,中国将主导供应链的这一部分,许多企业最终将使用反映中国价值观而非美国价值观的模型。UzV品论天涯网

开放权重模型正在将基础模型层商品化。正如我之前所写,LLM代币价格一直在快速下跌,开放权重助长了这一趋势,并为开发人员提供了更多选择。OpenAI的o1每百万输出代币成本为60美元;DeepSeekR1成本为2.19美元。这近30倍的差异让许多人注意到了价格下跌的趋势。UzV品论天涯网

训练基础模型并销售API访问权的业务很艰难。该领域的许多公司仍在寻找收回模型训练巨额成本的方法。Sequoia的文章“AI的6000亿美元问题”很好地阐述了这一挑战(但需要明确的是,我认为基础模型公司做得很好,我希望他们能成功)。相比之下,在基础模型之上构建应用程序则带来了许多巨大的商机。既然其他人已经花费数十亿美元训练此类模型,您只需花费几美元就可以访问这些模型,以构建客户服务聊天机器人、电子邮件摘要器、AI医生、法律文件助理等等。UzV品论天涯网

扩大规模并不是AI进步的唯一途径。关于扩大模型规模作为推动进步的方式,人们大肆炒作。公平地说,我是扩大模型规模的早期支持者。许多公司通过制造这样的谣言筹集了数十亿美元:有了更多的资本,它们就可以(i)扩大规模和(ii)可预测地推动改进。因此,人们非常关注扩大规模,而不是采取更细致入微的观点,充分关注我们可以取得进步的许多不同方式。在一定程度上,在美国AI芯片禁运的推动下,DeepSeek团队不得不在许多优化方面进行创新,以便在性能较差的H800GPU而不是H100上运行,最终导致模型的训练(不包括研究成本)计算成本低于600万美元。UzV品论天涯网

这是否真的会减少对计算的需求还有待观察。有时,降低每单位商品的价格可以带来更多美元用于购买该商品。我认为,从长远来看,对智能和计算的需求几乎没有上限,因此我仍然看好人类将使用更多智能,即使智能变得更便宜。UzV品论天涯网

我在X看到了对DeepSeek进展的许多不同解读,就好像这是一个罗夏墨迹测试,让许多人将自己的意义投射到它上面。我认为DeepSeek-R1具有尚未解决的地缘政治影响。而且它对AI应用程序构建者来说也很棒。我的团队已经开始集思广益,这些想法之所以成为可能,只是因为我们可以轻松访问开放的高级推理模型。现在仍然是构建的好时机!UzV品论天涯网

吴恩达介绍:UzV品论天涯网

吴恩达,AndrewNg,华裔美国人,斯坦福大学计算机科学系和电子工程系副教授,人工智能实验室主任。吴恩达是人工智能和机器学习领域国际上最权威的学者之一。吴恩达也是在线教育平台Coursera的联合创始人(withDaphneKoller),DeepLearning.AI创始人。UzV品论天涯网

2014年5月16日,吴恩达加入百度,担任百度公司首席科学家,负责百度研究院的领导工作,尤其是BaiduBrain计划。UzV品论天涯网

2024年4月,亚马逊将吴恩达纳入其董事会。UzV品论天涯网

本网除标明“PLTYW原创”的文章外,其它文章均为转载或者爬虫(PBot)抓取; 本文只代表作者个人观点,不代表本站观点,仅供大家学习参考。本网站属非谋利性质,旨在传播马克思主义和共产主义历史文献和参考资料。凡刊登的著作文献侵犯了作者、译者或版权持有人权益的,可来信联系本站删除。 本站邮箱service@pltyw.com

10
扫二维码添加收藏返回顶部