人工智能

DeepSeek开源周才第二天 有些公司就已经坐不住了

字号+作者:差评 来源:差评 2025-02-26 09:28 评论(创建话题) 收藏成功收藏本文

今天的AI圈可以说是格外热闹了。真正“Open”的DeepSeek,打出开源周的第二发炮弹,短短几个小时就已经在GitHub上,收获了3k多星。“开源老兵”阿里通义千问'...

今天的AI圈可以说是格外热闹了。真正“Open”的DeepSeek,打出开源周的第二发炮弹,短短几个小时就已经在GitHub上,收获了3k多星。“开源老兵”阿里通义千问也没闲着,推出了QwQ-Max-Preview深度思考模型,展示思维链,还支持联网搜索。7YJ品论天涯网

今天的AI圈可以说是格外热闹了。真正“Open”的DeepSeek,打出开源周的第二发炮弹,短短几个小时就已经在GitHub上,收获了3k多星。7YJ品论天涯网

“开源老兵”阿里通义千问也没闲着,推出了QwQ-Max-Preview深度思考模型,展示思维链,还支持联网搜索。7YJ品论天涯网

还有凌晨两点多,大伙儿可能还在做梦的时候,大洋彼岸的Anthropic也给模型升级换代了。号称他们迄今为止最聪明的Claude3.7Sonnet,还是个推理模型和传统模型的“混血”。7YJ品论天涯网

7YJ品论天涯网

我估计今天那些专门做模型测评的博主,都快要忙不过来了吧。。。7YJ品论天涯网

再加上Grok3、DeepSeekR1、o3mini,世超猜到了今年推理模型必有一战,但没想到,来得这么快。7YJ品论天涯网

光这么说大伙儿估计也没感受,今天咱们就挨个来看看,AI圈子到底是怎么个热闹法。7YJ品论天涯网

先把视线,放在新一代“开源战神”DeepSeek身上。7YJ品论天涯网

用R1教育了一遍市场之后,DeepSeek这两天,干脆开源了个彻底,5天时间,每天发一个代码库。7YJ品论天涯网

第一天,整了个FlashMLA,这玩意儿专门针对英伟达的HoppersGPU(比如H100、H800),进行了效率优化,通俗点说就是榨干GPU的最后一滴性能7YJ品论天涯网

7YJ品论天涯网

今天开源的,则是DeepEP通信库。7YJ品论天涯网

根据官方的介绍,这是一个专门为专家混合(MoE)和专家并行(EP)设计的通信库。太复杂的咱也不去深究,大白话就是通信库可以让“专家们”的交流更快速、高效。7YJ品论天涯网

盲猜一波,国内那些个手里有HoppersGPU,还是研究MOE模型的AI公司,可能已经冲了。7YJ品论天涯网

不知道明天DeepSeek又会开源哪个代码库,但光凭他们这敞亮、真诚的态度,圈粉就是分分钟的事儿,在DeepSeek的评论区底下,世超已经看到不只一位老哥,对着OpenAI贴脸开大了。7YJ品论天涯网

7YJ品论天涯网

不过说到这,可能会有差友疑惑,网上整天嚷嚷着开源,这跟咱到底有啥关系?7YJ品论天涯网

这么说吧,DeepSeekR1开源以后,大大小小的私企、国企都吻了上来,还有高校甚至政府机关,不是已经接入DeepSeek,就是在接入的路上。7YJ品论天涯网

经过大规模的模型部署后,下一步就是生态的构建、产业的融合,就像当年的“互联网+”,AI同样也可以成为基础设施,融入到咱们生活的方方面面。7YJ品论天涯网

很难说,闭源模型在构建生态这一步,能不能在短时间内达到像DeepSeek这样的效果。7YJ品论天涯网

所以这一切,我们可能都得感谢开源。7YJ品论天涯网

7YJ品论天涯网

再来看阿里通义千问的QwQ-Max-Preview,是个推理模型。阿里也算是国内第一个,推出推理模型的头部大厂。7YJ品论天涯网

根据官方的说法,这是一个基于Qwen2.5-Max的推理模型,有很强的数学理解、编码能力,但目前还只是预览版。7YJ品论天涯网

世超在第一时间简单试了试,QwQ也有思维链的展示。(不得不说,QwQ这名字有点可爱。。)7YJ品论天涯网

7YJ品论天涯网

问它一道数学竞赛真题,最后的答案倒是对了,就是思考时间稍微久了些,我粗略估计思考了得有两分钟出头。7YJ品论天涯网

7YJ品论天涯网

这道题问DeepSeekR1,它的思考过程跟QwQ很相似,也是分析了多种可能性,但R1胜在推理的速度稍微快一些(112秒)。7YJ品论天涯网

而同样的题目,我又问了今天的另外一位主角Claude3.7Sonnet。7YJ品论天涯网

只能说,又快又准。7YJ品论天涯网

7YJ品论天涯网

但值得注意的是,Claude3.7Sonnet是个混合模型,一个模型有标准和扩展两种模式。7YJ品论天涯网

如果你想看到大模型的推理步骤、思考过程,那就得选扩展模式。7YJ品论天涯网

7YJ品论天涯网

如大伙儿所见,体验Claude3.7Sonnet的推理能力,是另外的价格。7YJ品论天涯网

7YJ品论天涯网

世超还找了几个外网的实测案例,发现Claude的代码能力依然强得可怕。7YJ品论天涯网

同一组提示词喂给Claude3.7Sonnet和Grok3,这是Claude3.7Sonnet的结果。7YJ品论天涯网

7YJ品论天涯网

再来看Grok3的,直接被碾压。7YJ品论天涯网

7YJ品论天涯网

即使DeepSeek加入战斗,也被秒了。。。7YJ品论天涯网

7YJ品论天涯网

反正看下来,AI发展到今天,已经有点超乎世超的想象了。7YJ品论天涯网

虽说今天这三则新闻放一起,打眼一看,好像没啥特别大的关联。7YJ品论天涯网

但稍微一提炼你就会发现,它们恰好体现了当前人工智能发展的趋势:开源阵营不断壮大,推理模型成为主流。7YJ品论天涯网

模型的开源和闭源之争,DeepSeek一出手,即便是奥特曼,也不得不亲口承认,OpenAI的闭源策略“站在了历史错误的一边”。7YJ品论天涯网

7YJ品论天涯网

像Llama家族这种具有里程碑意义的模型,对于开源社区的重要性无需多言。7YJ品论天涯网

而除了DeepSeek和Meta,阿里通义千问、xAI,还有陆续拥抱开源的百度、Minimax和阶跃星辰,开源阵营肉眼可见在壮大。7YJ品论天涯网

另外一边,前两年大模型是不是老强调自己的长文本能力,慢慢的开始卷文生图、文生视频还有语音交互这些多模态,再到最近,模型跑分全是数学、代码。7YJ品论天涯网

真就应了那句话,AI一天,人间一年。7YJ品论天涯网

照这么下去,可能哪天OpenAI宣布开源,又或者谁家突然宣布把AGI整出来了,我都不会觉得惊讶了。7YJ品论天涯网

本网除标明“PLTYW原创”的文章外,其它文章均为转载或者爬虫(PBot)抓取; 本文只代表作者个人观点,不代表本站观点,仅供大家学习参考。本网站属非谋利性质,旨在传播马克思主义和共产主义历史文献和参考资料。凡刊登的著作文献侵犯了作者、译者或版权持有人权益的,可来信联系本站删除。 本站邮箱service@pltyw.com

评论(0人参与,0条评论)
  • 请先说点什么
    热门评论
    最新评论
    正在载入评论列表...

    查看完整讨论话题】 | 【用户登录】 | 【用户注册

    21
    扫二维码添加收藏返回顶部