人工智能

DeepSeek V3“报错家门”:我是ChatGPT

字号+作者:量子位 来源:量子位 2024-12-29 15:13 评论(创建话题) 收藏成功收藏本文

要说这两天大模型圈的顶流话题,那绝对是非DeepSeekV3莫属了。不过在网友们纷纷测试之际,有个bug也成了热议的焦点——只是少了一个问号,DeepSeekV3竟然称'...

要说这两天大模型圈的顶流话题,那绝对是非DeepSeekV3莫属了。不过在网友们纷纷测试之际,有个bug也成了热议的焦点——只是少了一个问号,DeepSeekV3竟然称自己是ChatGPT。cLQ品论天涯网


cLQ品论天涯网

甚至让它讲个笑话,生成的结果也是跟ChatGPT一样:cLQ品论天涯网


cLQ品论天涯网

加之DeepSeekV3这次爆火的一个亮点,就是训练只花了557.6万美元的成本。cLQ品论天涯网

于是乎,有人就开始怀疑了:它不会是在ChatGPT的输出基础上训练的吧?cLQ品论天涯网

好巧不巧,Altman也发了一个状态,似乎在暗讽着什么……cLQ品论天涯网


cLQ品论天涯网

不过DeepSeekV3并非是第一个出现“报错家门”的大模型。cLQ品论天涯网

例如Gemini就曾说过自己是百度的文心一言cLQ品论天涯网


cLQ品论天涯网

那么这到底是怎么一回事?cLQ品论天涯网

为什么DeepSeekV3报错家门?cLQ品论天涯网

首先需要强调的一点是,从目前网友们整体讨论的观点来看,说DeepSeekV3是在ChatGPT输出上训练的可能性不大cLQ品论天涯网


cLQ品论天涯网

之所以这么说,正如网友RileyGoodside所总结的那样——因为ChatGPT的影子无处不在。cLQ品论天涯网

即便DeepSeekV3故意用ChatGPT的输出做了训练,但这并不重要。所有在ChatGPT之后出现的大模型,几乎都见过它。

例如ShareGPT,一个并不新鲜的ChatGPT对话数据集,许多人已经尝试在它和其它ChatGPT数据源上进行调整。但即便如此,也没能出现DeepSeekV3级别的大模型。cLQ品论天涯网


cLQ品论天涯网

紧接着,RileyGoodside又拿出了DeepSeekV3报告中的一些证据:cLQ品论天涯网

而且要是用了ChatGPT数据的话,有些关于DeepSeekV3质量的问题是解释不通的。

例如Pile测试(基础模型压缩Pile的效果),DeepSeekV3得分几乎与Llama3.1405B相当,这跟它接没接触ChatGPT数据无关。cLQ品论天涯网

而且报告称95%的GPU-hours用于预训练基础模型,即便是跟ChatGPT数据有关,那这部分也会在post-training阶段发生(后5%)。cLQ品论天涯网


cLQ品论天涯网

而比起用没用ChatGPT数据,或许我们应当更加关注的是为什么大模型会频繁出现“报错家门”的问题。cLQ品论天涯网

TechCrunch针对这个问题给出了一句犀利的点评:cLQ品论天涯网

因为AI公司们获取数据的地方——网络,正在充斥着AI垃圾。

毕竟欧盟的一份报告曾预测,到2026年,90%的在线内容可能是AI生成的。cLQ品论天涯网

这种“AI污染”就会让“训练数据彻底过滤AI的输出”变得困难。cLQ品论天涯网


cLQ品论天涯网

AINowInstitute的首席科学家HeidyKhlaaf则表示:cLQ品论天涯网

尽管存在风险,开发者依然被从现有AI模型中“蒸馏”知识所带来的成本节约所吸引。

意外地在ChatGPT或GPT-4输出上进行训练的模型,也不一定会展示出让人想起OpenAI定制消息的输出。cLQ品论天涯网

那么现在对于网友们热议的问题,量子位进行了一波实测,DeepSeekV3目前还没有解决这个bug。cLQ品论天涯网

依旧是少了个问号,回答结果会不一样:cLQ品论天涯网


cLQ品论天涯网

DeepSeekV3更多玩法cLQ品论天涯网

不过有一说一,绝大部分网友对于DeepSeekV3的能力是给予了大大的肯定。cLQ品论天涯网

从各路AI大佬们集体直呼“优雅”中就能印证这一点。cLQ品论天涯网

而就在这两天,网友们陆续晒出了更多DeepSeekV3加持的实用玩法cLQ品论天涯网

例如有网友拿DeepSeekV3和ClaudeSonnet3.5一决高下,在ScrollHub中分别用它俩创建网站cLQ品论天涯网


cLQ品论天涯网

视频地址:https://mp.weixin.qq.com/s/ieCfWqC5gsJ-Oc7-_L3uDQ?token=904287848&lang=zh_CNcLQ品论天涯网

博主在测试之后,认为DeepSeekV3完全胜出!cLQ品论天涯网

还有网友分享了用DeepSeekV3在AI视频编辑器中的体验。cLQ品论天涯网

他表示以后不用再在FFMPEG命令上浪费时间了,DeepSeekV3不仅免费,还能改变你的工作流程:cLQ品论天涯网


cLQ品论天涯网

视频地址:https://mp.weixin.qq.com/s/ieCfWqC5gsJ-Oc7-_L3uDQ?token=904287848&lang=zh_CNcLQ品论天涯网

AI编程神器Cursor也能跟DeepSeekV3结合,来看一个做贪吃蛇的案例:cLQ品论天涯网


cLQ品论天涯网

视频地址:https://mp.weixin.qq.com/s/ieCfWqC5gsJ-Oc7-_L3uDQ?token=904287848&lang=zh_CNcLQ品论天涯网

嗯,DeepSeekV3是有点好用在身上的。cLQ品论天涯网

OneMoreThingcLQ品论天涯网

对于此前公布的53页论文,也有网友关注到了一个非技术性的细节——cLQ品论天涯网

贡献列表中,不仅展示了技术人员,还有数据注释和商务等工作人员:cLQ品论天涯网


cLQ品论天涯网

网友认为这种做法非常符合DeepSeek的调性:cLQ品论天涯网


cLQ品论天涯网

[1]https://techcrunch.com/2024/12/27/why-deepseeks-new-ai-model-thinks-its-chatgpt/cLQ品论天涯网

[2]https://x.com/victormustar/status/1872647314231398524cLQ品论天涯网

[3]https://x.com/breckyunits/status/1872422078592516295cLQ品论天涯网

[4]https://x.com/op7418/status/1872689338242482203cLQ品论天涯网

[5]https://x.com/goodside/status/1872911457857208596cLQ品论天涯网

[6]https://x.com/kevinsxu/status/1873146905846530472cLQ品论天涯网

本网除标明“PLTYW原创”的文章外,其它文章均为转载或者爬虫(PBot)抓取; 本文只代表作者个人观点,不代表本站观点,仅供大家学习参考。本网站属非谋利性质,旨在传播马克思主义和共产主义历史文献和参考资料。凡刊登的著作文献侵犯了作者、译者或版权持有人权益的,可来信联系本站删除。 本站邮箱[email protected]