奥特曼还在抱娃 GPT-4.5已经被网友开喷了-品论天涯网

自打DeepSeek全球爆火以后，AI圈里都跟按了快进键一样，都好顿加速。别的不说，光这一周就有马斯克的Grok3，Anthropic的Claude3.7Sonnet，阿里的通义QwQ-Max-Preview，腾讯的TurboS，月之暗面的Kimi-1.6-IoI-High，Google的GeminiCodeAssist啥的一大堆东西，还有个DeepSeek开源周，简直是仙之人兮列如麻。eYs品论天涯网

而就在昨晚，回回被拿出来鞭尸，每次都自称在憋大的的OpenAI终于憋出来了，掏出了GPT系列的船新版本，GPT-4.5。eYs品论天涯网

按奥特曼的说法，这回这个GPT-4.5是一种不同类型的智能，其中有着他从未感受过的奇妙之处，这将是第一个让你感觉在和一个有思想的人说话的模型。eYs品论天涯网

eYs品论天涯网

不过，自打两个月前哥们连着十几天，次次半夜两点追他们无聊发布会，说实话奥特曼有点伤了哥们的心了。eYs品论天涯网

所以咱其实对这个GPT-4.5也没报啥期望，甚至发布会上奥特曼人都没来，说是回家带孩子去了，对，就他跟他老公俩男的生的那个娃。eYs品论天涯网

反正整体看下来，我只能说GPT-4.5这波算是“唐唐”亮相了。eYs品论天涯网

这倒不是哥们尬黑，其他网友们对这玩意多数也是这个看法，外网上甚至有个GPT-4.5是不是垃圾的讨论，因为就连红脖子们也不看好GPT，都投票给了马斯克的xAI。eYs品论天涯网

eYs品论天涯网

所以这玩意到底怎么个拉法呢，不卖关子，咱直接说结论，那就是GPT-4.5性能不行，而且价高。eYs品论天涯网

同样是昨晚发布，但他跟su7u属于是完全反着来。eYs品论天涯网

先说性能吧，在一个OpenAI官方给出的基准测试里，GPT-4.5在科学，数学，编码能力上都比不上自家去年发的o3-mini，基准测试也只比4o好5%。eYs品论天涯网

eYs品论天涯网

也就是说，GPT-4.5在AIME和GPQA等困难的学术基准测试上，相比自家o3-mini都是不太够的，更别说跟DeepSeek-R1和Claude3.7Sonnet这些放一个怪物房了。eYs品论天涯网

eYs品论天涯网

抛开官网的数据，拿网友们的实测来看，GPT-4.5跟同在这周发布的Claude3.7也相差不小。eYs品论天涯网

比如在思维理解和导图生成上，Claude几乎可以搬到ppt上做插图了，但GPT-4.5画的图就跟我小学微机课上的作业一样……eYs品论天涯网

eYs品论天涯网

更离谱的是，这玩意的运行速度还很慢……eYs品论天涯网

eYs品论天涯网

但这还不是最离谱的，真正让它挨喷的，其实是它的价格。eYs品论天涯网

按他们官方的数据，GPT-4.5每百万Tokens价格是75美元，跟4o相比整整涨了30倍，更别说跟DeepSeek比了，那直接能达到280倍……eYs品论天涯网

要是再算上DeepSeek的折扣，甚至能相差1000倍以上！eYs品论天涯网

但搞笑的是，OpenAI的官网文章还说GPT-4.5“无法完全替代GPT-4o”。eYs品论天涯网

eYs品论天涯网

不过人家OpenAI官方倒是不太在意这个，他们觉得GPT-4.5真正厉害之处，在于它的语言能力。eYs品论天涯网

他们在官网的博客里说，GPT-4.5可以在对话中分析人类情感需求，提供情绪价值这方面是现在最牛的。eYs品论天涯网

“它将对世界的深刻理解与更佳的协作相结合，可以形成一种模型，该模型可以在更适合人类协作的热情而直观的对话中自然地整合想法。GPT-4.5能够更好地理解人类的意思，并以更细致入微的“情商”来解读微妙的暗示或隐含的期望。”eYs品论天涯网

就比如说你没考好，跟他一说他就会先安慰你，但4o就很直男的直接给你一堆方案。eYs品论天涯网

eYs品论天涯网

可是咋说呢，这看起来确实有人情味了些，但调教出一个有情商的AI似乎没法证明它真的就比别家强。eYs品论天涯网

拿字节的豆包来说，你给它发这句它也回答的挺人性的，甚至还能打电话。eYs品论天涯网

不止咱们，外网网友也对OpenAI纷纷发推，那它跟DeepSeekr1和Grok做比较，公开表示阴阳。eYs品论天涯网

说实话这也能理解，劳资花了市场上最贵的钱，结果它是要算法有情商，要推理有情商，要应用有情商……eYs品论天涯网

eYs品论天涯网

前OpenAI员工，国外知名AI分析师AndrejKarpathy发了个文章说，GPT-4.5相比前代的训练成本是提高了整整十倍的，但智商并不如推理模型，而是把重点放在了AI的情商上。eYs品论天涯网

虽然Andrej对GPT-4.5的情商挺满意的，说这是GPT-3.5到4.0的进步；但他也指出，GPT-4.5并不是推理模型，而且可能是OpenAI最后一代非推理模型了。eYs品论天涯网

这么一来，等到OpenAI在4.5的基础上再搞下一代推理模型，估计才会有更好的表现。eYs品论天涯网

eYs品论天涯网

不过从这一点上说，以后可能大部分AI的方向，都将会彻底转向推理。eYs品论天涯网

一方面，GPT-4.5的这次亮相，其实某种意义上可以说，传统只靠大力出奇迹，狂堆算力的ScalingLaw（规模法则）已开始减速了。eYs品论天涯网

而另一方面，开源模型阵营这边，在这个方向上已经上道了。eYs品论天涯网

eYs品论天涯网

不说别的，DeepSeek开源周这几天，每天都把自家V3和R1训练推理过程中的核心出装，都免费晒出来给大家用。eYs品论天涯网

比方说第一天的FlashMLA架构，相当于把自己调教英伟达GPU的招给教了，手把手教你榨干H800的算力资源；eYs品论天涯网

后面几天还陆续开放了DeepEP、DeepGEMM、DualPipe、EPLB这一堆数据库和算法；最后还给了个用来压榨固态硬盘性能的3FS和Smallpond数据处理框架。eYs品论天涯网

eYs品论天涯网

而在类似GitHub的社区，AI领域的开发者们这几天也是高兴坏了，DeepSeek这些开源数据几乎每天都在GitHub热榜上坐庄，这波可以说是新的“源神”了。eYs品论天涯网

一边GPT-4.5表现平平，一边DeepSeek搞得是人人有枪，这样一来，以后的AI训练估计很难再看到传统的算力竞赛了，更低本高效的训练估计会变成王道。eYs品论天涯网