人工智能

没人味的GPT-5更新了 但变尬了

字号+作者:差评 来源:差评 2025-11-14 12:55 评论(创建话题) 收藏成功收藏本文

被吐槽了这么久没人味的GPT-5,终于进化了。今天凌晨三点,奥特曼又又又开始给自家产品吆喝了。这回不谈竞技场跑分,只聊短板,主打的就是一个倾听群众心声,产'...

被吐槽了这么久没人味的GPT-5,终于进化了。今天凌晨三点,奥特曼又又又开始给自家产品吆喝了。这回不谈竞技场跑分,只聊短板,主打的就是一个倾听群众心声,产品优化。U5P品论天涯网


U5P品论天涯网

看得出来,OpenAI是真有点没招了。毕竟,GPT-5上线后本该功成身退的4o,就因为太受欢迎,被生拉硬拽着不许退役。新产品口碑不如旧产品,换谁都得急着证明自己。U5P品论天涯网

那被培养成替身的5.1,能取代大伙儿心目中的赛博白月光吗?看完了官网案例,世超立刻上手试了试。U5P品论天涯网

结果怎么说呢,仨字就能形容:不太妙。U5P品论天涯网


U5P品论天涯网

事先说明,下面所有的测试都在临时聊天环境进行,没有任何AI受到记忆干扰。U5P品论天涯网

咱先测了一下奥特曼“尤其喜欢”的指令遵循,第一个问题就把它考蒙了。U5P品论天涯网


U5P品论天涯网

明明要求回答六个字,嗯是只憋出来了五个。就这,六字游戏甚至还是官方测试案例。U5P品论天涯网

行吧,世超只能怀疑自己,开始反思是不是因为没用英文。U5P品论天涯网

结果用官方一毛一样的英语提示词,5.1还是答错了。U5P品论天涯网


U5P品论天涯网

不死心的世超又换了一个问题,让它写一段200字的薯条颂,但全文不能出现“的”字。U5P品论天涯网

答案乍一看好像是符合要求,不过这字怎么变成繁体了?U5P品论天涯网


U5P品论天涯网

本来以为是网不好引起的波动,但试了五遍全是繁体。去掉后半段强制性指令,回答又正常了。U5P品论天涯网


U5P品论天涯网

再看看Gemini2.5pro,轻轻松松一口气给出正确答案,啥岔子都没出。U5P品论天涯网


U5P品论天涯网

讲真,测到这,世超已经产生浓浓的怀疑了。虽然只是一次小更新,三分之一的卖点都不太灵,有点说不过去。U5P品论天涯网

而接下来是大伙儿吐槽得最多的,GPT-5莫得感情。官方表示,这回5.1在5的基础上变得“更温暖、更有对话性”了,又能有意思,又能保持回答清晰有用。U5P品论天涯网

说实话,从官网给出的案例来看,这个效果也只能说一般般。4o本来就有的能力,被5整没了,现在又靠5.1回到起跑线,属实夸不出口啊。U5P品论天涯网


U5P品论天涯网

但该测还得测,世超问了一个经典失恋问题,结果没有对比就没有伤害,不管是5.1还是5,都和4o不在一个level……U5P品论天涯网

上GPT-5.1,中GPT-5,下GPT-4oU5P品论天涯网


U5P品论天涯网

不知道大伙儿有没有感觉,5和5.1像是在描述对人类情感的刻板印象,作为旁观者分析“失恋”是一种什么感觉,为什么难过,怎么解决。U5P品论天涯网

而4o的回答更像是已经带入了失恋的角色,感同身受,先共情再鼓励,不愧是梦中情AI。U5P品论天涯网

为了不冤枉它,世超换了个问题再问问,这次感觉新版回答得还不如老版,连基本的感情牌都不打了……U5P品论天涯网

上5,下5.1U5P品论天涯网


U5P品论天涯网

再翻翻官网的更新公告,除了各种情感语气对比,还有一张自适应耗时对比图。U5P品论天涯网

自适应,我愿称之为5.1更新最大的亮点,毕竟前两个都拉完了。U5P品论天涯网


U5P品论天涯网

这优化简单来说,就是以前的AI,在不同难度题目上不会自己分配思考时长,问个杭州美食都有啥,花的力气可能和宇宙为什么大爆炸一样。U5P品论天涯网

世超试了试,它的效果还挺明显的。在简单的逻辑问题上,左边5.1Thinking的思考速度明显比右边5Thinking要快得多。U5P品论天涯网


U5P品论天涯网

而到了复杂的编程难题,反而是5Thinking更快给出了错误结果,5.1思考了更长的时间给出了正确答案。U5P品论天涯网


U5P品论天涯网

其实这个优化对于我们普通用户来说,感觉并不是特别明显。但对于一些调用API的用户确实是好事,因为这样可以在简单问题上更省钱,难题上少花冤枉钱了。U5P品论天涯网

除了上面这些属于5.1的版本变动,ChatGPT还有个整体大更——在个性化里面可以设置GPT的回答风格,除了默认一共七种人设可选。U5P品论天涯网


U5P品论天涯网

这个功能还挺有意思,同一个问题,不一样的人设能给出不同的回答,人设之间风格差异很大。U5P品论天涯网

比如,吐槽达人说话更冲更直接,技术宅有探知欲,天马行空喜欢艺术化的表达,专业可靠是纯纯工具人等等。U5P品论天涯网

上吐槽达人,中技术宅,下默认模式U5P品论天涯网


U5P品论天涯网

比起默认模式,尬是真的尬。但很神奇的是,套上人设的外壳,GPT身上的讨好感消失了。U5P品论天涯网

尤其是吐槽达人,基本上啥都跟你杠着来,反而有了大部分AI没有的思辨能力。面对不给钱又让它卖力干活的话术一点不领情,知道世超在这PUA它呢。U5P品论天涯网

有一说一,要是说话方式能不这么尬,感觉这模式的潜力可比默认模式大多了。U5P品论天涯网


U5P品论天涯网

总的来说,虽然这次更新小有亮点,但OpenAI带来的惊喜越来越少了。U5P品论天涯网

比起最开始刚出世的惊艳,爆火的4o生图,现在看来,GPT-5可能还不如不掏。U5P品论天涯网

根据10月的一篇报告,GPT在2025已经快走了一年的下坡路,市场份额一直在萎缩。虽然抢占先机保住了龙头地位,但AI界的竞争依然在残酷进行中。U5P品论天涯网

Similarweb10月的统计数据U5P品论天涯网


U5P品论天涯网

像是世超以前用得最多就是GPT,最近也开始频繁使用其他家的产品了,竞品们的市占率增长可比想象中快得多,顺利得多。U5P品论天涯网

一边是奥特曼还在到处拉小手招投资,一边是产品在核心质量上有点泯然众人。U5P品论天涯网

OpenAI,赶紧整点好活儿吧。U5P品论天涯网

本网除标明“PLTYW原创”的文章外,其它文章均为转载或者爬虫(PBot)抓取; 本文只代表作者个人观点,不代表本站观点,仅供大家学习参考。本网站属非谋利性质,旨在传播马克思主义和共产主义历史文献和参考资料。凡刊登的著作文献侵犯了作者、译者或版权持有人权益的,可来信联系本站删除。 本站邮箱[email protected]