DeepSeek大升级 V4真的不远了-品论天涯网

就在刚刚，DeepSeek网页端迎来大更新。没有发布会，没有blog，甚至连一条官方推文都没有。DeepSeek网页端的输入框上方多了两个图标——一个闪电，一个钻石，分别对应“快速模式”和“专家模式”。gwM品论天涯网

gwM品论天涯网

悬停一下，提示语出来了：快速模式“适合日常对话，即时响应”，专家模式“擅长复杂问题，高峰需等待”。gwM品论天涯网

目前从实测和网友拆解来看，两个模式的差异大概是这样的：gwM品论天涯网

快速模式，可以识别图片和文件中的文字，速度快，响应即时。代价是，背后跑的大概率是一个更轻量的V4Lite模型，但针对速度做了优化。gwM品论天涯网

gwM品论天涯网

专家模式，疑似路由到了更大、更强的模型——很可能就是DeepSeekV4正式版的某个形态。但目前它不支持文件上传，也没有多模态能力。等等，更强的模型，反而功能更少？gwM品论天涯网

gwM品论天涯网

我们也做了一轮简单测试。gwM品论天涯网

比如让两个模式各自写一个p5.js程序，模拟球在旋转六边形内弹跳，要求受重力和摩擦力影响。结果显示专家模式给出的结果更符合物理直觉，落点更准，弹跳轨迹更真实。gwM品论天涯网

gwM品论天涯网

对比之下，快速模式给出的的结果肉眼可见差了一个档次。gwM品论天涯网

gwM品论天涯网

这种差距，其实挺能说明问题的。物理仿真对数学推理能力要求高，弱一点的模型容易出现“看起来像物理但实际上不对”的结果。专家模式在这里的表现，是实打实的能力差异。gwM品论天涯网

但网友@AiBattle_让其制作的太空侵略者游戏结果却让人有点意外：专家模式的输出和快速模式差距并不明显。gwM品论天涯网

gwM品论天涯网

做测试的网友给出了一个判断：“我估计专家模式现在路由的仍然是某个版本的V4Lite。要看到完整版V4在网页端上线，可能还得再等一阵。”这个判断和外部报道的时间线基本吻合——晚点LatePost报道，V4正式版预计今年4月亮相，届时大概率仍是开源最强，但报道也点明“很难是碾压级的强”。gwM品论天涯网

换句话说，这次灰度上线的“专家模式”，未必就是最终形态。gwM品论天涯网

创意写作方面，我给两种模式出了一道辩论写作题，题目是“替无聊辩护，论证无聊是现代人的奢侈品”。gwM品论天涯网

专家模式的输出更长，逻辑链更完整；快速模式的文风则相对自然朴实。gwM品论天涯网

gwM品论天涯网

快速模式（前）和专家模式（后）gwM品论天涯网

有意思的是，在这个任务上，两个模式的速度差距并不明显，甚至专家模式的思考时间更短。这有点反直觉，但可能和任务性质有关——创意写作对模型规模的敏感度，远低于数学推理类任务。gwM品论天涯网

对于简单任务，两个模式差异有限；越是需要深度推理的场景，专家模式的优势越明显。gwM品论天涯网

在数学逻辑题“绳子绕地球一圈，加长1米均匀撑开，缝隙多高？”中，尽管两个模式给出了相同的答案，但过程截然不同。快速模式的回答很简略；专家模式则一步一步拆解，每个推导环节都交代清楚，更接近“把思考过程写出来”这个指令要求。gwM品论天涯网

gwM品论天涯网

值得一提的是，目前网页端实际上线的只有快速和专家两个模式，但此前的爆料显示，还有第三个选项正在路上——“Vision模式”。gwM品论天涯网

gwM品论天涯网

图片来自互联网gwM品论天涯网

关注DeepSeek技术路线的博主Teortaxes认为：把Vision单独列为一个类，是很不寻常的设计。他提到，DeepSeek此前拒绝在网页端部署DS-VL系列，原因是“尚未成熟”。如果Vision模式真的上线，背后支撑它的，很可能已经是一个“完全功能化”的VLM。gwM品论天涯网

而Teortaxes在他的长评里，给出了一个更大胆的猜测——这个视觉模型，有可能不是常规的VLM，而是某种“深度统一世界模型”，是Janus系列的下一步演化，或者其他更非传统的架构。gwM品论天涯网

当然，这仅仅只是他的猜测，也有网友@xhyctf表示，DeepSeek被逆向的前端代码显示，Vision模式，根本就没有独立的模型。所谓“视觉理解”，只是在快速模式下悄悄加了一个参数——filefeature.vision=true。gwM品论天涯网

尽管如此，有一点是确定的：DeepSeek在多模态方向一直都有所布局，或许只是差一个良好的时间窗口。而把快速、专家等入口摆在用户面前，背后其实是一个更值得关注的方向：gwM品论天涯网

gwM品论天涯网

DeepSeek开始做产品分层了。gwM品论天涯网

自去年初爆火以来，DeepSeek的产品逻辑一直是高度“反商业”的——API定价较低，网页端完全免费，功能也没什么门槛区分。但问题也随之而来：长期维持这种“全免费、无分层”的运营方式，商业上是不可持续的。gwM品论天涯网

现在，DeepSeek开始把“更强的模型”和“更基础的模型”做成两个入口。专家模式目前还是免费的，但这个架构一旦搭好，后续要在上面做付费体系，技术上已经不是问题了。gwM品论天涯网

当然，分层的目的，未必只是为了收费。gwM品论天涯网

把用户自然地分流到两个入口，让真正需要深度推理的请求走专家模式，日常对话走快速模式——这本身就是一种算力调度策略，限额限流，缓解峰值压力。gwM品论天涯网

gwM品论天涯网

收费是一条路，限额是另一条路，两条路都能走，也可以同时走。而这整件事拼起来看，也是一个很完整的铺垫路径：gwM品论天涯网

先灰度上线分层入口→让用户感知差异→打通多模态和文件能力→视觉模式开闸→限额/给更强大的模式定价。当然，这仅仅是我个人的推测，毕竟DeepSeek从来不按常理出牌。gwM品论天涯网

诚然，大家给DeepSeek贴了太多标签——技术理想主义、反商业、普惠AI。然而，GPU的推理成本每个月都是实打实的。幻方的量化收益再丰厚，也很难靠卖API填完一个全球级AI服务无限期免费运营的窟窿。gwM品论天涯网

DeepSeek搅动了整个AI圈，但现实也终将搅动DeepSeek。gwM品论天涯网