爆料称DeepSeek V4和姚顺雨的新混元模型将同时于下月发布-品论天涯网

3月12日，据《白鲸实验室》独家爆料，DeepSeekV4和姚顺雨领衔操刀的混元新模型，均预计将于下个月（2026年4月）发布。3月11日，OpenRouter新上线了两个神秘模型——HealerAlpha与HunterAlpha。e74品论天涯网

e74品论天涯网

OpenRouter页面显示，HealerAlpha被描述为具备视觉、听觉、推理与行动能力的前沿全模态模型；e74品论天涯网

e74品论天涯网

社区因此迅速将其与尚未发布的新一代国产模型联系起来，据称捕捉到了“系统提示词中要求严格遵守中国法律法规”。e74品论天涯网

e74品论天涯网

https://x.com/chetaslua/status/2031983459057672455e74品论天涯网

而就在3月12日，据《白鲸实验室》独家爆料（独家｜梁文锋将携DeepSeekV4撞上姚顺雨）：e74品论天涯网

DeepSeekV4将于4月正式上线。e74品论天涯网

作为梁文锋打磨已久的多模态大模型，DeepSeekV4除了代码能力跃升，还会在长期记忆上取得突破。e74品论天涯网

这一方向与DeepSeek团队近几个月的公开研究脉络基本一致。e74品论天涯网

2026年1月，梁文锋署名论文《ConditionalMemoryviaScalableLookup》提出“条件记忆”机制；e74品论天涯网

2025年12月的《mHC:Manifold-ConstrainedHyper-Connections》则继续指向底层架构优化。e74品论天涯网

两篇论文都在尝试处理Transformer在记忆、训练稳定性和长上下文上的瓶颈。e74品论天涯网

据《白鲸实验室》独家爆料（独家｜梁文锋将携DeepSeekV4撞上姚顺雨）：e74品论天涯网

梁文锋过去半年的主要工作，是补齐DeepSeek在视觉内容处理和AI搜索上的短板。e74品论天涯网

为强化AI搜索能力，DeepSeek早在去年就已与百度展开合作。e74品论天涯网

梁文锋这次为DeepSeekV4设定的关键迭代方向，正是长期记忆能力。e74品论天涯网

DeepSeekV4还将深度适配国产芯片，并有望成为首个完全跑在国产算力生态上的大模型。e74品论天涯网

另一个已被公开验证的现实是，DeepSeek的产品声量已经抬高了市场预期。e74品论天涯网

DeepSeekApp上线至2025年2月9日，累计下载量已超过1.1亿次，周活跃用户规模最高接近9700万。e74品论天涯网

姚顺雨的全新混元模型e74品论天涯网

也计划于4月发布e74品论天涯网

DeepSeek之外，腾讯也在为4月准备新动作。e74品论天涯网

姚顺雨已于2025年12月出任腾讯总办首席AI科学家，同时兼任AIInfra部和大语言模型部负责人；e74品论天涯网

e74品论天涯网

2026年2月，署名包含姚顺雨的论文CL-bench发布，提出一套面向“上下文学习”的新评测基准，继续把腾讯混元的研究焦点推向长上下文与Agent可用性。e74品论天涯网

e74品论天涯网

https://arxiv.org/abs/2602.03587e74品论天涯网

据《白鲸实验室》独家爆料（独家｜梁文锋将携DeepSeekV4撞上姚顺雨）：e74品论天涯网

姚顺雨也将在4月发布新的混元模型，规模约为30B参数。e74品论天涯网

早在2025年初，姚顺雨就已接受邀请回国；实际上，姚顺雨对新模型的准备早已开始，而不是只有官宣后的不到半年时间。e74品论天涯网

今年1月末，《晚点LatePost》也已爆料（字节、阿里、腾讯AI大战全记录：一场影响命运的战争）：e74品论天涯网

在腾讯内部，姚顺雨要求团队不要以打榜为导向。e74品论天涯网

e74品论天涯网

从公开轨迹看，4月这一轮更新不会只是一次参数竞赛。e74品论天涯网

DeepSeek的已知研究正向长期记忆、多模态和底层架构延伸，腾讯混元则在上下文学习和真实任务评测上加快补课。e74品论天涯网

两条路线很不一样，但都在试图回答同一个问题：下一个阶段的大模型，究竟该怎样真正走进生产环境。e74品论天涯网