3月12日,据《白鲸实验室》独家爆料,DeepSeekV4和姚顺雨领衔操刀的混元新模型,均预计将于下个月(2026年4月)发布。3月11日,OpenRouter新上线了两个神秘模型——HealerAlpha与HunterAlpha。
OpenRouter页面显示,HealerAlpha被描述为具备视觉、听觉、推理与行动能力的前沿全模态模型;
社区因此迅速将其与尚未发布的新一代国产模型联系起来,据称捕捉到了“系统提示词中要求严格遵守中国法律法规”。
https://x.com/chetaslua/status/2031983459057672455
而就在3月12日,据《白鲸实验室》独家爆料(独家|梁文锋将携DeepSeekV4撞上姚顺雨):
DeepSeekV4将于4月正式上线。
作为梁文锋打磨已久的多模态大模型,DeepSeekV4除了代码能力跃升,还会在长期记忆上取得突破。
这一方向与DeepSeek团队近几个月的公开研究脉络基本一致。
2026年1月,梁文锋署名论文《ConditionalMemoryviaScalableLookup》提出“条件记忆”机制;
2025年12月的《mHC:Manifold-ConstrainedHyper-Connections》则继续指向底层架构优化。
两篇论文都在尝试处理Transformer在记忆、训练稳定性和长上下文上的瓶颈。
据《白鲸实验室》独家爆料(独家|梁文锋将携DeepSeekV4撞上姚顺雨):
梁文锋过去半年的主要工作,是补齐DeepSeek在视觉内容处理和AI搜索上的短板。
为强化AI搜索能力,DeepSeek早在去年就已与百度展开合作。
梁文锋这次为DeepSeekV4设定的关键迭代方向,正是长期记忆能力。
DeepSeekV4还将深度适配国产芯片,并有望成为首个完全跑在国产算力生态上的大模型。
另一个已被公开验证的现实是,DeepSeek的产品声量已经抬高了市场预期。
DeepSeekApp上线至2025年2月9日,累计下载量已超过1.1亿次,周活跃用户规模最高接近9700万。
姚顺雨的全新混元模型
也计划于4月发布
DeepSeek之外,腾讯也在为4月准备新动作。
姚顺雨已于2025年12月出任腾讯总办首席AI科学家,同时兼任AIInfra部和大语言模型部负责人;
2026年2月,署名包含姚顺雨的论文CL-bench发布,提出一套面向“上下文学习”的新评测基准,继续把腾讯混元的研究焦点推向长上下文与Agent可用性。
https://arxiv.org/abs/2602.03587
据《白鲸实验室》独家爆料(独家|梁文锋将携DeepSeekV4撞上姚顺雨):
姚顺雨也将在4月发布新的混元模型,规模约为30B参数。
早在2025年初,姚顺雨就已接受邀请回国;实际上,姚顺雨对新模型的准备早已开始,而不是只有官宣后的不到半年时间。
今年1月末,《晚点LatePost》也已爆料(字节、阿里、腾讯AI大战全记录:一场影响命运的战争):
在腾讯内部,姚顺雨要求团队不要以打榜为导向。
从公开轨迹看,4月这一轮更新不会只是一次参数竞赛。
DeepSeek的已知研究正向长期记忆、多模态和底层架构延伸,腾讯混元则在上下文学习和真实任务评测上加快补课。
两条路线很不一样,但都在试图回答同一个问题:下一个阶段的大模型,究竟该怎样真正走进生产环境。

相关文章

头条焦点
精彩导读
关注我们
【查看完整讨论话题】 | 【用户登录】 | 【用户注册】