帝都魔都双双押宝，年底了AI圈居然还有高手？-品论天涯网

本以为OpenAI直播已经是24年AI领域的尾声，没想到还有高手，国内AI圈又传出个大新闻。就在前几天，国产AI六小虎中的阶跃星辰，拿到了数亿美元的融资。而且更值得一提的是，这轮融资的背景可不简单，差评君还从投资方里找到了上海国资的身影。bT0品论天涯网

bT0品论天涯网

要知道就在几天前，北京国资也投了六小虎中的另一家智谱。bT0品论天涯网

一南一北两大超级城市，各自押宝，都上了赌桌。bT0品论天涯网

有一说一，经过前段时间的“百模大战”，AI在融资圈儿其实是有些降温的，结果这次两大国资先后出手：bT0品论天涯网

这一波，难不成是大模型版的沪爷VS京爷？bT0品论天涯网

bT0品论天涯网

虽然话是这么说，估计一些网友还是对“阶跃星辰”的名字有点陌生，“这又是从哪冒出的大模型公司？”bT0品论天涯网

但其实在圈儿内，阶跃星辰早就小有名气，不过倒也不怪大家没听过，主要这企业确实比较低调。bT0品论天涯网

相对其他AI创业公司，阶跃是六小虎里最后出场的，但在登场时，就已经是独角兽的存在了。bT0品论天涯网

如果要用一句话来形容的话，差评君能想到的就是“低调神秘有实力，国资背景大牛多”，是国产AI里的一匹黑马。bT0品论天涯网

bT0品论天涯网

不仅在首秀时，阶跃星辰就掏出了个对标GPT-4的万亿参数模型，而且主打一个速度快、效率高，10个月内就发布11款模型，并且在16个月内，就捣腾出了从理解到生成的全系列模型矩阵。bT0品论天涯网

虽然人家确实挺有实力，不过咱这次的重点倒不是纯讲这个。bT0品论天涯网

差评君觉得借着拿阶跃星辰融资这事，还是有挺多有意思的AI圈内故事，能和大家聊聊的。bT0品论天涯网

首先不可否认的是，大模型领域实际已经在缩决赛圈儿了。bT0品论天涯网

差评君也和不少圈内人聊了聊，发现大家基本都在从两个点，来判断这家公司有无能吃鸡的冠军相。bT0品论天涯网

一个是有没有牛逼的人才，另一个是能不能坚持投入技术研发搞AGI。bT0品论天涯网

bT0品论天涯网

咱先说人才，其实大模型的人才圈儿，可能比差评君的朋友圈还小。bT0品论天涯网

就拿今年诺奖得主乔弗里辛顿来说，他这个深度学习之父的实验室，一向就是各大公司眼中的顶级宗门。bT0品论天涯网

像什么OpenAI联合创始人伊利亚，就是他的博士；GoogleDeepMind的大佬阿列克谢，是他的博士后；bT0品论天涯网

Meta的人工智能负责人杨立昆也是他的弟子；前百度首席科学家吴恩达，也跟他有千丝万缕的关系。bT0品论天涯网

bT0品论天涯网

而在国内，被北京国资选中的智谱AI，实际上也是学术上的大宗门出身，直接来自有27年人工智能研究历史的清华大学知识工程实验室。bT0品论天涯网

所以说，有没有这些牛逼人才，往往是行业内认不认可一家公司的理由之一，甚至有时候请这些圈内大牛，要比花钱买显卡搞计算还重要。bT0品论天涯网

前不久，差评君就和某大模型一线技术人员聊了聊，他用前不久字节高薪挖阿里通义大模型技术负责人周畅的新闻举例，告诉差评君目前圈内人才急缺。bT0品论天涯网

他觉得传闻中花费8位数薪资挖人的操作，是可以理解的。bT0品论天涯网

因为大模型训练成本动不动就是几千万上亿，而合适的人才，能少走很多弯路，反而是最省的操作。bT0品论天涯网

bT0品论天涯网

而这次的阶跃星辰，差评觉得它能被资本看好，也和人才脱不了干系……bT0品论天涯网

不过与学院派京爷智谱不同，沪爷阶跃这方面也很特色，很多人都是行业内老人了。bT0品论天涯网

他们里面很多研究人员都是从读博士开始搞相关领域，然后在大厂工作过，亲身在一线经历了过去10年AI的最前沿发展。bT0品论天涯网

比如阶跃星辰的创始人、CEO姜大昕，这哥们以前是微软前全球副总裁，日活上亿、备受差友们喜欢的Bing搜索，还有全球最早的智能个人助理Cortana，都是他曾参与过的项目。bT0品论天涯网

这么说吧，他把深度学习技术应用到了Bing上，帮助Bing搜索服务扩展到全球200多个国家和地区。bT0品论天涯网

bT0品论天涯网

除了CEO，阶跃的首席科学家张祥雨，在这个圈子里也很有名。bT0品论天涯网

这老哥本来是西交跟微软亚洲研究院的博士生，师从孙剑和何恺明，还是开山大弟子。bT0品论天涯网

但这还不是重点，重点在于读博期间，他们师门四人完成了——引用次数几十万、本世纪最火的深度学习著名论文——ResNet（残差学习），而张祥雨在里面就负责了底层框架和编码。bT0品论天涯网

bT0品论天涯网

有的差友可能不了解这个ResNet，没关系，重点就一句话，这文章的核心思想残差网络，对现代深度学习影响巨大。bT0品论天涯网

当年打败八冠王捷豹的AlphaGo系列，就用了ResNet技术；现在的Transformer网络（GPT里那个T）里，同样也用了残差网络。bT0品论天涯网

除了这个，张祥雨在其他技术上也很牛逼，在这咱就不细说了。就说一个苹果的3D人脸解锁，也就是FaceID，那其实也是受他的ShuffleNet技术影响才搞出来的……bT0品论天涯网

总之，这个2023年4月才建立的团队，在六小虎里亮相最晚，但人才的实力却丝毫不虚，从这点上看，能拿到魔都的投资也不算奇怪。bT0品论天涯网

然而另一方面，除了人才以外，大模型厂商路线的选择，也越来越受重视。bT0品论天涯网

而AGI基座模型这方向，其实也是技术理想主义者们最兴奋的方向，是大部分创业者入局大模型领域的初心所在。bT0品论天涯网

bT0品论天涯网

换句话说，基座大模型就是那一层地基，只有地基扎实了，模型的基础能力逐渐提升了，才有可能在未来搞出能真理解世界的通用模型，并运用到各种场景中改变人们的生活。bT0品论天涯网

像是OpenAI、Google、Anthropic、Meta，还有国内的智谱、阶跃等，就属于这一派，在坚持推出各类AI应用的同时，也依旧在基座大模型的探索上越走越远。bT0品论天涯网

bT0品论天涯网

然而就像开头说过的，整个AI领域其实有些降温。bT0品论天涯网

不少初创厂商们因为成本上的压力，逐渐搁置了基座大模型的研究和探索，把重心放在AI应用上。bT0品论天涯网

要么转向垂直行业赛道、要么单纯搞toC的生意来赚钱，毕竟要先活着才能去实现理想。bT0品论天涯网

而在2024年，国内依旧在不断更新基座模型，依旧在公开场合重申AGI为最终目标的公司里，智谱和阶跃星辰算是很典型的代表了。bT0品论天涯网

几个月前，差评编辑部就跟智谱的CEO张鹏对话过。张鹏表示：我们的目标定在AGI，这里面每一个问题的突破都有可能带来飞跃式的发展。bT0品论天涯网

bT0品论天涯网

包括阶跃星辰也一样，阶跃的创始人姜大昕曾经说，高昂的训练成本的确是一个挑战。有人调侃“讲卡伤感情，没卡没感情，用卡费脑筋”，但如果追求的目标就是AGI的话，付出再多也还是要坚持下去。bT0品论天涯网

姜大昕给阶跃星辰设计的技术路线中，就分成“单模态-多模态-多模理解和生成-世界模型-AGI”，一共五个步骤。bT0品论天涯网

这可能也是阶跃的大模型系列之所以被命名为Step的原因，五步成诗。bT0品论天涯网

到了现在，阶跃星辰已经走出了两步。bT0品论天涯网

bT0品论天涯网

阶跃的第一步，就是万亿参数大模型Step-2，它在上个月就炸场了一番。bT0品论天涯网

在图灵奖得主杨立昆亲推的权威榜单，有“全球最难大模型评测”之称的LiveBench上，Step-2拿下了国内第一、总榜第五的成绩，成了唯⼀进⼊前⼗名的中国语⾔⼤模型。bT0品论天涯网

榜单成绩时间：2024-11-19bT0品论天涯网

bT0品论天涯网

而阶跃的“第二步”Step-1V走的也不错。bT0品论天涯网

拿⼤模型竞技场ChatbotArena的数据来看，这个竞技场网站里网友们可以试用所有的大模型，然后给它们打分，今年11⽉的榜单里Step-1V的总分已经达到了Gemini1.5的水平。bT0品论天涯网

除了这些，在C端应用上这家公司也做出过一些出圈的产品，就比如主打拍照识别的跃问app。bT0品论天涯网

他家的跃问拍照问，也是最早接入iPhone16相机控制的国产大模型功能。bT0品论天涯网

bT0品论天涯网

还有一上线就快速冲上AppStore美食榜前三的胃之书，用的就是阶跃的多模态大模型；bT0品论天涯网

今年在圈内爆红的AI小游戏换你来当爹、灵魂提取器，也是基于阶跃模型能力开发出来的。bT0品论天涯网

像是界面财联社这些财经垂类的专业媒体，也跟阶跃做过AI合作。bT0品论天涯网

bT0品论天涯网

但归根结底，阶跃星辰给人最深的感觉，还是在低调有实力，和坚持着AGI初心这两点上。bT0品论天涯网

而这，或许就是上海国资之所以选择它的另一个原因。bT0品论天涯网

最后，差评君觉得在AI领域逐渐降温的2024年末，智谱和阶跃星辰两家先后拿到了国家队的投资，这对国产AI行业来说也是一个比较重要的信号。bT0品论天涯网

一方面，这意味着行业内的方向已经开始逐渐清晰，最顶端国家队的层面，也希望能尽快看到AGI。bT0品论天涯网

而另一方面，这也可以说是拉开了国内大模型下半场的序幕：bT0品论天涯网

拥有人才、找准方向、能坚持到最后的人，才有机会向人工智能的OnePiece——AGI进军。bT0品论天涯网