人工智能

股价飙升!商汤大模型挑战GPT4

字号+作者: 来源:站长之家 2024-04-25 18:01 评论(创建话题) 收藏成功收藏本文

站长之家(ChinaZ.com)4月25日 消息:4月24日,商汤集团在港交所暂停交易前股价上涨31.15%。商汤集团表示,其大模型日日新5.0发布会受到市场极大关注,公司将进'...

站长之家(ChinaZ.com)4月25日 消息:4月24日,商汤集团在港交所暂停交易前股价上涨31.15%。商汤集团表示,其大模型日日新5.0发布会受到市场极大关注,公司将进一步刊发相关公告。在“2024年商汤技术交流日”上,商汤发布了其最新的大模型——SenseNova5.0,旨在追赶GPT-4,这反映了中国大模型行业的集体目标。8gH品论天涯网

image.png8gH品论天涯网

商汤通过遵循大语言模型的尺度定律(Scaling laws),在不到三个月的时间内,从SenseNova4.0超越GPT-3.5到SenseNova5.0全面对标GPT-4Turbo。尺度定律强调了模型性能与模型大小、数据量和计算量之间的幂律关系。商汤利用科学试验和数学公式预测下一代大模型的性能,避免了盲目尝试。8gH品论天涯网

商汤科技董事长兼CEO徐立提出,通过小规模实验可以预测和验证模型架构和数据配方的有效性,并确保这些结论在更大规模上得到保持。SenseNova5.0采用了超过10万亿tokens的中英文预训练数据,并通过逻辑合成数据提升模型的推理、数学和编程能力。8gH品论天涯网

商汤还推出了1.8B参数的SenseChat-Lite,它在主流评测中超过了所有开源2B的同级别模型。此外,商汤发布了针对端侧业务的SDK,以及企业级大模型一体机,支持金融、代码、医疗、政务等行业的数据私有化部署需求。8gH品论天涯网

面向软件开发,商汤发布了小浣熊代码大模型一体机轻量版,它在HumanEval的测试中表现超过了GPT-4,支持多种编程语言和上下文,旨在帮助企业开发人员更高效地编写、理解和维护代码。8gH品论天涯网

商汤在技术交流日上强调了合作伙伴的重要性,并展示了与华为昇腾等公司的合作成果。商汤的AI基础设施SenseCore和AIDC算力基座为其提供了强大的支持。商汤的生成式AI业务在2023年取得了显著增长,占总收入的35%。8gH品论天涯网

本网除标明“PLTYW原创”的文章外,其它文章均为转载或者爬虫(PBot)抓取; 本文只代表作者个人观点,不代表本站观点,仅供大家学习参考。本网站属非谋利性质,旨在传播马克思主义和共产主义历史文献和参考资料。凡刊登的著作文献侵犯了作者、译者或版权持有人权益的,可来信联系本站删除。 本站邮箱[email protected]