人工智能

MLPerf放榜 中国AI芯片公司再获世界第一

字号+作者: 来源:新智元 2023-09-14 14:15 评论(创建话题) 收藏成功收藏本文

MLPerf最新GPT大模型推理测试放榜了!这家国产算力公司再拿世界第一,性能最高可达1.8倍英伟达H100。随着ChatGPT等AIGC应用掀起大模型浪潮,算力层作为基础'...

MLPerf最新GPT大模型推理测试放榜了!这家国产算力公司再拿世界第一,性能最高可达1.8倍英伟达H100。随着ChatGPT等AIGC应用掀起大模型浪潮,算力层作为基础设施,成为最先受益的产业。nyY品论天涯网

然而,算力需求大、费用昂贵等问题,已成为企业落地大模型的普通痛点,更可能制约AI向前发展:大模型参数日益增长,而算力供给瓶颈迫在眉睫,二者形成巨大矛盾。nyY品论天涯网

如何探索更好的大模型算力方案,是业界共同关注的焦点。nyY品论天涯网

近日,全球权威测评MLPerf公布最新推理测评结果,这是MLPerf首度引入GPT大模型推理测试,参与热度再创纪录,收到了来自英伟达、英特尔、Google、高通等企业提交的13500多项性能结果。nyY品论天涯网

在MLPerfInference3.1中,墨芯人工智能(MoffetAI)S30计算卡在大模型GPT-J(60亿参数)上,单卡、4卡、8卡的算力均获得第一。nyY品论天涯网


nyY品论天涯网

这是墨芯在MLPerf上连续第三次卫冕。nyY品论天涯网

此前墨芯曾在MLPerfInference2.0与2.1上,连续两届获得第一。nyY品论天涯网


nyY品论天涯网

墨芯S30计算卡nyY品论天涯网

墨芯的成绩,为大模型算力方案带来了可行的创新方向。nyY品论天涯网

事实证明:结合AI模型与计算平台的软硬协同创新,能够释放更大的算力潜力。这也再度印证:以稀疏计算为代表的创新技术,将是大模型时代算力发展的关键。nyY品论天涯网

墨芯参加的是MLPerf开放分区,据主办方MLCommons介绍,该分区旨在鼓励创新。因此参赛者可以通过软硬协同等方式,探索对算力的提升。nyY品论天涯网

在MLPerf中的GPT-J大模型上,与4nm制程的H100纯硬件加速方案相比,12nm制程的墨芯S30计算卡通过“原创的双稀疏算法+硬件协同”方式,取得了高达1.8倍的优势。nyY品论天涯网

本次测评的GPT-J模型是生成式AI模型,墨芯S30计算卡在8卡、4卡、单卡模式下,性能分别为170.59,91.57,23.28(Sample/s),达到英伟达H100性能的1.6倍、1.8倍、1.8倍,展现出墨芯产品在AIGC类任务上的能力。nyY品论天涯网


nyY品论天涯网

三度夺冠,大模型算力率先“交卷”,软硬协同持续创新——墨芯的产品实力数次经过MLPerf的严格检验,也探索出大模型算力发展的新路径。nyY品论天涯网

01nyY品论天涯网

稀疏计算——大模型“潜力股”获得市场认可nyY品论天涯网

墨芯接连的优异成绩,主要得益于基于稀疏化算法的软硬协同设计。nyY品论天涯网

在大模型时代,稀疏计算的重要性不言而喻:AI模型大小与其稀疏化潜力成正比。nyY品论天涯网

也就是说,当模型越大,算法上有更大稀疏的可能性,稀疏计算可加速的幅度也越高。对于一般大型语言模型,稀疏计算可带来数十倍加速。nyY品论天涯网

墨芯独创的双稀疏算法,结合软硬协同设计,使墨芯Antoum®芯片成为全球首款高稀疏倍率AI芯片,支持高达32倍稀疏——这也正是墨芯在本次MLPerf中创新纪录的关键。nyY品论天涯网

模型越大,稀疏计算的优势越明显——尤其是在GPT等大模型参数动辄上百亿、千亿的现状下,这使得墨芯的护城河更为稳固。nyY品论天涯网

墨芯的产品实力与稀疏计算的大势所趋,也获得了业界的认可:墨芯商业化进程接连取得重要突破,助力企业加速AI应用。nyY品论天涯网

就在近日,墨芯正式成为支持ByteMLPerf的供应商之一。nyY品论天涯网


nyY品论天涯网

来源:ByteMLPerf网站nyY品论天涯网

项目地址:https://github.com/bytedance/ByteMLPerf/blob/main/README.mdnyY品论天涯网

当前,墨芯AI计算平台已能够支持不同参数级别的大模型,包括BLOOM,OPT,GPT-J,LLaMA,StableDiffusion等。nyY品论天涯网

同时具有高吞吐、低延时、低功耗等特点,缓解算力之困,真正为企业带来“好用”、“用得起”的大模型算力方案。nyY品论天涯网

02nyY品论天涯网

带来根本性的算力变革,稀疏计算助力大模型发展nyY品论天涯网

墨芯的稀疏计算方案不仅能够缓解当前的算力难题,也为AI的持续发展打开新的空间。nyY品论天涯网

稀疏计算减少了AI模型的计算量,这意味着能让大模型既在参数量上跃升若干个数量级的同时,又不产生过大的计算量,大模型参数增长与算力瓶颈的矛盾有望从根本上得到解决。nyY品论天涯网

同时,由于计算量的减少,大模型的高算力需求、高功耗、高费用等痛点,也一并得到解决,实现“多赢”效果。nyY品论天涯网


nyY品论天涯网

墨芯Antoum芯片:全球首款高稀疏倍率AI芯片,支持高达32倍稀疏nyY品论天涯网

连续三届MLPerf的优异成绩,不仅是对墨芯产品实力的证明,也为业界带来新启示:在稀疏计算等技术的助力下,大模型的发展与应用有望迎来更广阔的施展空间,加速AIGC等应用在各行各业遍地开花。nyY品论天涯网

03nyY品论天涯网

关于MLPerfnyY品论天涯网

MLPerf由图灵奖得主大卫•帕特森(DavidPatterson)联合Google、斯坦福、哈佛大学顶尖学术机构发起成立,是权威性最高、影响力最广的国际AI性能基准测试,以对迅速增长的AI计算需求与性能进行及时的跟踪测评。nyY品论天涯网

本网除标明“PLTYW原创”的文章外,其它文章均为转载或者爬虫(PBot)抓取; 本文只代表作者个人观点,不代表本站观点,仅供大家学习参考。本网站属非谋利性质,旨在传播马克思主义和共产主义历史文献和参考资料。凡刊登的著作文献侵犯了作者、译者或版权持有人权益的,可来信联系本站删除。 本站邮箱[email protected]