人工智能

DeepSeek宣布开源MLA解码核FlashMLA GitHubstar超1700

字号+作者:新浪科技 来源:新浪科技 2025-02-24 12:00 评论(创建话题) 收藏成功收藏本文

在上周DeepSeek宣布本周将是开源周(OpenSourceWeek),并将连续开源五个软件库后。今日,DeepSeek宣布开源了开源周首款用于Hopper GPU的高效型MLA解码核——F'...

在上周DeepSeek宣布本周将是开源周(OpenSourceWeek),并将连续开源五个软件库后。今日,DeepSeek宣布开源了开源周首款用于Hopper GPU的高效型MLA解码核——FlashMLA。DRr品论天涯网


DRr品论天涯网

在GitHub上,目前该项目已经收获了超过1700star,并且拥有62个Fork。DRr品论天涯网

MLA是DeepSeek V2-V3系列大模型最为重要技术创新,主要用于减少推理过程的KVCache,进而降低推理成本。据DeepSeek介绍,FlashMLA是HopperGPUs的有效MLA解码内核,可针对可变长度序列进行优化,目前主要发布包括:1、 BF16;2、块大小为64的分页kvcache。DRr品论天涯网

在基准测试性能表现上,FlashMLA在英伟达H800SXM5GPU上可实现3000GB/s的内存速度以及580TFLOPS的计算上限。DRr品论天涯网

本网除标明“PLTYW原创”的文章外,其它文章均为转载或者爬虫(PBot)抓取; 本文只代表作者个人观点,不代表本站观点,仅供大家学习参考。本网站属非谋利性质,旨在传播马克思主义和共产主义历史文献和参考资料。凡刊登的著作文献侵犯了作者、译者或版权持有人权益的,可来信联系本站删除。 本站邮箱service@pltyw.com

13
扫二维码添加收藏返回顶部