人工智能

元象大模型开源30款量化版本 可更低成本部署

字号+作者: 来源:站长之家 2024-03-28 14:08 评论(创建话题) 收藏成功收藏本文

站长之家(ChinaZ.com) 3月28日 消息:元象大模型开源了30款量化版本,支持 vLLM 和 llama.cpp 等主流框架的量化推理,无条件免费商用。对量化前后的模型能'...

站长之家(ChinaZ.com) 3月28日 消息:元象大模型开源了30款量化版本,支持 vLLM 和 llama.cpp 等主流框架的量化推理,无条件免费商用。bau品论天涯网

对量化前后的模型能力、推理性能进行评估,以 XVERSE-13B-GPTQ-Int4量化版本为例,量化后模型权重压缩了72%,总吞吐提高了1.5倍,同时保留了95% 的能力。bau品论天涯网

微信截图_20240328140935.pngbau品论天涯网

开发者可以根据技能、软硬件配置和具体需求选择不同推理框架和数据精度的模型。如果本地资源有限,可以直接调用元象大模型的 API 服务(chat.xverse.cn)。bau品论天涯网

总体来说,元象大模型的开源量化版本提供了方便快捷的部署方式,可以根据需求选择不同的框架和精度模型进行部署和推理。bau品论天涯网

元象大模型下载:bau品论天涯网

Hugging Face:https://huggingface.co/xversebau品论天涯网

ModelScope魔搭:https://modelscope.cn/organization/xversebau品论天涯网

Github:https://github.com/xverse-aibau品论天涯网

本网除标明“PLTYW原创”的文章外,其它文章均为转载或者爬虫(PBot)抓取; 本文只代表作者个人观点,不代表本站观点,仅供大家学习参考。本网站属非谋利性质,旨在传播马克思主义和共产主义历史文献和参考资料。凡刊登的著作文献侵犯了作者、译者或版权持有人权益的,可来信联系本站删除。 本站邮箱[email protected]

相关文章