OpenBuddy发布新一代中文跨语言大模型基于Llama 3 70B打造-品论天涯网

站长之家(ChinaZ.com) 5月10日消息:OpenBuddy 团队发布了基于 Meta Llama370B 的最新成果:OpenBuddy-Llama3-70B-v21.1-8k，这是他们首次在 Llama370B 基座上的中文跨语言训练尝试。eo8品论天涯网

Llama370B 是一个15T 训练集训练而成的稠密大模型，然而由于训练集中缺少中文数据，Meta 官方的 Llama3系列对话模型在中文领域的认知、理能力较弱，容易出现以英文回答中文问题的现象。eo8品论天涯网

AI,人工智能，机器人，2024d9dc94358d8e eo8品论天涯网

因此，OpenBuddy 团队在此次训中选择了 Llama370B Base 模型作为基础，重点提升模型的跨语言理解、认知能力。eo8品论天涯网

测试过程中，OpenBuddy-Llama3-70B 展现出了优秀的中文理解能力，具备了更的认知潜力和量化后性能。在此次发布的模型中，他们对 Llama3现有词表进行了扩，增加了7000余个中文字词，进一步提升了模型中文编码密度。eo8品论天涯网

值得一提的是，于量化版模型能力下降较为明显，他们本次只发布了模型的完整版权重，后续会尝优化70B 模型的量化后性能，并挑选合适时机发布量化版。eo8品论天涯网

模型链接:eo8品论天涯网

https://www.modelscope.cn/models/OpenBuddy/openbuddy-llama3-70b-v21.1-8k/summaryeo8品论天涯网

OpenBuddy发布新一代中文跨语言大模型 基于Llama 3 70B打造