当前位置:首页 > TAG信息列表 > 训练速度
-
阿里通义千问开源Qwen1.5-MoE-A2.7B模型
站长之家(ChinaZ.com) 3月29日 消息:通义千问团队推出了 Qwen 系列的首个 MoE 模型,命名为 Qwen1.5-MoE-A2.7B。这个模型只有27亿个激活参数,但性能却与当前最先进的70亿参数...
作者:2024-03-29 17:17
排行榜
编辑推荐
-
习近平:在纪念邓小平同志诞辰120周年座谈会上的讲话
-
梁孝:反思现代西方“神话”历史:“古希腊起源”、霸权意识和回溯式目的
-
高建明:美国新一轮社会主义思潮评析
-
余斌:生产力——生活方式”的传导机制及其启示
关注我们
关注微信公众号,了解最新精彩内容