人工智能

DeepSeek又得了个第一

字号+作者:智东西 来源:智东西 2025-02-14 15:39 评论(创建话题) 收藏成功收藏本文

刚刚,DeepSeek在开源社区HuggingFace上的点赞数跃居第一,获约8730次点赞,这一数字仍在持续上涨。这是继DeepSeek应用力压ChatGPT登顶美区AppStore免费榜、'...

刚刚,DeepSeek在开源社区HuggingFace上的点赞数跃居第一,获约8730次点赞,这一数字仍在持续上涨。这是继DeepSeek应用力压ChatGPT登顶美区AppStore免费榜、模型在开源社区GitHub上Star数首次超越OpenAI之后,创下的又一个历史时刻,DeepSeek在海外平台再次登顶。M5a品论天涯网


M5a品论天涯网

HuggingFace点赞榜单前十名的模型中,都曾在不同节点引爆整个大模型产业。M5a品论天涯网

排名第二的是曾以AI生图“新王”名号横空出世的FLUX.1,由StableDiffusion原班人马成立的新工作室黑森林工作室打造,点赞数约8710次。M5a品论天涯网

排名第六的是全球1000名科学家组成BigScience打造的参数高达1760亿个的超大NLP模型BLOOM,第八的是欧洲AI独角兽MistralAI基于MoE架构的模型Mixtral-8x7B,其余六席被Meta的Llama系列模型和StabilityAI家的模型包揽。M5a品论天涯网

OpenAI的语音转录模型Whisper-large-v3被挤出前十名之列,排名第11,点赞数约3810次。M5a品论天涯网

此外,DeepSeek-V3的排名在第19名,点赞约3810次,超越了微软的Phi-2GoogleGemma-7B模型。M5a品论天涯网

HuggingFace点赞数排行榜前30的还有DeepSeek另一款开源的多模态模型Janus-Pro-7B,该模型在使用文本提示的图像生成排行榜中优于OpenAI的DALL-E3和StabilityAI的StableDiffusion。M5a品论天涯网


M5a品论天涯网

▲开源社区HuggingFace点赞榜(图源:HuggingFace)M5a品论天涯网

DeepSeekV3、DeepSeekR1、Janus-Pro-7B分别于2024年12月26日和今年1月20日、1月28日发布。M5a品论天涯网

DeepSeekV3为DeepSeek自研MoE模型,参数量达到671B,激活参数量37B,在14.8Ttoken上进行了预训练,该模型在多项评测成绩超越了Qwen2.5-72B和Llama-3.1-405B等开源模型,并在性能上和闭源模型GPT-4o以及Claude-3.5-Sonnet比肩。M5a品论天涯网

DeepSeekR1在数学、代码、自然语言推理等任务上,性能比肩OpenAIo1正式版,在开源DeepSeek-R1-Zero和DeepSeek-R1两个660B模型的同时,蒸馏了6个小模型,其中32B和70B模型在多项能力上实现了对标OpenAIo1-mini的效果。M5a品论天涯网

多模态模型Janus-Pro是去年发布的Janus的高级版本,可显著提高多模态理解和视觉生成。M5a品论天涯网

当下,全球已经掀起了从芯片企业、云计算巨头到各路基础设施公司适配、接入DeepSeek的热潮,DeepSeek所展现出的卓越性能与广泛的应用潜力正在逐渐放大。M5a品论天涯网

本网除标明“PLTYW原创”的文章外,其它文章均为转载或者爬虫(PBot)抓取; 本文只代表作者个人观点,不代表本站观点,仅供大家学习参考。本网站属非谋利性质,旨在传播马克思主义和共产主义历史文献和参考资料。凡刊登的著作文献侵犯了作者、译者或版权持有人权益的,可来信联系本站删除。 本站邮箱service@pltyw.com

20
扫二维码添加收藏返回顶部