人工智能

美团发布LongCat-Flash-Omni:总参数达5600亿 开源最先进水平

字号+作者:快科技 来源:快科技 2025-11-04 13:22 评论(创建话题) 收藏成功收藏本文

昨日,美团LongCat(龙猫)团队正式推出全新开源大模型LongCat-Flash-Omni。该大模型总参数规模高达5600亿,实现全模态能力突破,登顶开源领域最先进水平(SOTA)。'...

昨日,美团LongCat(龙猫)团队正式推出全新开源大模型LongCat-Flash-Omni。该大模型总参数规模高达5600亿,实现全模态能力突破,登顶开源领域最先进水平(SOTA)。wqs品论天涯网

wqs品论天涯网

今年9月1日,美团正式发布LongCat-Flash系列模型,并开源了LongCat-Flash-Chat和LongCat-Flash-Thinking两大版本。wqs品论天涯网

此次LongCat-Flash-Omni是系列全新家族成员。它也是业界首个实现“全模态覆盖、端到端架构、大参数量高效推理”于一体的开源大语言模型,首次在开源范畴内实现了全模态能力对闭源模型的对标。wqs品论天涯网

wqs品论天涯网

该模型的核心突破在于破解了“大参数与高效率”的行业矛盾。wqs品论天涯网

该模型总参数达5600亿(激活参数270亿),却依托LongCat-Flash系列创新的ScMoE架构(含零计算专家)作为LLM骨干,结合高效多模态编解码器和“分块式音视频特征交织机制”,最终实现低延迟、高质量的音视频处理与流式语音生成。wqs品论天涯网

模型支持128Ktokens上下文窗口及超8分钟音视频交互,在多模态长时记忆、多轮对话、时序推理等能力上具备显著优势。wqs品论天涯网

wqs品论天涯网

实测显示,其图像理解性能与闭源全模态模型Gemini-2.5-Pro相当,且优于开源模型Qwen3-Omni。短视频理解性能超越同类模型,长视频处理能力比肩Gemini-2.5-Pro。wqs品论天涯网

落地体验上,LongCat官方App现已正式发布,支持联网搜索,还可以发起语音通话(视频通话功能敬请期待)。wqs品论天涯网

wqs品论天涯网

本网除标明“PLTYW原创”的文章外,其它文章均为转载或者爬虫(PBot)抓取; 本文只代表作者个人观点,不代表本站观点,仅供大家学习参考。本网站属非谋利性质,旨在传播马克思主义和共产主义历史文献和参考资料。凡刊登的著作文献侵犯了作者、译者或版权持有人权益的,可来信联系本站删除。 本站邮箱[email protected]