人工智能

火山引擎发布豆包大模型1.8 多模态Agent能力进入全球第一梯队

字号+作者:新浪科技 来源:新浪科技 2025-12-18 11:56 评论(创建话题) 收藏成功收藏本文

今日,火山引擎在FORCE原动力大会上正式发布豆包大模型1.8及音视频创作模型Seedance1.5pro。权威评测数据显示,豆包大模型在多模态理解、生成能力及Agent'...

今日,火山引擎在FORCE原动力大会上正式发布豆包大模型1.8及音视频创作模型Seedance1.5pro。权威评测数据显示,豆包大模型在多模态理解、生成能力及Agent能力上,已跻身全球第一梯队。5eP品论天涯网

据火山引擎总裁谭待介绍,截至今年12月,豆包大模型日均token使用量突破50万亿,较去年同期增长超过10倍;目前已有超过100家企业客户累计token使用量超过一万亿。5eP品论天涯网

作为豆包家族的最新旗舰模型,豆包大模型1.8(Doubao-Seed-1.8)面向多模态Agent场景进行了定向优化。其工具调用能力、复杂指令遵循能力及OSAgent能力均得到增强,提升了模型在处理复杂任务时的规划与执行水平。5eP品论天涯网

在视觉理解方面,豆包1.8的单次视频理解帧数从640帧倍增至1280帧。模型支持以低帧率理解超长视频,并能调用工具对关键片段进行高帧率理解。该能力可广泛用于在线教育、产品质检等场景中。5eP品论天涯网

针对日益增长的视频创作需求,火山引擎推出了Seedance1.5pro音视频创作模型。该模型不仅具备影视级的叙事张力,能够精准捕捉运动细节并细腻呈现人物情绪,更在音画同步技术上取得了突破性进展。5eP品论天涯网

Seedance1.5pro采用创新的原生音视频联合生成架构,支持环境音、背景音乐、人声等多种元素,实现了毫秒级的音画同步输出。在对白处理上,模型支持多人多语言对话,口型对齐精准,覆盖中文方言(如四川话、粤语等)、英文及小语种,极大地提升了视频内容的真实感与全球化创作潜力。5eP品论天涯网

为进一步降低创作门槛与成本,Seedance系列即将上线“Draft样片”功能。创作者可先生成低分辨率样片进行预览,其关键要素与最终成片高度一致,真正做到“预览即所得”。数据显示,该功能可帮助创作者提升65%的整体效率,并减少60%的无效创作成本。5eP品论天涯网

目前,个人用户已可在豆包、即梦AI等平台体验该模型;企业用户则可从12月23日起,通过火山引擎API接入Seedance1.5pro模型服务。5eP品论天涯网

谭待指出,传统的IT架构已无法满足Agent时代的需求,以模型为中心的AI云原生架构正在形成,并围绕Agent的开发与运营进行重构。5eP品论天涯网

在Agent开发层面,火山引擎全面升级了企业级AIAgent平台AgentKit。该平台覆盖了Agent从开发、部署到管控的全生命周期,旨在解决企业在Agent落地中面临的身份权限管理、模型确定性及系统集成等核心挑战。5eP品论天涯网

此外,为降低企业使用门槛,火山引擎推出了业内首个“AI节省计划”。该计划覆盖所有按量后付费的大模型产品,通过阶梯式折扣,帮助企业最高节省47%的成本。5eP品论天涯网

5eP品论天涯网

本网除标明“PLTYW原创”的文章外,其它文章均为转载或者爬虫(PBot)抓取; 本文只代表作者个人观点,不代表本站观点,仅供大家学习参考。本网站属非谋利性质,旨在传播马克思主义和共产主义历史文献和参考资料。凡刊登的著作文献侵犯了作者、译者或版权持有人权益的,可来信联系本站删除。 本站邮箱[email protected]