人工智能

Cohere推出开源语音转写模型Transcribe 主打轻量自托管场景

字号+作者:cnBeta.COM 来源:cnBeta 2026-03-27 01:11 评论(创建话题) 收藏成功收藏本文

企业级人工智能公司Cohere于本周四发布其首个语音模型Transcribe,这是一款开源自动语音识别(ASR)模型,主要面向语音转文字记录、语音内容分析等场景。该模'...

企业级人工智能公司Cohere于本周四发布其首个语音模型Transcribe,这是一款开源自动语音识别(ASR)模型,主要面向语音转文字记录、语音内容分析等场景。该模型参数规模约为20亿,被定位为“轻量级”方案,方便在消费级GPU上运行,适合有自托管需求的企业和开发者部署。Izt品论天涯网

Izt品论天涯网

Transcribe目前支持14种语言,包括英语、法语、德语、意大利语、西班牙语、葡萄牙语、希腊语、荷兰语、波兰语、中文、日语、韩语、越南语以及阿拉伯语。Cohere表示,在HuggingFace的OpenASR榜单上,Transcribe的平均词错误率(WER)达到5.42,在该基准测试中优于ZoomScribev1、IBMGranite4.01B、ElevenLabsScribev2以及Qwen3-ASR-1.7BSpeech等模型。Izt品论天涯网

在人工评估方面,Cohere称,当由人工评审从准确性、一致性和可用性等维度对转写结果进行对比时,Transcribe相比其他模型的平均胜率为61%。不过,公司也承认,在葡萄牙语、德语和西班牙语等语言上,该模型的表现仍略逊于部分竞品。Izt品论天涯网

性能方面,Cohere给出的数据是,Transcribe每分钟可处理约525分钟的音频,在同类模型中属于较高水平。Cohere计划将这一语音模型整合进其面向企业的智能体编排平台North,并通过公司API免费提供访问。同时,Transcribe也将上架于Cohere的托管推理平台ModelVault,方便客户直接调用。Izt品论天涯网

随着Granola和WisprFlow等基于语音记事与听写的应用需求不断增长,语音识别模型整体正快速升温。在此背景下,Cohere试图通过开源、轻量和多语言支持切入市场,为希望掌控数据和部署环境的企业提供一套自托管友好的语音基础设施。Izt品论天涯网

今年早些时候,有报道称Cohere在2025年实现了约2.4亿美元的年度经常性收入(ARR),公司CEOAidanGomez也被引述称该初创企业“可能很快”就会公开上市。Izt品论天涯网

本网除标明“PLTYW原创”的文章外,其它文章均为转载或者爬虫(PBot)抓取; 本文只代表作者个人观点,不代表本站观点,仅供大家学习参考。本网站属非谋利性质,旨在传播马克思主义和共产主义历史文献和参考资料。凡刊登的著作文献侵犯了作者、译者或版权持有人权益的,可来信联系本站删除。 本站邮箱[email protected]