WhisperFusion是一款基于WhisperLive和WhisperSpeech功能的产品,通过在实时语音转文字流程中集成Mistral大型语言模型(LLM)来实现与AI的无缝对话。Whisper和LLM均经过TensorRT引擎优化,以最大程度提升性能和实时处理能力。WhisperSpeech则使用torch.compile来优化。产品定位于提供超低延迟的AI实时对话体验。
点击前往WhisperFusion官网体验入口
需求人群:
用户可以通过使用预构建的TensorRT-LLM Docker容器快速开始与[WhisperFusion](https://top.aibase.com/tool/whisperfusion)进行交互。同时,也可以构建适用于不同cuda架构的docker镜像。
使用场景示例:
在网站上与WhisperFusion的AI进行实时对话
通过WhisperFusion的小程序进行语音转文字交互
使用WhisperFusion插件在桌面客户端上进行实时语音识别
产品特色:
实时语音转文字:利用OpenAI WhisperLive实现实时语音转文字。
大型语言模型集成:整合Mistral大型语言模型,增强对转录文本的理解和语境。
TensorRT优化:LLM和Whisper均优化为TensorRT引擎,确保高性能和低延迟处理。
torch.compile:WhisperSpeech使用torch.compile来加速推断,通过将PyTorch代码即时编译为优化内核,使PyTorch代码运行更快。
【查看完整讨论话题】 | 【用户登录】 | 【用户注册】