FunASR

FunASR

工业级语音识别工具包,支持50多种语言、说话人分离和情感检测。

MCP编程与开发开源
形态
MCP
传输协议
http
是否开源
GitHub Stars
★ 1.8w
收录来源
mcp-github

能力说明

FunASR 是一个工业级的语音识别工具包,支持50多种语言,具备说话人分离和情感检测功能。它比Whisper快170倍,并且提供OpenAI兼容的API。通过简单的安装和调用,可以轻松集成到各种AI应用中。适合需要高性能语音处理能力的开发者和企业。

能力点

  • 支持50多种语言
  • 实时语音识别
  • 说话人分离
  • 情感检测
  • 流式处理
  • OpenAI兼容API

适用场景

多语言语音转文字会议记录自动化情感分析实时语音识别

接入方式

依赖:PyTorchtorchaudioGPU(推荐)
pip install torch torchaudio && pip install funasr

以上信息由 AI 基于公开资料整理,可能存在偏差,以来源为准。

常见问题

如何快速开始使用FunASR?

可以通过Colab快速入门或本地安装后使用示例代码。

FunASR支持哪些语言?

支持50多种语言,包括中文、英文等。

是否需要GPU?

推荐使用GPU以获得最佳性能,但CPU也可以运行。

相关 Skill