G

GMTalker

GMTalker 是一个集成语音识别、合成和自然语言理解的3D数字人。

🇨🇳 国内免费开源设计与多媒体开源桌面操作跨平台
支持平台:Web桌面端AndroidAPI
地区
国内
定价
免费
是否开源
GitHub Stars
★ 1.2k
收录来源
GitHub
收录于
2026-06-15
最近确认可用
2026-06-15
GMTalker 预览图

详细介绍

GMTalker 是由光明实验室媒体智能团队开发的3D数字人,集成了语音识别、语音合成、自然语言理解和嘴型动画驱动。支持在Windows、Linux和Android平台上快速部署。适用于演示、扩展和商业集成。系统架构灵活,支持多种模型和自定义角色,提供实时交互功能,如唤醒、中断和语音克隆。

核心功能

  • 跨平台支持:Windows、Linux、Android
  • 实时交互:唤醒、中断、语音克隆
  • 模型灵活性:兼容LLM、自定义代理
  • 快速部署:一键启动,无需额外依赖

适用场景

演示和展示商业集成教育和培训客户服务

优点

  • 多平台支持
  • 实时交互功能丰富
  • 易于部署和配置
  • 支持多种硬件

局限 / 注意

  • 需要2GB VRAM
  • 学习成本较高

适合谁

开发者内容创作者企业团队教育机构

以上介绍由 AI 基于公开资料整理,可能存在偏差,以官网为准。

常见问题

是否免费?

是,该项目是开源且免费的。

支持中文吗?

支持,项目提供了中文文档和社区支持。

能否商用?

可以,适用于商业集成。

需要联网吗?

支持离线使用,但部分功能可能需要联网。

相似智能体

信息有误?欢迎在 关于页 联系我们更正。