py-xiaozhi

py-xiaozhi

开源AI助手生态系统,支持MCP集成、多模态工作流、IoT和跨平台语音交互。

MCP编程与开发开源AI助手多模态IoT跨平台
形态
MCP
传输协议
http
是否开源
GitHub Stars
★ 3.4k
收录来源
mcp-github

能力说明

py-xiaozhi是一个轻量级的跨平台多模态AI交互框架,基于Python的异步架构构建。它支持实时语音流、视觉-语言任务和IoT设备控制。可以在Windows、macOS、Linux桌面以及ARM嵌入式平台(如Raspberry Pi)上部署,无缝连接大型语言模型和物理硬件。该框架提供多种UI模式,包括PySide6 + QML GUI、CLI和GPIO接口,适应桌面、无头服务器和嵌入式环境。

能力点

  • 实时语音AI,低延迟
  • 多模态视觉,图像理解
  • MCP工具生态系统,模块化JSON-RPC 2.0
  • 跨平台部署,支持多种操作系统
  • 多种UI模式,适应不同环境
  • 离线唤醒词识别

适用场景

智能家居控制机器人控制多模态AI应用开发跨平台AI助手

接入方式

依赖:Python 3.10 - 3.12音频设备网络连接
pip install py-xiaozhi

以上信息由 AI 基于公开资料整理,可能存在偏差,以来源为准。

常见问题

支持哪些操作系统?

支持Windows 10+、macOS 10.15+、Linux(x86_64 & ARM)。

需要哪些硬件设备?

需要麦克风和扬声器设备,推荐至少4GB RAM和现代CPU。

相关 Skill