OmniX-Space/xiaozhi-esp32

Fork 0

T

MoeCinnamo 63e404d610 Update to 2.0.0

2025-09-13 23:40:38 +08:00

.github/ISSUE_TEMPLATE

add some files

2025-09-05 17:56:01 +08:00

docs

add README.md

2025-09-02 18:33:03 +08:00

main

Update to 2.0.0

2025-09-13 23:40:38 +08:00

managed_components

Update to 2.0.0

2025-09-13 23:40:38 +08:00

partitions

add some code

2025-09-05 13:25:11 +08:00

scripts

add some code

2025-09-05 13:25:11 +08:00

.clangd

add some files

2025-09-05 17:56:01 +08:00

.gitignore

add some files

2025-09-05 17:56:01 +08:00

CMakeLists.txt

Update to 2.0.0

2025-09-13 23:40:38 +08:00

dependencies.lock

Update to 2.0.0

2025-09-13 23:40:38 +08:00

LICENSE

add some code

2025-09-05 13:25:11 +08:00

README.md

modify README

2025-09-12 14:34:53 +08:00

sdkconfig.defaults

Update to 2.0.0

2025-09-13 23:40:38 +08:00

sdkconfig.defaults.esp32

add some code

2025-09-05 13:25:11 +08:00

sdkconfig.defaults.esp32c3

Update to 2.0.0

2025-09-13 23:40:38 +08:00

sdkconfig.defaults.esp32c6

Update to 2.0.0

2025-09-13 23:40:38 +08:00

sdkconfig.defaults.esp32p4

Update to 2.0.0

2025-09-13 23:40:38 +08:00

sdkconfig.defaults.esp32s3

Update to 2.0.0

2025-09-13 23:40:38 +08:00

README.md

超级小智-ESP32

（中文 | English(编写中) | 日本語(编写中)）

基于 https://github.com/78/xiaozhi-esp32 改良的船新版本

💡介绍

这是一个由虾哥开源的 ESP32 项目，以 MIT 许可证发布，允许任何人免费使用，或用于商业用途。

我们希望通过这个项目，能够帮助大家了解 AI 硬件开发，将当下飞速发展的大语言模型应用到实际的硬件设备中。

如果你有任何想法或建议，请随时提出 Issues 或加入 QQ 群：暂无，Telegram群：暂无。

项目主要贡献者：小霜霜Meow(抖音、B站UP)、空白泡泡糖果（B站UP），硅灵造物科技（B站UP）

贡献者说明：引入部分其它贡献者在其它项目上的代码，并进行了部分修改。

音乐服务器、相关源码提供者(为爱发电)：小霜霜Meow

音乐服务器源码请见 https://github.com/IntelligentlyEverything/MeowMusicServer

❕注意事项

如果小智说找不到歌曲怎么办？进入小智后台，找到对应设备，修改角色配置

选择 DeepSeekV3 大语言模型
在人物介绍中填入
- 收到音乐相关的需求时，只使用 MPC tool self.music.play_song 工具，同时禁止使用 search_music 功能。

内置API调用失败怎么办？请查看具体错误代码后，加入QQ群：865754861，或电报群 http://t.me/MeowMusicServer 给出错误代码和日志，等待我们修复。

⚙️已支持硬件芯片系列

ESP32
ESP32-S2
ESP32-S3
ESP32-C2
ESP32-C3
ESP32-C5
ESP32-C6
ESP32-C61
ESP32-H2
ESP32-H4
ESP32-H21
ESP32-P4

❕大部分硬件由于没有进行完整测试，可能会存在一些问题，属于正常现象，具体可提交issues进行反馈。

项目改动范围

新增:

main/boards/common/music.h
main/boards/common/esp32_music.h
main/boards/common/esp32_music.cc

修改:

main/audio/audio_codec.h
main/audio/audio_codec.cc
main/audio/audio_service.h
main/audio/audio_service.cc
main/boards/common/board.h
main/boards/common/board.cc
main/display/display.h
main/display/display.cc
main/display/lcd_display.h
main/display/lcd_display.cc
main/application.h
main/application.cc
main/idf_component.yml
main/mcp_server.cc

基于 MCP 控制万物

小智 AI 聊天机器人作为一个语音交互入口，利用 Qwen / DeepSeek 等大模型的 AI 能力，通过 MCP 协议实现多端控制。

已实现功能

Wi-Fi / ML307 Cat.1 4G
离线语音唤醒 ESP-SR
支持两种通信协议（Websocket 或 MQTT+UDP）
采用 OPUS 音频编解码
基于流式 ASR + LLM + TTS 架构的语音交互
声纹识别，识别当前说话人的身份 3D Speaker
OLED / LCD 显示屏，支持表情显示
电量显示与电源管理
支持多语言（中文、英文、日文）
支持 ESP32-C3、ESP32-S3、ESP32-P4 芯片平台
通过设备端 MCP 实现设备控制（音量、灯光、电机、GPIO 等）
通过云端 MCP 扩展大模型能力（智能家居控制、PC桌面操作、知识搜索、邮件收发等）本项目新增功能:
新增音乐播放功能，支持播放本地音乐(开发中，敬请期待)、云端音乐(完善中)。

硬件

面包板手工制作实践

详见飞书文档教程：

👉 《小智 AI 聊天机器人百科全书》

面包板效果图如下：

支持 70 多个开源硬件（仅展示部分）

软件

固件烧录

新手第一次操作建议先不要搭建开发环境，直接使用免开发环境烧录的固件。

固件默认接入 xiaozhi.me 官方服务器，个人用户注册账号可以免费使用 Qwen 实时模型。

👉 新手烧录固件教程

开发环境

Cursor 或 VSCode
安装 ESP-IDF 插件，选择 SDK 版本 5.4 或以上
Linux 比 Windows 更好，编译速度快，也免去驱动问题的困扰
本项目使用 Google C++ 代码风格，提交代码时请确保符合规范

开发者文档

自定义开发板指南 - 学习如何为小智 AI 创建自定义开发板
MCP 协议物联网控制用法说明 - 了解如何通过 MCP 协议控制物联网设备
MCP 协议交互流程 - 设备端 MCP 协议的实现方式
MQTT + UDP 混合通信协议文档
一份详细的 WebSocket 通信协议文档

大模型配置

如果你已经拥有一个小智 AI 聊天机器人设备，并且已接入官方服务器，可以登录 xiaozhi.me 控制台进行配置。

👉 后台操作视频教程（旧版界面）

Star History

Languages

C++ 70.1%

C 20.8%

Python 7.7%

CMake 1.2%

HTML 0.2%

README.md Unescape Escape

超级小智-ESP32

💡介绍

❕注意事项

⚙️已支持硬件芯片系列

项目改动范围

基于 MCP 控制万物

已实现功能

硬件

面包板手工制作实践

支持 70 多个开源硬件（仅展示部分）

软件

固件烧录

开发环境

开发者文档

大模型配置

相关开源项目

Star History

README.md