项目简介

警告

本项目仍处于早期阶段，目前正在积极开发中。

UMaxing-VTuber 是一款独特的语音交互 AI 数字人，它不仅支持实时语音对话和视觉感知，还配备了生动的 Live2D 形象。所有功能都可以在你的电脑上完全离线运行！

你可以把它当作你的专属 AI 数字人 —— 无论你想要一个虚拟女友、男友、萌宠还是其他角色，它都能满足你的期待。项目完美支持 Windows、macOS 和 Linux 系统，并提供两种使用方式：网页版和桌面客户端（特别支持透明背景的桌宠模式，让 AI 数字人在屏幕上的任意位置时刻陪伴着你）。

虽然长期记忆功能暂时下线（即将回归），但得益于聊天记录的持久化存储，你随时都能继续之前未完的对话，不会丢失任何珍贵的互动瞬间。

在后端支持方面，我们集成了丰富多样的 LLM 对话引擎、文本转语音模型和语音识别方案。如果你想让 AI 数字人更有个性，还可以参考角色定制指南来自定义专属的 AI 数字人形象和人设。

关于为什么叫 UMaxing-Vtuber 而不是 UMaxing-Companion 或者 UMaxing-Waifu，是因为项目的开发初衷是采用可在 Windows 以外平台离线运行的开源方案。

👀 效果演示

✨ 功能和亮点

🖥️ 跨平台支持：完美支持 macOS、Linux 和 Windows。我们支持英伟达和非英伟达 GPU，可以选择在 CPU 上运行或使用云 API 处理资源密集型任务。部分组件在 macOS 上支持 GPU 加速。
🔒 支持离线模式：使用本地模型完全离线运行 - 无需联网。你的对话只会待在你的设备上，确保隐私安全。
💻 好看且功能强大的网页和桌面客户端：提供网页版和桌面客户端两种使用方式，支持丰富的交互功能和个性化设置，桌面客户端还可以在窗口模式和桌宠模式之间自由切换，让 AI 数字人随时陪伴在身边
🎯 高级交互功能：
- 👁️ 视觉感知，支持摄像头、屏幕录制和截图，让 AI 伙伴能看到你和你的屏幕
- 🎤 语音打断，无需耳机（AI 不会听到自己的声音）
- 👥 群组聊天，支持多个 AI 角色同时参与对话交互
- 🫱 触摸反馈，可以通过点击或拖拽与 AI 伙伴互动
- 😊 Live2D 表情，设置情绪映射让后端控制模型表情
- 🐱 宠物模式，支持透明背景全局置顶和鼠标穿透 - 可以将你的 AI 伙伴拖到屏幕上的任意位置
- 🗣️ AI 主动说话功能
- 💭 AI 内心 OS，AI 的表情、想法和动作可以被看到，但不会被读出来
- 💾 聊天记录持久化，可以随时切换到以前的对话
- 🌍 TTS 翻译支持（例如，用中文聊天的同时，AI 使用日语声音）
🧠 广泛的模型支持：
- 🤖 大语言模型 (LLM)：Ollama、OpenAI（以及任何与 OpenAI 兼容的 API）、Gemini、Claude、Mistral、DeepSeek、智谱、GGUF、LM Studio、vLLM 等
- 🎙️ 语音识别 (ASR)：sherpa-onnx、FunASR、Faster-Whisper、Whisper.cpp、Whisper、Groq Whisper、Azure ASR等
- 🔊 语音合成 (TTS)：sherpa-onnx、pyttsx3、MeloTTS、Coqui-TTS、GPTSoVITS、Bark、CosyVoice、Edge TTS、Fish Audio、Azure TTS等
🔧 高度可定制:
- ⚙️ 简单的模块配置：通过简单的配置文件修改，即可切换各种功能模块，无需深入代码
- 🎨 角色随心定制：导入自定义 Live2D 模型，让你的 AI 数字人拥有独特外观。通过修改 Prompt，塑造你 AI 数字人的人设。进行音色克隆，让你的 AI 数字人有着你想要的声线
- 🧩 Agent自由实现：继承并实现 Agent 接口，接入任何架构的 Agent，如 HumeAI EVI、OpenAI Her、Mem0 等
- 🔌 良好的可扩展性：模块化设计让你能轻松添加自己的 LLM、ASR、TTS 等模块实现，随时扩展新特性

👥 用户评价

感谢开发者把女朋友开源分享出来让大家一起使用

👀 效果演示​

✨ 功能和亮点​

👥 用户评价​

👀 效果演示

✨ 功能和亮点

👥 用户评价