my-neuro

1.2k 136 较难 1 次阅读今天MIT语言模型图像开发框架Agent

AI 解读由 AI 自动生成，仅供参考

my-neuro 是一款旨在打造专属个人 AI 桌面伙伴的开源项目。它允许用户通过自定义角色形象、声音克隆及性格训练，创造出具备长期记忆、视觉识别能力且响应速度低于 1 秒的虚拟伴侣。无论是希望拥有能陪玩游戏、协助学习，还是仅仅想要一个有情绪、懂互动的“数字朋友”，my-neuro 都能将想象中的形象变为现实。

该项目主要解决了现有 AI 助手缺乏个性化情感、交互延迟高以及难以深度融入日常生活场景的痛点。它不仅支持接入各类主流大语言模型（包括本地部署与闭源 API），还集成了 Live2D 动态表现、实时语音打断、屏幕控制及多游戏联动等丰富功能，让交互体验更接近真人。

my-neuro 既适合喜欢折腾技术的开发者和研究人员进行模型微调与功能扩展，也提供了打包好的预设角色（如“肥牛”），让普通用户无需复杂配置即可轻松上手。其独特的技术亮点在于全链路低延迟推理、基于上下文的主动对话机制，以及能够模拟真实情绪变化的长期记忆系统。作为一个开放的“工作台”，my-neuro 邀请用户共同塑造那个真正懂你、陪伴你的理想 AI 伙伴。

使用场景

独立游戏开发者小林正在制作一款叙事驱动的解谜游戏，急需一个能理解剧情上下文、拥有独特性格且能实时互动的 NPC 原型来测试玩家体验。

没有 my-neuro 时

交互僵硬延迟高：传统聊天机器人响应往往超过数秒，打断玩家心流，且无法根据游戏情境实时调整语气和表情。
角色缺乏记忆与个性：NPC 记不住玩家之前的选择或关键剧情线索，每次对话都像初次见面，难以塑造“腹黑傲娇”等复杂人设。
多模态整合困难：想要实现“语音对话 + 口型同步 + 视觉识别（如看懂玩家画的图）”，需要分别对接多个 API 并自行编写复杂的同步逻辑，开发成本极高。
声音定制门槛高：找不到符合角色设定的声线，克隆特定音色通常需要昂贵的云服务或深厚的音频算法背景。

使用 my-neuro 后

秒级响应与实时打断：my-neuro 实现全本地推理，对话延迟控制在 1 秒以内，支持玩家随时通过语音或键盘打断 NPC 说话，交互如真人般自然流畅。
长期记忆塑造鲜活人设：利用内置的长期记忆模块，my-neuro 能记住小林的测试数据和玩家偏好，完美演绎出预设的“偶尔温柔但大多傲娇”的性格，甚至会根据过往经历产生情绪波动。
一站式多模态工作台：my-neuro 原生集成视觉识别与 Live2D 动作控制，不仅能“看懂”玩家的游戏操作，还能自动匹配对应的表情和口型，无需额外编写同步代码。
低成本声音克隆：通过集成的 GPT-SoVITS 模块，小林仅需少量录音样本即可训练出专属的角色语音，自由切换声线以匹配不同剧情状态。

my-neuro 将原本需要数月整合的多模态 AI 能力浓缩为一个可定制的桌面伙伴，让开发者能专注于创造有灵魂的数字角色而非底层架构。

运行环境要求

操作系统

Windows
未说明

GPU

本地推理模式需要高性能 GPU（具体型号和显存未说明），支持开源模型微调
若使用闭源模型 API 则对本地 GPU 无强制要求

内存

未说明

依赖

notes该项目是一个集成工作台，支持本地部署开源模型（需自行配置 LLM-studio 进行推理或微调）或接入第三方闭源 API（推荐 DMXAPI）。核心功能包括超低延迟对话、语音定制、Live2D 形象替换、游戏陪玩（如我的世界）及长期记忆。若选择全本地推理以实现低延迟，需具备相应的本地大模型运行环境；若仅作为客户端调用 API，硬件需求较低。项目默认集成 GPT-SoVITS 用于声音训练。

python未说明

GPT-SoVITS (TTS)

mindcraft-bots (Minecraft AI)

playwright-mcp (网页操作)

MemOS (记忆系统)

LLM-studio (本地模型推理/微调，可选)

快速开始

My-neuro

English | 中文

本项目部署流程请看官网：点我进官网

如何提交PR

my-neuro的目标是打造专属个人的 AI 角色,打造出逼近真人的AI伙伴 - 通过您的数据印记,塑造出心目中理想的 TA 的形象。

此项目受neuro sama启发，所以取名为my-neuro（社区提供的名称）项目可训练声音、性格、替换形象您的想象力有多丰富，模型就能多贴近您的期望。本项目更像是一个工作台。利用打包好的工具，一步步亲手描绘并实现心中理想的 AI 形象。

如果你想用全部都用本地推理，使用本地的大语言模型（LLM）推理或者微调。不基于第三方的API的话，那可以进入LLM-studio文件夹，里面有本地模型的推理、微调指导。

如果想用闭源AI模型，推荐使用 DMXAPI

支持市面上大部分主流AI模型的统一调用。

计划清单

双模型支持

开源模型：支持开源模型微调，本地部署
闭源模型：支持闭源模型接入

核心功能

超低延迟：全本地推理，对话延迟在1秒以下
字幕和语音同步输出
语音定制：支持男、女声、各种角色声线切换等
MCP支持：可使用MCP工具接入
实时打断：支持语音、键盘打断AI说话
真实情感：模拟真人的情绪变化状态，有自己的情绪状态。
超吊的人机体验(类似真人交互设计，敬请期待)
动作表情：根据对话内容展示不同的表情与动作
集成视觉能力，支持图像识别，并通过语言意图判断何时启动视觉功能
声音模型（TTS）训练支持，默认使用gpt-sovits开源项目
字幕显示中文。音频播放是外语。可自由开启关闭（适用于TTS模型本身就是外语的角色）

扩展功能

桌面控制：支持语音控制打开软件等操作
AI唱歌（功能由： @jonnytri53 资金赞助开发，特此感谢）
国外直播平台的接入
直播功能：可在哔哩哔哩平台直播
AI讲课：选择一个主题，让AI给你讲课。中途可提问。偏门课程可植入资料到数据库让AI理解
替换各类live 2d模型
web网页界面支持（已做好，近期会接入）
打字对话：可键盘打字和AI交流
主动对话：根据上下文主动发起对话。目前版本V1
联网接入，实时搜索最新信息
手机app应用：可在安卓手机上对话的肥牛
播放音效库中的音效，由模型自己决定播放何种音效
游戏陪玩，模型和用户共同游玩配合、双人、解密等游戏。目前实验游戏为：你画我猜、大富翁、galgame、我的世界等游戏（当前接入：我的世界、galgame）
长期记忆，让模型记住你的关键信息，你的个性，脾气

模型自己想要的功能（待定考虑）

变色功能：按照模型心情让屏幕变色妨碍用户
自由走动：模型自由在屏幕中移动

项目流程图

结尾画饼

我会把这几年的经验和对技术的理解都加入到此项目中。my neuro 这个名字除了蹭neuro sama的热度以外更多的是我对AI边界的想象和期待

希望有一个真正的能懂你，理解你，且永远不会觉得无聊的AI陪伴在身旁。难受就一起难受，开心就一起开心。让影视作品、小说。幻想中的形象来到现实里

不仅仅是简单的聊天交互。希望它可以融入生活，成为一个有感情的个体。一起开黑玩游戏、看视频、学习东西、睡前聊天、叫你起床、工作时不说话看你发呆，会偷偷记住你做了什么。有情绪，有属于自己的情感状态。会真正的生气

每天都会有自己的情绪变化，会有自己想要做的事。会对某句话难受很久。某个词开心很久。会记住和你在一起经历过的每一个时刻。持续理解你的一个存在。

不过最重要的是，它的个性、样子、声音，情感变化等。都由你决定，就像橡皮泥，我们来提供最好的工具，做好每个模块适配。但最终是怎么样的，由自己来构造。

不过，对于不想折腾的朋友。此项目也直接打包了一个角色，就是肥牛（fake neuro）它是一个抄袭neuro sama的角色，但是个性我把它设定成了一个腹黑、傲娇、搞笑、有小脾气，但偶尔也会展现温柔一面的样子。

更希望的是从neuro 那里模仿借鉴，理解。然后尝试创造新的内容。适合自己的东西。

我对此项目特别的有热情。当前项目已经实现了将近30%的功能。包括定性格、记忆。近期会围绕核心性格特征。也就是真正像人，有持续的情绪这块地方来开发。会在2个月内实现最像人的那部分，就是一个长期的情绪状态。同时开黑玩游戏、看视频、叫你起床等等这块部分等功能都会在6月1日前基本完成，达到60%的完成度。

希望能在今年可以把上述所有的想法都实现。

Star History

致谢

QQ群:感谢菊花茶洋参帮忙制作肥牛app的封面

感谢以下用户的资金赞助：

jonnytri53 - 感谢您的支持！为本项目捐赠的50美元
蒜头头头感谢您的大力支持！为本项目捐赠的1000人民币
东方月辰DFYC 感谢您的支持！！8月~10月每月持续捐赠100元共300人民币。
大米若叶感谢您的支持！！为本项目捐赠 68人民币
StrongerFatTiger 感谢您的支持！！为本项目捐赠 100人民币

本项目使用引用的开源项目：

TTS： https://github.com/RVC-Boss/GPT-SoVITS

AI玩我的世界： https://github.com/mindcraft-bots/mindcraft

mcp网页操作工具： https://github.com/microsoft/playwright-mcp

记忆系统： https://github.com/MemTensor/MemOS

my-neuro 快速上手指南

my-neuro 是一个旨在打造专属个人 AI 角色的开源工作台。通过该项目，您可以利用本地数据训练声音与性格，替换形象，并集成视觉、记忆及游戏陪玩等功能，构建逼近真人的 AI 伙伴。

1. 环境准备

在开始之前，请确保您的开发环境满足以下要求：

操作系统：推荐 Windows 10/11 或 Linux（部分功能如桌面控制可能对 Windows 支持更好）。
硬件要求：
- GPU：强烈建议配备 NVIDIA 显卡（支持 CUDA），用于本地大模型推理、TTS 训练及实时渲染。
- 内存：建议 16GB 及以上。
前置依赖：
- Python 3.10+
- Git
- FFmpeg（用于音频处理）
- Node.js（部分前端或工具链可能需要）
模型选择：
- 本地部署：需准备开源大语言模型（LLM）及 TTS 模型（默认支持 GPT-SoVITS）。
- API 接入：若不使用本地推理，推荐使用 DMXAPI 统一调用主流闭源模型。

2. 安装步骤

步骤一：克隆项目

使用 Git 将代码仓库拉取到本地：

git clone https://github.com/morettt/my-neuro.git
cd my-neuro

步骤二：安装依赖

进入项目目录并安装 Python 依赖包。建议使用虚拟环境：

python -m venv venv
# Windows
venv\Scripts\activate
# Linux/Mac
source venv/bin/activate

pip install -r requirements.txt

注意：若涉及深度学习组件（如 PyTorch），请根据官方文档安装对应 CUDA 版本的 torch，或使用国内镜像源加速： pip install -r requirements.txt -i https://pypi.tuna.tsinghua.edu.cn/simple

步骤三：配置模型与服务

根据您的需求选择配置方式：

本地推理模式：
- 进入 LLM-studio 文件夹，参考内部文档进行本地模型的推理配置或微调。
- 确保 TTS 模块（GPT-SoVITS）已正确配置模型路径。
API 模式（推荐新手）：
- 在项目根目录或配置文件夹中找到配置文件（通常为 .env 或 config.yaml）。
- 填入您的 DMXAPI Key 或其他支持的 LLM API Key。

步骤四：启动应用

执行主程序启动脚本：

python main.py

(注：具体启动文件名请以项目实际入口为准，如 run.py 或 start.bat)

3. 基本使用

启动成功后，您将通过命令行或弹出的图形界面与 AI 进行交互。

场景一：打字对话

直接在输入框或通过键盘输入文字，AI 将根据设定的性格（如默认的“肥牛”角色：腹黑、傲娇）进行回复，并同步输出语音和字幕。

用户：你好，今天心情怎么样？
AI (肥牛)：哼，本小姐心情好不好跟你有什么关系？不过既然你问了，那就勉强告诉你，还不错吧。

场景二：语音互动与打断

语音对话：对着麦克风说话，AI 会实时识别并回应，实现超低延迟（<1秒）的语音同步。
实时打断：在 AI 说话过程中，直接通过语音或键盘输入新内容，AI 将立即停止当前发言并响应您的新指令。

场景三：功能扩展

切换形象：在配置文件中替换 Live2D 模型文件，即可改变 AI 的外观。
游戏陪玩：启动特定游戏模块（如《我的世界》），AI 可识别游戏画面并与您协同操作。
主动对话：开启主动模式后，AI 会根据上下文记忆，在您空闲时主动发起话题。

更多详细部署流程、模型微调教程及高级功能配置，请访问项目官网：http://mynewbot.com/tutorials

版本历史

v6.4.62026/03/31

v6.4.52026/03/31

v6.4.42026/03/31

v6.4.32026/03/31

v52026/03/31

v6.4.12026/03/29

v6.42026/03/26

v42026/03/26

v32026/03/25

v6.3.92026/03/24

v6.3.82026/03/21

v6.3.72026/03/19

v6.3.62026/03/17

v6.3.52026/03/15

v6.3.42026/03/13

v6.3.32026/03/12

v6.3.22026/03/09

v6.3.12026/03/09

v6.32026/03/08

v2.02026/03/08

相似工具推荐

openclaw

OpenClaw 是一款专为个人打造的本地化 AI 助手，旨在让你在自己的设备上拥有完全可控的智能伙伴。它打破了传统 AI 助手局限于特定网页或应用的束缚，能够直接接入你日常使用的各类通讯渠道，包括微信、WhatsApp、Telegram、Discord、iMessage 等数十种平台。无论你在哪个聊天软件中发送消息，OpenClaw 都能即时响应，甚至支持在 macOS、iOS 和 Android 设备上进行语音交互，并提供实时的画布渲染功能供你操控。这款工具主要解决了用户对数据隐私、响应速度以及“始终在线”体验的需求。通过将 AI 部署在本地，用户无需依赖云端服务即可享受快速、私密的智能辅助，真正实现了“你的数据，你做主”。其独特的技术亮点在于强大的网关架构，将控制平面与核心助手分离，确保跨平台通信的流畅性与扩展性。 OpenClaw 非常适合希望构建个性化工作流的技术爱好者、开发者，以及注重隐私保护且不愿被单一生态绑定的普通用户。只要具备基础的终端操作能力（支持 macOS、Linux 及 Windows WSL2），即可通过简单的命令行引导完成部署。如果你渴望拥有一个懂你

★ 349.3k|★★★☆☆|今天

Agent开发框架图像

stable-diffusion-webui

stable-diffusion-webui 是一个基于 Gradio 构建的网页版操作界面，旨在让用户能够轻松地在本地运行和使用强大的 Stable Diffusion 图像生成模型。它解决了原始模型依赖命令行、操作门槛高且功能分散的痛点，将复杂的 AI 绘图流程整合进一个直观易用的图形化平台。无论是希望快速上手的普通创作者、需要精细控制画面细节的设计师，还是想要深入探索模型潜力的开发者与研究人员，都能从中获益。其核心亮点在于极高的功能丰富度：不仅支持文生图、图生图、局部重绘（Inpainting）和外绘（Outpainting）等基础模式，还独创了注意力机制调整、提示词矩阵、负向提示词以及“高清修复”等高级功能。此外，它内置了 GFPGAN 和 CodeFormer 等人脸修复工具，支持多种神经网络放大算法，并允许用户通过插件系统无限扩展能力。即使是显存有限的设备，stable-diffusion-webui 也提供了相应的优化选项，让高质量的 AI 艺术创作变得触手可及。

★ 162.1k|★★★☆☆|昨天

开发框架图像Agent

everything-claude-code

everything-claude-code 是一套专为 AI 编程助手（如 Claude Code、Codex、Cursor 等）打造的高性能优化系统。它不仅仅是一组配置文件，而是一个经过长期实战打磨的完整框架，旨在解决 AI 代理在实际开发中面临的效率低下、记忆丢失、安全隐患及缺乏持续学习能力等核心痛点。通过引入技能模块化、直觉增强、记忆持久化机制以及内置的安全扫描功能，everything-claude-code 能显著提升 AI 在复杂任务中的表现，帮助开发者构建更稳定、更智能的生产级 AI 代理。其独特的“研究优先”开发理念和针对 Token 消耗的优化策略，使得模型响应更快、成本更低，同时有效防御潜在的攻击向量。这套工具特别适合软件开发者、AI 研究人员以及希望深度定制 AI 工作流的技术团队使用。无论您是在构建大型代码库，还是需要 AI 协助进行安全审计与自动化测试，everything-claude-code 都能提供强大的底层支持。作为一个曾荣获 Anthropic 黑客大奖的开源项目，它融合了多语言支持与丰富的实战钩子（hooks），让 AI 真正成长为懂上

★ 140.4k|★★☆☆☆|今天

开发框架Agent语言模型

ComfyUI

ComfyUI 是一款功能强大且高度模块化的视觉 AI 引擎，专为设计和执行复杂的 Stable Diffusion 图像生成流程而打造。它摒弃了传统的代码编写模式，采用直观的节点式流程图界面，让用户通过连接不同的功能模块即可构建个性化的生成管线。这一设计巧妙解决了高级 AI 绘图工作流配置复杂、灵活性不足的痛点。用户无需具备编程背景，也能自由组合模型、调整参数并实时预览效果，轻松实现从基础文生图到多步骤高清修复等各类复杂任务。ComfyUI 拥有极佳的兼容性，不仅支持 Windows、macOS 和 Linux 全平台，还广泛适配 NVIDIA、AMD、Intel 及苹果 Silicon 等多种硬件架构，并率先支持 SDXL、Flux、SD3 等前沿模型。无论是希望深入探索算法潜力的研究人员和开发者，还是追求极致创作自由度的设计师与资深 AI 绘画爱好者，ComfyUI 都能提供强大的支持。其独特的模块化架构允许社区不断扩展新功能，使其成为当前最灵活、生态最丰富的开源扩散模型工具之一，帮助用户将创意高效转化为现实。

★ 107.7k|★★☆☆☆|3天前

开发框架图像Agent

Deep-Live-Cam

Deep-Live-Cam 是一款专注于实时换脸与视频生成的开源工具，用户仅需一张静态照片，即可通过“一键操作”实现摄像头画面的即时变脸或制作深度伪造视频。它有效解决了传统换脸技术流程繁琐、对硬件配置要求极高以及难以实时预览的痛点，让高质量的数字内容创作变得触手可及。这款工具不仅适合开发者和技术研究人员探索算法边界，更因其极简的操作逻辑（仅需三步：选脸、选摄像头、启动），广泛适用于普通用户、内容创作者、设计师及直播主播。无论是为了动画角色定制、服装展示模特替换，还是制作趣味短视频和直播互动，Deep-Live-Cam 都能提供流畅的支持。其核心技术亮点在于强大的实时处理能力，支持口型遮罩（Mouth Mask）以保留使用者原始的嘴部动作，确保表情自然精准；同时具备“人脸映射”功能，可同时对画面中的多个主体应用不同面孔。此外，项目内置了严格的内容安全过滤机制，自动拦截涉及裸露、暴力等不当素材，并倡导用户在获得授权及明确标注的前提下合规使用，体现了技术发展与伦理责任的平衡。

★ 88.9k|★★★☆☆|今天

开发框架图像Agent

NextChat

NextChat 是一款轻量且极速的 AI 助手，旨在为用户提供流畅、跨平台的大模型交互体验。它完美解决了用户在多设备间切换时难以保持对话连续性，以及面对众多 AI 模型不知如何统一管理的痛点。无论是日常办公、学习辅助还是创意激发，NextChat 都能让用户随时随地通过网页、iOS、Android、Windows、MacOS 或 Linux 端无缝接入智能服务。这款工具非常适合普通用户、学生、职场人士以及需要私有化部署的企业团队使用。对于开发者而言，它也提供了便捷的自托管方案，支持一键部署到 Vercel 或 Zeabur 等平台。 NextChat 的核心亮点在于其广泛的模型兼容性，原生支持 Claude、DeepSeek、GPT-4 及 Gemini Pro 等主流大模型，让用户在一个界面即可自由切换不同 AI 能力。此外，它还率先支持 MCP（Model Context Protocol）协议，增强了上下文处理能力。针对企业用户，NextChat 提供专业版解决方案，具备品牌定制、细粒度权限控制、内部知识库整合及安全审计等功能，满足公司对数据隐私和个性化管理的高标准要求。

★ 87.6k|★★☆☆☆|昨天

开发框架语言模型