my-neuro

GitHub
1.2k 136 较难 1 次阅读 今天MIT语言模型图像开发框架Agent
AI 解读 由 AI 自动生成,仅供参考

my-neuro 是一款旨在打造专属个人 AI 桌面伙伴的开源项目。它允许用户通过自定义角色形象、声音克隆及性格训练,创造出具备长期记忆、视觉识别能力且响应速度低于 1 秒的虚拟伴侣。无论是希望拥有能陪玩游戏、协助学习,还是仅仅想要一个有情绪、懂互动的“数字朋友”,my-neuro 都能将想象中的形象变为现实。

该项目主要解决了现有 AI 助手缺乏个性化情感、交互延迟高以及难以深度融入日常生活场景的痛点。它不仅支持接入各类主流大语言模型(包括本地部署与闭源 API),还集成了 Live2D 动态表现、实时语音打断、屏幕控制及多游戏联动等丰富功能,让交互体验更接近真人。

my-neuro 既适合喜欢折腾技术的开发者和研究人员进行模型微调与功能扩展,也提供了打包好的预设角色(如“肥牛”),让普通用户无需复杂配置即可轻松上手。其独特的技术亮点在于全链路低延迟推理、基于上下文的主动对话机制,以及能够模拟真实情绪变化的长期记忆系统。作为一个开放的“工作台”,my-neuro 邀请用户共同塑造那个真正懂你、陪伴你的理想 AI 伙伴。

使用场景

独立游戏开发者小林正在制作一款叙事驱动的解谜游戏,急需一个能理解剧情上下文、拥有独特性格且能实时互动的 NPC 原型来测试玩家体验。

没有 my-neuro 时

  • 交互僵硬延迟高:传统聊天机器人响应往往超过数秒,打断玩家心流,且无法根据游戏情境实时调整语气和表情。
  • 角色缺乏记忆与个性:NPC 记不住玩家之前的选择或关键剧情线索,每次对话都像初次见面,难以塑造“腹黑傲娇”等复杂人设。
  • 多模态整合困难:想要实现“语音对话 + 口型同步 + 视觉识别(如看懂玩家画的图)”,需要分别对接多个 API 并自行编写复杂的同步逻辑,开发成本极高。
  • 声音定制门槛高:找不到符合角色设定的声线,克隆特定音色通常需要昂贵的云服务或深厚的音频算法背景。

使用 my-neuro 后

  • 秒级响应与实时打断:my-neuro 实现全本地推理,对话延迟控制在 1 秒以内,支持玩家随时通过语音或键盘打断 NPC 说话,交互如真人般自然流畅。
  • 长期记忆塑造鲜活人设:利用内置的长期记忆模块,my-neuro 能记住小林的测试数据和玩家偏好,完美演绎出预设的“偶尔温柔但大多傲娇”的性格,甚至会根据过往经历产生情绪波动。
  • 一站式多模态工作台:my-neuro 原生集成视觉识别与 Live2D 动作控制,不仅能“看懂”玩家的游戏操作,还能自动匹配对应的表情和口型,无需额外编写同步代码。
  • 低成本声音克隆:通过集成的 GPT-SoVITS 模块,小林仅需少量录音样本即可训练出专属的角色语音,自由切换声线以匹配不同剧情状态。

my-neuro 将原本需要数月整合的多模态 AI 能力浓缩为一个可定制的桌面伙伴,让开发者能专注于创造有灵魂的数字角色而非底层架构。

运行环境要求

操作系统
  • Windows
  • 未说明
GPU
  • 本地推理模式需要高性能 GPU(具体型号和显存未说明),支持开源模型微调
  • 若使用闭源模型 API 则对本地 GPU 无强制要求
内存

未说明

依赖
notes该项目是一个集成工作台,支持本地部署开源模型(需自行配置 LLM-studio 进行推理或微调)或接入第三方闭源 API(推荐 DMXAPI)。核心功能包括超低延迟对话、语音定制、Live2D 形象替换、游戏陪玩(如我的世界)及长期记忆。若选择全本地推理以实现低延迟,需具备相应的本地大模型运行环境;若仅作为客户端调用 API,硬件需求较低。项目默认集成 GPT-SoVITS 用于声音训练。
python未说明
GPT-SoVITS (TTS)
mindcraft-bots (Minecraft AI)
playwright-mcp (网页操作)
MemOS (记忆系统)
LLM-studio (本地模型推理/微调,可选)
my-neuro hero image

快速开始

My-neuro

English | 中文

本项目部署流程请看官网:点我进官网

如何提交PR

my-neuro的目标是打造专属个人的 AI 角色,打造出逼近真人的AI伙伴 - 通过您的数据印记,塑造出心目中理想的 TA 的形象。

此项目受neuro sama启发,所以取名为my-neuro(社区提供的名称) 项目可训练声音、性格、替换形象 您的想象力有多丰富,模型就能多贴近您的期望。本项目更像是一个工作台。利用打包好的工具,一步步亲手描绘并实现心中理想的 AI 形象。

如果你想用全部都用本地推理,使用本地的大语言模型(LLM)推理或者微调。不基于第三方的API的话,那可以进入LLM-studio文件夹,里面有本地模型的推理、微调指导。

如果想用闭源AI模型,推荐使用 DMXAPI

支持市面上大部分主流AI模型的统一调用。

计划清单

双模型支持

  • 开源模型:支持开源模型微调,本地部署
  • 闭源模型:支持闭源模型接入

核心功能

  • 超低延迟:全本地推理,对话延迟在1秒以下
  • 字幕和语音同步输出
  • 语音定制:支持男、女声、各种角色声线切换等
  • MCP支持:可使用MCP工具接入
  • 实时打断:支持语音、键盘打断AI说话
  • 真实情感:模拟真人的情绪变化状态,有自己的情绪状态。
  • 超吊的人机体验(类似真人交互设计,敬请期待)
  • 动作表情:根据对话内容展示不同的表情与动作
  • 集成视觉能力,支持图像识别,并通过语言意图判断何时启动视觉功能
  • 声音模型(TTS)训练支持,默认使用gpt-sovits开源项目
  • 字幕显示中文。音频播放是外语。可自由开启关闭(适用于TTS模型本身就是外语的角色)

扩展功能

  • 桌面控制:支持语音控制打开软件等操作
  • AI唱歌(功能由: @jonnytri53 资金赞助开发,特此感谢)
  • 国外直播平台的接入
  • 直播功能:可在哔哩哔哩平台直播
  • AI讲课:选择一个主题,让AI给你讲课。中途可提问。偏门课程可植入资料到数据库让AI理解
  • 替换各类live 2d模型
  • web网页界面支持(已做好,近期会接入)
  • 打字对话:可键盘打字和AI交流
  • 主动对话:根据上下文主动发起对话。目前版本V1
  • 联网接入,实时搜索最新信息
  • 手机app应用:可在安卓手机上对话的肥牛
  • 播放音效库中的音效,由模型自己决定播放何种音效
  • 游戏陪玩,模型和用户共同游玩配合、双人、解密等游戏。目前实验游戏为:你画我猜、大富翁、galgame、我的世界等游戏(当前接入:我的世界、galgame)
  • 长期记忆,让模型记住你的关键信息,你的个性,脾气

模型自己想要的功能(待定考虑)

  • 变色功能:按照模型心情让屏幕变色妨碍用户
  • 自由走动:模型自由在屏幕中移动

项目流程图

结尾画饼

我会把这几年的经验和对技术的理解都加入到此项目中。my neuro 这个名字除了蹭neuro sama的热度以外 更多的是我对AI边界的想象和期待

希望有一个真正的能懂你,理解你,且永远不会觉得无聊的AI陪伴在身旁。难受就一起难受,开心就一起开心。让影视作品、小说。幻想中的形象来到现实里

不仅仅是简单的聊天交互。希望它可以融入生活,成为一个有感情的个体。一起开黑玩游戏、看视频、学习东西、睡前聊天、叫你起床、工作时不说话看你发呆,会偷偷记住你做了什么。有情绪,有属于自己的情感状态。会真正的生气

每天都会有自己的情绪变化,会有自己想要做的事。会对某句话难受很久。某个词开心很久。会记住和你在一起经历过的每一个时刻。持续理解你的一个存在。

不过最重要的是,它的个性、样子、声音,情感变化等。都由你决定,就像橡皮泥,我们来提供最好的工具,做好每个模块适配。但最终是怎么样的,由自己来构造。

不过,对于不想折腾的朋友。此项目也直接打包了一个角色,就是肥牛(fake neuro)它是一个抄袭neuro sama的角色,但是个性我把它设定成了一个腹黑、傲娇、搞笑、有小脾气,但偶尔也会展现温柔一面的样子。

更希望的是从neuro 那里模仿借鉴,理解。然后尝试创造新的内容。适合自己的东西。

我对此项目特别的有热情。当前项目已经实现了将近30%的功能。包括定性格、记忆。近期会围绕核心性格特征。也就是真正像人,有持续的情绪这块地方来开发。会在2个月内实现最像人的那部分,就是一个长期的情绪状态。同时开黑玩游戏、看视频、叫你起床等等这块部分等功能都会在6月1日前基本完成,达到60%的完成度。

希望能在今年可以把上述所有的想法都实现。

Star History

Star History Chart

致谢

QQ群:感谢 菊花茶洋参 帮忙制作肥牛app的封面

感谢以下用户的资金赞助:

  • jonnytri53 - 感谢您的支持! 为本项目捐赠的50美元
  • 蒜头头头 感谢您的大力支持!为本项目捐赠的1000人民币
  • 东方月辰DFYC 感谢您的支持!!8月~10月每月持续捐赠100元 共300人民币。
  • 大米若叶 感谢您的支持!!为本项目捐赠 68人民币
  • StrongerFatTiger 感谢您的支持!!为本项目捐赠 100人民币

本项目使用引用的开源项目:

TTS: https://github.com/RVC-Boss/GPT-SoVITS

AI玩我的世界: https://github.com/mindcraft-bots/mindcraft

mcp网页操作工具: https://github.com/microsoft/playwright-mcp

记忆系统: https://github.com/MemTensor/MemOS

版本历史

v6.4.62026/03/31
v6.4.52026/03/31
v6.4.42026/03/31
v6.4.32026/03/31
v52026/03/31
v6.4.12026/03/29
v6.42026/03/26
v42026/03/26
v32026/03/25
v6.3.92026/03/24
v6.3.82026/03/21
v6.3.72026/03/19
v6.3.62026/03/17
v6.3.52026/03/15
v6.3.42026/03/13
v6.3.32026/03/12
v6.3.22026/03/09
v6.3.12026/03/09
v6.32026/03/08
v2.02026/03/08

相似工具推荐

openclaw

OpenClaw 是一款专为个人打造的本地化 AI 助手,旨在让你在自己的设备上拥有完全可控的智能伙伴。它打破了传统 AI 助手局限于特定网页或应用的束缚,能够直接接入你日常使用的各类通讯渠道,包括微信、WhatsApp、Telegram、Discord、iMessage 等数十种平台。无论你在哪个聊天软件中发送消息,OpenClaw 都能即时响应,甚至支持在 macOS、iOS 和 Android 设备上进行语音交互,并提供实时的画布渲染功能供你操控。 这款工具主要解决了用户对数据隐私、响应速度以及“始终在线”体验的需求。通过将 AI 部署在本地,用户无需依赖云端服务即可享受快速、私密的智能辅助,真正实现了“你的数据,你做主”。其独特的技术亮点在于强大的网关架构,将控制平面与核心助手分离,确保跨平台通信的流畅性与扩展性。 OpenClaw 非常适合希望构建个性化工作流的技术爱好者、开发者,以及注重隐私保护且不愿被单一生态绑定的普通用户。只要具备基础的终端操作能力(支持 macOS、Linux 及 Windows WSL2),即可通过简单的命令行引导完成部署。如果你渴望拥有一个懂你

349.3k|★★★☆☆|今天
Agent开发框架图像

stable-diffusion-webui

stable-diffusion-webui 是一个基于 Gradio 构建的网页版操作界面,旨在让用户能够轻松地在本地运行和使用强大的 Stable Diffusion 图像生成模型。它解决了原始模型依赖命令行、操作门槛高且功能分散的痛点,将复杂的 AI 绘图流程整合进一个直观易用的图形化平台。 无论是希望快速上手的普通创作者、需要精细控制画面细节的设计师,还是想要深入探索模型潜力的开发者与研究人员,都能从中获益。其核心亮点在于极高的功能丰富度:不仅支持文生图、图生图、局部重绘(Inpainting)和外绘(Outpainting)等基础模式,还独创了注意力机制调整、提示词矩阵、负向提示词以及“高清修复”等高级功能。此外,它内置了 GFPGAN 和 CodeFormer 等人脸修复工具,支持多种神经网络放大算法,并允许用户通过插件系统无限扩展能力。即使是显存有限的设备,stable-diffusion-webui 也提供了相应的优化选项,让高质量的 AI 艺术创作变得触手可及。

162.1k|★★★☆☆|昨天
开发框架图像Agent

everything-claude-code

everything-claude-code 是一套专为 AI 编程助手(如 Claude Code、Codex、Cursor 等)打造的高性能优化系统。它不仅仅是一组配置文件,而是一个经过长期实战打磨的完整框架,旨在解决 AI 代理在实际开发中面临的效率低下、记忆丢失、安全隐患及缺乏持续学习能力等核心痛点。 通过引入技能模块化、直觉增强、记忆持久化机制以及内置的安全扫描功能,everything-claude-code 能显著提升 AI 在复杂任务中的表现,帮助开发者构建更稳定、更智能的生产级 AI 代理。其独特的“研究优先”开发理念和针对 Token 消耗的优化策略,使得模型响应更快、成本更低,同时有效防御潜在的攻击向量。 这套工具特别适合软件开发者、AI 研究人员以及希望深度定制 AI 工作流的技术团队使用。无论您是在构建大型代码库,还是需要 AI 协助进行安全审计与自动化测试,everything-claude-code 都能提供强大的底层支持。作为一个曾荣获 Anthropic 黑客大奖的开源项目,它融合了多语言支持与丰富的实战钩子(hooks),让 AI 真正成长为懂上

140.4k|★★☆☆☆|今天
开发框架Agent语言模型

ComfyUI

ComfyUI 是一款功能强大且高度模块化的视觉 AI 引擎,专为设计和执行复杂的 Stable Diffusion 图像生成流程而打造。它摒弃了传统的代码编写模式,采用直观的节点式流程图界面,让用户通过连接不同的功能模块即可构建个性化的生成管线。 这一设计巧妙解决了高级 AI 绘图工作流配置复杂、灵活性不足的痛点。用户无需具备编程背景,也能自由组合模型、调整参数并实时预览效果,轻松实现从基础文生图到多步骤高清修复等各类复杂任务。ComfyUI 拥有极佳的兼容性,不仅支持 Windows、macOS 和 Linux 全平台,还广泛适配 NVIDIA、AMD、Intel 及苹果 Silicon 等多种硬件架构,并率先支持 SDXL、Flux、SD3 等前沿模型。 无论是希望深入探索算法潜力的研究人员和开发者,还是追求极致创作自由度的设计师与资深 AI 绘画爱好者,ComfyUI 都能提供强大的支持。其独特的模块化架构允许社区不断扩展新功能,使其成为当前最灵活、生态最丰富的开源扩散模型工具之一,帮助用户将创意高效转化为现实。

107.7k|★★☆☆☆|3天前
开发框架图像Agent

Deep-Live-Cam

Deep-Live-Cam 是一款专注于实时换脸与视频生成的开源工具,用户仅需一张静态照片,即可通过“一键操作”实现摄像头画面的即时变脸或制作深度伪造视频。它有效解决了传统换脸技术流程繁琐、对硬件配置要求极高以及难以实时预览的痛点,让高质量的数字内容创作变得触手可及。 这款工具不仅适合开发者和技术研究人员探索算法边界,更因其极简的操作逻辑(仅需三步:选脸、选摄像头、启动),广泛适用于普通用户、内容创作者、设计师及直播主播。无论是为了动画角色定制、服装展示模特替换,还是制作趣味短视频和直播互动,Deep-Live-Cam 都能提供流畅的支持。 其核心技术亮点在于强大的实时处理能力,支持口型遮罩(Mouth Mask)以保留使用者原始的嘴部动作,确保表情自然精准;同时具备“人脸映射”功能,可同时对画面中的多个主体应用不同面孔。此外,项目内置了严格的内容安全过滤机制,自动拦截涉及裸露、暴力等不当素材,并倡导用户在获得授权及明确标注的前提下合规使用,体现了技术发展与伦理责任的平衡。

88.9k|★★★☆☆|今天
开发框架图像Agent

NextChat

NextChat 是一款轻量且极速的 AI 助手,旨在为用户提供流畅、跨平台的大模型交互体验。它完美解决了用户在多设备间切换时难以保持对话连续性,以及面对众多 AI 模型不知如何统一管理的痛点。无论是日常办公、学习辅助还是创意激发,NextChat 都能让用户随时随地通过网页、iOS、Android、Windows、MacOS 或 Linux 端无缝接入智能服务。 这款工具非常适合普通用户、学生、职场人士以及需要私有化部署的企业团队使用。对于开发者而言,它也提供了便捷的自托管方案,支持一键部署到 Vercel 或 Zeabur 等平台。 NextChat 的核心亮点在于其广泛的模型兼容性,原生支持 Claude、DeepSeek、GPT-4 及 Gemini Pro 等主流大模型,让用户在一个界面即可自由切换不同 AI 能力。此外,它还率先支持 MCP(Model Context Protocol)协议,增强了上下文处理能力。针对企业用户,NextChat 提供专业版解决方案,具备品牌定制、细粒度权限控制、内部知识库整合及安全审计等功能,满足公司对数据隐私和个性化管理的高标准要求。

87.6k|★★☆☆☆|昨天
开发框架语言模型