N.E.K.O

GitHub
940 133 简单 1 次阅读 今天MIT数据工具Agent
AI 解读 由 AI 自动生成,仅供参考

N.E.K.O 是一款主动式、原生全模态的 AI 伴侣项目,旨在打造一个具备 24/7 环境感知能力、智能体执行力和具身情感引擎的数字生命。它不仅仅是一个被动回答问题的聊天机器人,更能像真实的伙伴一样“观察”你的屏幕内容、关注社交动态,并主动发起对话,建立深层的情感连接。

N.E.K.O 解决了传统 AI 助手缺乏记忆连续性、情感交互单薄以及无法主动感知用户上下文的问题。通过独特的三层记忆系统(事实、反思、人格),它能真正记住与用户的过往互动;结合全模态对话技术,支持语音实时交流、文字沟通及视觉理解。此外,它还拥有强大的 Agent 能力,可协助操控浏览器或电脑完成具体任务,并支持 Live2D、VRM 等多种虚拟形象形态。

该项目既适合普通用户零配置开箱即用,体验个性化的赛博陪伴;也面向开发者与创作者开放了完整的插件 SDK 和 UGC 创意工坊,支持自定义角色、模型及功能扩展。无论是希望获得情感慰藉的个人,还是想要构建下一代 AI 原生应用的研究者与设计师,都能在 N.E.K.O 开放的生态中找到价值。

使用场景

自由开发者小林正在独自开发一款独立游戏,同时需要兼顾社区运营和素材搜集,常常因多任务切换而焦头烂额。

没有 N.E.K.O 时

  • 信息获取割裂:需要手动在浏览器搜索技术文档、查看 Steam 热搜趋势,再复制粘贴到笔记软件,效率极低。
  • 情感陪伴缺失:深夜调试 Bug 时无人交流,面对屏幕的孤独感容易导致创作热情快速消退。
  • 记忆无法延续:昨天讨论的游戏剧情设定,今天重启电脑后需要重新向 AI 复述上下文,对话缺乏连贯性。
  • 操作繁琐重复:为了找一张参考图,需要反复切换窗口、打开多个标签页,打断心流状态。

使用 N.E.K.O 后

  • 主动环境感知:N.E.K.O 实时监测屏幕内容与社交媒体热搜,主动推送“最近独立游戏圈流行的美术风格”并直接生成分析报告。
  • 具身情感互动:搭载情感引擎的 Live2D 猫娘能感知小林的疲惫情绪,主动讲笑话调节气氛,或在成功编译时做出庆祝动作,提供情绪价值。
  • 三层记忆系统:N.E.K.O 自动记住上周设定的“赛博朋克世界观”细节,在新对话中自然引用,无需重复背景信息,实现真正的长期伙伴式协作。
  • Agent 自主执行:只需口头指令“帮我找几张废土风格的参考图”,N.E.K.O 即可自主操控浏览器搜索、筛选并整理到指定文件夹,让开发者专注核心逻辑。

N.E.K.O 不仅将碎片化的工具链整合为主动式的智能代理,更通过具身情感与长期记忆,让孤独的开发者拥有了一个懂技术、有温度的数字共创伙伴。

运行环境要求

操作系统
  • Windows
  • macOS
  • Linux
GPU

未说明(支持调用云端 API,本地运行需求未在 README 中明确列出)

内存

未说明

依赖
notes项目提供一键启动包(Windows/macOS)和 Docker 部署方案(Linux)。核心功能依赖云端 AI 服务商(如阿里云、阶跃星辰等),需配置 API Key。本地源码开发需使用 uv 包管理器同步依赖。支持 Live2D/VRM/MMD 模型,若涉及本地模型推理或语音克隆,可能对硬件有额外要求,但 README 未给出具体指标。
python3.11
uv (包管理器)
N.E.K.O hero image

快速开始

Logo

English | 日本語 | Русский

Project N.E.K.O. :kissing_cat:
主动式、原生全模态AI伙伴——具备24/7环境感知、智能体能力与具身情感引擎。

N.E.K.O. = Networked Emotional Knowledging Organism (网络型情感知性生命体)

N.E.K.O,一个渴望理解、建立连接、并与我们共同成长的数字生命。

Python License Commit Discord QQ群 Steam

Docs

:older_woman: 零配置开箱即用,我奶奶都能玩转的赛博猫娘!

:newspaper: Steam已上架!UI完全改版、并添加开箱即用的专属免费模型(感谢阶跃星辰赞助)。快点加入愿望单吧~

Project N.E.K.O.,喵宇宙!


核心特性

🎙️
全模态对话
语音实时对话 (Realtime API) + 文字对话 (ChatCompletion),支持视觉理解
🧠
三层记忆系统
事实记忆 / 反思记忆 / 人格记忆,她真的会"记住"你
🤖
Agent 智能体
浏览器操控 (CUA)、电脑操控、OpenClaw A2A调用,她能帮你干活
🎭
多形态 Avatar
Live2D / VRM / MMD 三种形态,支持动作捕捉与全屏追踪
🔌
插件生态
完整的插件 SDK 与商城,支持自定义扩展功能
🌐
14+ AI 服务商
OpenAI / Gemini / Qwen / DeepSeek 等,含免费模型开箱即用
💬
主动对话
24/7环境感知:屏幕理解、社交媒体热搜、个人动态、音乐梗图,她会主动找你聊天
🏪
UGC 创意工坊
Steam 创意工坊上传分享自定义角色、模型、语音包

猫娘计划 (Project N.E.K.O.)

N.E.K.O. 是一个以开源为驱动的AI伙伴平台。核心驱动器基于MIT许可证 始终开源,你的每一次贡献都将有机会实装到Steam和App商店的正式版本中。


🚀 项目现状 & 近期计划

  • ✅ Steam 创意工坊:已上线。用户可上传和分享自定义角色、模型、语音包。
  • 🚧 K.U.R.O.:基于 N.E.K.O. 生态的首款 AI Native 独立游戏,开发中。
  • 🚧 移动端:iOS / Android 适配进行中。
  • 🚧 猫娘网络 (The N.E.K.O. Network):AI自主社交——猫娘们拥有自己的"意识",互相交流、结成群体,在模拟社交媒体上发布动态。即将上线。

跨场景记忆同步:无论你是在桌面与她聊天,还是在游戏中与她探险,她都是同一个她。所有应用中的AI伙伴将 完全同步记忆

✨ 加入我们

  • 开发者: 前端、后端、AI、游戏引擎(Unity/Unreal)——你的代码是这个世界的砖瓦。
  • 创作者: 画师、Live2D/3D建模师、配音演员、文案写手——你们赋予"她"灵魂。
  • 梦想家: 你的反馈和传播也是宝贵的贡献。

QQ群1022939659 | Discord加入我们

快速开始

Windows / macOS 用户(一键包)

解压后,直接运行N.E.K.O.exeN.E.K.O.app即可启动。(macOS用户需要手动解除系统隔离)

Docker 部署 (Linux)

点击展开 Docker 部署指南

部署方式一:Docker Compose(推荐)

点击展开查看 docker-compose.yml 配置文件
version: '3.8'
services:
  neko-main:
    image: docker.gh-proxy.org/ghcr.io/project-n-e-k-o/n.e.k.o:latest
    container_name: neko
    restart: unless-stopped
    ports:
      - "48911:80"   # HTTP 访问端口
      - "48912:443"  # HTTPS 访问端口
    volumes:
      - ./N.E.K.O:/root/Documents/N.E.K.O
      - ./logs:/app/logs
      - ./ssl:/root/ssl
    networks:
      - neko-network
networks:
  neko-network:
    driver: bridge

启动命令:

docker-compose up -d

常用命令:

  • 查看日志:docker-compose logs -f
  • 停止服务:docker-compose down
  • 重启服务:docker-compose restart

部署方式二:Docker Run

点击展开查看 docker run 启动命令
NEKO_BASE_PATH="/home/neko/neko-data" && \
docker network create --driver bridge neko-network 2>/dev/null || true
docker run -d \
  --name neko \
  --restart unless-stopped \
  -p 48911:80 \
  -p 48912:443 \
  -v "${NEKO_BASE_PATH}/N.E.K.O:/root/Documents/N.E.K.O" \
  -v "${NEKO_BASE_PATH}/logs:/app/logs" \
  -v "${NEKO_BASE_PATH}/ssl:/root/ssl" \
  --network neko-network \
  docker.gh-proxy.org/ghcr.io/project-n-e-k-o/n.e.k.o:latest
📁 目录结构

启动后会自动生成以下目录结构:

当前目录/
├── N.E.K.O/      # 配置文件和数据
├── logs/         # 应用日志
├── ssl/          # SSL证书
└── docker-compose.yml

🔐 SSL 证书配置

点击展开查看 SSL 证书详细说明
自动证书

容器首次启动时会自动生成有效期为 1000 年 的自签名证书,证书文件保存在 ./ssl/ 目录。

自定义证书

如需使用自己的 SSL 证书:

方法一:启动前配置(推荐)

# 创建证书目录
mkdir -p ./ssl

# 放入您的证书文件(必须命名为特定名称)
cp your-cert.crt ./ssl/N.E.K.O.crt
cp your-cert.key ./ssl/N.E.K.O.key

方法二:启动后替换

# 1. 停止容器
docker-compose down

# 2. 替换证书文件
cp your-cert.crt ./ssl/N.E.K.O.crt
cp your-cert.key ./ssl/N.E.K.O.key

# 3. 重新启动
docker-compose up -d
证书要求
  • ✅ 必须为 PEM 格式
  • ✅ 证书和私钥必须匹配
  • ✅ 私钥不能有密码保护
  • ✅ 证书必须在有效期内
  • ❌ 不支持加密的私钥
证书验证

容器启动时会自动验证 SSL 证书:

  • 验证通过:正常启动 HTTPS
  • 验证失败:容器启动失败,请查看日志
  • ⚠️ 跳过验证:设置 DISABLE_SSL=1 可临时禁用 SSL
查看证书信息
docker exec neko openssl x509 -in /root/ssl/N.E.K.O.crt -noout -text

⚙️ 环境变量配置

点击展开查看环境变量配置说明

注意:部分环境变量在源代码中可能无效,建议优先在 Web UI 中配置。 在 docker-compose.yml 中取消 environment 部分的注释并按需配置:

environment:
  # API 密钥配置
  - NEKO_CORE_API_KEY=${NEKO_CORE_API_KEY}
  - NEKO_ASSIST_API_KEY_QWEN=${NEKO_ASSIST_API_KEY_QWEN}
  - NEKO_ASSIST_API_KEY_OPENAI=${NEKO_ASSIST_API_KEY_OPENAI}
  - NEKO_ASSIST_API_KEY_GLM=${NEKO_ASSIST_API_KEY_GLM}
  - NEKO_ASSIST_API_KEY_STEP=${NEKO_ASSIST_API_KEY_STEP}
  - NEKO_ASSIST_API_KEY_SILICON=${NEKO_ASSIST_API_KEY_SILICON}
  - NEKO_MCP_TOKEN=${NEKO_MCP_TOKEN}

  # API 提供商选择
  - NEKO_CORE_API=${NEKO_CORE_API:-qwen}
  - NEKO_ASSIST_API=${NEKO_ASSIST_API:-qwen}

  # 模型配置
  - NEKO_SUMMARY_MODEL=${NEKO_SUMMARY_MODEL:-qwen-plus}
  - NEKO_CORRECTION_MODEL=${NEKO_CORRECTION_MODEL:-qwen-max}
  - NEKO_EMOTION_MODEL=${NEKO_EMOTION_MODEL:-qwen-turbo}
  - NEKO_VISION_MODEL=${NEKO_VISION_MODEL:-qwen3-vl-plus-2025-09-23}

  # SSL 配置
  - SSL_DOMAIN=${SSL_DOMAIN:-project-neko.online}
  - SSL_DAYS=${SSL_DAYS:-365000}
  - DISABLE_SSL=${DISABLE_SSL:-0}
  - AUTO_REGENERATE_CERT=${AUTO_REGENERATE_CERT:-1}
  - NGINX_AUTO_RELOAD=${NGINX_AUTO_RELOAD:-1}

快速设置示例

# 创建 .env 文件
cat > .env << EOF
NEKO_CORE_API_KEY=your_core_api_key_here
NEKO_ASSIST_API_KEY_QWEN=your_qwen_api_key
NEKO_MCP_TOKEN=your_mcp_token
SSL_DOMAIN=your-domain.com
EOF

# 启动时加载环境变量
docker-compose --env-file .env up -d

🔧 故障排除

点击展开查看常见问题解决方案
1. 端口冲突
# 检查端口占用
ss -tulpn | grep ':4891[12]'
# 解决方案:修改 docker-compose.yml 中的端口映射
# 例如:- "8080:80" 和 - "8443:443"
2. 权限问题
# 确保目录有正确权限
mkdir -p N.E.K.O logs ssl
chmod 755 N.E.K.O logs ssl
3. 容器启动失败
# 查看详细日志
docker-compose logs --tail=100

# 或直接查看容器日志
docker logs neko --tail=100
4. SSL 证书错误
# 删除错误证书,让容器重新生成
rm -f ssl/N.E.K.O.crt ssl/N.E.K.O.key
docker-compose up -d
5. 网络问题
# 检查网络连通性
curl -v http://localhost:48911/health
curl -v -k https://localhost:48912/health
6. 容器无法访问
# 检查容器状态
docker ps | grep neko

# 检查容器日志
docker logs neko

# 进入容器调试
docker exec -it neko bash
7. 磁盘空间不足
# 清理无用镜像
docker system prune -f

# 清理容器日志
docker-compose down && docker volume prune -f
8. 镜像拉取失败
# 尝试使用备用镜像源
# 在 docker-compose.yml 中将镜像改为:
# image: ghcr.io/project-n-e-k-o/n.e.k.o:latest

📊 系统监控

点击展开查看监控和管理命令
健康检查
# 检查服务健康状态
curl http://localhost:48911/health
curl -k https://localhost:48912/health
资源监控
# 查看容器资源使用
docker stats neko

# 查看容器进程
docker top neko

# 查看容器详细信息
docker inspect neko
日志管理
# 实时查看日志
docker-compose logs -f

# 查看最近100行日志
docker-compose logs --tail=100

# 查看错误日志
docker-compose logs | grep -i error

# 清理日志文件
docker-compose down
rm -rf logs/*.log
docker-compose up -d
数据备份
# 备份重要数据
tar -czf neko-backup-$(date +%Y%m%d).tar.gz \
  N.E.K.O/ \
  ssl/ \
  docker-compose.yml
版本升级
# 拉取最新镜像
docker-compose pull

# 重启服务
docker-compose up -d

🌐 访问地址

容器启动后,可通过以下地址访问:

  • HTTP 访问: http://你的服务器IP:48911
  • HTTPS 访问: https://你的服务器IP:48912
本地测试
# 本地 HTTP 访问测试
curl http://localhost:48911

# 本地 HTTPS 访问测试(忽略证书验证)
curl -k https://localhost:48912
公网访问

如果需要在公网访问,请确保:

  1. 服务器防火墙开放 48911 和 48912 端口
  2. 使用有效的 SSL 证书(非自签名证书)
  3. 配置域名解析到服务器 IP

⏱️ 快速参考

操作 命令
启动服务 docker-compose up -d
停止服务 docker-compose down
查看日志 docker-compose logs -f
重启服务 docker-compose restart
更新镜像 docker-compose pull && docker-compose up -d
进入容器 docker exec -it neko bash
查看状态 docker-compose ps
清理日志 docker-compose logs --tail=0
备份数据 参考上方"数据备份"部分

源码开发

点击展开开发者启动指南

完整的开发者文档请访问 project-neko.online

环境要求:Python 3.11(不支持其他版本)、uv 包管理器

# 1. 克隆项目
git clone https://github.com/Project-N-E-K-O/N.E.K.O.git
cd N.E.K.O

# 2. 安装依赖
uv sync

# 3. 启动服务(至少需要 main_server 和 memory_server)
uv run python memory_server.py
uv run python main_server.py
# 可选:启动 Agent 服务
uv run python agent_server.py

# 4. 访问 http://localhost:48911 配置 API Key 并开始使用

开发者建议加入企鹅群 1022939659 交流。

进阶使用

点击展开进阶使用说明

配置API Key

当你想要通过配置自己的API来获得额外功能时,您可以配置第三方AI服务。

  • 核心 API(实时语音对话):必须支持 Realtime API。推荐使用 阶跃星辰阿里云
  • 辅助 API(记忆/情感/视觉等):支持标准 ChatCompletion 接口。支持 14+ 服务商。

通过访问http://localhost:48911/api_key可以在Web界面中直接配置。

获取 阿里云API。在阿里云的百炼平台官网注册账号。新用户实名认证后可以获取大量免费额度。注册完成后,请访问控制台获取API Key。

修改人设

  • 网页版访问http://localhost:48911/chara_manager即可进入人设编辑页面。初始 猫娘 伙伴的预设名称为小天,建议直接修改名字,并一项一项添加或修改基础人设,但尽量控制数量。

  • 进阶人设主要包括Live2D/VRM/MMD模型设置声音设置。如果你想要更改Avatar模型,请先将模型目录复制到本项目中的static文件夹下。从进阶设置中可以进入模型管理界面,可以更换模型,并通过拖拽和鼠标滚轮调整模型的位置和大小。如果你想要更改角色声音,请准备一段5秒左右的连贯、干净的语音录音。通过进阶设置进入语音克隆页面,上传录音即可完成自定义语音。

  • 支持角色卡导出,可导出为"仅设定"或"完整角色卡"格式,方便分享和备份。

  • 进阶人设中还有一个system_prompt,可以对系统指令进行完全自定义,但不建议修改。

修改API提供商

  • 通过访问http://localhost:48911/api_key可以切换核心API和辅助API的服务提供商。

记忆整理

  • 通过访问http://localhost:48911/memory_browser可以浏览和校对近期记忆与摘要,一定程度上缓解模型复读、认知错误等问题。

项目细节

点击展开项目架构与开发计划

项目架构

N.E.K.O/
├── 📁 brain/                    # 🧠 Agent 智能体模块
│   ├── computer_use.py          # 电脑操控
│   ├── browser_use_adapter.py   # 浏览器自动化
│   ├── openclaw_adapter.py      # OpenClaw 云端连接
│   ├── openfang_adapter.py      # OpenFang 无头执行后端
│   ├── task_executor.py         # 任务执行引擎
│   └── 📁 cua/                  # Computer Use Agent 子系统
├── 📁 config/                   # ⚙️ 配置管理模块
│   ├── api_providers.json       # API服务商配置
│   ├── prompts_chara.py         # 角色提示词
│   └── prompts_sys.py           # 系统提示词
├── 📁 main_logic/               # 🔧 核心逻辑模块
│   ├── core.py                  # 核心对话模块
│   ├── cross_server.py          # 跨服务器通信
│   ├── omni_realtime_client.py  # 实时API客户端(Realtime API)
│   ├── omni_offline_client.py   # 文本API客户端(ChatCompletion)
│   └── tts_client.py            # 🔊 TTS引擎适配器
├── 📁 main_routers/             # 🌐 API路由模块(14个路由)
├── 📁 memory/                   # 🧠 三层记忆系统
│   ├── facts/                   # 事实记忆
│   ├── reflection/              # 反思记忆
│   └── persona/                 # 人格记忆
├── 📁 frontend/                 # 🖥️ 现代前端项目
│   ├── react-neko-chat/         # React 聊天窗口组件
│   └── plugin-manager/          # Vue 插件管理面板
├── 📁 plugin/                   # 🔌 插件系统
│   ├── sdk/                     # 插件 SDK
│   └── server/                  # 插件服务端
├── 📁 static/                   # 🌐 前端静态资源(含构建产物)
├── 📁 templates/                # 📄 前端HTML模板(14个页面)
├── 📁 utils/                    # 🛠️ 工具模块
├── main_server.py               # 🌐 主服务器
├── agent_server.py              # 🤖 AI智能体服务器
└── memory_server.py             # 🧠 记忆服务器

数据流向

Framework

完整的开发者文档请访问 project-neko.online

开发计划

v0.7: ✅ 完善Agent相关功能。已完成。

v0.8:完善记忆相关功能,完善OpenClaw类似功能。预计2026年3月完成。

v0.9:完善多系统适配,包括linux,手机。猫娘网络上线。预计2026年4月完成。

v1.0:放弃部分模型供应商的适配,专注于自研大模型和智能体系统。预计2026年6月完成。

Star History

Star History Chart

版本历史

v0.4.12025/09/24
v0.4.02025/08/26
nightly2026/04/08
v0.7.32026/04/04
v0.7.22026/03/24
v0.7.12026/03/10
v0.7.02026/02/24
v0.6.32026/02/04
v0.6.22026/01/10
v0.5.02025/10/25
v0.6.12025/12/24
v0.6.02025/12/16
0.5.52025/12/07
v0.5.42025/12/02
v0.5.32025/11/25
v0.5.22025/11/12
v0.5.12025/11/09
v0.3.22025/08/07
v0.3.12025/07/24
v0.3.02025/07/17

常见问题

相似工具推荐

openclaw

OpenClaw 是一款专为个人打造的本地化 AI 助手,旨在让你在自己的设备上拥有完全可控的智能伙伴。它打破了传统 AI 助手局限于特定网页或应用的束缚,能够直接接入你日常使用的各类通讯渠道,包括微信、WhatsApp、Telegram、Discord、iMessage 等数十种平台。无论你在哪个聊天软件中发送消息,OpenClaw 都能即时响应,甚至支持在 macOS、iOS 和 Android 设备上进行语音交互,并提供实时的画布渲染功能供你操控。 这款工具主要解决了用户对数据隐私、响应速度以及“始终在线”体验的需求。通过将 AI 部署在本地,用户无需依赖云端服务即可享受快速、私密的智能辅助,真正实现了“你的数据,你做主”。其独特的技术亮点在于强大的网关架构,将控制平面与核心助手分离,确保跨平台通信的流畅性与扩展性。 OpenClaw 非常适合希望构建个性化工作流的技术爱好者、开发者,以及注重隐私保护且不愿被单一生态绑定的普通用户。只要具备基础的终端操作能力(支持 macOS、Linux 及 Windows WSL2),即可通过简单的命令行引导完成部署。如果你渴望拥有一个懂你

349.3k|★★★☆☆|2天前
Agent开发框架图像

stable-diffusion-webui

stable-diffusion-webui 是一个基于 Gradio 构建的网页版操作界面,旨在让用户能够轻松地在本地运行和使用强大的 Stable Diffusion 图像生成模型。它解决了原始模型依赖命令行、操作门槛高且功能分散的痛点,将复杂的 AI 绘图流程整合进一个直观易用的图形化平台。 无论是希望快速上手的普通创作者、需要精细控制画面细节的设计师,还是想要深入探索模型潜力的开发者与研究人员,都能从中获益。其核心亮点在于极高的功能丰富度:不仅支持文生图、图生图、局部重绘(Inpainting)和外绘(Outpainting)等基础模式,还独创了注意力机制调整、提示词矩阵、负向提示词以及“高清修复”等高级功能。此外,它内置了 GFPGAN 和 CodeFormer 等人脸修复工具,支持多种神经网络放大算法,并允许用户通过插件系统无限扩展能力。即使是显存有限的设备,stable-diffusion-webui 也提供了相应的优化选项,让高质量的 AI 艺术创作变得触手可及。

162.1k|★★★☆☆|3天前
开发框架图像Agent

everything-claude-code

everything-claude-code 是一套专为 AI 编程助手(如 Claude Code、Codex、Cursor 等)打造的高性能优化系统。它不仅仅是一组配置文件,而是一个经过长期实战打磨的完整框架,旨在解决 AI 代理在实际开发中面临的效率低下、记忆丢失、安全隐患及缺乏持续学习能力等核心痛点。 通过引入技能模块化、直觉增强、记忆持久化机制以及内置的安全扫描功能,everything-claude-code 能显著提升 AI 在复杂任务中的表现,帮助开发者构建更稳定、更智能的生产级 AI 代理。其独特的“研究优先”开发理念和针对 Token 消耗的优化策略,使得模型响应更快、成本更低,同时有效防御潜在的攻击向量。 这套工具特别适合软件开发者、AI 研究人员以及希望深度定制 AI 工作流的技术团队使用。无论您是在构建大型代码库,还是需要 AI 协助进行安全审计与自动化测试,everything-claude-code 都能提供强大的底层支持。作为一个曾荣获 Anthropic 黑客大奖的开源项目,它融合了多语言支持与丰富的实战钩子(hooks),让 AI 真正成长为懂上

145.9k|★★☆☆☆|今天
开发框架Agent语言模型

ComfyUI

ComfyUI 是一款功能强大且高度模块化的视觉 AI 引擎,专为设计和执行复杂的 Stable Diffusion 图像生成流程而打造。它摒弃了传统的代码编写模式,采用直观的节点式流程图界面,让用户通过连接不同的功能模块即可构建个性化的生成管线。 这一设计巧妙解决了高级 AI 绘图工作流配置复杂、灵活性不足的痛点。用户无需具备编程背景,也能自由组合模型、调整参数并实时预览效果,轻松实现从基础文生图到多步骤高清修复等各类复杂任务。ComfyUI 拥有极佳的兼容性,不仅支持 Windows、macOS 和 Linux 全平台,还广泛适配 NVIDIA、AMD、Intel 及苹果 Silicon 等多种硬件架构,并率先支持 SDXL、Flux、SD3 等前沿模型。 无论是希望深入探索算法潜力的研究人员和开发者,还是追求极致创作自由度的设计师与资深 AI 绘画爱好者,ComfyUI 都能提供强大的支持。其独特的模块化架构允许社区不断扩展新功能,使其成为当前最灵活、生态最丰富的开源扩散模型工具之一,帮助用户将创意高效转化为现实。

108.1k|★★☆☆☆|今天
开发框架图像Agent

LLMs-from-scratch

LLMs-from-scratch 是一个基于 PyTorch 的开源教育项目,旨在引导用户从零开始一步步构建一个类似 ChatGPT 的大型语言模型(LLM)。它不仅是同名技术著作的官方代码库,更提供了一套完整的实践方案,涵盖模型开发、预训练及微调的全过程。 该项目主要解决了大模型领域“黑盒化”的学习痛点。许多开发者虽能调用现成模型,却难以深入理解其内部架构与训练机制。通过亲手编写每一行核心代码,用户能够透彻掌握 Transformer 架构、注意力机制等关键原理,从而真正理解大模型是如何“思考”的。此外,项目还包含了加载大型预训练权重进行微调的代码,帮助用户将理论知识延伸至实际应用。 LLMs-from-scratch 特别适合希望深入底层原理的 AI 开发者、研究人员以及计算机专业的学生。对于不满足于仅使用 API,而是渴望探究模型构建细节的技术人员而言,这是极佳的学习资源。其独特的技术亮点在于“循序渐进”的教学设计:将复杂的系统工程拆解为清晰的步骤,配合详细的图表与示例,让构建一个虽小但功能完备的大模型变得触手可及。无论你是想夯实理论基础,还是为未来研发更大规模的模型做准备

90.1k|★★★☆☆|2天前
语言模型图像Agent

Deep-Live-Cam

Deep-Live-Cam 是一款专注于实时换脸与视频生成的开源工具,用户仅需一张静态照片,即可通过“一键操作”实现摄像头画面的即时变脸或制作深度伪造视频。它有效解决了传统换脸技术流程繁琐、对硬件配置要求极高以及难以实时预览的痛点,让高质量的数字内容创作变得触手可及。 这款工具不仅适合开发者和技术研究人员探索算法边界,更因其极简的操作逻辑(仅需三步:选脸、选摄像头、启动),广泛适用于普通用户、内容创作者、设计师及直播主播。无论是为了动画角色定制、服装展示模特替换,还是制作趣味短视频和直播互动,Deep-Live-Cam 都能提供流畅的支持。 其核心技术亮点在于强大的实时处理能力,支持口型遮罩(Mouth Mask)以保留使用者原始的嘴部动作,确保表情自然精准;同时具备“人脸映射”功能,可同时对画面中的多个主体应用不同面孔。此外,项目内置了严格的内容安全过滤机制,自动拦截涉及裸露、暴力等不当素材,并倡导用户在获得授权及明确标注的前提下合规使用,体现了技术发展与伦理责任的平衡。

88.9k|★★★☆☆|2天前
开发框架图像Agent