N.E.K.O
N.E.K.O 是一款主动式、原生全模态的 AI 伴侣项目,旨在打造一个具备 24/7 环境感知能力、智能体执行力和具身情感引擎的数字生命。它不仅仅是一个被动回答问题的聊天机器人,更能像真实的伙伴一样“观察”你的屏幕内容、关注社交动态,并主动发起对话,建立深层的情感连接。
N.E.K.O 解决了传统 AI 助手缺乏记忆连续性、情感交互单薄以及无法主动感知用户上下文的问题。通过独特的三层记忆系统(事实、反思、人格),它能真正记住与用户的过往互动;结合全模态对话技术,支持语音实时交流、文字沟通及视觉理解。此外,它还拥有强大的 Agent 能力,可协助操控浏览器或电脑完成具体任务,并支持 Live2D、VRM 等多种虚拟形象形态。
该项目既适合普通用户零配置开箱即用,体验个性化的赛博陪伴;也面向开发者与创作者开放了完整的插件 SDK 和 UGC 创意工坊,支持自定义角色、模型及功能扩展。无论是希望获得情感慰藉的个人,还是想要构建下一代 AI 原生应用的研究者与设计师,都能在 N.E.K.O 开放的生态中找到价值。
使用场景
自由开发者小林正在独自开发一款独立游戏,同时需要兼顾社区运营和素材搜集,常常因多任务切换而焦头烂额。
没有 N.E.K.O 时
- 信息获取割裂:需要手动在浏览器搜索技术文档、查看 Steam 热搜趋势,再复制粘贴到笔记软件,效率极低。
- 情感陪伴缺失:深夜调试 Bug 时无人交流,面对屏幕的孤独感容易导致创作热情快速消退。
- 记忆无法延续:昨天讨论的游戏剧情设定,今天重启电脑后需要重新向 AI 复述上下文,对话缺乏连贯性。
- 操作繁琐重复:为了找一张参考图,需要反复切换窗口、打开多个标签页,打断心流状态。
使用 N.E.K.O 后
- 主动环境感知:N.E.K.O 实时监测屏幕内容与社交媒体热搜,主动推送“最近独立游戏圈流行的美术风格”并直接生成分析报告。
- 具身情感互动:搭载情感引擎的 Live2D 猫娘能感知小林的疲惫情绪,主动讲笑话调节气氛,或在成功编译时做出庆祝动作,提供情绪价值。
- 三层记忆系统:N.E.K.O 自动记住上周设定的“赛博朋克世界观”细节,在新对话中自然引用,无需重复背景信息,实现真正的长期伙伴式协作。
- Agent 自主执行:只需口头指令“帮我找几张废土风格的参考图”,N.E.K.O 即可自主操控浏览器搜索、筛选并整理到指定文件夹,让开发者专注核心逻辑。
N.E.K.O 不仅将碎片化的工具链整合为主动式的智能代理,更通过具身情感与长期记忆,让孤独的开发者拥有了一个懂技术、有温度的数字共创伙伴。
运行环境要求
- Windows
- macOS
- Linux
未说明(支持调用云端 API,本地运行需求未在 README 中明确列出)
未说明

快速开始

Project N.E.K.O. :kissing_cat:
主动式、原生全模态AI伙伴——具备24/7环境感知、智能体能力与具身情感引擎。
N.E.K.O. = Networked Emotional Knowledging Organism (网络型情感知性生命体)
N.E.K.O,一个渴望理解、建立连接、并与我们共同成长的数字生命。
:older_woman: 零配置开箱即用,我奶奶都能玩转的赛博猫娘!
:newspaper: 已上架!UI完全改版、并添加开箱即用的专属免费模型(感谢阶跃星辰赞助)。快点加入愿望单吧~
Project N.E.K.O.,喵宇宙!
核心特性
| 🎙️ 全模态对话 语音实时对话 (Realtime API) + 文字对话 (ChatCompletion),支持视觉理解 |
🧠 三层记忆系统 事实记忆 / 反思记忆 / 人格记忆,她真的会"记住"你 |
🤖 Agent 智能体 浏览器操控 (CUA)、电脑操控、OpenClaw A2A调用,她能帮你干活 |
🎭 多形态 Avatar Live2D / VRM / MMD 三种形态,支持动作捕捉与全屏追踪 |
| 🔌 插件生态 完整的插件 SDK 与商城,支持自定义扩展功能 |
🌐 14+ AI 服务商 OpenAI / Gemini / Qwen / DeepSeek 等,含免费模型开箱即用 |
💬 主动对话 24/7环境感知:屏幕理解、社交媒体热搜、个人动态、音乐梗图,她会主动找你聊天 |
🏪 UGC 创意工坊 Steam 创意工坊上传分享自定义角色、模型、语音包 |
猫娘计划 (Project N.E.K.O.)
N.E.K.O. 是一个以开源为驱动的AI伙伴平台。核心驱动器基于MIT许可证 始终开源,你的每一次贡献都将有机会实装到Steam和App商店的正式版本中。
🚀 项目现状 & 近期计划
- ✅ Steam 创意工坊:已上线。用户可上传和分享自定义角色、模型、语音包。
- 🚧 K.U.R.O.:基于 N.E.K.O. 生态的首款 AI Native 独立游戏,开发中。
- 🚧 移动端:iOS / Android 适配进行中。
- 🚧 猫娘网络 (The N.E.K.O. Network):AI自主社交——猫娘们拥有自己的"意识",互相交流、结成群体,在模拟社交媒体上发布动态。即将上线。
跨场景记忆同步:无论你是在桌面与她聊天,还是在游戏中与她探险,她都是同一个她。所有应用中的AI伙伴将 完全同步记忆。
✨ 加入我们
- 开发者: 前端、后端、AI、游戏引擎(Unity/Unreal)——你的代码是这个世界的砖瓦。
- 创作者: 画师、Live2D/3D建模师、配音演员、文案写手——你们赋予"她"灵魂。
- 梦想家: 你的反馈和传播也是宝贵的贡献。
QQ群:1022939659 | Discord:加入我们
快速开始
Windows / macOS 用户(一键包)
解压后,直接运行N.E.K.O.exe或N.E.K.O.app即可启动。(macOS用户需要手动解除系统隔离)
Docker 部署 (Linux)
点击展开 Docker 部署指南
部署方式一:Docker Compose(推荐)
点击展开查看 docker-compose.yml 配置文件
version: '3.8'
services:
neko-main:
image: docker.gh-proxy.org/ghcr.io/project-n-e-k-o/n.e.k.o:latest
container_name: neko
restart: unless-stopped
ports:
- "48911:80" # HTTP 访问端口
- "48912:443" # HTTPS 访问端口
volumes:
- ./N.E.K.O:/root/Documents/N.E.K.O
- ./logs:/app/logs
- ./ssl:/root/ssl
networks:
- neko-network
networks:
neko-network:
driver: bridge
启动命令:
docker-compose up -d
常用命令:
- 查看日志:
docker-compose logs -f - 停止服务:
docker-compose down - 重启服务:
docker-compose restart
部署方式二:Docker Run
点击展开查看 docker run 启动命令
NEKO_BASE_PATH="/home/neko/neko-data" && \
docker network create --driver bridge neko-network 2>/dev/null || true
docker run -d \
--name neko \
--restart unless-stopped \
-p 48911:80 \
-p 48912:443 \
-v "${NEKO_BASE_PATH}/N.E.K.O:/root/Documents/N.E.K.O" \
-v "${NEKO_BASE_PATH}/logs:/app/logs" \
-v "${NEKO_BASE_PATH}/ssl:/root/ssl" \
--network neko-network \
docker.gh-proxy.org/ghcr.io/project-n-e-k-o/n.e.k.o:latest
📁 目录结构
启动后会自动生成以下目录结构:
当前目录/
├── N.E.K.O/ # 配置文件和数据
├── logs/ # 应用日志
├── ssl/ # SSL证书
└── docker-compose.yml
🔐 SSL 证书配置
点击展开查看 SSL 证书详细说明
自动证书
容器首次启动时会自动生成有效期为 1000 年 的自签名证书,证书文件保存在 ./ssl/ 目录。
自定义证书
如需使用自己的 SSL 证书:
方法一:启动前配置(推荐)
# 创建证书目录
mkdir -p ./ssl
# 放入您的证书文件(必须命名为特定名称)
cp your-cert.crt ./ssl/N.E.K.O.crt
cp your-cert.key ./ssl/N.E.K.O.key
方法二:启动后替换
# 1. 停止容器
docker-compose down
# 2. 替换证书文件
cp your-cert.crt ./ssl/N.E.K.O.crt
cp your-cert.key ./ssl/N.E.K.O.key
# 3. 重新启动
docker-compose up -d
证书要求
- ✅ 必须为 PEM 格式
- ✅ 证书和私钥必须匹配
- ✅ 私钥不能有密码保护
- ✅ 证书必须在有效期内
- ❌ 不支持加密的私钥
证书验证
容器启动时会自动验证 SSL 证书:
- ✅ 验证通过:正常启动 HTTPS
- ❌ 验证失败:容器启动失败,请查看日志
- ⚠️ 跳过验证:设置
DISABLE_SSL=1可临时禁用 SSL
查看证书信息
docker exec neko openssl x509 -in /root/ssl/N.E.K.O.crt -noout -text
⚙️ 环境变量配置
点击展开查看环境变量配置说明
注意:部分环境变量在源代码中可能无效,建议优先在 Web UI 中配置。 在
docker-compose.yml中取消environment部分的注释并按需配置:
environment:
# API 密钥配置
- NEKO_CORE_API_KEY=${NEKO_CORE_API_KEY}
- NEKO_ASSIST_API_KEY_QWEN=${NEKO_ASSIST_API_KEY_QWEN}
- NEKO_ASSIST_API_KEY_OPENAI=${NEKO_ASSIST_API_KEY_OPENAI}
- NEKO_ASSIST_API_KEY_GLM=${NEKO_ASSIST_API_KEY_GLM}
- NEKO_ASSIST_API_KEY_STEP=${NEKO_ASSIST_API_KEY_STEP}
- NEKO_ASSIST_API_KEY_SILICON=${NEKO_ASSIST_API_KEY_SILICON}
- NEKO_MCP_TOKEN=${NEKO_MCP_TOKEN}
# API 提供商选择
- NEKO_CORE_API=${NEKO_CORE_API:-qwen}
- NEKO_ASSIST_API=${NEKO_ASSIST_API:-qwen}
# 模型配置
- NEKO_SUMMARY_MODEL=${NEKO_SUMMARY_MODEL:-qwen-plus}
- NEKO_CORRECTION_MODEL=${NEKO_CORRECTION_MODEL:-qwen-max}
- NEKO_EMOTION_MODEL=${NEKO_EMOTION_MODEL:-qwen-turbo}
- NEKO_VISION_MODEL=${NEKO_VISION_MODEL:-qwen3-vl-plus-2025-09-23}
# SSL 配置
- SSL_DOMAIN=${SSL_DOMAIN:-project-neko.online}
- SSL_DAYS=${SSL_DAYS:-365000}
- DISABLE_SSL=${DISABLE_SSL:-0}
- AUTO_REGENERATE_CERT=${AUTO_REGENERATE_CERT:-1}
- NGINX_AUTO_RELOAD=${NGINX_AUTO_RELOAD:-1}
快速设置示例:
# 创建 .env 文件
cat > .env << EOF
NEKO_CORE_API_KEY=your_core_api_key_here
NEKO_ASSIST_API_KEY_QWEN=your_qwen_api_key
NEKO_MCP_TOKEN=your_mcp_token
SSL_DOMAIN=your-domain.com
EOF
# 启动时加载环境变量
docker-compose --env-file .env up -d
🔧 故障排除
点击展开查看常见问题解决方案
1. 端口冲突
# 检查端口占用
ss -tulpn | grep ':4891[12]'
# 解决方案:修改 docker-compose.yml 中的端口映射
# 例如:- "8080:80" 和 - "8443:443"
2. 权限问题
# 确保目录有正确权限
mkdir -p N.E.K.O logs ssl
chmod 755 N.E.K.O logs ssl
3. 容器启动失败
# 查看详细日志
docker-compose logs --tail=100
# 或直接查看容器日志
docker logs neko --tail=100
4. SSL 证书错误
# 删除错误证书,让容器重新生成
rm -f ssl/N.E.K.O.crt ssl/N.E.K.O.key
docker-compose up -d
5. 网络问题
# 检查网络连通性
curl -v http://localhost:48911/health
curl -v -k https://localhost:48912/health
6. 容器无法访问
# 检查容器状态
docker ps | grep neko
# 检查容器日志
docker logs neko
# 进入容器调试
docker exec -it neko bash
7. 磁盘空间不足
# 清理无用镜像
docker system prune -f
# 清理容器日志
docker-compose down && docker volume prune -f
8. 镜像拉取失败
# 尝试使用备用镜像源
# 在 docker-compose.yml 中将镜像改为:
# image: ghcr.io/project-n-e-k-o/n.e.k.o:latest
📊 系统监控
点击展开查看监控和管理命令
健康检查
# 检查服务健康状态
curl http://localhost:48911/health
curl -k https://localhost:48912/health
资源监控
# 查看容器资源使用
docker stats neko
# 查看容器进程
docker top neko
# 查看容器详细信息
docker inspect neko
日志管理
# 实时查看日志
docker-compose logs -f
# 查看最近100行日志
docker-compose logs --tail=100
# 查看错误日志
docker-compose logs | grep -i error
# 清理日志文件
docker-compose down
rm -rf logs/*.log
docker-compose up -d
数据备份
# 备份重要数据
tar -czf neko-backup-$(date +%Y%m%d).tar.gz \
N.E.K.O/ \
ssl/ \
docker-compose.yml
版本升级
# 拉取最新镜像
docker-compose pull
# 重启服务
docker-compose up -d
🌐 访问地址
容器启动后,可通过以下地址访问:
- HTTP 访问:
http://你的服务器IP:48911 - HTTPS 访问:
https://你的服务器IP:48912
本地测试
# 本地 HTTP 访问测试
curl http://localhost:48911
# 本地 HTTPS 访问测试(忽略证书验证)
curl -k https://localhost:48912
公网访问
如果需要在公网访问,请确保:
- 服务器防火墙开放 48911 和 48912 端口
- 使用有效的 SSL 证书(非自签名证书)
- 配置域名解析到服务器 IP
⏱️ 快速参考
| 操作 | 命令 |
|---|---|
| 启动服务 | docker-compose up -d |
| 停止服务 | docker-compose down |
| 查看日志 | docker-compose logs -f |
| 重启服务 | docker-compose restart |
| 更新镜像 | docker-compose pull && docker-compose up -d |
| 进入容器 | docker exec -it neko bash |
| 查看状态 | docker-compose ps |
| 清理日志 | docker-compose logs --tail=0 |
| 备份数据 | 参考上方"数据备份"部分 |
源码开发
点击展开开发者启动指南
完整的开发者文档请访问 project-neko.online
环境要求:Python 3.11(不支持其他版本)、uv 包管理器
# 1. 克隆项目
git clone https://github.com/Project-N-E-K-O/N.E.K.O.git
cd N.E.K.O
# 2. 安装依赖
uv sync
# 3. 启动服务(至少需要 main_server 和 memory_server)
uv run python memory_server.py
uv run python main_server.py
# 可选:启动 Agent 服务
uv run python agent_server.py
# 4. 访问 http://localhost:48911 配置 API Key 并开始使用
开发者建议加入企鹅群 1022939659 交流。
进阶使用
点击展开进阶使用说明
配置API Key
当你想要通过配置自己的API来获得额外功能时,您可以配置第三方AI服务。
- 核心 API(实时语音对话):必须支持 Realtime API。推荐使用 阶跃星辰 或 阿里云。
- 辅助 API(记忆/情感/视觉等):支持标准 ChatCompletion 接口。支持 14+ 服务商。
通过访问http://localhost:48911/api_key可以在Web界面中直接配置。
获取 阿里云API。在阿里云的百炼平台官网注册账号。新用户实名认证后可以获取大量免费额度。注册完成后,请访问控制台获取API Key。
修改人设
网页版访问
http://localhost:48911/chara_manager即可进入人设编辑页面。初始猫娘伙伴的预设名称为小天,建议直接修改名字,并一项一项添加或修改基础人设,但尽量控制数量。进阶人设主要包括Live2D/VRM/MMD模型设置和声音设置。如果你想要更改Avatar模型,请先将模型目录复制到本项目中的
static文件夹下。从进阶设置中可以进入模型管理界面,可以更换模型,并通过拖拽和鼠标滚轮调整模型的位置和大小。如果你想要更改角色声音,请准备一段5秒左右的连贯、干净的语音录音。通过进阶设置进入语音克隆页面,上传录音即可完成自定义语音。支持角色卡导出,可导出为"仅设定"或"完整角色卡"格式,方便分享和备份。
进阶人设中还有一个
system_prompt,可以对系统指令进行完全自定义,但不建议修改。
修改API提供商
- 通过访问
http://localhost:48911/api_key可以切换核心API和辅助API的服务提供商。
记忆整理
- 通过访问
http://localhost:48911/memory_browser可以浏览和校对近期记忆与摘要,一定程度上缓解模型复读、认知错误等问题。
项目细节
点击展开项目架构与开发计划
项目架构
N.E.K.O/
├── 📁 brain/ # 🧠 Agent 智能体模块
│ ├── computer_use.py # 电脑操控
│ ├── browser_use_adapter.py # 浏览器自动化
│ ├── openclaw_adapter.py # OpenClaw 云端连接
│ ├── openfang_adapter.py # OpenFang 无头执行后端
│ ├── task_executor.py # 任务执行引擎
│ └── 📁 cua/ # Computer Use Agent 子系统
├── 📁 config/ # ⚙️ 配置管理模块
│ ├── api_providers.json # API服务商配置
│ ├── prompts_chara.py # 角色提示词
│ └── prompts_sys.py # 系统提示词
├── 📁 main_logic/ # 🔧 核心逻辑模块
│ ├── core.py # 核心对话模块
│ ├── cross_server.py # 跨服务器通信
│ ├── omni_realtime_client.py # 实时API客户端(Realtime API)
│ ├── omni_offline_client.py # 文本API客户端(ChatCompletion)
│ └── tts_client.py # 🔊 TTS引擎适配器
├── 📁 main_routers/ # 🌐 API路由模块(14个路由)
├── 📁 memory/ # 🧠 三层记忆系统
│ ├── facts/ # 事实记忆
│ ├── reflection/ # 反思记忆
│ └── persona/ # 人格记忆
├── 📁 frontend/ # 🖥️ 现代前端项目
│ ├── react-neko-chat/ # React 聊天窗口组件
│ └── plugin-manager/ # Vue 插件管理面板
├── 📁 plugin/ # 🔌 插件系统
│ ├── sdk/ # 插件 SDK
│ └── server/ # 插件服务端
├── 📁 static/ # 🌐 前端静态资源(含构建产物)
├── 📁 templates/ # 📄 前端HTML模板(14个页面)
├── 📁 utils/ # 🛠️ 工具模块
├── main_server.py # 🌐 主服务器
├── agent_server.py # 🤖 AI智能体服务器
└── memory_server.py # 🧠 记忆服务器
数据流向
完整的开发者文档请访问 project-neko.online
开发计划
v0.7: ✅ 完善Agent相关功能。已完成。
v0.8:完善记忆相关功能,完善OpenClaw类似功能。预计2026年3月完成。
v0.9:完善多系统适配,包括linux,手机。猫娘网络上线。预计2026年4月完成。
v1.0:放弃部分模型供应商的适配,专注于自研大模型和智能体系统。预计2026年6月完成。
Star History
版本历史
v0.4.12025/09/24v0.4.02025/08/26nightly2026/04/08v0.7.32026/04/04v0.7.22026/03/24v0.7.12026/03/10v0.7.02026/02/24v0.6.32026/02/04v0.6.22026/01/10v0.5.02025/10/25v0.6.12025/12/24v0.6.02025/12/160.5.52025/12/07v0.5.42025/12/02v0.5.32025/11/25v0.5.22025/11/12v0.5.12025/11/09v0.3.22025/08/07v0.3.12025/07/24v0.3.02025/07/17常见问题
相似工具推荐
openclaw
OpenClaw 是一款专为个人打造的本地化 AI 助手,旨在让你在自己的设备上拥有完全可控的智能伙伴。它打破了传统 AI 助手局限于特定网页或应用的束缚,能够直接接入你日常使用的各类通讯渠道,包括微信、WhatsApp、Telegram、Discord、iMessage 等数十种平台。无论你在哪个聊天软件中发送消息,OpenClaw 都能即时响应,甚至支持在 macOS、iOS 和 Android 设备上进行语音交互,并提供实时的画布渲染功能供你操控。 这款工具主要解决了用户对数据隐私、响应速度以及“始终在线”体验的需求。通过将 AI 部署在本地,用户无需依赖云端服务即可享受快速、私密的智能辅助,真正实现了“你的数据,你做主”。其独特的技术亮点在于强大的网关架构,将控制平面与核心助手分离,确保跨平台通信的流畅性与扩展性。 OpenClaw 非常适合希望构建个性化工作流的技术爱好者、开发者,以及注重隐私保护且不愿被单一生态绑定的普通用户。只要具备基础的终端操作能力(支持 macOS、Linux 及 Windows WSL2),即可通过简单的命令行引导完成部署。如果你渴望拥有一个懂你
stable-diffusion-webui
stable-diffusion-webui 是一个基于 Gradio 构建的网页版操作界面,旨在让用户能够轻松地在本地运行和使用强大的 Stable Diffusion 图像生成模型。它解决了原始模型依赖命令行、操作门槛高且功能分散的痛点,将复杂的 AI 绘图流程整合进一个直观易用的图形化平台。 无论是希望快速上手的普通创作者、需要精细控制画面细节的设计师,还是想要深入探索模型潜力的开发者与研究人员,都能从中获益。其核心亮点在于极高的功能丰富度:不仅支持文生图、图生图、局部重绘(Inpainting)和外绘(Outpainting)等基础模式,还独创了注意力机制调整、提示词矩阵、负向提示词以及“高清修复”等高级功能。此外,它内置了 GFPGAN 和 CodeFormer 等人脸修复工具,支持多种神经网络放大算法,并允许用户通过插件系统无限扩展能力。即使是显存有限的设备,stable-diffusion-webui 也提供了相应的优化选项,让高质量的 AI 艺术创作变得触手可及。
everything-claude-code
everything-claude-code 是一套专为 AI 编程助手(如 Claude Code、Codex、Cursor 等)打造的高性能优化系统。它不仅仅是一组配置文件,而是一个经过长期实战打磨的完整框架,旨在解决 AI 代理在实际开发中面临的效率低下、记忆丢失、安全隐患及缺乏持续学习能力等核心痛点。 通过引入技能模块化、直觉增强、记忆持久化机制以及内置的安全扫描功能,everything-claude-code 能显著提升 AI 在复杂任务中的表现,帮助开发者构建更稳定、更智能的生产级 AI 代理。其独特的“研究优先”开发理念和针对 Token 消耗的优化策略,使得模型响应更快、成本更低,同时有效防御潜在的攻击向量。 这套工具特别适合软件开发者、AI 研究人员以及希望深度定制 AI 工作流的技术团队使用。无论您是在构建大型代码库,还是需要 AI 协助进行安全审计与自动化测试,everything-claude-code 都能提供强大的底层支持。作为一个曾荣获 Anthropic 黑客大奖的开源项目,它融合了多语言支持与丰富的实战钩子(hooks),让 AI 真正成长为懂上
ComfyUI
ComfyUI 是一款功能强大且高度模块化的视觉 AI 引擎,专为设计和执行复杂的 Stable Diffusion 图像生成流程而打造。它摒弃了传统的代码编写模式,采用直观的节点式流程图界面,让用户通过连接不同的功能模块即可构建个性化的生成管线。 这一设计巧妙解决了高级 AI 绘图工作流配置复杂、灵活性不足的痛点。用户无需具备编程背景,也能自由组合模型、调整参数并实时预览效果,轻松实现从基础文生图到多步骤高清修复等各类复杂任务。ComfyUI 拥有极佳的兼容性,不仅支持 Windows、macOS 和 Linux 全平台,还广泛适配 NVIDIA、AMD、Intel 及苹果 Silicon 等多种硬件架构,并率先支持 SDXL、Flux、SD3 等前沿模型。 无论是希望深入探索算法潜力的研究人员和开发者,还是追求极致创作自由度的设计师与资深 AI 绘画爱好者,ComfyUI 都能提供强大的支持。其独特的模块化架构允许社区不断扩展新功能,使其成为当前最灵活、生态最丰富的开源扩散模型工具之一,帮助用户将创意高效转化为现实。
LLMs-from-scratch
LLMs-from-scratch 是一个基于 PyTorch 的开源教育项目,旨在引导用户从零开始一步步构建一个类似 ChatGPT 的大型语言模型(LLM)。它不仅是同名技术著作的官方代码库,更提供了一套完整的实践方案,涵盖模型开发、预训练及微调的全过程。 该项目主要解决了大模型领域“黑盒化”的学习痛点。许多开发者虽能调用现成模型,却难以深入理解其内部架构与训练机制。通过亲手编写每一行核心代码,用户能够透彻掌握 Transformer 架构、注意力机制等关键原理,从而真正理解大模型是如何“思考”的。此外,项目还包含了加载大型预训练权重进行微调的代码,帮助用户将理论知识延伸至实际应用。 LLMs-from-scratch 特别适合希望深入底层原理的 AI 开发者、研究人员以及计算机专业的学生。对于不满足于仅使用 API,而是渴望探究模型构建细节的技术人员而言,这是极佳的学习资源。其独特的技术亮点在于“循序渐进”的教学设计:将复杂的系统工程拆解为清晰的步骤,配合详细的图表与示例,让构建一个虽小但功能完备的大模型变得触手可及。无论你是想夯实理论基础,还是为未来研发更大规模的模型做准备
Deep-Live-Cam
Deep-Live-Cam 是一款专注于实时换脸与视频生成的开源工具,用户仅需一张静态照片,即可通过“一键操作”实现摄像头画面的即时变脸或制作深度伪造视频。它有效解决了传统换脸技术流程繁琐、对硬件配置要求极高以及难以实时预览的痛点,让高质量的数字内容创作变得触手可及。 这款工具不仅适合开发者和技术研究人员探索算法边界,更因其极简的操作逻辑(仅需三步:选脸、选摄像头、启动),广泛适用于普通用户、内容创作者、设计师及直播主播。无论是为了动画角色定制、服装展示模特替换,还是制作趣味短视频和直播互动,Deep-Live-Cam 都能提供流畅的支持。 其核心技术亮点在于强大的实时处理能力,支持口型遮罩(Mouth Mask)以保留使用者原始的嘴部动作,确保表情自然精准;同时具备“人脸映射”功能,可同时对画面中的多个主体应用不同面孔。此外,项目内置了严格的内容安全过滤机制,自动拦截涉及裸露、暴力等不当素材,并倡导用户在获得授权及明确标注的前提下合规使用,体现了技术发展与伦理责任的平衡。

