Claude-Code-Remote

GitHub
1.2k 130 简单 1 次阅读 昨天MITAgent插件
AI 解读 由 AI 自动生成,仅供参考

Claude-Code-Remote 是一款让开发者能够随时随地通过即时通讯软件或邮件远程操控 Claude Code 的开源工具。它主要解决了编程任务必须守在电脑终端前才能启动和监控的痛点,让用户在本地发起任务后,即使离开座位也能通过手机接收完成通知,并直接回复消息下达新指令。

这款工具特别适合需要灵活办公的软件开发人员、运维工程师以及 AI 研究者。无论是通勤途中还是居家休息,用户都能利用碎片时间管理代码任务,甚至支持在 LINE 或 Telegram 群组中进行团队协作。

其技术亮点在于强大的双向交互能力与多平台适配:不仅支持电子邮件、Telegram、LINE 及桌面通知,还能在邮件中完整呈现终端执行轨迹;具备基于 ID 的安全白名单验证,确保操作安全;更创新地集成了 tmux 会话管理,可无缝将命令注入正在运行的终端环境。配合智能声音提醒和历史对话追踪,Claude-Code-Remote 让远程编码协作变得像日常聊天一样简单自然。

使用场景

资深后端工程师李明在周末外出露营时,突然收到生产环境紧急报警,需要立即排查日志并修复一个复杂的并发 Bug。

没有 Claude-Code-Remote 时

  • 响应严重滞后:李明身处户外无电脑环境,无法远程连接开发机启动调试任务,只能焦急等待返回酒店。
  • 信息获取断层:即使勉强用手机 SSH 连接,狭小的屏幕难以查看完整的终端执行轨迹和长日志输出,极易遗漏关键错误。
  • 交互操作繁琐:在移动端输入复杂的多行修复命令极其困难,且无法直观监控 AI 的实时思考与执行过程。
  • 协作沟通受阻:无法将实时的修复进度和完整报告直接转发给团队群组,导致协同效率低下。

使用 Claude-Code-Remote 后

  • 随时随地启动:李明直接在 Telegram 或邮件中回复指令,即可远程触发本地开发机的 Claude Code 开始分析代码库。
  • 全景执行追踪:任务完成后,系统自动将包含完整终端输出和执行轨迹的详细报告推送到他的手机,如同亲临现场。
  • 双向便捷控制:发现新线索时,他只需在邮件或聊天窗口直接回复新的自然语言命令,即可让 AI 继续深入排查或应用修复。
  • 智能即时通知:配合桌面端声音警报和多通道消息同步,确保他在任何场景下都能第一时间感知任务状态并介入决策。

核心价值在于打破物理设备限制,将强大的本地 AI 编程能力延伸至任意通讯终端,实现真正的“零延迟”远程研发运维。

运行环境要求

操作系统
  • Linux
  • macOS
  • Windows
GPU

未说明

内存

未说明

依赖
notes该工具基于 Node.js 运行,非 Python AI 模型,因此无 GPU 和特定显存需求。核心依赖为 Node.js 14+。支持两种运行模式:默认 PTY 模式(无需 tmux,推荐本地直接使用)和 tmux 模式(需安装 tmux 并保持会话运行)。配置通过交互式脚本或手动编辑 .env 文件完成,需设置 Email、Telegram 或 LINE 的凭证。若使用 Gmail 需应用专用密码。桌面通知支持声音提醒。
python未说明
Node.js >= 14.0.0
tmux (可选,用于 tmux 模式)
Claude-Code-Remote hero image

快速开始

Claude Code 远程

通过多个消息平台远程控制 Claude Code。您可以在本地启动任务,在 Claude 完成任务时接收通知,并只需回复消息即可发送新命令。

支持的平台:

  • 📧 电子邮件 - 传统的 SMTP/IMAP 集成,附带执行轨迹
  • 📱 Telegram - 带有智能按钮的交互式机器人 ✅ 新增
  • 💬 LINE - 基于令牌的丰富消息指令
  • 🖥️ 桌面 - 声音提醒和系统通知

🎥 观看演示视频

Claude Code Remote 演示
在 YouTube 上观看

🐦 关注 @Jiaxi_Cui,获取最新动态和 AI 开发见解

✨ 功能

  • 📧 多种消息平台
    • 电子邮件通知,附带完整执行轨迹及回复发送命令
    • Telegram 机器人,带有交互式按钮和斜杠命令
    • LINE 消息,支持基于令牌的命令
    • 桌面通知,附带声音提醒
  • 🔄 双向控制:回复消息或邮件即可发送新命令
  • 📱 远程访问:随时随地控制 Claude
  • 🔒 安全性:所有平台均采用基于 ID 的白名单验证
  • 👥 团队支持:可在 LINE 群组或 Telegram 群组中使用,便于团队协作
  • 🤖 智能命令:各平台提供直观的命令格式
  • 📋 多行支持:支持格式化的复杂命令
  • ⚡ 智能监控:智能检测 Claude 的响应,并可进行历史追踪
  • 🔄 tmux 集成:无缝将命令注入到正在运行的 tmux 会话中
  • 📊 执行轨迹:电子邮件通知中完整捕获终端输出

📅 更改记录

2025 年 8 月

  • 2025-08-02:在电子邮件通知中添加完整的执行轨迹(#14,由 @vaclisinc 提交)
  • 2025-08-01:增强多渠道通知系统(#1,由 @laihenyi@JessyTsui 提交)
    • Telegram 集成完成:交互式按钮、实时命令、智能处理个人与群聊
    • 多渠道通知:同时推送到桌面、Telegram、电子邮件和 LINE
    • 智能声音提醒:始终开启的音频反馈,支持自定义声音
    • 智能会话管理:自动检测、识别对话内容、24 小时有效期令牌
  • 2025-08-01:修复 #9 和 #12:增加禁用子代理通知的配置(#10,由 @vaclisinc 提交)
  • 2025-08-01:为电子邮件通知实现终端风格的 UI(#8,由 @vaclisinc 提交)
  • 2025-08-01:修复工作目录问题——使 claude-remote 能够从任意目录运行(#7,由 @vaclisinc 提交)

2025 年 7 月

  • 2025-07-31:修复使用同一邮箱作为收发邮箱时的自回复循环问题(#4,由 @vaclisinc 提交)
  • 2025-07-28:移除硬编码值,实施基于环境变量的配置(#2,由 @kevinsslin 提交)

📋 待办事项清单

通知渠道

  • 📱 Telegram 集成已完成:机器人集成,支持交互式按钮和实时命令
  • 💬 Discord 集成:为消息平台集成机器人
  • ⚡ Slack 工作流:原生 Slack 应用程序,支持斜杠命令

开发工具

  • 🤖 AI 工具支持:与 Gemini CLI、Cursor 等其他 AI 开发工具集成
  • 🔀 Git 自动化:自动提交功能、PR 创建、分支管理

使用分析

  • 💰 成本跟踪:监控令牌使用情况并估算成本
  • ⚡ 性能指标:跟踪执行时间并分析资源使用情况
  • emailer 报告:每日/每周使用摘要通过电子邮件发送

原生应用

  • 📱 移动应用:iOS 和 Android 应用程序,用于远程控制 Claude
  • 🖥️ 桌面应用:macOS 和 Windows 原生客户端,支持系统集成

🚀 快速入门

1. 先决条件

系统要求:

  • Node.js >= 14.0.0
  • 对于默认 PTY 模式:无需 tmux(推荐直接在本地使用)
  • 对于 tmux 模式:需要 tmux 和一个正在运行 Claude Code 的会话

2. 安装

git clone https://github.com/JessyTsui/Claude-Code-Remote.git
cd Claude-Code-Remote
npm install

3. 交互式设置(推荐)

npm run setup
  • 引导式填写电子邮件、Telegram 和 LINE 的配置,生成 .env
  • 自动将 Claude 钩子合并到 ~/.claude/settings.json
  • 可随时重新运行以更新密钥或切换渠道
  • 如需手动配置或离线编辑 .env 文件,请参阅下方“手动配置”

4. 手动配置(可选,如果已运行 npm run setup 则可跳过)

选项 A:配置电子邮件(推荐给初学者)

# 复制示例配置文件
cp .env.example .env

# 使用您的电子邮件凭据编辑
nano .env

必需的电子邮件设置:

EMAIL_ENABLED=true
SMTP_USER=your-email@gmail.com
SMTP_PASS=your-app-password
IMAP_USER=your-email@gmail.com  
IMAP_PASS=your-app-password
EMAIL_TO=your-notification-email@gmail.com
ALLOWED_SENDERS=your-notification-email@gmail.com
SESSION_MAP_PATH=/your/path/to/Claude-Code-Remote/src/data/session-map.json

📌 Gmail 用户:请使用应用专用密码,而非常规密码。

选项 B:配置 Telegram ✅ 新增

快速设置:

chmod +x setup-telegram.sh
./setup-telegram.sh

手动设置:

  1. 通过 @BotFather 创建机器人
  2. 从机器人 API 获取您的 Chat ID
  3. 配置 Webhook URL(本地测试可使用 ngrok)

必需的 Telegram 设置:

TELEGRAM_ENABLED=true
TELEGRAM_BOT_TOKEN=your-bot-token-here
TELEGRAM_CHAT_ID=your-chat-id-here
TELEGRAM_WEBHOOK_URL=https://your-ngrok-url.app
SESSION_MAP_PATH=/your/path/to/Claude-Code-Remote/src/data/session-map.json

可选的 Telegram 设置:

# 强制使用 IPv4 连接至 Telegram API(默认为假)

# 如果您遇到 IPv6 连接问题,请启用此项
TELEGRAM_FORCE_IPV4=true

网络配置说明:

  • IPv4 与 IPv6:某些网络环境可能存在 Telegram API 服务器的 IPv6 连接不稳定的情况。
  • 何时使用 TELEGRAM_FORCE_IPV4=true
    • 发送消息时出现连接超时或失败;
    • Webhook 消息传递不一致;
    • 网络环境未正确支持 IPv6。
  • 默认行为:使用系统默认设置(通常在可用时优先使用 IPv6,不可用时回退到 IPv4)。
  • 性能影响:极小——仅影响初始连接建立。

选项 C:配置 LINE

必需的 LINE 设置:

LINE_ENABLED=true
LINE_CHANNEL_ACCESS_TOKEN=your-token
LINE_CHANNEL_SECRET=your-secret
LINE_USER_ID=your-user-id

配置 Claude Code Hooks(仅在跳过 npm run setup 时需要)

创建 hooks 配置文件:

方法 1:全局配置(推荐)

# 添加到 ~/.claude/settings.json
{
  "hooks": {
    "Stop": [{
      "matcher": "*",
      "hooks": [{
        "type": "command",
        "command": "node /your/path/to/Claude-Code-Remote/claude-hook-notify.js completed",
        "timeout": 5
      }]
    }],
    "SubagentStop": [{
      "matcher": "*",
      "hooks": [{
        "type": "command",
        "command": "node /your/path/to/Claude-Code-Remote/claude-hook-notify.js waiting",
        "timeout": 5
      }]
    }]
  }
}

方法 2:项目特定配置

# 设置环境变量
export CLAUDE_HOOKS_CONFIG=/your/path/to/Claude-Code-Remote/claude-hooks.json

注意:子代理通知默认是关闭的。如需启用,请在配置中设置 enableSubagentNotifications: true。详情请参阅 子代理通知指南

5. 启动 Claude(按你的注入模式选择)

  • 默认 PTY 模式(无需 tmux):直接在终端运行 claude-code --config /path/to/your/claude/settings.json
  • 如果你选择 tmux 模式
    tmux new-session -d -s claude-session
    tmux attach-session -t claude-session
    claude-code --config /path/to/your/claude/settings.json
    

    分离会话:Ctrl+B 然后 D

注意:交互式设置已将 hooks 合并到 ~/.claude/settings.json。若跳过,请确保手动配置 hooks。

6. 启动服务

对所有平台(推荐)

# 自动启动所有已启用的平台
npm run webhooks
# 或
node start-all-webhooks.js

对于单个平台

对于电子邮件:

npm run daemon:start
# 或
node claude-remote.js daemon start

对于 Telegram:

npm run telegram
# 或
node start-telegram-webhook.js

对于 LINE:

npm run line
# 或
node start-line-webhook.js

7. 测试您的设置

快速测试:

# 测试所有通知渠道
node claude-hook-notify.js completed
# 应该通过所有已启用的平台收到通知

完整测试:

  1. 在启用了 hooks 的 tmux 会话中启动 Claude;
  2. 在 Claude 中执行任意命令;
  3. 检查通知(电子邮件/Telegram/LINE);
  4. 回复新命令以测试双向控制。

🎮 工作原理

  1. 在 tmux 会话中正常使用 Claude
  2. 当 Claude 完成任务时接收通知,方式包括:
    • 🔊 桌面声音提醒
    • 📧 带有执行轨迹的电子邮件通知(如果启用);
    • 📱 带有按钮的 Telegram 消息(如果启用);
    • 💬 LINE 消息(如果启用);
  3. 使用任意平台回复命令
  4. 命令会在 Claude 中自动执行

各平台的命令格式

电子邮件:

只需回复通知邮件即可发送命令
无需特殊格式

Telegram:NEW

点击智能按钮获取格式:
📝 个人聊天:/cmd TOKEN123 您的命令在这里
👥 群组聊天:@bot_name /cmd TOKEN123 您的命令在这里

LINE:

回复通知内容:您的命令在这里
(令牌会自动从对话上下文中提取)

本地回退(无 tmux)

  • 默认 INJECTION_MODE=pty:命令通过 PTY/智能粘贴注入,不依赖 tmux
  • macOS 可自动复制/粘贴到 Claude/终端;若自动注入失败,会把命令复制到剪贴板并弹出提醒

高级配置

电子邮件通知选项

  1. 电子邮件中的子代理活动

    默认情况下,电子邮件通知仅显示执行轨迹。您可以选择启用单独的子代理活动摘要部分:

    // 在您的 config/config.json 中
    {
      "showSubagentActivitiesInEmail": true  // 默认:false
    }
    

    启用后,电子邮件将包含:

    • 子代理活动摘要:所有子代理活动的结构化列表;
    • 完整的执行轨迹:完整的终端输出。

    由于执行轨迹已经包含了所有信息,此功能默认关闭,以保持邮件简洁。

  2. 执行轨迹显示

    您可以控制是否在电子邮件通知中包含执行轨迹:

    // 在您的电子邮件通道配置中
    {
      "email": {
        "config": {
          "includeExecutionTrace": false  // 默认:true
        }
      }
    }
    
    • 当为 true(默认)时:电子邮件中会显示可滚动的执行轨迹部分;
    • 当为 false时:完全移除电子邮件中的执行轨迹部分。

    如果您觉得执行轨迹过于冗长,或者您的电子邮件客户端对可滚动内容有兼容性问题,此功能非常有用。

💡 使用场景

  • 远程代码评审:在办公室开始评审,然后在家通过任何平台继续;
  • 长时间运行的任务:远程监控进度并指导下一步操作;
  • 多地点开发:无需 VPN 即可在任何地方控制 Claude;
  • 团队协作:共享 Telegram 群组以进行团队通知;
  • 移动开发:通过 Telegram 从手机发送命令。

🔧 命令

设置

npm run setup   # 交互式向导,用于创建 .env 文件并将 hooks 合并到 ~/.claude/settings.json

测试与诊断

# 测试所有通知渠道
node claude-hook-notify.js completed

# 测试特定平台
node test-telegram-notification.js
node test-real-notification.js
node test-injection.js

# 系统诊断
node claude-remote.js diagnose
node claude-remote.js status
node claude-remote.js test

服务管理

# 启动所有已启用的平台
npm run webhooks

# 单独的服务
npm run telegram         # Telegram webhook
npm run line            # LINE webhook  
npm run daemon:start    # Email daemon

# 停止服务
npm run daemon:stop     # 停止 email 守护进程

🔍 故障排除

常见问题

未收到来自 Claude 的通知?

  1. 检查 tmux 会话中的 hooks 配置:
    echo $CLAUDE_HOOKS_CONFIG
    
  2. 确认 Claude 正在运行且启用了 hooks;
  3. 手动测试通知:
    node claude-hook-notify.js completed
    

Telegram 机器人没有响应?NEW

# 测试机器人连通性
curl -X POST "https://api.telegram.org/bot$TELEGRAM_BOT_TOKEN/sendMessage" \
  -H "Content-Type: application/json" \
  -d "{\"chat_id\": $TELEGRAM_CHAT_ID, \"text\": \"Test\"}"

# 检查 webhook 状态
curl "https://api.telegram.org/bot$TELEGRAM_BOT_TOKEN/getWebhookInfo"

Claude 中命令未执行?

# 检查 tmux 会话是否存在
tmux list-sessions

# 验证注入模式
grep INJECTION_MODE .env  # 应为 'tmux'

# 测试注入
node test-injection.js

未收到邮件?

  • 运行 node claude-remote.js test 来测试邮件设置
  • 检查垃圾邮件文件夹
  • 验证 .env 文件中的 SMTP 设置
  • 对于 Gmail:确保使用应用专用密码

调试模式

# 启用详细日志记录
LOG_LEVEL=debug npm run webhooks
DEBUG=true node claude-hook-notify.js completed

🛡️ 安全性

多平台认证

  • 邮箱: 通过 ALLOWED_SENDERS 环境变量进行发件人白名单管理
  • Telegram: Bot Token 和 Chat ID 验证
  • LINE: Channel Secret 和 Access Token 验证
  • 会话令牌: 8 位字母数字组合的令牌用于命令验证

会话安全

  • 会话隔离: 每个令牌仅控制其特定的 tmux 会话
  • 自动过期: 会话在 24 小时后自动超时
  • 基于令牌的命令: 所有平台均需有效的会话令牌
  • 最小化数据存储: 会话文件仅包含必要信息

🤝 贡献

发现 bug 或有功能需求?

  • 🐛 问题: GitHub Issues
  • 🐦 更新: 关注 Twitter 上的 @Jiaxi_Cui
  • 💬 讨论: 分享您的使用场景和改进建议

📄 许可证

MIT 许可证 - 欢迎自由使用和修改!


🚀 让 Claude 代码真正实现远程化,随时随地访问!

⭐ 星标历史

星标历史图表

⭐ 如果这个项目帮助您更高效地编码,请给它点个星吧!

💡 提示: 启用多个通知渠道以增加冗余——再也不错过 Claude 的任何完成结果了!

常见问题

相似工具推荐

openclaw

OpenClaw 是一款专为个人打造的本地化 AI 助手,旨在让你在自己的设备上拥有完全可控的智能伙伴。它打破了传统 AI 助手局限于特定网页或应用的束缚,能够直接接入你日常使用的各类通讯渠道,包括微信、WhatsApp、Telegram、Discord、iMessage 等数十种平台。无论你在哪个聊天软件中发送消息,OpenClaw 都能即时响应,甚至支持在 macOS、iOS 和 Android 设备上进行语音交互,并提供实时的画布渲染功能供你操控。 这款工具主要解决了用户对数据隐私、响应速度以及“始终在线”体验的需求。通过将 AI 部署在本地,用户无需依赖云端服务即可享受快速、私密的智能辅助,真正实现了“你的数据,你做主”。其独特的技术亮点在于强大的网关架构,将控制平面与核心助手分离,确保跨平台通信的流畅性与扩展性。 OpenClaw 非常适合希望构建个性化工作流的技术爱好者、开发者,以及注重隐私保护且不愿被单一生态绑定的普通用户。只要具备基础的终端操作能力(支持 macOS、Linux 及 Windows WSL2),即可通过简单的命令行引导完成部署。如果你渴望拥有一个懂你

349.3k|★★★☆☆|昨天
Agent开发框架图像

stable-diffusion-webui

stable-diffusion-webui 是一个基于 Gradio 构建的网页版操作界面,旨在让用户能够轻松地在本地运行和使用强大的 Stable Diffusion 图像生成模型。它解决了原始模型依赖命令行、操作门槛高且功能分散的痛点,将复杂的 AI 绘图流程整合进一个直观易用的图形化平台。 无论是希望快速上手的普通创作者、需要精细控制画面细节的设计师,还是想要深入探索模型潜力的开发者与研究人员,都能从中获益。其核心亮点在于极高的功能丰富度:不仅支持文生图、图生图、局部重绘(Inpainting)和外绘(Outpainting)等基础模式,还独创了注意力机制调整、提示词矩阵、负向提示词以及“高清修复”等高级功能。此外,它内置了 GFPGAN 和 CodeFormer 等人脸修复工具,支持多种神经网络放大算法,并允许用户通过插件系统无限扩展能力。即使是显存有限的设备,stable-diffusion-webui 也提供了相应的优化选项,让高质量的 AI 艺术创作变得触手可及。

162.1k|★★★☆☆|2天前
开发框架图像Agent

everything-claude-code

everything-claude-code 是一套专为 AI 编程助手(如 Claude Code、Codex、Cursor 等)打造的高性能优化系统。它不仅仅是一组配置文件,而是一个经过长期实战打磨的完整框架,旨在解决 AI 代理在实际开发中面临的效率低下、记忆丢失、安全隐患及缺乏持续学习能力等核心痛点。 通过引入技能模块化、直觉增强、记忆持久化机制以及内置的安全扫描功能,everything-claude-code 能显著提升 AI 在复杂任务中的表现,帮助开发者构建更稳定、更智能的生产级 AI 代理。其独特的“研究优先”开发理念和针对 Token 消耗的优化策略,使得模型响应更快、成本更低,同时有效防御潜在的攻击向量。 这套工具特别适合软件开发者、AI 研究人员以及希望深度定制 AI 工作流的技术团队使用。无论您是在构建大型代码库,还是需要 AI 协助进行安全审计与自动化测试,everything-claude-code 都能提供强大的底层支持。作为一个曾荣获 Anthropic 黑客大奖的开源项目,它融合了多语言支持与丰富的实战钩子(hooks),让 AI 真正成长为懂上

142.7k|★★☆☆☆|今天
开发框架Agent语言模型

ComfyUI

ComfyUI 是一款功能强大且高度模块化的视觉 AI 引擎,专为设计和执行复杂的 Stable Diffusion 图像生成流程而打造。它摒弃了传统的代码编写模式,采用直观的节点式流程图界面,让用户通过连接不同的功能模块即可构建个性化的生成管线。 这一设计巧妙解决了高级 AI 绘图工作流配置复杂、灵活性不足的痛点。用户无需具备编程背景,也能自由组合模型、调整参数并实时预览效果,轻松实现从基础文生图到多步骤高清修复等各类复杂任务。ComfyUI 拥有极佳的兼容性,不仅支持 Windows、macOS 和 Linux 全平台,还广泛适配 NVIDIA、AMD、Intel 及苹果 Silicon 等多种硬件架构,并率先支持 SDXL、Flux、SD3 等前沿模型。 无论是希望深入探索算法潜力的研究人员和开发者,还是追求极致创作自由度的设计师与资深 AI 绘画爱好者,ComfyUI 都能提供强大的支持。其独特的模块化架构允许社区不断扩展新功能,使其成为当前最灵活、生态最丰富的开源扩散模型工具之一,帮助用户将创意高效转化为现实。

107.9k|★★☆☆☆|昨天
开发框架图像Agent

markitdown

MarkItDown 是一款由微软 AutoGen 团队打造的轻量级 Python 工具,专为将各类文件高效转换为 Markdown 格式而设计。它支持 PDF、Word、Excel、PPT、图片(含 OCR)、音频(含语音转录)、HTML 乃至 YouTube 链接等多种格式的解析,能够精准提取文档中的标题、列表、表格和链接等关键结构信息。 在人工智能应用日益普及的今天,大语言模型(LLM)虽擅长处理文本,却难以直接读取复杂的二进制办公文档。MarkItDown 恰好解决了这一痛点,它将非结构化或半结构化的文件转化为模型“原生理解”且 Token 效率极高的 Markdown 格式,成为连接本地文件与 AI 分析 pipeline 的理想桥梁。此外,它还提供了 MCP(模型上下文协议)服务器,可无缝集成到 Claude Desktop 等 LLM 应用中。 这款工具特别适合开发者、数据科学家及 AI 研究人员使用,尤其是那些需要构建文档检索增强生成(RAG)系统、进行批量文本分析或希望让 AI 助手直接“阅读”本地文件的用户。虽然生成的内容也具备一定可读性,但其核心优势在于为机器

93.4k|★★☆☆☆|今天
插件开发框架

LLMs-from-scratch

LLMs-from-scratch 是一个基于 PyTorch 的开源教育项目,旨在引导用户从零开始一步步构建一个类似 ChatGPT 的大型语言模型(LLM)。它不仅是同名技术著作的官方代码库,更提供了一套完整的实践方案,涵盖模型开发、预训练及微调的全过程。 该项目主要解决了大模型领域“黑盒化”的学习痛点。许多开发者虽能调用现成模型,却难以深入理解其内部架构与训练机制。通过亲手编写每一行核心代码,用户能够透彻掌握 Transformer 架构、注意力机制等关键原理,从而真正理解大模型是如何“思考”的。此外,项目还包含了加载大型预训练权重进行微调的代码,帮助用户将理论知识延伸至实际应用。 LLMs-from-scratch 特别适合希望深入底层原理的 AI 开发者、研究人员以及计算机专业的学生。对于不满足于仅使用 API,而是渴望探究模型构建细节的技术人员而言,这是极佳的学习资源。其独特的技术亮点在于“循序渐进”的教学设计:将复杂的系统工程拆解为清晰的步骤,配合详细的图表与示例,让构建一个虽小但功能完备的大模型变得触手可及。无论你是想夯实理论基础,还是为未来研发更大规模的模型做准备

90.1k|★★★☆☆|昨天
语言模型图像Agent