MAHORAGA

GitHub
798 165 中等 1 次阅读 5天前NOASSERTION语言模型Agent
AI 解读 由 AI 自动生成,仅供参考

MAHORAGA 是一款基于大语言模型(LLM)的自主交易代理,能够全天候在云端自动运行。它通过实时监测 StockTwits、Reddit 等社交平台的市场情绪,利用 AI 分析信号并自动通过 Alpaca 执行加密货币及期权交易,旨在解决人工交易难以持续监控市场、易受情绪干扰以及无法快速响应社交媒体风向变化的痛点。

该工具特别适合具备一定编程基础的开发者、量化交易爱好者及金融技术研究人员使用。用户无需本地服务器,只需配置 Cloudflare 账号即可部署。MAHORAGA 的技术亮点在于其独特的架构设计:依托 Cloudflare Durable Objects 实现状态持久化与自动重启,确保 7×24 小时稳定运行;支持 OpenAI、Anthropic、Google 等多主流大模型灵活切换;内置“陈旧性检测”机制,能自动识别并退出失去动能的头寸以控制风险。此外,其插件化的策略系统允许用户在不修改核心代码的前提下自定义交易逻辑,配合 Discord 实时通知功能,让自动化交易既强大又易于管理。需要注意的是,该项目主要用于教育和信息参考,不构成任何投资建议。

使用场景

一位独立开发者希望利用社交媒体情绪进行加密货币全天候交易,但受限于精力和实时数据分析能力。

没有 MAHORAGA 时

  • 错失夜间行情:人工无法 24 小时盯盘,经常错过美股收盘后或周末爆发的加密市场剧烈波动。
  • 情绪分析滞后:面对 StockTwits 和 Reddit 上海量的讨论帖,手动筛选有效信号耗时极长,往往等到发现趋势时已高位接盘。
  • 策略执行僵硬:缺乏自动止损机制,当市场 momentum 消失时,因犹豫不决导致利润回吐甚至亏损。
  • 多模型切换困难:想对比不同大模型(如 Claude 与 GPT-4)对同一市场信号的看法,需要反复编写脚本调用 API,开发成本极高。

使用 MAHORAGA 后

  • 全天候无人值守:部署在 Cloudflare Workers 上,MAHORAGA 7x24 小时自动监控市场,即便在开发者睡眠时也能捕捉并执行交易机会。
  • 实时情绪洞察:自动聚合多个社交平台数据,利用 AI 即时分析市场情绪并生成交易信号,通过 Discord 第一时间推送买入提醒。
  • 智能动态风控:内置“陈旧性检测”功能,一旦检测到持仓失去上涨动能,MAHORAGA 会自动平仓退出,锁定利润。
  • 灵活模型集成:通过简单配置即可在 OpenAI、Anthropic 或 DeepSeek 等多个主流大模型间无缝切换,快速验证不同 AI 对策略的有效性。

MAHORAGA 将分散的社交情绪数据转化为自动化的交易执行力,让个人投资者拥有了机构级的全天候智能交易助理。

运行环境要求

操作系统
  • Linux
  • macOS
  • Windows
GPU

不需要本地 GPU(基于 Cloudflare Workers 云端运行)

内存

未说明(取决于本地开发环境,云端由 Cloudflare 管理)

依赖
notes该工具是一个基于 Node.js 的自主交易代理,部署在 Cloudflare Workers 上,无需本地服务器或 GPU。主要依赖包括:Cloudflare 账户、Alpaca 交易账户、以及至少一个大语言模型(LLM)提供商的 API 密钥(如 OpenAI、Anthropic 等)。本地开发需安装 Node.js 18+ 并使用 npm 安装依赖。
python不需要 Python(基于 Node.js)
Node.js>=18
wrangler
AI SDK
MAHORAGA hero image

快速开始

⚠️ 警告:本软件仅用于教育和信息目的。本仓库中的任何内容均不构成财务、投资、法律或税务建议。

MAHORAGA

一款基于大型语言模型(LLM)的自主交易代理,可在 Cloudflare Workers 上 24/7 全天候运行。

Discord

MAHORAGA 会监控 StockTwits 和 Reddit 上的市场情绪,利用 AI(通过 AI SDK 使用 OpenAI、Anthropic、Google、xAI 和 DeepSeek)分析信号,并通过 Alpaca 执行交易。它以 Cloudflare Durable Object 的形式运行,具备持久化状态、自动重启功能,并提供 24/7 的加密货币交易支持。

dashboard

功能特性

  • 全天候运行 — 在 Cloudflare Workers 上运行,无需本地机器
  • 多源信号 — 来自 StockTwits、Reddit(4 个子版块)以及 Twitter 的确认信号
  • 多提供商 LLM — 通过 AI SDK 或 Cloudflare AI Gateway 支持 OpenAI、Anthropic、Google、xAI 和 DeepSeek
  • 加密货币交易 — 全天候交易 BTC、ETH 和 SOL
  • 期权支持 — 高确定性的期权策略
  • 过时检测 — 自动平仓失去动能的头寸
  • 盘前分析 — 在市场开盘前制定交易计划
  • Discord 通知 — 接收买入信号提醒
  • 可插拔策略系统 — 无需修改核心文件即可创建自定义策略

系统要求

  • Node.js 18+
  • Cloudflare 账户(免费层级即可)
  • Alpaca 账户(免费,支持模拟交易)
  • LLM API 密钥(OpenAI、Anthropic、Google、xAI、DeepSeek)或 Cloudflare AI Gateway 凭证

快速入门

1. 克隆并安装

git clone https://github.com/ygwyg/MAHORAGA.git
cd mahoraga
npm install

2. 创建 Cloudflare 资源

# 创建 D1 数据库
npx wrangler d1 create mahoraga-db
# 将 database_id 复制到 wrangler.jsonc 中

# 创建 KV 命名空间
npx wrangler kv namespace create CACHE
# 将 id 复制到 wrangler.jsonc 中

# 运行数据库迁移
npx wrangler d1 migrations apply mahoraga-db

3. 设置密钥

# 必需
npx wrangler secret put ALPACA_API_KEY
npx wrangler secret put ALPACA_API_SECRET

# API 认证 — 生成一个安全的随机令牌(推荐 64 个字符以上)
# 示例:openssl rand -base64 48
npx wrangler secret put MAHORAGA_API_TOKEN

# LLM 提供商(选择一种模式)
npx wrangler secret put LLM_PROVIDER  # "openai-raw"(默认)、"ai-sdk" 或 "cloudflare-gateway"
npx wrangler secret put LLM_MODEL     # 例如:"gpt-4o-mini" 或 "anthropic/claude-sonnet-4"

# LLM API 密钥(根据提供商模式)
npx wrangler secret put OPENAI_API_KEY         # 用于 openai-raw 或使用 OpenAI 的 ai-sdk
npx wrangler secret put OPENAI_BASE_URL        # 可选:覆盖 openai-raw 和 ai-sdk 的 OpenAI 基础 URL(适用于 OpenAI 模型)
# npx wrangler secret put ANTHROPIC_API_KEY    # 用于使用 Anthropic 的 ai-sdk
# npx wrangler secret put GOOGLE_GENERATIVE_AI_API_KEY  # 用于使用 Google 的 ai-sdk
# npx wrangler secret put XAI_API_KEY          # 用于使用 xAI/Grok 的 ai-sdk
# npx wrangler secret put DEEPSEEK_API_KEY     # 用于使用 DeepSeek 的 ai-sdk
# npx wrangler secret put CLOUDFLARE_AI_GATEWAY_ACCOUNT_ID  # 用于 cloudflare-gateway
# npx wrangler secret put CLOUDFLARE_AI_GATEWAY_ID          # 用于 cloudflare-gateway
# npx wrangler secret put CLOUDFLARE_AI_GATEWAY_TOKEN       # 用于 cloudflare-gateway

# 可选
npx wrangler secret put ALPACA_PAPER         # 设置为 "true" 以启用模拟交易(推荐)
npx wrangler secret put TWITTER_BEARER_TOKEN
npx wrangler secret put DISCORD_WEBHOOK_URL
npx wrangler secret put KILL_SWITCH_SECRET   # 紧急停止开关(与 API 令牌分开)

4. 部署

npx wrangler deploy

5. 启用代理

所有 API 端点都需要通过 Bearer 令牌进行认证:

# 为了方便起见,将您的 API 令牌设置为环境变量
export MAHORAGA_TOKEN="your-api-token"

# 启用代理
curl -H "Authorization: Bearer $MAHORAGA_TOKEN" \
  https://mahoraga.bernardoalmeida2004.workers.dev/agent/enable

6. 监控

# 检查状态
curl -H "Authorization: Bearer $MAHORAGA_TOKEN" \
  https://mahoraga.bernardoalmeida2004.workers.dev/agent/status

# 查看日志
curl -H "Authorization: Bearer $MAHORAGA_TOKEN" \
  https://mahoraga.bernardoalmeida2004.workers.dev/agent/logs

# 紧急停止开关(使用单独的 KILL_SWITCH_SECRET)
curl -H "Authorization: Bearer $KILL_SWITCH_SECRET" \
  https://mahoraga.bernardoalmeida2004.workers.dev/agent/kill

# 在本地运行仪表板
cd dashboard && npm install && npm run dev

本地开发

# 终端 1 — 启动 wrangler
npx wrangler dev

# 终端 2 — 启动仪表板  
cd dashboard && npm run dev

# 终端 3 — 启用代理
curl -H "Authorization: Bearer $MAHORAGA_TOKEN" \
  http://localhost:8787/agent/enable

自定义策略

Mahoraga 使用一个 可插拔的策略系统。核心框架是一个轻量级的协调器——所有可定制的逻辑都位于策略模块中。您无需修改核心文件。

工作原理

  1. 创建 src/strategy/my-strategy/index.ts,实现 Strategy 接口
  2. 修改 src/strategy/index.ts 中的一行导入语句
// src/strategy/index.ts
import { myStrategy } from "./my-strategy";
export const activeStrategy = myStrategy;

可自定义的内容

组件 文件 作用
数据收集器 gatherers/*.ts 从数据源(StockTwits、Reddit 等)获取信号
提示模板 prompts/*.ts 用于研究和分析的 LLM 提示模板
入场规则 rules/entries.ts 决定购买哪些信号
出场规则 rules/exits.ts 决定何时卖出头寸
配置 config.ts 默认参数和各数据源权重

您可以复用默认的数据收集器,混合使用自定义的收集器,覆盖提示模板,并定义自己的入场/出场规则——所有这些都不需要修改核心文件。

添加新的数据源

创建一个返回 Signal[] 的数据收集器:

import type { Gatherer, StrategyContext } from "../../types";

const myGatherer: Gatherer = {
  name: "my-source",
  gather: async (ctx: StrategyContext) => {
    const res = await fetch("https://your-api.com/data");
    const data = await res.json();
    return data.items.map(item => ({
      symbol: item.ticker,
      source: "my_source",
      source_detail: "my_source_v1",
      sentiment: item.sentiment,
      raw_sentiment: item.sentiment,
      volume: 1,
      freshness: 1.0,
      source_weight: 0.9,
      reason: `MySource: ${item.summary}`,
      timestamp: Date.now(),
    }));
  },
};

然后将其加入到您的策略的 gatherers 数组中。

完整自定义指南请参阅 docs/harness.html

配置

设置 默认值 描述
max_positions 5 最大并发持仓数
max_position_value 5000 每个仓位的最大金额(美元)
take_profit_pct 10 止盈百分比
stop_loss_pct 5 止损百分比
min_sentiment_score 0.3 考虑交易的最低情绪得分
min_analyst_confidence 0.6 进行交易所需的最低 LLM 置信度
options_enabled false 启用期权交易
crypto_enabled false 启用 24/7 加密货币交易
llm_model gpt-4o-mini 研究模型(便宜,用于批量分析)
llm_analyst_model gpt-4o 分析师模型(智能,用于交易决策)

LLM 提供商配置

MAHORAGA 支持通过三种模式使用多个 LLM 提供商:

模式 描述 必需的环境变量
openai-raw 直接使用 OpenAI API(默认) OPENAI_API_KEY
ai-sdk Vercel AI SDK,支持 5 家提供商 一个或多个提供商的密钥
cloudflare-gateway Cloudflare AI Gateway (/compat) CLOUDFLARE_AI_GATEWAY_ACCOUNT_IDCLOUDFLARE_AI_GATEWAY_IDCLOUDFLARE_AI_GATEWAY_TOKEN

可选的 OpenAI 基础 URL 替换:

  • OPENAI_BASE_URL — 替换用于 OpenAI 请求的基础 URL。适用于 LLM_PROVIDER=openai-raw 以及 LLM_PROVIDER=ai-sdk 中的 OpenAI 模型(以 openai/ 开头)。默认值:https://api.openai.com/v1

Cloudflare AI Gateway 注意事项:

  • 该集成会调用 Cloudflare 兼容 OpenAI 的 /compat/chat/completions 端口,并始终发送 cf-aig-authorization
  • 它适用于 BYOK/统一计费设置,在这种情况下上游提供商的密钥已在 Cloudflare 中配置(因此您的 Worker 不会发送提供商的 API 密钥)。
  • 模型采用 {provider}/{model} 格式(例如 openai/gpt-5-minigoogle-ai-studio/gemini-2.5-flashanthropic/claude-sonnet-4-5)。

AI SDK 支持的提供商:

提供商 环境变量 示例模型
OpenAI OPENAI_API_KEY openai/gpt-4oopenai/o1
Anthropic ANTHROPIC_API_KEY anthropic/claude-sonnet-4anthropic/claude-opus-4
Google GOOGLE_GENERATIVE_AI_API_KEY google/gemini-2.5-progoogle/gemini-2.5-flash
xAI (Grok) XAI_API_KEY xai/grok-4xai/grok-3
DeepSeek DEEPSEEK_API_KEY deepseek/deepseek-chatdeepseek/deepseek-reasoner

示例:使用 Claude 和 AI SDK:

npx wrangler secret put LLM_PROVIDER      # 设置为 "ai-sdk"
npx wrangler secret put LLM_MODEL         # 设置为 "anthropic/claude-sonnet-4"
npx wrangler secret put ANTHROPIC_API_KEY # 您的 Anthropic API 密钥

API 端点

端点 描述
/agent/status 完整状态(账户、持仓、信号)
/agent/enable 启用代理
/agent/disable 禁用代理
/agent/config 获取或更新配置
/agent/logs 获取最近的日志
/agent/trigger 手动触发(用于测试)
/agent/kill 紧急停止开关(使用 KILL_SWITCH_SECRET
/mcp MCP 服务器,用于工具访问

安全性

API 认证(必需)

所有 /agent/* 端点都需要使用 MAHORAGA_API_TOKEN 进行 Bearer 令牌认证:

curl -H "Authorization: Bearer $MAHORAGA_TOKEN" https://mahoraga.bernardoalmeida2004.workers.dev/agent/status

生成安全令牌的方法:openssl rand -base64 48

紧急停止开关

/agent/kill 端点使用单独的 KILL_SWITCH_SECRET 进行紧急关闭:

curl -H "Authorization: Bearer $KILL_SWITCH_SECRET" https://mahoraga.bernardoalmeida2004.workers.dev/agent/kill

这将立即禁用代理,取消所有警报,并清空信号缓存。

Cloudflare Access(推荐)

为了通过 SSO/电子邮件验证提供额外的安全保障,可以设置 Cloudflare Access:

# 1. 创建具有 Access:Edit 权限的 Cloudflare API 令牌
#    https://dash.cloudflare.com/profile/api-tokens

# 2. 运行设置脚本
CLOUDFLARE_API_TOKEN=your-token \
CLOUDFLARE_ACCOUNT_ID=your-account-id \
MAHORAGA_WORKER_URL=https://mahoraga.your-subdomain.workers.dev \
MAHORAGA_ALLOWED_EMAILS=you@example.com \
npm run setup:access

这将创建一个带有电子邮件验证或一次性 PIN 的 Cloudflare Access 应用程序。

项目结构

mahoraga/
├── wrangler.jsonc              # Cloudflare Workers 配置文件
├── src/
│   ├── index.ts                # 入口点及路由
│   ├── core/
│   │   ├── types.ts            # 共享类型(Signal、AgentState 等)
│   │   └── policy-broker.ts    # 使用 PolicyEngine 包装的交易执行
│   ├── durable-objects/
│   │   └── mahoraga-harness.ts # 核心编排器(轻量级——委托给策略)
│   ├── strategy/
│   │   ├── types.ts            # 策略接口契约
│   │   ├── index.ts            # 活跃策略选择器(只需更改这一行)
│   │   └── default/            # 默认的“情绪-动量”策略
│   │       ├── index.ts        # 策略组装
│   │       ├── config.ts       # 默认配置及数据源权重
│   │       ├── gatherers/      # StockTwits、Reddit、SEC、加密货币、Twitter
│   │       ├── prompts/        # LLM 提示模板
│   │       ├── rules/          # 进出场、过时、期权、加密货币规则
│   │       └── helpers/        # 股票代码提取、情绪分析
│   ├── mcp/                    # MCP 服务器及工具
│   ├── policy/                 # 交易验证与风险引擎
│   ├── providers/              # Alpaca、LLM 提供商
│   └── schemas/                # 配置模式(Zod)
├── dashboard/                  # React 仪表盘
├── docs/                       # 文档
└── migrations/                 # D1 数据库迁移

安全特性

特性 描述
模拟交易 使用 ALPACA_PAPER=true 开始
紧急停止开关 通过密钥进行紧急停止
仓位限制 最大仓位数及每个仓位的金额限制
日度亏损上限 当日亏损超过 2% 时停止交易
过时检测 自动平掉过时的仓位
无保证金 仅现金交易
无做空 仅多头仓位

社区

加入我们的 Discord 以获取帮助和讨论:

Discord 服务器

免责声明

⚠️ 重要:使用前请阅读

本软件仅用于教育和信息目的。本仓库中的任何内容均不构成金融、投资、法律或税务建议。

使用本软件即表示您确认并同意以下事项:

  • 所有的交易和投资决策均由您自行承担风险
  • 市场具有高度波动性,您可能损失部分或全部本金
  • 不对性能、收益或结果作出任何保证
  • 作者及贡献者对任何财务损失不承担任何责任
  • 本软件可能存在漏洞或出现意外行为
  • 过去的业绩并不保证未来的成果

请务必先进行模拟交易,并且切勿投入您无法承受损失的资金。

许可证

MIT 许可证——可供个人和商业用途免费使用。完整条款请参阅 LICENSE 文件。

常见问题

相似工具推荐

openclaw

OpenClaw 是一款专为个人打造的本地化 AI 助手,旨在让你在自己的设备上拥有完全可控的智能伙伴。它打破了传统 AI 助手局限于特定网页或应用的束缚,能够直接接入你日常使用的各类通讯渠道,包括微信、WhatsApp、Telegram、Discord、iMessage 等数十种平台。无论你在哪个聊天软件中发送消息,OpenClaw 都能即时响应,甚至支持在 macOS、iOS 和 Android 设备上进行语音交互,并提供实时的画布渲染功能供你操控。 这款工具主要解决了用户对数据隐私、响应速度以及“始终在线”体验的需求。通过将 AI 部署在本地,用户无需依赖云端服务即可享受快速、私密的智能辅助,真正实现了“你的数据,你做主”。其独特的技术亮点在于强大的网关架构,将控制平面与核心助手分离,确保跨平台通信的流畅性与扩展性。 OpenClaw 非常适合希望构建个性化工作流的技术爱好者、开发者,以及注重隐私保护且不愿被单一生态绑定的普通用户。只要具备基础的终端操作能力(支持 macOS、Linux 及 Windows WSL2),即可通过简单的命令行引导完成部署。如果你渴望拥有一个懂你

349.3k|★★★☆☆|1周前
Agent开发框架图像

stable-diffusion-webui

stable-diffusion-webui 是一个基于 Gradio 构建的网页版操作界面,旨在让用户能够轻松地在本地运行和使用强大的 Stable Diffusion 图像生成模型。它解决了原始模型依赖命令行、操作门槛高且功能分散的痛点,将复杂的 AI 绘图流程整合进一个直观易用的图形化平台。 无论是希望快速上手的普通创作者、需要精细控制画面细节的设计师,还是想要深入探索模型潜力的开发者与研究人员,都能从中获益。其核心亮点在于极高的功能丰富度:不仅支持文生图、图生图、局部重绘(Inpainting)和外绘(Outpainting)等基础模式,还独创了注意力机制调整、提示词矩阵、负向提示词以及“高清修复”等高级功能。此外,它内置了 GFPGAN 和 CodeFormer 等人脸修复工具,支持多种神经网络放大算法,并允许用户通过插件系统无限扩展能力。即使是显存有限的设备,stable-diffusion-webui 也提供了相应的优化选项,让高质量的 AI 艺术创作变得触手可及。

162.1k|★★★☆☆|1周前
开发框架图像Agent

everything-claude-code

everything-claude-code 是一套专为 AI 编程助手(如 Claude Code、Codex、Cursor 等)打造的高性能优化系统。它不仅仅是一组配置文件,而是一个经过长期实战打磨的完整框架,旨在解决 AI 代理在实际开发中面临的效率低下、记忆丢失、安全隐患及缺乏持续学习能力等核心痛点。 通过引入技能模块化、直觉增强、记忆持久化机制以及内置的安全扫描功能,everything-claude-code 能显著提升 AI 在复杂任务中的表现,帮助开发者构建更稳定、更智能的生产级 AI 代理。其独特的“研究优先”开发理念和针对 Token 消耗的优化策略,使得模型响应更快、成本更低,同时有效防御潜在的攻击向量。 这套工具特别适合软件开发者、AI 研究人员以及希望深度定制 AI 工作流的技术团队使用。无论您是在构建大型代码库,还是需要 AI 协助进行安全审计与自动化测试,everything-claude-code 都能提供强大的底层支持。作为一个曾荣获 Anthropic 黑客大奖的开源项目,它融合了多语言支持与丰富的实战钩子(hooks),让 AI 真正成长为懂上

154.3k|★★☆☆☆|今天
开发框架Agent语言模型

ComfyUI

ComfyUI 是一款功能强大且高度模块化的视觉 AI 引擎,专为设计和执行复杂的 Stable Diffusion 图像生成流程而打造。它摒弃了传统的代码编写模式,采用直观的节点式流程图界面,让用户通过连接不同的功能模块即可构建个性化的生成管线。 这一设计巧妙解决了高级 AI 绘图工作流配置复杂、灵活性不足的痛点。用户无需具备编程背景,也能自由组合模型、调整参数并实时预览效果,轻松实现从基础文生图到多步骤高清修复等各类复杂任务。ComfyUI 拥有极佳的兼容性,不仅支持 Windows、macOS 和 Linux 全平台,还广泛适配 NVIDIA、AMD、Intel 及苹果 Silicon 等多种硬件架构,并率先支持 SDXL、Flux、SD3 等前沿模型。 无论是希望深入探索算法潜力的研究人员和开发者,还是追求极致创作自由度的设计师与资深 AI 绘画爱好者,ComfyUI 都能提供强大的支持。其独特的模块化架构允许社区不断扩展新功能,使其成为当前最灵活、生态最丰富的开源扩散模型工具之一,帮助用户将创意高效转化为现实。

108.3k|★★☆☆☆|4天前
开发框架图像Agent

gemini-cli

gemini-cli 是一款由谷歌推出的开源 AI 命令行工具,它将强大的 Gemini 大模型能力直接集成到用户的终端环境中。对于习惯在命令行工作的开发者而言,它提供了一条从输入提示词到获取模型响应的最短路径,无需切换窗口即可享受智能辅助。 这款工具主要解决了开发过程中频繁上下文切换的痛点,让用户能在熟悉的终端界面内直接完成代码理解、生成、调试以及自动化运维任务。无论是查询大型代码库、根据草图生成应用,还是执行复杂的 Git 操作,gemini-cli 都能通过自然语言指令高效处理。 它特别适合广大软件工程师、DevOps 人员及技术研究人员使用。其核心亮点包括支持高达 100 万 token 的超长上下文窗口,具备出色的逻辑推理能力;内置 Google 搜索、文件操作及 Shell 命令执行等实用工具;更独特的是,它支持 MCP(模型上下文协议),允许用户灵活扩展自定义集成,连接如图像生成等外部能力。此外,个人谷歌账号即可享受免费的额度支持,且项目基于 Apache 2.0 协议完全开源,是提升终端工作效率的理想助手。

100.8k|★★☆☆☆|4天前
插件Agent图像

LLMs-from-scratch

LLMs-from-scratch 是一个基于 PyTorch 的开源教育项目,旨在引导用户从零开始一步步构建一个类似 ChatGPT 的大型语言模型(LLM)。它不仅是同名技术著作的官方代码库,更提供了一套完整的实践方案,涵盖模型开发、预训练及微调的全过程。 该项目主要解决了大模型领域“黑盒化”的学习痛点。许多开发者虽能调用现成模型,却难以深入理解其内部架构与训练机制。通过亲手编写每一行核心代码,用户能够透彻掌握 Transformer 架构、注意力机制等关键原理,从而真正理解大模型是如何“思考”的。此外,项目还包含了加载大型预训练权重进行微调的代码,帮助用户将理论知识延伸至实际应用。 LLMs-from-scratch 特别适合希望深入底层原理的 AI 开发者、研究人员以及计算机专业的学生。对于不满足于仅使用 API,而是渴望探究模型构建细节的技术人员而言,这是极佳的学习资源。其独特的技术亮点在于“循序渐进”的教学设计:将复杂的系统工程拆解为清晰的步骤,配合详细的图表与示例,让构建一个虽小但功能完备的大模型变得触手可及。无论你是想夯实理论基础,还是为未来研发更大规模的模型做准备

90.1k|★★★☆☆|1周前
语言模型图像Agent