llm-twin-course

4.3k 716 较难 1 次阅读今天MIT开发框架语言模型

AI 解读由 AI 自动生成，仅供参考

llm-twin-course 是一门免费的实战课程，旨在指导开发者从零构建一个端到端、可投入生产的"LLM 分身”系统。这个 AI 分身能够学习并模仿特定用户的写作风格与个性，解决传统机器学习教程中代码碎片化、缺乏工程落地场景的痛点，帮助学习者掌握从数据采集到模型部署的全流程 LLMOps 最佳实践。

本课程特别适合希望提升大模型工程化能力的开发者、数据科学家及 AI 研究人员。其核心亮点在于将复杂的系统架构拆解为四个清晰的 Python 微服务：数据收集流水线负责从社交媒体抓取并清洗数据；特征流水线利用 Bytewax 进行实时流处理并向量化存储；训练流水线演示了如何使用 LoRA/QLoRA 微调模型并结合 Comet ML 与 Opik 进行实验追踪与评估；推理流水线则展示了如何通过 AWS SageMaker 部署可扩展的 API 并集成高级 RAG 技术。

通过 12 节动手课程，学员不仅能获得完整源码，还能深入理解向量数据库、流式计算、模型注册及提示词监控等关键技术，最终独立搭建出具备生产级稳定性的个性化大语言模型应用。

使用场景

某科技博主希望构建一个能模仿其写作风格、自动回答粉丝提问的 AI 助手，但缺乏将分散数据转化为生产级系统的工程经验。

没有 llm-twin-course 时

数据孤岛严重：手动从 Medium、GitHub 等平台复制粘贴文章，清洗和格式化数据耗时且容易出错，无法形成自动化流。
原型难以落地：代码仅停留在 Jupyter Notebook 中的实验脚本，缺乏微服务架构设计，无法应对真实并发请求。
模型迭代黑盒：微调过程没有实验追踪和版本管理，一旦效果不佳，难以复现问题或对比不同参数策略。
监控缺失：部署后无法监测 Prompt 质量和生成内容的准确性，出现“幻觉”或风格偏差时只能被动等待用户反馈。

使用 llm-twin-course 后

自动化数据流水线：通过课程提供的 ETL 管道和 CDC 模式，自动抓取多平台数据并实时流入 Qdrant 向量库，确保知识库动态更新。
生产级微服务架构：直接复用包含数据、特征、训练和推理四大微服务的完整架构，快速将系统部署为可扩展的 AWS SageMaker API。
标准化 LLMOps 流程：利用 Comet ML 和 Opik 全程监控微调实验与评估指标，轻松管理模型版本，确保每次迭代都有据可依。
全链路可观测性：内置的 Prompt 监控机制实时分析生成结果，结合 RAG 技术显著降低幻觉，保证输出内容高度契合个人风格。

llm-twin-course 将零散的 AI 实验转化为具备工业级鲁棒性的端到端系统，让开发者能专注于业务逻辑而非重复造轮子。

运行环境要求

操作系统

Linux
macOS
Windows

GPU

本地无需 GPU（微调与推理在 AWS SageMaker 云端进行）
若本地运行实验，建议使用支持 CUDA 的 NVIDIA GPU

内存

任何现代笔记本电脑或工作站即可（具体数值未说明，建议 16GB+ 以流畅运行数据处理流程）

依赖

notes本课程架构设计为云端优先，核心计算任务（LLM 微调、推理部署）均在 AWS SageMaker 上执行，因此对本地硬件要求极低。主要依赖包括向量数据库 Qdrant/Redis、流处理框架 Bytewax、优化引擎 Superlinked 以及监控工具 Opik/Comet ML。用户需准备 AWS 账户并配置相关凭证，预计产生少量云服务费用（约 10 美元以内）。

python3.8+

bytewax

qdrant-client

superlinked

comet_ml

opik

transformers

peft

aws-sagemaker

mongo

rabbitmq

gradio

快速开始

LLM双生课程：构建你的生产就绪AI副本

通过构建你的LLM双生，学习如何架构并实现一个生产就绪的LLM与RAG系统

从数据收集到使用LLMOps最佳实践将LLM投入生产。

由 Decoding ML

🎯 你将学到什么

完成免费课程 “LLM双生：构建你的生产就绪AI副本” 后，你将学会如何利用LLM、向量数据库和LLMOps最佳实践，设计、训练并部署一个属于你自己的、具备生产级标准的LLM双生模型。

不再局限于孤立的脚本或Notebook！ 通过构建并部署一个端到端的生产级LLM系统，掌握生产环境下的机器学习开发。

📖 关于本课程

你将学习如何从起点到终点，架构并 构建一个真实的LLM系统——从 数据收集 到部署。

你还将学习如何 运用MLOps最佳实践，例如实验跟踪器、模型注册表、提示监控和版本管理等。

最终目标？ 构建并部署属于你自己的LLM双生。

什么是LLM双生？ 它是一个能够模仿某人写作风格和个性的AI角色，通过将这些特征融入LLM中来实现。

🪈 LLM双生的架构分为4个Python微服务

数据收集管道

从Medium、Substack和GitHub等多种社交媒体平台抓取你的数字数据。

通过一系列ETL管道对数据进行清洗、归一化处理，并加载到 Mongo NoSQL数据库中。
使用CDC模式将数据库变更发送到RabbitMQ队列中。
学习如何将爬虫封装为AWS Lambda函数。

特征提取管道

通过Bytewax流式处理管道实时消费队列中的消息。
每条消息都会被清洗、分块、嵌入并向量数据库Qdrant中加载。
在附加章节中，我们将使用Superlinked，一种专门的向量计算引擎，重构清洗、分块和嵌入逻辑。我们还将把向量加载并索引到Redis向量数据库中。

训练管道

基于你的自定义数字数据创建一个定制指令数据集，用于监督微调（SFT）。
使用LoRA或QLoRA对LLM进行微调。
使用Comet ML的实验跟踪器监控实验过程。
使用Opik评估LLM性能。
将最佳模型保存并版本化至Hugging Face模型注册表。
使用AWS SageMaker运行并自动化训练管道。

推理管道

从Hugging Face模型注册表加载微调后的LLM。
使用AWS SageMaker推理端点将LLM部署为可扩展的REST API。
通过高级RAG技术增强提示。
使用Opik监控提示及LLM生成的结果。
在附加章节中，我们将使用Superlinked重构高级RAG层，以编写更优化的查询。
最后，通过一个Gradio UI界面（如下所示）完成整个流程，你可以开始与LLM双生互动，生成符合你写作风格的内容。

Gradio UI

在四个微服务的过程中，你还将学习如何集成以下四种无服务器工具：

Comet ML 作为你的实验跟踪器和数据注册表；
Qdrant 作为你的向量数据库；
AWS SageMaker 作为你的机器学习基础设施；
Opik 作为你的提示评估与监控工具。

📬 保持更新

加入Decoding ML，获取关于如何运用软件工程和MLOps最佳实践设计、编码并部署生产级AI系统的实用内容，助你成功交付AI应用。每周直接发送到你的邮箱。

👥 谁适合参加？

本课程非常适合：

希望学习如何基于LLMOps原则构建生产就绪LLM与RAG系统的ML/AI工程师
想要理解LLM与RAG系统背后工程原理的数据工程师、数据科学家和软件工程师

注意： 本课程侧重于工程实践和端到端系统实现，而非理论模型优化或研究。

🎓 入门要求

类别	要求
技能	对Python和机器学习有基本了解
硬件	任何现代笔记本电脑或工作站均可，因为LLM的微调和推理将在AWS SageMaker上完成。
水平	中级

💰 成本结构

课程中使用的工具大多会遵循其免费层级，例外情况如下：

OpenAI的API，费用约为1美元；
AWS用于微调和推理，根据你使用脚本的频率以及所在地区，费用不超过10美元。

🥂 开源课程：参与开放且免费

作为一门开源课程，你无需报名。所有内容均为自主学习，完全免费，资源也可自由访问，具体如下：

代码：本GitHub仓库
文章：Decoding ML

📚 你将如何学习？

本课程包含10节实践性书面课程以及可在GitHub上获取的开源代码，演示如何构建一个端到端的LLM系统。

此外，还包含2节关于如何改进RAG系统的附加课程。

你可以按照自己的节奏阅读所有内容。

课程

本自学课程由12节全面的课程组成，涵盖理论、系统设计和动手实现。

我们对每个模块的建议：

阅读文章
运行代码以复现我们的结果
通过阅读src目录下的Python模块深入理解代码

[!NOTE] 请查看INSTALL_AND_USAGE文档，获取分步安装和使用指南。

课程	文章	类别	描述	源代码
1	用于生产就绪LLM系统的端到端框架	系统设计	学习生产级LLM系统的整体架构和设计原则。	无代码
2	数据爬取	数据工程	学习如何爬取和处理社交媒体内容以用于LLM训练。	`src/data_crawling`
3	CDC魔法	数据工程	学习实现变更数据捕获（CDC），用于同步两个数据源。	`src/data_cdc`
4	特征流式管道	特征管道	构建用于LLM和RAG数据处理的实时流式管道。	`src/feature_pipeline`
5	高级RAG算法	特征管道	实现先进的RAG技术以提升检索效果。	`src/feature_pipeline`
6	生成微调指令数据集	训练管道	创建用于LLM微调的自定义指令数据集。	`src/feature_pipeline/generate_dataset`
7	LLM微调管道	训练管道	构建端到端的LLM微调管道，并将其部署到AWS SageMaker。	`src/training_pipeline`
8	LLM与RAG评估	训练管道	学习如何评估LLM和RAG系统的性能。	`src/inference_pipeline/evaluation`
9	实施并部署RAG推理管道	推理管道	设计、实施并将RAG推理服务部署到AWS SageMaker。	`src/inference_pipeline`
10	提示监控	推理管道	构建提示监控和生产评估管道。	`src/inference_pipeline`
11	使用74.3%更少的代码重构RAG模块	RAG附加课程	优化RAG系统。	`src/bonus_superlinked_rag`
12	多索引RAG应用	RAG附加课程	构建先进的多索引RAG应用。	`src/bonus_superlinked_rag`

📬 保持更新

加入Decoding ML，获取经过验证的内容，介绍如何运用软件工程和MLOps最佳实践来设计、编码和部署生产级AI系统，帮助你成功交付AI应用。每周直接发送到你的邮箱。

🏗️ 项目结构

在Decoding ML，我们教授如何构建生产级ML系统，因此本课程遵循真实Python项目的结构：

llm-twin-course/
├── src/                     # 所有ML管道和服务的源代码
│ ├── data_crawling/         # 数据采集管道代码
│ ├── data_cdc/              # 变更数据捕获（CDC）管道代码
│ ├── feature_pipeline/      # 特征工程管道代码
│ ├── training_pipeline/     # 训练管道代码
│ ├── inference_pipeline/    # 推理服务代码
│ └── bonus_superlinked_rag/ # RAG优化附加代码
├── .env.example             # 环境变量模板示例
├── Makefile                 # 用于构建和运行项目的命令
├── pyproject.toml           # 项目依赖项

🚀 安装与使用

要了解如何端到端地安装和运行LLM Twin代码，请访问专门的INSTALL_AND_USAGE文档。

[!NOTE] 尽管你仅凭INSTALL_AND_USAGE文档就能运行所有内容，但我们仍建议你阅读相关文章，以便充分理解LLM Twin系统及其设计决策。

💡 问题与故障排除

遇到问题或疑问？我们随时为您提供帮助！

请在GitHub问题中提出：

关于课程内容的问题
技术故障排除
对概念的澄清

🥂 贡献

作为一门开源课程，我们可能无法修复所有出现的bug。

如果你发现了bug并知道如何修复，请通过贡献你的修复补丁来支持未来的读者。

我们将非常感谢你对AI社区和未来读者的支持 🤗

贡献者

向所有贡献者致以诚挚的感谢 🙏！本课程的完成离不开他们的辛勤付出。

赞助商

同时，我们也向所有支持我们工作、使本课程得以实现的赞助商表示衷心的感谢 🙏。

Comet	Opik	Bytewax	Qdrant	Superlinked

后续步骤

我们的《LLM 工程师手册》启发了这门开源的 LLM Twin 课程。

请考虑通过购买我们的书籍来支持我们的工作，学习一套完整的框架，用于构建和部署生产级的 LLM 和 RAG 系统——从数据准备到上线部署。本书非常适合希望将理论与实践相结合，并在数据工程、研究、机器学习工程和 MLOps 之间建立联系的从业者：

购买《LLM 工程师手册》

许可证

本课程是一个基于 MIT 许可证发布的开源项目。因此，只要您分发我们的 LICENSE 文件并注明我们的工作出处，就可以安全地克隆或 fork 该项目，并将其作为灵感来源，用于任何用途（例如：大学项目、毕业设计、个人项目等）。

📬 保持更新

加入 Decoding ML，获取关于如何运用软件工程和 MLOps 最佳实践来设计、编码并部署生产级 AI 系统的实用内容，助您顺利交付 AI 应用。每周一次，直接发送到您的邮箱。

LLM Twin Course 快速上手指南

本指南帮助你快速搭建并运行 LLM Twin 项目，构建一个基于你个人数据风格的生产级 LLM 与 RAG 系统。

环境准备

在开始之前，请确保你的开发环境满足以下要求：

系统要求

操作系统: Linux, macOS 或 Windows (推荐 WSL2)
硬件: 任意现代笔记本电脑或工作站即可。
- 注意: 模型的微调（Fine-tuning）和推理（Inference）将在 AWS SageMaker 云端运行，本地无需高性能 GPU。
Python 版本: Python 3.9+

前置依赖与账号

你需要准备以下云服务和工具账号（大部分提供免费层级）：

AWS 账号: 用于 SageMaker 训练、推理及 Lambda 函数（预计成本 < $10）。
Hugging Face 账号: 用于模型注册表及访问 Token。
Comet ML 账号: 用于实验追踪（免费层可用）。
Qdrant 账号/实例: 用于向量数据库（可使用本地 Docker 或云服务）。
OpenAI API Key: 用于部分数据处理流程（预计成本 ~$1）。
基础技能: 具备基本的 Python 和机器学习知识。

安装步骤

1. 克隆项目代码

git clone https://github.com/decodingml/llm-twin-course.git
cd llm-twin-course

2. 创建虚拟环境

推荐使用 venv 或 conda 隔离环境：

python -m venv venv
source venv/bin/activate  # Windows 用户请使用: venv\Scripts\activate

3. 安装依赖

安装项目所需的核心 Python 包：

pip install -r requirements.txt

(注：如果下载速度慢，可添加国内镜像源，例如：pip install -r requirements.txt -i https://pypi.tuna.tsinghua.edu.cn/simple)

4. 配置环境变量

复制示例配置文件并根据实际情况填入你的 API Keys 和云凭证：

cp .env.example .env

编辑 .env 文件，确保填入以下关键信息：

AWS_ACCESS_KEY_ID / AWS_SECRET_ACCESS_KEY
HUGGINGFACE_TOKEN
COMET_API_KEY
OPENAI_API_KEY
QDRANT_URL (如果使用本地 Docker，通常为 http://localhost:6333)

5. 启动本地基础设施 (可选)

如果你选择在本地运行向量数据库和消息队列，可以使用 Docker Compose：

docker-compose up -d

这将启动 Qdrant (向量库) 和 RabbitMQ (消息队列)。

提示: 详细的分步安装和特定模块的配置说明，请参考项目根目录下的 INSTALL_AND_USAGE.md 文档。

基本使用

本项目由 4 个微服务管道组成，建议按照课程顺序依次运行。以下是最核心的数据抓取与推理演示流程示例。

第一步：运行数据抓取管道 (Data Crawling)

从社交媒体（如 Medium, GitHub, Substack）抓取你的数字足迹并清洗数据。

# 进入数据抓取模块目录
cd src/data_crawling

# 运行爬虫脚本 (请确保已在 .env 中配置好相关平台 Token)
python main.py --platforms medium,github --user YOUR_USERNAME

执行后，数据将被清洗并存入 MongoDB，变更将通过 CDC 模式发送至 RabbitMQ。

第二步：运行特征工程管道 (Feature Pipeline)

消费消息队列中的数据，进行分块（Chunking）、嵌入（Embedding）并加载到向量数据库。

cd ../feature_pipeline

# 启动流式处理管道
python main.py

第三步：微调与部署 (Training & Inference)

由于微调和推理主要在 AWS SageMaker 上运行，你需要通过脚本触发云端任务。

触发微调任务：

cd ../training_pipeline

# 提交训练作业到 SageMaker
python submit_training_job.py --model_name llama-3-8b --lora_r 16

部署推理端点并测试： 当模型训练完成并注册到 Hugging Face 后，部署推理服务：

cd ../inference_pipeline

# 部署 SageMaker 端点
python deploy_endpoint.py --model_id YOUR_HF_MODEL_ID

# 调用端点进行简单测试
python test_inference.py --prompt "写一篇关于机器学习的文章，模仿我的风格"

第四步：启动交互界面 (Gradio UI)

项目提供了一个 Gradio 界面，让你可以直接与训练好的 "LLM Twin" 对话。

# 在项目根目录或 inference_pipeline 目录下运行
python app.py

运行后，终端会显示一个本地 URL（通常是 http://127.0.0.1:7860），在浏览器中打开即可开始体验生成符合你写作风格的内容。

学习建议：本项目包含 12 节配套教程。最佳学习路径是：阅读对应章节的文章 -> 运行上述代码复现结果 -> 深入阅读 src 目录下的源码理解实现细节。

常见问题

我应该从哪里开始学习本课程（Course 1）？

这个仓库的项目与书中的项目有什么区别？哪个更完整或更新？

我应该遵循哪个目录下的源代码？根目录的 1-6 文件夹还是 /course 目录？

运行 docker logs 时出现 Rust panic 错误或队列获取消息错误，如何解决？

在本地运行数据爬虫测试（make local-test-github）时遇到 500 错误怎么办？

教程文章中提到的推理管道（Inference Pipeline）代码在仓库中找不到，是否缺失？

教程文章链接与当前代码库不匹配，指令和代码对不上怎么办？

相似工具推荐

openclaw

OpenClaw 是一款专为个人打造的本地化 AI 助手，旨在让你在自己的设备上拥有完全可控的智能伙伴。它打破了传统 AI 助手局限于特定网页或应用的束缚，能够直接接入你日常使用的各类通讯渠道，包括微信、WhatsApp、Telegram、Discord、iMessage 等数十种平台。无论你在哪个聊天软件中发送消息，OpenClaw 都能即时响应，甚至支持在 macOS、iOS 和 Android 设备上进行语音交互，并提供实时的画布渲染功能供你操控。这款工具主要解决了用户对数据隐私、响应速度以及“始终在线”体验的需求。通过将 AI 部署在本地，用户无需依赖云端服务即可享受快速、私密的智能辅助，真正实现了“你的数据，你做主”。其独特的技术亮点在于强大的网关架构，将控制平面与核心助手分离，确保跨平台通信的流畅性与扩展性。 OpenClaw 非常适合希望构建个性化工作流的技术爱好者、开发者，以及注重隐私保护且不愿被单一生态绑定的普通用户。只要具备基础的终端操作能力（支持 macOS、Linux 及 Windows WSL2），即可通过简单的命令行引导完成部署。如果你渴望拥有一个懂你

★ 349.3k|★★★☆☆|3天前

Agent开发框架图像

stable-diffusion-webui

stable-diffusion-webui 是一个基于 Gradio 构建的网页版操作界面，旨在让用户能够轻松地在本地运行和使用强大的 Stable Diffusion 图像生成模型。它解决了原始模型依赖命令行、操作门槛高且功能分散的痛点，将复杂的 AI 绘图流程整合进一个直观易用的图形化平台。无论是希望快速上手的普通创作者、需要精细控制画面细节的设计师，还是想要深入探索模型潜力的开发者与研究人员，都能从中获益。其核心亮点在于极高的功能丰富度：不仅支持文生图、图生图、局部重绘（Inpainting）和外绘（Outpainting）等基础模式，还独创了注意力机制调整、提示词矩阵、负向提示词以及“高清修复”等高级功能。此外，它内置了 GFPGAN 和 CodeFormer 等人脸修复工具，支持多种神经网络放大算法，并允许用户通过插件系统无限扩展能力。即使是显存有限的设备，stable-diffusion-webui 也提供了相应的优化选项，让高质量的 AI 艺术创作变得触手可及。

★ 162.1k|★★★☆☆|3天前

开发框架图像Agent

everything-claude-code

everything-claude-code 是一套专为 AI 编程助手（如 Claude Code、Codex、Cursor 等）打造的高性能优化系统。它不仅仅是一组配置文件，而是一个经过长期实战打磨的完整框架，旨在解决 AI 代理在实际开发中面临的效率低下、记忆丢失、安全隐患及缺乏持续学习能力等核心痛点。通过引入技能模块化、直觉增强、记忆持久化机制以及内置的安全扫描功能，everything-claude-code 能显著提升 AI 在复杂任务中的表现，帮助开发者构建更稳定、更智能的生产级 AI 代理。其独特的“研究优先”开发理念和针对 Token 消耗的优化策略，使得模型响应更快、成本更低，同时有效防御潜在的攻击向量。这套工具特别适合软件开发者、AI 研究人员以及希望深度定制 AI 工作流的技术团队使用。无论您是在构建大型代码库，还是需要 AI 协助进行安全审计与自动化测试，everything-claude-code 都能提供强大的底层支持。作为一个曾荣获 Anthropic 黑客大奖的开源项目，它融合了多语言支持与丰富的实战钩子（hooks），让 AI 真正成长为懂上

★ 146.8k|★★☆☆☆|今天

开发框架Agent语言模型

ComfyUI

ComfyUI 是一款功能强大且高度模块化的视觉 AI 引擎，专为设计和执行复杂的 Stable Diffusion 图像生成流程而打造。它摒弃了传统的代码编写模式，采用直观的节点式流程图界面，让用户通过连接不同的功能模块即可构建个性化的生成管线。这一设计巧妙解决了高级 AI 绘图工作流配置复杂、灵活性不足的痛点。用户无需具备编程背景，也能自由组合模型、调整参数并实时预览效果，轻松实现从基础文生图到多步骤高清修复等各类复杂任务。ComfyUI 拥有极佳的兼容性，不仅支持 Windows、macOS 和 Linux 全平台，还广泛适配 NVIDIA、AMD、Intel 及苹果 Silicon 等多种硬件架构，并率先支持 SDXL、Flux、SD3 等前沿模型。无论是希望深入探索算法潜力的研究人员和开发者，还是追求极致创作自由度的设计师与资深 AI 绘画爱好者，ComfyUI 都能提供强大的支持。其独特的模块化架构允许社区不断扩展新功能，使其成为当前最灵活、生态最丰富的开源扩散模型工具之一，帮助用户将创意高效转化为现实。

★ 108.1k|★★☆☆☆|今天

开发框架图像Agent

markitdown

MarkItDown 是一款由微软 AutoGen 团队打造的轻量级 Python 工具，专为将各类文件高效转换为 Markdown 格式而设计。它支持 PDF、Word、Excel、PPT、图片（含 OCR）、音频（含语音转录）、HTML 乃至 YouTube 链接等多种格式的解析，能够精准提取文档中的标题、列表、表格和链接等关键结构信息。在人工智能应用日益普及的今天，大语言模型（LLM）虽擅长处理文本，却难以直接读取复杂的二进制办公文档。MarkItDown 恰好解决了这一痛点，它将非结构化或半结构化的文件转化为模型“原生理解”且 Token 效率极高的 Markdown 格式，成为连接本地文件与 AI 分析 pipeline 的理想桥梁。此外，它还提供了 MCP（模型上下文协议）服务器，可无缝集成到 Claude Desktop 等 LLM 应用中。这款工具特别适合开发者、数据科学家及 AI 研究人员使用，尤其是那些需要构建文档检索增强生成（RAG）系统、进行批量文本分析或希望让 AI 助手直接“阅读”本地文件的用户。虽然生成的内容也具备一定可读性，但其核心优势在于为机器

★ 93.4k|★★☆☆☆|2天前

插件开发框架

LLMs-from-scratch

LLMs-from-scratch 是一个基于 PyTorch 的开源教育项目，旨在引导用户从零开始一步步构建一个类似 ChatGPT 的大型语言模型（LLM）。它不仅是同名技术著作的官方代码库，更提供了一套完整的实践方案，涵盖模型开发、预训练及微调的全过程。该项目主要解决了大模型领域“黑盒化”的学习痛点。许多开发者虽能调用现成模型，却难以深入理解其内部架构与训练机制。通过亲手编写每一行核心代码，用户能够透彻掌握 Transformer 架构、注意力机制等关键原理，从而真正理解大模型是如何“思考”的。此外，项目还包含了加载大型预训练权重进行微调的代码，帮助用户将理论知识延伸至实际应用。 LLMs-from-scratch 特别适合希望深入底层原理的 AI 开发者、研究人员以及计算机专业的学生。对于不满足于仅使用 API，而是渴望探究模型构建细节的技术人员而言，这是极佳的学习资源。其独特的技术亮点在于“循序渐进”的教学设计：将复杂的系统工程拆解为清晰的步骤，配合详细的图表与示例，让构建一个虽小但功能完备的大模型变得触手可及。无论你是想夯实理论基础，还是为未来研发更大规模的模型做准备

★ 90.1k|★★★☆☆|2天前

语言模型图像Agent