hello-agents

33.7k 3.9k 简单 63 次阅读今天NOASSERTION语言模型Agent开发框架

AI 解读由 AI 自动生成，仅供参考

Hello-Agents 是一本开源的中文教程，旨在帮助读者从零开始理解并动手构建真正由 AI 驱动的智能体（AI Native Agent）。当前智能体开发领域缺乏系统性、重实践的学习资源，Hello-Agents 正是为填补这一空白而设计。它不仅讲解智能体的核心原理、发展脉络和经典范式（如 ReAct、Reflection 等），还引导读者使用主流框架（如 AutoGen、LangGraph）并从头实现自己的智能体框架，涵盖上下文管理、记忆机制、通信协议、评估方法，甚至包括基于强化学习的模型训练（如 GRPO）。教程适合对大语言模型有一定了解的开发者、研究人员或技术爱好者，尤其适合希望从“模型使用者”进阶为“智能体构建者”的学习者。内容完全免费，支持在线阅读或本地参与，强调理论与实战结合，通过旅行助手、赛博小镇等真实项目巩固所学。

使用场景

某高校人工智能实验室的研究生小李，正在参与一个基于大语言模型的多智能体科研项目，需要从零设计并实现一个能协作完成复杂任务的AI系统。

没有 hello-agents 时

对“智能体”概念模糊，仅会调用现成API，不清楚ReAct、Reflection等核心范式如何落地
面对AutoGen、LangGraph等框架文档繁杂，缺乏系统引导，试错成本高、进展缓慢
想自研轻量级Agent框架却无从下手，不清楚Memory管理、工具调用、通信协议等模块如何设计
团队成员对Agent理解不一致，开发风格混乱，难以协同构建统一架构

使用 hello-agents 后

通过第一章到第四章快速掌握智能体核心原理，并动手复现经典范式，夯实理论基础
借助第五、六章对比学习主流低代码平台与开源框架，精准选择适合项目的工具链
按照第七章“从零构建Agent框架”的实战指引，基于OpenAI原生API搭建出可扩展的自研框架
团队统一采用教程中的架构思想和术语体系，协作效率显著提升，两周内完成原型验证

hello-agents 让开发者从“调用模型”跃迁为“构建智能体系统”，真正实现AI Native应用的自主可控开发。

运行环境要求

操作系统

Linux
macOS
Windows

GPU

未说明

内存

未说明

依赖

notes项目主要为教程性质，包含代码示例和实践内容。部分章节涉及使用 OpenAI API 和本地运行开源大模型，实际环境需求取决于具体案例。建议具备基础 Python 编程能力，并对大语言模型有基本了解。详细环境配置可参考 Extra-Chapter 中的《环境配置》文档（Extra07-环境配置.md）。

python未说明

快速开始

English | 中文

Hello-Agents

🤖 《从零开始构建智能体》

从基础理论到实际应用，全面掌握智能体（Agent）系统的设计与实现

🎯 项目介绍

如果说 2024 年是“百模大战”的元年，那么 2025 年无疑开启了“Agent 元年”。技术的焦点正从训练更大的基础模型，转向构建更聪明的智能体（Agent）应用。然而，当前系统性、重实践的教程却极度匮乏。为此，我们发起了 Hello-Agents 项目，希望能为社区提供一本从零开始、理论与实战并重的智能体系统构建指南。

Hello-Agents 是 Datawhale 社区的系统性智能体学习教程。如今 Agent 构建主要分为两派，一派是 Dify、Coze、n8n 这类软件工程类 Agent，其本质是流程驱动的软件开发，LLM（大语言模型，Large Language Model）作为数据处理的后端；另一派则是 AI 原生的 Agent，即真正以 AI 驱动的 Agent。本教程旨在带领大家深入理解并构建后者——真正的 AI Native Agent。教程将带领你穿透框架表象，从智能体的核心原理出发，深入其核心架构，理解其经典范式，并最终亲手构建起属于自己的多智能体应用。我们相信，最好的学习方式就是动手实践。希望这本教程能成为你探索智能体世界的起点，能够从一名大语言模型的“使用者”，蜕变为一名智能体系统的“构建者”。

📚 快速开始

在线阅读

🌐 国外访问 | 🚀 国内加速 - 无需下载，随时随地学习

本地阅读

如果您希望在本地阅读或贡献内容，请参考下方的学习指南。

✨ 你将收获什么？

📖 Datawhale 开源免费 完全免费学习本项目所有内容，与社区共同成长
🔍 理解核心原理 深入理解智能体的概念、历史与经典范式
🏗️ 亲手实现 掌握热门低代码平台和智能体代码框架的使用
🛠️ 自研框架HelloAgents 基于 Openai 原生 API 从零构建一个自己的智能体框架
⚙️ 掌握高级技能 一步步实现上下文工程（Context Engineering）、Memory（记忆）、协议、评估等系统性技术
🤝 模型训练 掌握 Agentic RL（智能体强化学习），从 SFT（监督微调，Supervised Fine-Tuning）到 GRPO 的全流程实战训练 LLM
🚀 驱动真实案例 实战开发智能旅行助手、赛博小镇等综合项目
📖 求职面试 学习智能体求职相关面试问题

📖 内容导航

章节	关键内容	状态
前言	项目的缘起、背景及读者建议	✅
第一部分：智能体与语言模型基础
第一章初识智能体	智能体定义、类型、范式与应用	✅
第二章智能体发展史	从符号主义到 LLM 驱动的智能体演进	✅
第三章大语言模型基础	Transformer、提示（Prompting）、主流 LLM 及其局限	✅
第二部分：构建你的大语言模型智能体
第四章智能体经典范式构建	手把手实现 ReAct、Plan-and-Solve、Reflection	✅
第五章基于低代码平台的智能体搭建	了解 Coze、Dify、n8n 等低代码智能体平台使用	✅
第六章框架开发实践	AutoGen、AgentScope、LangGraph 等主流框架应用	✅
第七章构建你的Agent框架	从 0 开始构建智能体框架	✅
第三部分：高级知识扩展
第八章记忆与检索	记忆系统，RAG（检索增强生成，Retrieval-Augmented Generation），存储	✅
第九章上下文工程	持续交互的“情境理解”	✅
第十章智能体通信协议	MCP、A2A、ANP 等协议解析	✅
第十一章 Agentic-RL	从 SFT 到 GRPO 的 LLM 训练实战	✅
第十二章智能体性能评估	核心指标、基准测试与评估框架	✅
第四部分：综合案例进阶
第十三章智能旅行助手	MCP 与多智能体协作的真实世界应用	✅
第十四章自动化深度研究智能体	DeepResearch Agent 复现与解析	✅
第十五章构建赛博小镇	Agent 与游戏的结合，模拟社会动态	✅
第五部分：毕业设计及未来展望
第十六章毕业设计	构建属于你的完整多智能体应用	✅

社区贡献精选 (Community Blog)

欢迎大家将在学习 Hello-Agents 或 Agent（智能体）相关技术中的独到见解、实践总结，以 PR 的形式贡献到社区精选。如果是独立于正文的内容，也可以投稿至 Extra-Chapter！期待你的第一次贡献！

社区精选	内容总结
00-共创毕业设计	社区共创毕业设计项目
01-Agent面试题总结	Agent 岗位相关面试问题
01-Agent面试题答案	相关面试问题答案
02-上下文工程内容补充	上下文工程（Context Engineering）内容扩展
03-Dify智能体创建保姆级教程	Dify智能体创建保姆级教程
04-Hello-agents课程常见问题	Datawhale课程常见问题
05-Agent Skills与MCP对比解读	Agent Skills 与 MCP（Model Context Protocol）技术对比
06-GUI Agent科普与实战	GUI Agent（图形用户界面智能体）科普与多场景实战
07-环境配置	环境配置
08-如何写出好的Skill	Skill（技能模块）写作最佳实践
09-Agent应用开发实践踩坑与经验分享	Code Agent 应用开发踩坑与经验总结

PDF 版本下载

本 Hello-Agents PDF 教程完全开源免费。为防止各类营销号加水印后贩卖给多智能体系统初学者，我们特地在 PDF 文件中预先添加了不影响阅读的 Datawhale 开源标志水印，敬请谅解～

Hello-Agents PDF : https://github.com/datawhalechina/hello-agents/releases/tag/V1.0.0
Hello-Agents PDF 国内下载地址 : https://www.datawhale.cn/learn/summary/239

💡 如何学习

欢迎你，未来的智能系统构建者！在开启这段激动人心的旅程之前，请允许我们给你一些清晰的指引。

本项目内容兼顾理论与实战，旨在帮助你系统性地掌握从单个智能体（Agent）到多智能体系统的设计与开发全流程。因此，尤其适合有一定编程基础的 AI 开发者、软件工程师、在校学生 以及对前沿 AI 技术抱有浓厚兴趣的 自学者。在学习本项目之前，我们希望你具备基础的 Python 编程能力，并对大语言模型（LLM, Large Language Model）有基本的概念性了解（例如，知道如何通过 API 调用一个 LLM）。项目的重点是应用与构建，因此你无需具备深厚的算法或模型训练背景。

项目分为五大部分，每一部分都是通往下一阶段的坚实阶梯：

第一部分：智能体与语言模型基础（第一章～第三章），我们将从智能体的定义、类型与发展历史讲起，为你梳理"智能体"这一概念的来龙去脉。随后，我们会快速巩固大语言模型的核心知识，为你的实践之旅打下坚实的理论地基。
第二部分：构建你的大语言模型智能体（第四章～第七章），这是你动手实践的起点。你将亲手实现 ReAct 等经典范式，体验 Coze 等低代码平台的便捷，并掌握 Langgraph 等主流框架的应用。最终，我们还会带你从零开始构建一个属于自己的智能体框架，让你兼具“用轮子”与“造轮子”的能力。
第三部分：高级知识扩展（第八章～第十二章），在这一部分，你的智能体将“学会”思考与协作。我们将使用第二部分的自研框架，深入探索记忆与检索、上下文工程、Agent 训练等核心技术，并学习多智能体间的通信协议。最终，你将掌握评估智能体系统性能的专业方法。
第四部分：综合案例进阶（第十三章～第十五章），这里是理论与实践的交汇点。你将把所学融会贯通，亲手打造智能旅行助手、自动化深度研究智能体，乃至一个模拟社会动态的赛博小镇，在真实有趣的项目中淬炼你的构建能力。
第五部分：毕业设计及未来展望（第十六章），在旅程的终点，你将迎来一个毕业设计，构建一个完整的、属于你自己的多智能体应用，全面检验你的学习成果。我们还将与你一同展望智能体的未来，探索激动人心的前沿方向。

智能体是一个飞速发展且极度依赖实践的领域。为了获得最佳的学习效果，我们在项目的code文件夹内提供了配套的全部代码，强烈建议你将理论与实践相结合。请务必亲手运行、调试甚至修改项目里提供的每一份代码。欢迎你随时关注 Datawhale 以及其他 Agent 相关社区，当遇到问题时，你可以随时在本项目的 issue 区提问。

现在，准备好进入智能体的奇妙世界了吗？让我们即刻启程！

下一步规划

视频课程陆续放出（将会更加细致，实践课带领大家从设计思路到实施，授人以鱼也授人以渔）
HelloAgents框架已经更新V1.0.0版本，将会继续完善，增加更多好用，轻量化的工具和特性，兼容学习版本。
感谢大家助力3W Star! 之后将会提供调查问卷，供大家填写自己需要学习的智能体训练内容。后续作品《从零开始训练智能体》，帮助每一个学习者掌握从零到一训练自定义场景智能体模型的能力。

🤝 如何贡献

我们是一个开放的开源社区，欢迎任何形式的贡献！

🐛 报告 Bug - 发现内容或代码问题，请提交 Issue
💡 提出建议 - 对项目有好想法，欢迎发起讨论
📝 完善内容 - 帮助改进教程，提交你的 Pull Request
✍️ 分享实践 - 在"社区贡献精选"中分享你的学习笔记和项目

🙏 致谢

核心贡献者

陈思州-项目负责人 (Datawhale 成员, 全文写作和校对)
孙韬-联合发起者 (Datawhale 成员、CAMEL-AI, 第九章内容和校对)
姜舒凡-联合发起者（Datawhale 成员, 章节习题设计和校对）
黄佩林-Datawhale意向成员 (Agent 开发工程师, 第五章内容贡献者)
曾鑫民-Agent工程师 (牛客科技, 第十四章案例开发)
朱信忠-指导专家 (Datawhale首席科学家-浙江师范大学杭州人工智能研究院教授)

Extra-Chapter 贡献者

WH (内容贡献者)
周奥杰-DW贡献者团队 (西安交通大学, Extra02 内容贡献)
张宸旭-个人开发者(帝国理工学院, Extra03 内容贡献)
黄宏晗-DW贡献者团队 (深圳大学, Extra04 内容贡献)
王大鹏-Datawhale成员 (高级研发工程师, Extra08 内容贡献)
尤逸晖-个人开发者 (南京信息工程大学, Extra09 内容贡献)

特别感谢

感谢 @Sm1les 对本项目的帮助与支持
感谢所有为本项目做出贡献的开发者们 ❤️

Star History

⭐ 如果这个项目对你有帮助，请给我们一个 Star！

读者交流群

扫描二维码加入读者交流群，与更多学习者交流讨论

关于 Datawhale

扫描二维码关注 Datawhale 公众号，获取更多优质开源内容

📜 开源协议

本作品采用知识共享署名-非商业性使用-相同方式共享 4.0 国际许可协议进行许可。

Hello-Agents 快速上手指南

环境准备

操作系统：Linux / macOS / Windows（推荐使用 Linux 或 macOS）
Python 版本：>= 3.9
网络要求：需能访问 OpenAI API（或兼容的国产大模型 API）
可选加速：国内用户建议配置镜像源以加速依赖安装

# 推荐设置 pip 国内镜像（如清华源）
pip config set global.index-url https://pypi.tuna.tsinghua.edu.cn/simple

安装步骤

克隆项目代码：

git clone https://github.com/datawhalechina/hello-agents.git
cd hello-agents

创建并激活虚拟环境（推荐）：

python -m venv venv
source venv/bin/activate  # Linux/macOS
# 或 venv\Scripts\activate  # Windows

安装依赖：

pip install -r requirements.txt

配置 API 密钥（以 OpenAI 为例）：

export OPENAI_API_KEY="your-api-key"
# 或在 Windows 中使用：
# set OPENAI_API_KEY=your-api-key

💡 提示：你也可以使用兼容 OpenAI 协议的国产模型 API（如 DeepSeek、Moonshot、Qwen 等），只需替换 base_url 和 API key。

基本使用

以下是一个使用自研 HelloAgents 框架构建简单智能体的示例：

from helloagents.agent import Agent

# 创建一个基础智能体
agent = Agent(
    name="助手",
    system_prompt="你是一个乐于助人的 AI 助手。",
    model="gpt-4o"  # 可替换为其他支持的模型
)

# 与智能体对话
response = agent.chat("你好！你能做什么？")
print(response)

📌 所有配套代码位于项目根目录的 code/ 文件夹中，建议结合教程章节同步运行对应示例。

更多实战案例（如多智能体协作、旅行助手、赛博小镇等）请参考在线教程或本地 docs/ 目录。

版本历史

V1.0.22026/02/10

V1.0.02025/11/03

常见问题

Chapter8.1.4 中配置了 Qdrant 云服务，但程序仍连接本地 Qdrant，如何解决？

Chapter13 旅行 Agent 在生成行程计划时调用大模型超时，怎么办？

Chapter13 运行时报错找不到 amap_maps_weather、amap_maps_text_search 等工具，如何修复？

Chapter8.1.4 中 Neo4j 服务连接失败，报错“Unable to retrieve routing information”或“远程主机强迫关闭连接”，如何解决？

安装 hello-agents[all]==0.2.0 后，qdrant-client 版本过高导致 API 弃用错误，如何处理？

Chapter8.1.4 中即使配置了 Neo4j 云服务，程序仍默认连接本地 Neo4j，怎么办？

相似工具推荐

stable-diffusion-webui

stable-diffusion-webui 是一个基于 Gradio 构建的网页版操作界面，旨在让用户能够轻松地在本地运行和使用强大的 Stable Diffusion 图像生成模型。它解决了原始模型依赖命令行、操作门槛高且功能分散的痛点，将复杂的 AI 绘图流程整合进一个直观易用的图形化平台。无论是希望快速上手的普通创作者、需要精细控制画面细节的设计师，还是想要深入探索模型潜力的开发者与研究人员，都能从中获益。其核心亮点在于极高的功能丰富度：不仅支持文生图、图生图、局部重绘（Inpainting）和外绘（Outpainting）等基础模式，还独创了注意力机制调整、提示词矩阵、负向提示词以及“高清修复”等高级功能。此外，它内置了 GFPGAN 和 CodeFormer 等人脸修复工具，支持多种神经网络放大算法，并允许用户通过插件系统无限扩展能力。即使是显存有限的设备，stable-diffusion-webui 也提供了相应的优化选项，让高质量的 AI 艺术创作变得触手可及。

★ 162.1k|★★★☆☆|今天

开发框架图像Agent

everything-claude-code

everything-claude-code 是一套专为 AI 编程助手（如 Claude Code、Codex、Cursor 等）打造的高性能优化系统。它不仅仅是一组配置文件，而是一个经过长期实战打磨的完整框架，旨在解决 AI 代理在实际开发中面临的效率低下、记忆丢失、安全隐患及缺乏持续学习能力等核心痛点。通过引入技能模块化、直觉增强、记忆持久化机制以及内置的安全扫描功能，everything-claude-code 能显著提升 AI 在复杂任务中的表现，帮助开发者构建更稳定、更智能的生产级 AI 代理。其独特的“研究优先”开发理念和针对 Token 消耗的优化策略，使得模型响应更快、成本更低，同时有效防御潜在的攻击向量。这套工具特别适合软件开发者、AI 研究人员以及希望深度定制 AI 工作流的技术团队使用。无论您是在构建大型代码库，还是需要 AI 协助进行安全审计与自动化测试，everything-claude-code 都能提供强大的底层支持。作为一个曾荣获 Anthropic 黑客大奖的开源项目，它融合了多语言支持与丰富的实战钩子（hooks），让 AI 真正成长为懂上

★ 139k|★★☆☆☆|今天

开发框架Agent语言模型

ComfyUI

ComfyUI 是一款功能强大且高度模块化的视觉 AI 引擎，专为设计和执行复杂的 Stable Diffusion 图像生成流程而打造。它摒弃了传统的代码编写模式，采用直观的节点式流程图界面，让用户通过连接不同的功能模块即可构建个性化的生成管线。这一设计巧妙解决了高级 AI 绘图工作流配置复杂、灵活性不足的痛点。用户无需具备编程背景，也能自由组合模型、调整参数并实时预览效果，轻松实现从基础文生图到多步骤高清修复等各类复杂任务。ComfyUI 拥有极佳的兼容性，不仅支持 Windows、macOS 和 Linux 全平台，还广泛适配 NVIDIA、AMD、Intel 及苹果 Silicon 等多种硬件架构，并率先支持 SDXL、Flux、SD3 等前沿模型。无论是希望深入探索算法潜力的研究人员和开发者，还是追求极致创作自由度的设计师与资深 AI 绘画爱好者，ComfyUI 都能提供强大的支持。其独特的模块化架构允许社区不断扩展新功能，使其成为当前最灵活、生态最丰富的开源扩散模型工具之一，帮助用户将创意高效转化为现实。

★ 107.7k|★★☆☆☆|2天前

开发框架图像Agent

NextChat

NextChat 是一款轻量且极速的 AI 助手，旨在为用户提供流畅、跨平台的大模型交互体验。它完美解决了用户在多设备间切换时难以保持对话连续性，以及面对众多 AI 模型不知如何统一管理的痛点。无论是日常办公、学习辅助还是创意激发，NextChat 都能让用户随时随地通过网页、iOS、Android、Windows、MacOS 或 Linux 端无缝接入智能服务。这款工具非常适合普通用户、学生、职场人士以及需要私有化部署的企业团队使用。对于开发者而言，它也提供了便捷的自托管方案，支持一键部署到 Vercel 或 Zeabur 等平台。 NextChat 的核心亮点在于其广泛的模型兼容性，原生支持 Claude、DeepSeek、GPT-4 及 Gemini Pro 等主流大模型，让用户在一个界面即可自由切换不同 AI 能力。此外，它还率先支持 MCP（Model Context Protocol）协议，增强了上下文处理能力。针对企业用户，NextChat 提供专业版解决方案，具备品牌定制、细粒度权限控制、内部知识库整合及安全审计等功能，满足公司对数据隐私和个性化管理的高标准要求。

★ 87.6k|★★☆☆☆|今天

开发框架语言模型

ML-For-Beginners

ML-For-Beginners 是由微软推出的一套系统化机器学习入门课程，旨在帮助零基础用户轻松掌握经典机器学习知识。这套课程将学习路径规划为 12 周，包含 26 节精炼课程和 52 道配套测验，内容涵盖从基础概念到实际应用的完整流程，有效解决了初学者面对庞大知识体系时无从下手、缺乏结构化指导的痛点。无论是希望转型的开发者、需要补充算法背景的研究人员，还是对人工智能充满好奇的普通爱好者，都能从中受益。课程不仅提供了清晰的理论讲解，还强调动手实践，让用户在循序渐进中建立扎实的技能基础。其独特的亮点在于强大的多语言支持，通过自动化机制提供了包括简体中文在内的 50 多种语言版本，极大地降低了全球不同背景用户的学习门槛。此外，项目采用开源协作模式，社区活跃且内容持续更新，确保学习者能获取前沿且准确的技术资讯。如果你正寻找一条清晰、友好且专业的机器学习入门之路，ML-For-Beginners 将是理想的起点。

★ 85k|★★☆☆☆|今天

图像数据工具视频

ragflow

RAGFlow 是一款领先的开源检索增强生成（RAG）引擎，旨在为大语言模型构建更精准、可靠的上下文层。它巧妙地将前沿的 RAG 技术与智能体（Agent）能力相结合，不仅支持从各类文档中高效提取知识，还能让模型基于这些知识进行逻辑推理和任务执行。在大模型应用中，幻觉问题和知识滞后是常见痛点。RAGFlow 通过深度解析复杂文档结构（如表格、图表及混合排版），显著提升了信息检索的准确度，从而有效减少模型“胡编乱造”的现象，确保回答既有据可依又具备时效性。其内置的智能体机制更进一步，使系统不仅能回答问题，还能自主规划步骤解决复杂问题。这款工具特别适合开发者、企业技术团队以及 AI 研究人员使用。无论是希望快速搭建私有知识库问答系统，还是致力于探索大模型在垂直领域落地的创新者，都能从中受益。RAGFlow 提供了可视化的工作流编排界面和灵活的 API 接口，既降低了非算法背景用户的上手门槛，也满足了专业开发者对系统深度定制的需求。作为基于 Apache 2.0 协议开源的项目，它正成为连接通用大模型与行业专有知识之间的重要桥梁。

★ 77.1k|★★★☆☆|昨天

Agent图像开发框架