hello-agents

GitHub
33.7k 3.9k 简单 63 次阅读 今天NOASSERTION语言模型Agent开发框架
AI 解读 由 AI 自动生成,仅供参考

Hello-Agents 是一本开源的中文教程,旨在帮助读者从零开始理解并动手构建真正由 AI 驱动的智能体(AI Native Agent)。当前智能体开发领域缺乏系统性、重实践的学习资源,Hello-Agents 正是为填补这一空白而设计。它不仅讲解智能体的核心原理、发展脉络和经典范式(如 ReAct、Reflection 等),还引导读者使用主流框架(如 AutoGen、LangGraph)并从头实现自己的智能体框架,涵盖上下文管理、记忆机制、通信协议、评估方法,甚至包括基于强化学习的模型训练(如 GRPO)。教程适合对大语言模型有一定了解的开发者、研究人员或技术爱好者,尤其适合希望从“模型使用者”进阶为“智能体构建者”的学习者。内容完全免费,支持在线阅读或本地参与,强调理论与实战结合,通过旅行助手、赛博小镇等真实项目巩固所学。

使用场景

某高校人工智能实验室的研究生小李,正在参与一个基于大语言模型的多智能体科研项目,需要从零设计并实现一个能协作完成复杂任务的AI系统。

没有 hello-agents 时

  • 对“智能体”概念模糊,仅会调用现成API,不清楚ReAct、Reflection等核心范式如何落地
  • 面对AutoGen、LangGraph等框架文档繁杂,缺乏系统引导,试错成本高、进展缓慢
  • 想自研轻量级Agent框架却无从下手,不清楚Memory管理、工具调用、通信协议等模块如何设计
  • 团队成员对Agent理解不一致,开发风格混乱,难以协同构建统一架构

使用 hello-agents 后

  • 通过第一章到第四章快速掌握智能体核心原理,并动手复现经典范式,夯实理论基础
  • 借助第五、六章对比学习主流低代码平台与开源框架,精准选择适合项目的工具链
  • 按照第七章“从零构建Agent框架”的实战指引,基于OpenAI原生API搭建出可扩展的自研框架
  • 团队统一采用教程中的架构思想和术语体系,协作效率显著提升,两周内完成原型验证

hello-agents 让开发者从“调用模型”跃迁为“构建智能体系统”,真正实现AI Native应用的自主可控开发。

运行环境要求

操作系统
  • Linux
  • macOS
  • Windows
GPU

未说明

内存

未说明

依赖
notes项目主要为教程性质,包含代码示例和实践内容。部分章节涉及使用 OpenAI API 和本地运行开源大模型,实际环境需求取决于具体案例。建议具备基础 Python 编程能力,并对大语言模型有基本了解。详细环境配置可参考 Extra-Chapter 中的《环境配置》文档(Extra07-环境配置.md)。
python未说明
hello-agents hero image

快速开始

English | 中文
alt text

Hello-Agents

🤖 《从零开始构建智能体》

从基础理论到实际应用,全面掌握智能体(Agent)系统的设计与实现

GitHub stars GitHub forks Language GitHub Project Online Reading

🎯 项目介绍

  如果说 2024 年是“百模大战”的元年,那么 2025 年无疑开启了“Agent 元年”。技术的焦点正从训练更大的基础模型,转向构建更聪明的智能体(Agent)应用。然而,当前系统性、重实践的教程却极度匮乏。为此,我们发起了 Hello-Agents 项目,希望能为社区提供一本从零开始、理论与实战并重的智能体系统构建指南。

  Hello-Agents 是 Datawhale 社区的系统性智能体学习教程。如今 Agent 构建主要分为两派,一派是 Dify、Coze、n8n 这类软件工程类 Agent,其本质是流程驱动的软件开发,LLM(大语言模型,Large Language Model)作为数据处理的后端;另一派则是 AI 原生的 Agent,即真正以 AI 驱动的 Agent。本教程旨在带领大家深入理解并构建后者——真正的 AI Native Agent。教程将带领你穿透框架表象,从智能体的核心原理出发,深入其核心架构,理解其经典范式,并最终亲手构建起属于自己的多智能体应用。我们相信,最好的学习方式就是动手实践。希望这本教程能成为你探索智能体世界的起点,能够从一名大语言模型的“使用者”,蜕变为一名智能体系统的“构建者”。

📚 快速开始

在线阅读

🌐 国外访问 | 🚀 国内加速 - 无需下载,随时随地学习

本地阅读

如果您希望在本地阅读或贡献内容,请参考下方的学习指南。

✨ 你将收获什么?

  • 📖 Datawhale 开源免费 完全免费学习本项目所有内容,与社区共同成长
  • 🔍 理解核心原理 深入理解智能体的概念、历史与经典范式
  • 🏗️ 亲手实现 掌握热门低代码平台和智能体代码框架的使用
  • 🛠️ 自研框架HelloAgents 基于 Openai 原生 API 从零构建一个自己的智能体框架
  • ⚙️ 掌握高级技能 一步步实现上下文工程(Context Engineering)、Memory(记忆)、协议、评估等系统性技术
  • 🤝 模型训练 掌握 Agentic RL(智能体强化学习),从 SFT(监督微调,Supervised Fine-Tuning)到 GRPO 的全流程实战训练 LLM
  • 🚀 驱动真实案例 实战开发智能旅行助手、赛博小镇等综合项目
  • 📖 求职面试 学习智能体求职相关面试问题

📖 内容导航

章节 关键内容 状态
前言 项目的缘起、背景及读者建议
第一部分:智能体与语言模型基础
第一章 初识智能体 智能体定义、类型、范式与应用
第二章 智能体发展史 从符号主义到 LLM 驱动的智能体演进
第三章 大语言模型基础 Transformer、提示(Prompting)、主流 LLM 及其局限
第二部分:构建你的大语言模型智能体
第四章 智能体经典范式构建 手把手实现 ReAct、Plan-and-Solve、Reflection
第五章 基于低代码平台的智能体搭建 了解 Coze、Dify、n8n 等低代码智能体平台使用
第六章 框架开发实践 AutoGen、AgentScope、LangGraph 等主流框架应用
第七章 构建你的Agent框架 从 0 开始构建智能体框架
第三部分:高级知识扩展
第八章 记忆与检索 记忆系统,RAG(检索增强生成,Retrieval-Augmented Generation),存储
第九章 上下文工程 持续交互的“情境理解”
第十章 智能体通信协议 MCP、A2A、ANP 等协议解析
第十一章 Agentic-RL 从 SFT 到 GRPO 的 LLM 训练实战
第十二章 智能体性能评估 核心指标、基准测试与评估框架
第四部分:综合案例进阶
第十三章 智能旅行助手 MCP 与多智能体协作的真实世界应用
第十四章 自动化深度研究智能体 DeepResearch Agent 复现与解析
第十五章 构建赛博小镇 Agent 与游戏的结合,模拟社会动态
第五部分:毕业设计及未来展望
第十六章 毕业设计 构建属于你的完整多智能体应用

社区贡献精选 (Community Blog)

  欢迎大家将在学习 Hello-Agents 或 Agent(智能体)相关技术中的独到见解、实践总结,以 PR 的形式贡献到社区精选。如果是独立于正文的内容,也可以投稿至 Extra-Chapter!期待你的第一次贡献!

社区精选 内容总结
00-共创毕业设计 社区共创毕业设计项目
01-Agent面试题总结 Agent 岗位相关面试问题
01-Agent面试题答案 相关面试问题答案
02-上下文工程内容补充 上下文工程(Context Engineering)内容扩展
03-Dify智能体创建保姆级教程 Dify智能体创建保姆级教程
04-Hello-agents课程常见问题 Datawhale课程常见问题
05-Agent Skills与MCP对比解读 Agent Skills 与 MCP(Model Context Protocol)技术对比
06-GUI Agent科普与实战 GUI Agent(图形用户界面智能体)科普与多场景实战
07-环境配置 环境配置
08-如何写出好的Skill Skill(技能模块)写作最佳实践
09-Agent应用开发实践踩坑与经验分享 Code Agent 应用开发踩坑与经验总结

PDF 版本下载

  本 Hello-Agents PDF 教程完全开源免费。为防止各类营销号加水印后贩卖给多智能体系统初学者,我们特地在 PDF 文件中预先添加了不影响阅读的 Datawhale 开源标志水印,敬请谅解~

Hello-Agents PDF : https://github.com/datawhalechina/hello-agents/releases/tag/V1.0.0
Hello-Agents PDF 国内下载地址 : https://www.datawhale.cn/learn/summary/239

💡 如何学习

  欢迎你,未来的智能系统构建者!在开启这段激动人心的旅程之前,请允许我们给你一些清晰的指引。

  本项目内容兼顾理论与实战,旨在帮助你系统性地掌握从单个智能体(Agent)到多智能体系统的设计与开发全流程。因此,尤其适合有一定编程基础的 AI 开发者、软件工程师、在校学生 以及对前沿 AI 技术抱有浓厚兴趣的 自学者。在学习本项目之前,我们希望你具备基础的 Python 编程能力,并对大语言模型(LLM, Large Language Model)有基本的概念性了解(例如,知道如何通过 API 调用一个 LLM)。项目的重点是应用与构建,因此你无需具备深厚的算法或模型训练背景。

  项目分为五大部分,每一部分都是通往下一阶段的坚实阶梯:

  • 第一部分:智能体与语言模型基础(第一章~第三章),我们将从智能体的定义、类型与发展历史讲起,为你梳理"智能体"这一概念的来龙去脉。随后,我们会快速巩固大语言模型的核心知识,为你的实践之旅打下坚实的理论地基。

  • 第二部分:构建你的大语言模型智能体(第四章~第七章),这是你动手实践的起点。你将亲手实现 ReAct 等经典范式,体验 Coze 等低代码平台的便捷,并掌握 Langgraph 等主流框架的应用。最终,我们还会带你从零开始构建一个属于自己的智能体框架,让你兼具“用轮子”与“造轮子”的能力。

  • 第三部分:高级知识扩展(第八章~第十二章),在这一部分,你的智能体将“学会”思考与协作。我们将使用第二部分的自研框架,深入探索记忆与检索、上下文工程、Agent 训练等核心技术,并学习多智能体间的通信协议。最终,你将掌握评估智能体系统性能的专业方法。

  • 第四部分:综合案例进阶(第十三章~第十五章),这里是理论与实践的交汇点。你将把所学融会贯通,亲手打造智能旅行助手、自动化深度研究智能体,乃至一个模拟社会动态的赛博小镇,在真实有趣的项目中淬炼你的构建能力。

  • 第五部分:毕业设计及未来展望(第十六章),在旅程的终点,你将迎来一个毕业设计,构建一个完整的、属于你自己的多智能体应用,全面检验你的学习成果。我们还将与你一同展望智能体的未来,探索激动人心的前沿方向。

  智能体是一个飞速发展且极度依赖实践的领域。为了获得最佳的学习效果,我们在项目的code文件夹内提供了配套的全部代码,强烈建议你将理论与实践相结合。请务必亲手运行、调试甚至修改项目里提供的每一份代码。欢迎你随时关注 Datawhale 以及其他 Agent 相关社区,当遇到问题时,你可以随时在本项目的 issue 区提问。

  现在,准备好进入智能体的奇妙世界了吗?让我们即刻启程!

下一步规划

  • 视频课程陆续放出(将会更加细致,实践课带领大家从设计思路到实施,授人以鱼也授人以渔)
  • HelloAgents框架已经更新V1.0.0版本,将会继续完善,增加更多好用,轻量化的工具和特性,兼容学习版本。
  • 感谢大家助力3W Star! 之后将会提供调查问卷,供大家填写自己需要学习的智能体训练内容。后续作品《从零开始训练智能体》,帮助每一个学习者掌握从零到一训练自定义场景智能体模型的能力。

🤝 如何贡献

我们是一个开放的开源社区,欢迎任何形式的贡献!

  • 🐛 报告 Bug - 发现内容或代码问题,请提交 Issue
  • 💡 提出建议 - 对项目有好想法,欢迎发起讨论
  • 📝 完善内容 - 帮助改进教程,提交你的 Pull Request
  • ✍️ 分享实践 - 在"社区贡献精选"中分享你的学习笔记和项目

🙏 致谢

核心贡献者

Extra-Chapter 贡献者

特别感谢

  • 感谢 @Sm1les 对本项目的帮助与支持
  • 感谢所有为本项目做出贡献的开发者们 ❤️

Star History

Datawhale

⭐ 如果这个项目对你有帮助,请给我们一个 Star!

读者交流群

读者群二维码

扫描二维码加入读者交流群,与更多学习者交流讨论

关于 Datawhale

Datawhale

扫描二维码关注 Datawhale 公众号,获取更多优质开源内容


📜 开源协议

本作品采用知识共享署名-非商业性使用-相同方式共享 4.0 国际许可协议进行许可。

版本历史

V1.0.22026/02/10
V1.0.02025/11/03

常见问题

相似工具推荐

stable-diffusion-webui

stable-diffusion-webui 是一个基于 Gradio 构建的网页版操作界面,旨在让用户能够轻松地在本地运行和使用强大的 Stable Diffusion 图像生成模型。它解决了原始模型依赖命令行、操作门槛高且功能分散的痛点,将复杂的 AI 绘图流程整合进一个直观易用的图形化平台。 无论是希望快速上手的普通创作者、需要精细控制画面细节的设计师,还是想要深入探索模型潜力的开发者与研究人员,都能从中获益。其核心亮点在于极高的功能丰富度:不仅支持文生图、图生图、局部重绘(Inpainting)和外绘(Outpainting)等基础模式,还独创了注意力机制调整、提示词矩阵、负向提示词以及“高清修复”等高级功能。此外,它内置了 GFPGAN 和 CodeFormer 等人脸修复工具,支持多种神经网络放大算法,并允许用户通过插件系统无限扩展能力。即使是显存有限的设备,stable-diffusion-webui 也提供了相应的优化选项,让高质量的 AI 艺术创作变得触手可及。

162.1k|★★★☆☆|今天
开发框架图像Agent

everything-claude-code

everything-claude-code 是一套专为 AI 编程助手(如 Claude Code、Codex、Cursor 等)打造的高性能优化系统。它不仅仅是一组配置文件,而是一个经过长期实战打磨的完整框架,旨在解决 AI 代理在实际开发中面临的效率低下、记忆丢失、安全隐患及缺乏持续学习能力等核心痛点。 通过引入技能模块化、直觉增强、记忆持久化机制以及内置的安全扫描功能,everything-claude-code 能显著提升 AI 在复杂任务中的表现,帮助开发者构建更稳定、更智能的生产级 AI 代理。其独特的“研究优先”开发理念和针对 Token 消耗的优化策略,使得模型响应更快、成本更低,同时有效防御潜在的攻击向量。 这套工具特别适合软件开发者、AI 研究人员以及希望深度定制 AI 工作流的技术团队使用。无论您是在构建大型代码库,还是需要 AI 协助进行安全审计与自动化测试,everything-claude-code 都能提供强大的底层支持。作为一个曾荣获 Anthropic 黑客大奖的开源项目,它融合了多语言支持与丰富的实战钩子(hooks),让 AI 真正成长为懂上

139k|★★☆☆☆|今天
开发框架Agent语言模型

ComfyUI

ComfyUI 是一款功能强大且高度模块化的视觉 AI 引擎,专为设计和执行复杂的 Stable Diffusion 图像生成流程而打造。它摒弃了传统的代码编写模式,采用直观的节点式流程图界面,让用户通过连接不同的功能模块即可构建个性化的生成管线。 这一设计巧妙解决了高级 AI 绘图工作流配置复杂、灵活性不足的痛点。用户无需具备编程背景,也能自由组合模型、调整参数并实时预览效果,轻松实现从基础文生图到多步骤高清修复等各类复杂任务。ComfyUI 拥有极佳的兼容性,不仅支持 Windows、macOS 和 Linux 全平台,还广泛适配 NVIDIA、AMD、Intel 及苹果 Silicon 等多种硬件架构,并率先支持 SDXL、Flux、SD3 等前沿模型。 无论是希望深入探索算法潜力的研究人员和开发者,还是追求极致创作自由度的设计师与资深 AI 绘画爱好者,ComfyUI 都能提供强大的支持。其独特的模块化架构允许社区不断扩展新功能,使其成为当前最灵活、生态最丰富的开源扩散模型工具之一,帮助用户将创意高效转化为现实。

107.7k|★★☆☆☆|2天前
开发框架图像Agent

NextChat

NextChat 是一款轻量且极速的 AI 助手,旨在为用户提供流畅、跨平台的大模型交互体验。它完美解决了用户在多设备间切换时难以保持对话连续性,以及面对众多 AI 模型不知如何统一管理的痛点。无论是日常办公、学习辅助还是创意激发,NextChat 都能让用户随时随地通过网页、iOS、Android、Windows、MacOS 或 Linux 端无缝接入智能服务。 这款工具非常适合普通用户、学生、职场人士以及需要私有化部署的企业团队使用。对于开发者而言,它也提供了便捷的自托管方案,支持一键部署到 Vercel 或 Zeabur 等平台。 NextChat 的核心亮点在于其广泛的模型兼容性,原生支持 Claude、DeepSeek、GPT-4 及 Gemini Pro 等主流大模型,让用户在一个界面即可自由切换不同 AI 能力。此外,它还率先支持 MCP(Model Context Protocol)协议,增强了上下文处理能力。针对企业用户,NextChat 提供专业版解决方案,具备品牌定制、细粒度权限控制、内部知识库整合及安全审计等功能,满足公司对数据隐私和个性化管理的高标准要求。

87.6k|★★☆☆☆|今天
开发框架语言模型

ML-For-Beginners

ML-For-Beginners 是由微软推出的一套系统化机器学习入门课程,旨在帮助零基础用户轻松掌握经典机器学习知识。这套课程将学习路径规划为 12 周,包含 26 节精炼课程和 52 道配套测验,内容涵盖从基础概念到实际应用的完整流程,有效解决了初学者面对庞大知识体系时无从下手、缺乏结构化指导的痛点。 无论是希望转型的开发者、需要补充算法背景的研究人员,还是对人工智能充满好奇的普通爱好者,都能从中受益。课程不仅提供了清晰的理论讲解,还强调动手实践,让用户在循序渐进中建立扎实的技能基础。其独特的亮点在于强大的多语言支持,通过自动化机制提供了包括简体中文在内的 50 多种语言版本,极大地降低了全球不同背景用户的学习门槛。此外,项目采用开源协作模式,社区活跃且内容持续更新,确保学习者能获取前沿且准确的技术资讯。如果你正寻找一条清晰、友好且专业的机器学习入门之路,ML-For-Beginners 将是理想的起点。

85k|★★☆☆☆|今天
图像数据工具视频

ragflow

RAGFlow 是一款领先的开源检索增强生成(RAG)引擎,旨在为大语言模型构建更精准、可靠的上下文层。它巧妙地将前沿的 RAG 技术与智能体(Agent)能力相结合,不仅支持从各类文档中高效提取知识,还能让模型基于这些知识进行逻辑推理和任务执行。 在大模型应用中,幻觉问题和知识滞后是常见痛点。RAGFlow 通过深度解析复杂文档结构(如表格、图表及混合排版),显著提升了信息检索的准确度,从而有效减少模型“胡编乱造”的现象,确保回答既有据可依又具备时效性。其内置的智能体机制更进一步,使系统不仅能回答问题,还能自主规划步骤解决复杂问题。 这款工具特别适合开发者、企业技术团队以及 AI 研究人员使用。无论是希望快速搭建私有知识库问答系统,还是致力于探索大模型在垂直领域落地的创新者,都能从中受益。RAGFlow 提供了可视化的工作流编排界面和灵活的 API 接口,既降低了非算法背景用户的上手门槛,也满足了专业开发者对系统深度定制的需求。作为基于 Apache 2.0 协议开源的项目,它正成为连接通用大模型与行业专有知识之间的重要桥梁。

77.1k|★★★☆☆|昨天
Agent图像开发框架