GenAI_Agents
GenAI_Agents 是一个专注于生成式 AI 智能体开发的开源资源库,旨在帮助开发者从零开始构建并部署各类 AI 应用。它收录了超过 50 个详细的教程与代码实现案例,内容覆盖范围极广:从基础的对话机器人,到复杂的协同多智能体系统(Multi-Agent Systems),甚至包括 HR 助手、艺术导览及数据分析助理等具体场景应用。
该项目主要解决了学习者在探索 AI 智能体技术时面临的“入门难”和“缺乏实战参考”的痛点。通过将抽象的理论转化为可运行的代码示例,它让用户能够直观地理解智能体的工作原理、交互逻辑及架构设计,从而大幅降低开发门槛。
GenAI_Agents 特别适合 AI 开发者、技术研究人员以及希望深入掌握大模型应用的学生使用。对于想要快速验证想法的原型开发者,这里提供了丰富的现成模板;对于进阶用户,其中关于多智能体协作和高级检索增强生成(RAG)结合的实践案例,则提供了极具价值的技术参考。无论是想迈出构建第一个智能体的第一步,还是致力于研发前沿的复杂系统,这个不断更新的社区资源库都能提供坚实的支持。
使用场景
某电商公司的技术团队正致力于构建一个能自动处理客户投诉、查询订单并协调物流的智能客服系统,以替代传统的人工流转模式。
没有 GenAI_Agents 时
- 开发门槛高且重复造轮子:工程师需从零研究多智能体协作架构,缺乏现成的多 Agent 通信与任务拆解模板,导致基础代码编写耗时数周。
- 场景覆盖单一:受限于技术复杂度,初期只能实现简单的问答机器人,无法处理涉及“查询库存 + 协调物流 + 生成赔偿方案”的复杂连环任务。
- 调试与维护困难:缺乏标准化的实施案例参考,当智能体出现死循环或决策错误时,团队难以快速定位问题根源,系统稳定性差。
- 知识更新滞后:团队难以及时获取最新的代理技术(如轻量级 RAG 集成),导致构建的系统在上下文理解能力上落后于行业水平。
使用 GenAI_Agents 后
- 快速落地复杂架构:直接复用仓库中 50+ 个成熟教程,基于现有的多智能体系统模板,仅用几天便搭建起包含“接待员”、“查询员”和“决策员”的协作网络。
- 实现全流程自动化:利用库中复杂的交互模式,系统能自主拆解用户诉求,串联多个专用智能体完成从订单检索到物流协调的闭环处理,无需人工干预。
- 标准化开发与排错:参照官方提供的最佳实践代码,团队迅速规范了智能体间的消息传递机制,显著降低了调试难度,系统运行稳定性大幅提升。
- 即时集成前沿技术:直接引入仓库最新更新的"LightRAG 艺术向导”或“上下文引用系统”等案例,让客服系统具备了精准引用内部知识库的高级能力。
GenAI_Agents 通过将抽象的多智能体理论转化为可执行的代码模板,帮助团队将原本需要数月研发的智能系统缩短至数周上线,极大降低了企业级 AI 应用的落地成本。
运行环境要求
- 未说明
未说明
未说明

快速开始
🌟 支持本项目: 您的赞助将推动GenAI智能体开发领域的创新。成为赞助者,帮助维护并扩展这一宝贵资源!
GenAI智能体:全面的开发与实现资源库 🚀
欢迎来到当今最全面、最具活力的生成式AI(GenAI)智能体教程与实现集合之一。本仓库旨在为学习、构建和分享GenAI智能体提供全方位的支持,涵盖从简单的对话机器人到复杂的多智能体系统。
📖 同一作者的其他作品
RAG轻松入门 — 亚马逊生成式AI类畅销书第一名。 22种RAG技术,配有直观解释、对比分析及图示。Kindle Unlimited会员可免费阅读,或以首发价**$0.99**购买(价格即将上调)。
👉 在亚马逊购买本书
🏆 赞助商
近期新增: HR人工智能助手、结合LightRAG的艺术导览员、上下文引用系统、ML/DS助手、古腾堡智者 | 52个教程 并持续更新中
📫 保持关注!
简介
生成式AI智能体正处于人工智能领域的最前沿,正彻底改变我们与AI技术互动及应用的方式。本仓库旨在引导您完成从基础智能体实现到先进尖端系统的开发之旅。
📚 学习构建您的第一个AI智能体这篇详尽的博客文章与本仓库相辅相成,提供了从A到Z的完整指南,深入解析核心概念、分步实施流程以及AI智能体背后的理论基础。文章设计得极其易于理解,同时涵盖了从零开始构建首个可用智能体所需的一切知识。 💡 小贴士:订阅通讯即可提前获取教程,并享受未来课程和书籍的特别折扣! |
我们的目标是为所有人提供有价值的资源——无论是刚刚踏入AI领域的新手,还是不断突破技术边界的老练从业者。通过提供从基础到复杂的多种示例,我们希望促进快速发展的GenAI智能体领域的学习、实验与创新。
此外,本仓库也是一个展示创新智能体成果的平台。无论您是开发了全新的智能体架构,还是为现有技术找到了创新的应用方式,我们都鼓励您与社区分享自己的成果。
相关项目
🚀 提升技能,请查看我的 Agents Towards Production 仓库。它提供以代码为核心的横向教程,覆盖构建生产级GenAI智能体生命周期中的每一个工具和步骤,通过成熟的模式与可重用蓝图,指导您从萌芽阶段逐步走向规模化落地,是真正致力于将智能体投入生产的最佳起点。
📚 深入了解我的 RAG技术综合指南,学习如何将外部知识整合到AI系统中,从而借助最新、最相关的信息检索来增强其能力。
🖋️ 探索我的 提示工程技巧指南,其中收录了从基础概念到高级方法的大量提示策略,帮助您提升与AI语言模型有效沟通的能力。
社区驱动的知识中心
这个仓库因你的贡献而愈发强大! 加入我们的活跃社区——这里是共同塑造和推动本项目发展的核心枢纽 🤝
无论你是渴望学习的新手,还是准备分享知识的专家,你的见解都能影响GenAI代理的未来发展方向。欢迎加入我们,提出想法、获取反馈,并协作实现创新应用。有关贡献指南,请参阅我们的 CONTRIBUTING.md 文件。让我们携手推进GenAI代理技术的发展吧!
🔗 如需讨论GenAI、代理相关话题,或探索知识共享机会,欢迎随时在 LinkedIn 上与我们联系。
核心特性
- 🎓 从入门到进阶,系统学习如何构建GenAI代理
- 🧠 探索多样化的代理架构与应用场景
- 📚 逐步教程与全面文档
- 🛠️ 实用且开箱即用的代理实现
- 🌟 定期更新,紧跟GenAI领域的最新进展
- 🤝 与社区分享你自己的代理作品
GenAI代理实现
以下是我们的GenAI代理实现的全面概览,按类别和功能划分。每个实现都旨在展示AI代理开发的不同方面,从基础对话代理到复杂的多代理系统。
| # | 类别 | 代理名称 | 框架 | 主要特点 |
|---|---|---|---|---|
| 1 | 🌱 初学者 | 简单对话代理 | LangChain/PydanticAI | 上下文感知对话,历史管理 |
| 2 | 🌱 初学者 | 简单问答代理 | LangChain | 理解查询,简洁回答 |
| 3 | 🌱 初学者 | 简单数据分析代理 | LangChain/PydanticAI | 数据集解读,自然语言查询 |
| 4 | 🔧 框架 | LangGraph入门 | LangGraph | 模块化AI工作流,状态管理 |
| 5 | 🔧 框架 | 模型上下文协议(MCP) | MCP | AI与外部资源集成 |
| 6 | 🎓 教育 | ATLAS:学术任务系统 | LangGraph | 多智能体学术规划,笔记记录 |
| 7 | 🎓 教育 | 科学论文代理 | LangGraph | 文献综述自动化 |
| 8 | 🎓 教育 | Chiron - 费曼学习 | LangGraph | 自适应学习,检查点系统 |
| 9 | 💼 商业 | 客户支持代理 | LangGraph | 查询分类,情感分析 |
| 10 | 💼 商业 | 作文评分代理 | LangGraph | 自动评分,多维度标准 |
| 11 | 💼 商业 | 旅行规划代理 | LangGraph | 个性化行程 |
| 12 | 💼 商业 | GenAI职业助手 | LangGraph | 职业指导,学习路径 |
| 13 | 💼 商业 | 项目经理助手 | LangGraph | 任务生成,风险评估 |
| 14 | 💼 商业 | 合同分析助手 | LangGraph | 条款分析,合规性检查 |
| 15 | 💼 商业 | 端到端测试代理 | LangGraph | 测试自动化,浏览器控制 |
| 16 | 🎨 创意 | GIF动画生成器 | LangGraph | 文本转动画流程 |
| 17 | 🎨 创意 | TTS诗歌生成器 | LangGraph | 文本分类,语音合成 |
| 18 | 🎨 创意 | 音乐作曲家 | LangGraph | AI音乐创作 |
| 19 | 🎨 创意 | 内容智能 | LangGraph | 多平台内容生成 |
| 20 | 🎨 创意 | 商业表情包生成器 | LangGraph | 品牌契合的表情包创作 |
| 21 | 🎨 创意 | 谋杀谜案游戏 | LangGraph | 过程化故事生成 |
| 22 | 📊 分析 | 增强记忆的对话代理 | LangChain | 短期/长期记忆整合 |
| 23 | 📊 分析 | 多智能体协作 | LangChain | 历史研究,数据分析 |
| 24 | 📊 分析 | 自我改进代理 | LangChain | 从交互中学习 |
| 25 | 📊 分析 | 任务导向型代理 | LangChain | 文本摘要,翻译 |
| 26 | 📊 分析 | 互联网搜索代理 | LangChain | 网络调研,总结 |
| 27 | 📊 分析 | 研究团队 - Autogen | AutoGen | 多智能体研究协作 |
| 28 | 📊 分析 | 销售电话分析器 | LangGraph | 音频转录,NLP分析 |
| 29 | 📊 分析 | 天气应急系统 | LangGraph | 实时数据处理 |
| 30 | 📊 分析 | 自愈代码库 | LangGraph | 错误检测,自动修复 |
| 31 | 📊 分析 | DataScribe | LangGraph | 数据库探索,查询计划 |
| 32 | 📊 分析 | 增强记忆的邮件代理 | LangGraph | 邮件分类,回复生成 |
| 33 | 📰 新闻 | 新闻TL;DR | LangGraph | 新闻摘要,API集成 |
| 34 | 📰 新闻 | AInsight | LangGraph | AI/ML新闻聚合 |
| 35 | 📰 新闻 | 新闻助理 | LangGraph | 事实核查,偏见检测 |
| 36 | 📰 新闻 | 博客写手 | OpenAI Swarm | 协作式内容创作 |
| 37 | 📰 新闻 | 播客生成器 | LangGraph | 内容搜索,音频生成 |
| 38 | 🛍️ 购物 | ShopGenie | LangGraph | 产品比较,推荐 |
| 39 | 🛍️ 购物 | 购车代理 | LangGraph | 网页抓取,决策支持 |
| 40 | 🎯 任务管理 | Taskifier | LangGraph | 工作方式分析,任务分解 |
| 41 | 🎯 任务管理 | 杂货管理 | CrewAI | 库存跟踪,食谱建议 |
| 42 | 🔍 QA | LangGraph检查员 | LangGraph | 系统测试,漏洞检测 |
| 43 | 🔍 QA | 欧盟绿色协议机器人 | LangGraph | 法规合规,FAQ系统 |
| 44 | 🔍 QA | 系统综述 | LangGraph | 学术论文处理,草稿生成 |
| 45 | 🌟 高级 | 可控RAG代理 | 自定义 | 复杂问题回答,确定性图 |
探索我们按类别排序的广泛 GenAI 代理实现列表:
🌱 适合初学者的代理
简单对话代理
概述 🔎
上下文感知型对话 AI 能够在多次交互中保持信息连贯,从而实现更自然的对话。
实现 🛠️
集成语言模型、提示模板和历史记录管理器,以生成具有上下文的响应并跟踪对话会话。
-
概述 🔎
基于 LangChain 和 OpenAI 语言模型的问答(QA)代理能够理解用户查询,并提供相关且简洁的答案。
实现 🛠️
结合 OpenAI 的 GPT 模型、提示模板和 LLMChain,以简化的方式处理用户问题并生成由 AI 驱动的响应。
简单数据分析代理
概述 🔎
人工智能驱动的数据分析代理能够使用自然语言解释和回答关于数据集的问题,将语言模型与数据处理工具相结合,实现直观的数据探索。
实现 🛠️
集成语言模型、数据处理框架和代理框架,以处理自然语言查询并对合成数据集进行数据分析,从而为非技术人员提供易于理解的洞察。
🔧 框架教程
-
概述 🔎
本教程介绍 LangGraph,这是一个用于创建基于图的模块化 AI 工作流的强大框架。学习如何利用 LangGraph 构建更复杂、更灵活的 AI 代理,以高效地处理多步骤流程。
实现 🛠️
分步指南,展示如何使用 LangGraph 创建 StateGraph 工作流。教程涵盖状态管理、节点创建和图编译等关键概念,并通过构建一个简单的文本分析管道来演示这些原则,为更高级的代理架构奠定基础。
补充资源 📚
-
概述 🔎
本教程介绍模型上下文协议 (MCP),这是一种用于连接 AI 模型与外部数据源和工具的开放标准。了解 MCP 如何作为 GenAI 代理与更广泛的数字生态系统之间的通用桥梁,从而实现功能更强大、更具上下文感知能力的 AI 应用程序。
实现 🛠️
提供 MCP 服务器和客户端的实践指南,演示如何将语言模型与外部工具和数据源连接起来。教程涵盖服务器设置、工具定义以及与 AI 客户端的集成,并通过实际案例展示了如何通过该协议构建有用的代理功能。
补充资源 📚
🎓 教育与科研智能体
-
概述 🔎
ATLAS 展示了如何构建一个智能多智能体系统,通过人工智能驱动的辅助功能来革新学术支持服务。该系统利用 LangGraph 的工作流框架,协调多个专业智能体,为用户提供个性化的学业规划、笔记记录和咨询支持。
实现 🛠️
采用状态管理的多智能体架构,由四个专业智能体(协调员、规划师、笔记撰写者和顾问)协同工作,借助 LangGraph 的工作流框架完成任务。系统具备复杂的用户画像分析与学术支持流程,并能根据学生的学习表现和反馈持续调整优化。
补充资源 📚
-
概述 🔎
这是一个智能科研助手,通过精心设计的工作流帮助用户浏览、理解并分析科学文献。系统结合了学术 API 和先进的论文处理技术,实现文献综述任务的自动化,使研究人员能够高效地从学术论文中提取洞见,同时确保研究的严谨性和质量控制。
实现 🛠️
利用 LangGraph 构建了一个包含决策、规划、工具执行和质量验证节点的五节点工作流系统。系统集成了 CORE API 用于获取论文、PDFplumber 用于文档处理,以及先进的语言模型来进行分析。其关键特性包括用于稳健下载论文的重试机制、通过 Pydantic 模型进行结构化数据处理,以及结合人工审核选项的质量改进循环。
补充资源 📚
-
概述 🔎
这是一个自适应学习智能体,它通过结构化的检查点系统和费曼式教学法引导用户学习教育内容。系统会处理学习材料(可以是用户提供的,也可以是从网络上获取的),并通过交互式检查点验证理解程度,并在必要时提供简化的解释,从而打造一种模拟一对一辅导的个性化学习体验。
实现 🛠️
使用 LangGraph 协调一个包含检查点定义、情境构建、理解验证和费曼式教学等节点的学习工作流。系统集成了网络搜索功能以动态获取内容,采用语义分块技术处理上下文,并利用嵌入向量检索相关信息。其主要特点包括:需达到 70% 的理解阈值才能进入下一阶段、交互式的“人机协作”验证环节,以及通过 Pydantic 模型输出结构化结果以保证数据的一致性。
补充资源 📚
💼 商业与专业代理
-
概述 🔎
一个使用 LangGraph 的智能客户支持代理,能够对用户问题进行分类、情感分析,并提供相应的回复或升级问题。
实现 🛠️
利用 LangGraph 创建了一个结合状态管理、查询分类、情感分析和回复生成的工作流。
-
概述 🔎
一个基于 LangGraph 和 LLM 模型的自动化论文评分系统,可以根据相关性、语法、结构和分析深度来评估论文。
实现 🛠️
使用状态图定义评分流程,为每个评分标准集成独立的评分函数。
-
概述 🔎
一个使用 LangGraph 的旅行规划助手,展示了如何构建一个有状态的多步骤对话式 AI 应用程序,收集用户输入并生成个性化的旅行行程。
实现 🛠️
使用 StateGraph 定义应用流程,集成自定义的 PlannerState 进行流程管理。
-
概述 🔎
GenAI 职业助理演示了如何创建一个多智能体系统,为生成式 AI 领域的职业发展提供个性化指导。该系统利用 LangGraph 和 Gemini LLM,提供定制化的学习路径、简历协助、面试准备以及求职支持。
实现 🛠️
借助 LangGraph 的多智能体架构,通过基于 TypedDict 的状态管理协调专门的智能体(学习、简历、面试、求职)。系统采用复杂的查询分类和路由机制,并与 DuckDuckGo 等外部工具集成,用于求职搜索和动态内容生成。
补充资源 📚
-
概述 🔎
一个旨在协助项目管理任务的 AI 代理,能够自动从项目描述中生成可执行的任务、识别依赖关系、安排工作进度,并根据团队成员的专业技能分配任务。该系统还具备风险评估和自我反思功能,可通过多次迭代优化项目计划,以最大限度地降低整体项目风险。
实现 🛠️
利用 LangGraph 协调一系列专用节点,包括任务生成、依赖关系映射、进度安排、任务分配和风险评估。每个节点都使用 GPT-4o-mini 根据 Pydantic 模型输出结构化结果。系统实现了反馈循环以不断改进,风险评分会触发反思周期,从而生成优化项目计划的见解。可视化工具会展示各次迭代生成的甘特图。
补充资源 📚
-
概述 🔎
ClauseAI 展示了如何使用多智能体方法构建一个基于 AI 的合同分析系统。该系统针对合同审查的不同方面配备了专门的智能体,从条款分析到合规性检查,并利用 LangGraph 进行工作流编排,同时借助 Pinecone 实现高效的条款检索与比较。
实现 🛠️
使用 LangGraph 实现了一个复杂的状态驱动的工作流,以协调多个 AI 智能体完成合同分析的各个阶段。系统采用了 Pydantic 模型进行数据验证,利用 Pinecone 存储向量以实现条款对比,并通过 LLM 分析生成全面的合同报告。实现还包括并行处理能力以及可根据用户需求自定义生成报告的功能。
补充资源 📚
-
概述 🔎
端到端测试代理演示了如何构建一个基于 AI 的系统,将自然语言测试指令转换为可执行的网页端到端测试。该系统使用 LangGraph 进行工作流编排,结合 Playwright 实现浏览器自动化,使用户能够用通俗易懂的英语指定测试用例,同时处理测试生成和执行的复杂性。
实现 🛠️
使用 LangGraph 实现了一个结构化的工作流,以协调测试的生成、验证和执行。系统采用 TypedDict 状态管理,与 Playwright 集成实现浏览器自动化,并利用 LLM 代码生成技术将自然语言指令转化为可执行的测试脚本。实现还包括 DOM 状态分析、错误处理和全面的测试报告。
补充资源 📚
🎨 创意与内容生成智能体
-
概述 🔎
一个结合 LangGraph 进行工作流管理、GPT-4 用于文本生成以及 DALL-E 用于图像创作的 GIF 动画生成器,能够根据用户提示生成定制化的动画。
实现 🛠️
使用 LangGraph 编排工作流,通过 GPT-4 生成角色描述、情节和图像提示,再利用 DALL-E 3 创建图像,并借助 PIL 将这些图像拼接成 GIF。整个流程采用异步编程以实现高效的并行处理。
-
概述 🔎
一个基于 LangGraph 和 OpenAI API 的高级文本转语音(TTS)智能体,能够对输入文本进行分类,并根据内容类型进行相应处理,最终生成对应的语音输出。
实现 🛠️
利用 LangGraph 编排工作流,先使用 GPT 模型对输入文本进行分类,再应用特定于内容类型的处理方法,最后通过 OpenAI 的 TTS API 将处理后的文本转换为语音。系统会根据识别出的内容类型(通用文本、诗歌、新闻或笑话)调整输出方式。
-
概述 🔎
一个基于 LangGraph 和 OpenAI 语言模型的 AI 音乐作曲智能体,可以根据用户输入生成定制化的音乐作品。系统将输入分解为多个环节,每个环节负责音乐创作的不同部分,最终合成一首完整的 MIDI 格式可播放的音乐。
实现 🛠️
LangGraph 负责编排工作流,将用户输入转化为音乐作品:使用 ChatOpenAI(GPT-4)生成旋律、和声及节奏,并对其进行风格化处理。最终生成的 AI 作曲会被 music21 转换为 MIDI 文件,随后可通过 pygame 播放。
-
概述 🔎
内容智能展示了如何构建一个先进的内容生成系统,能够将输入文本转化为适用于多个社交媒体平台的优化内容。该系统采用 LangGraph 进行工作流编排,分析内容、开展调研并生成符合各平台特性的定制化内容,同时确保品牌一致性。
实现 🛠️
使用 LangGraph 实现复杂的工作流,协调多个专业节点(摘要、调研、平台专属)完成内容生成过程。系统采用 TypedDict 和 Pydantic 模型进行状态管理,集成 Tavily Search 增强研究能力,并利用 GPT-4 生成各平台专属内容。此外,还支持多平台并行处理及自定义内容模板。
补充资源 📚
基于 LangGraph 和 Memegen.link 的商业表情包生成器
概述 🔎
商业表情包生成器演示了如何构建一个基于 AI 的系统,能够根据公司网站分析生成上下文相关的表情包。该系统利用 LangGraph 编排工作流,结合 Groq 的 Llama 模型进行文本分析,并通过 Memegen.link API 自动生成与品牌一致的数字营销用表情包。
实现 🛠️
使用 LangGraph 实现状态管理的工作流,协调网站内容分析、表情包创意生成和图像制作。系统采用 Pydantic 模型进行数据验证,借助 aiohttp 实现异步处理,并集成外部 API(Groq、Memegen.link),形成完整的表情包生成流水线,支持自定义模板。
补充资源 📚
-
概述 🔎
一款基于文本的侦探游戏,利用自主的 LLM 智能体作为互动角色,构建程序化生成的谋杀悬疑场景。受 UNBOUNDED 论文启发,每次都会生成独特的剧情,玩家扮演夏洛克·福尔摩斯,通过与角色对话和演绎推理来破解案件。
实现 🛠️
系统采用了两个 LangGraph 工作流——主游戏循环用于故事和角色的生成及游戏推进,以及用于角色交互的子图。系统结合 LLM 驱动的叙事生成、角色 AI 和结构化的游戏机制,打造出沉浸式的调查体验,并提供可重复游玩的故事情节。
补充资源 📚
📊 分析与信息处理智能体
-
概述 🔎
一种记忆增强型对话 AI 智能体,集成了短期和长期记忆系统,能够在单次对话及跨会话中保持上下文连贯性,从而提升交互质量和个性化程度。
实现 🛠️
将语言模型与独立的短期和长期记忆存储相结合,使用包含两种记忆类型的提示模板,并配备记忆管理器用于存储和检索。系统还包括一个交互循环,可在每次响应时更新和调用记忆。
-
概述 🔎
一个结合历史研究与数据分析的多智能体协作系统,利用大型语言模型模拟不同领域的专业智能体协同工作,共同解答复杂的历史问题。
实现 🛠️
通过基类 Agent 创建专门的历史研究智能体和数据分析智能体,并由历史数据协作系统进行协调。系统遵循五步流程:提供历史背景、确定数据需求、获取历史数据、进行数据分析,最后完成综合总结。
-
概述 🔎
基于 LangChain 的自我改进型智能体能够进行对话交流,从交互中学习,并通过反思与适应不断优化自身性能。
实现 🛠️
将语言模型与聊天记录管理、响应生成以及反思机制相结合。系统配备一套学习机制,能够吸收反思所得的洞见以提升后续表现,从而形成持续改进的闭环。
-
概述 🔎
一款基于 LangChain 的语言模型应用,可对文本进行摘要并将其翻译成西班牙语,融合了自定义函数、结构化工具和智能体,实现高效的文本处理流程。
实现 🛠️
使用自定义函数分别完成摘要和翻译任务,并将其封装为结构化工具。借助提示模板引导智能体工作,由智能体协调工具的使用。最终由智能体执行器负责整个流程,接收输入文本后生成英文摘要及其西班牙语译文。
-
概述 🔎
一款智能化的网络研究助手,将网页搜索能力与 AI 驱动的摘要生成技术相结合,自动从互联网上收集信息并提炼出简洁、相关性强的摘要。
实现 🛠️
集成了基于 DuckDuckGo API 的网页搜索模块、结果解析器以及利用 OpenAI 语言模型的文本摘要引擎。系统可执行特定站点或通用搜索,提取相关内容,生成精炼摘要,并汇总带来源标注的结果,从而实现高效的信息检索与整合。
-
概述 🔎
本方案探索了一种基于 AutoGen 库的多智能体协作研究系统。该系统采用多个智能体协同完成任务,注重执行效率与质量保障,通过将任务分配给不同专业领域的智能体来提升研究效能。
实现 🛠️
利用 GPT-4 模型为各智能体赋予特定角色,包括管理员、开发者、规划者、执行者和质量保证人员。通过交互管理确保沟通有序,并设定明确的流转规则。任务执行过程涵盖协作式规划、代码编写、实际执行及质量检查,展现出适用于多种领域的可扩展框架。
补充资源 📚
-
概述 🔎
一种智能化系统,通过结合音频转录与先进自然语言处理技术,自动分析销售通话录音。该分析器使用 OpenAI 的 Whisper 将音频转录为文本,再运用 NLP 技术对文本进行处理,最终生成包含情感分析、关键短语、痛点及改进建议在内的综合报告,以提升销售业绩。
实现 🛠️
系统采用结构化的流程,集成多个组件:OpenAI Whisper 负责音频转录,CrewAI 用于任务自动化和智能体管理,LangChain 则负责编排整个分析流水线。系统从音频转录开始,经过一系列步骤完成详细分析,借助自定义智能体和任务生成结构化的 JSON 报告,其中包含客户情绪洞察、销售机会以及改进建议等信息。
补充资源 📚
-
概述 🔎
一个综合性系统,展示了两种用于天气应急响应的智能体图实现:一种是实时图,用于处理实时气象数据;另一种是混合图,结合真实与模拟数据以测试高危场景。该系统覆盖从数据采集到应急计划生成的完整流程,并包含自动化通知及人工复核环节。
实现 🛠️
系统采用 LangGraph 进行复杂工作流的编排与状态管理,集成 OpenWeatherMap API 获取实时数据,同时利用 Gemini 进行分析并生成应对方案。此外,系统还具备邮件通知、社交媒体监控模拟功能,以及针对低/中度事件配置的人工复核机制,以按严重程度进行分流。
补充资源 📚
-
概述 🔎
一个智能化系统,利用 LangGraph 工作流编排和 ChromaDB 向量存储,自动检测、诊断并修复运行时代码错误。该系统通过向量嵌入保存已出现的 bug 及其修复方案,从而实现对代码库中类似问题的模式识别。
实现 🛠️
系统采用基于状态的图式工作流,将函数定义和运行时参数传递至专门的节点,用于错误检测、代码分析和修复生成。ChromaDB 被用作存储 bug 模式及修复方案的向量数据库,支持对相似错误模式的自动搜索与检索,同时通过结构化的验证步骤确保代码执行的安全性。
补充资源 📚
-
概述 🔎
一个智能代理系统,通过自然语言交互实现对关系型数据库的直观探索与查询。该系统利用由状态感知的监督者协调的一组专业代理,负责模式发现、查询规划和数据分析任务,并借助基于向量的关系图来保持上下文理解。
实现 🛠️
使用 LangGraph 协调包含发现、推理和规划代理在内的多代理工作流,并结合 NetworkX 进行关系图的可视化与管理。系统采用 TypedDict 类进行动态状态管理,通过 db_graph 属性在会话间维持数据库上下文,并配备安全措施以防止未经授权的数据库修改。
增强记忆功能的电子邮件代理(LangGraph 和 LangMem)
概述 🔎
一款智能电子邮件助手,融合语义记忆、情景记忆和程序性记忆三种类型的记忆机制,构建了一个能够不断自我提升的系统。该代理可以对收件箱中的邮件进行分类处理,利用存储的知识起草符合上下文的回复,并根据用户反馈持续优化自身性能。
实现 🛠️
利用 LangGraph 进行工作流编排,LangMem 则用于跨多种记忆类型的复杂记忆管理。系统实现了基于记忆增强决策的分类处理流程,配备了专门用于邮件撰写和日历管理的工具,并设计了一种自我改进机制,可根据反馈及过往表现更新自身的提示模板。
补充资源 📚
- **博客文章
📰 新闻与信息代理
-
概述 🔎
一个基于用户查询生成时事简明 TL;DR 摘要的新闻摘要系统。该系统利用大型语言模型进行决策和摘要生成,同时集成新闻 API 以获取最新内容,使用户能够通过生成的要点式摘要快速了解感兴趣的主题。
实现 🛠️
使用 LangGraph 协调由多个组件组成的流程:GPT-4o-mini 用于生成搜索词和文章摘要,NewsAPI 用于检索文章元数据,BeautifulSoup 用于抓取文章内容,Asyncio 用于并发处理。系统遵循从查询处理到文章选择和摘要生成的结构化流程,在各组件之间管理流程流转,以生成当前新闻文章的相关 TL;DR 摘要。
补充资源 📚
-
概述 🔎
AInsight 展示了如何使用多智能体架构构建一个智能新闻聚合与摘要系统。该系统采用三个专业代理(新闻搜索者、摘要生成者、发布者),通过基于 LangGraph 的工作流编排,自动收集、处理并为普通受众总结 AI/ML 方面的新闻。
实现 🛠️
使用 LangGraph 实现了一个状态管理的多智能体系统,协调新闻采集(Tavily API)、技术内容摘要(GPT-4)以及报告生成等流程。系统具有模块化架构,采用 TypedDict 基于的状态管理、外部 API 集成,并支持使用可定制模板生成 Markdown 格式的报告。
补充资源 📚
-
概述 🔎
一款专门帮助记者应对虚假信息、偏见和信息过载等现代新闻挑战的 AI 助手。该系统集成了事实核查、语气分析、摘要生成和语法检查工具,以提高新闻工作的准确性和效率,同时保持符合伦理的报道标准。
实现 🛠️
利用 LangGraph 协调包括用于分析和生成的语言模型、通过 DuckDuckGo API 集成的网络搜索、PyMuPDFLoader 和 WebBaseLoader 等文档解析工具、RecursiveCharacterTextSplitter 文本分割组件,以及结构化 JSON 输出在内的各个专业组件的工作流。各组件通过统一的工作流协同工作,对内容进行分析、核实事实、检测偏见、提取引文,并生成全面的报告。
-
概述 🔎
一个使用 OpenAI 的 Swarm 包协作创建博客文章的多智能体系统。它利用专业代理高效地完成研究、规划、写作和编辑任务。
实现 🛠️
使用 OpenAI 的 Swarm 包来管理智能体之间的交互。系统包含管理员、研究员、规划师、写手和编辑,每个角色都有明确的职责。系统遵循结构化的流程:确定主题、拟定提纲、进行研究、撰写初稿和编辑润色。这种方法通过任务分配、专业化和协作解决问题,提升了内容创作的效率。
补充资源 📚
-
概述 🔎
一个两步代理,首先根据给定主题在互联网上搜索相关信息,然后基于搜索结果生成一档关于该主题的播客节目。第一步由搜索代理和搜索函数负责查找最相关的信息;第二步则由播客生成代理和生成函数根据所搜到的信息制作播客。
实现 🛠️
使用 LangGraph 编排一个两步工作流。第一步由搜索代理和搜索函数从互联网上搜集信息;第二步则由播客生成代理和生成函数基于搜集到的信息制作播客。
🛍️ 购物与产品分析智能体
-
概述 🔎
这是一个基于人工智能的购物助手,即使用户缺乏相关领域的专业知识,也能帮助其做出明智的购买决策。该系统会从多个来源分析商品信息,比较规格和用户评价,根据用户需求找出最佳选项,并通过电子邮件附带视频评测的方式提供推荐,从而打造全方位的购物体验。
实现方式 🛠️
使用 LangGraph 编排工作流,结合 Tavily 进行网络搜索、Llama-3.1-70B 进行结构化数据分析和产品对比,以及 YouTube API 获取评测视频。系统通过多个节点处理搜索结果,包括模式映射、产品比较、评价筛选和邮件生成等环节。其关键特性包括使用 Pydantic 模型实现数据的一致性管理、为确保 API 调用的稳定性而设计的重试机制,以及通过 SMTP 协议发送邮件以分享推荐内容。
补充资源 📚
-
概述 🔎
智能产品购买者 AI 智能体展示了如何构建一个能够协助用户做出明智购买决策的智能系统。该系统利用 LangGraph 和基于大语言模型的智能技术,处理用户需求、抓取 AutoTrader 等网站上的商品信息,并提供详细的汽车选购分析与建议。
实现方式 🛠️
基于状态的工作流由 LangGraph 协调用户交互、网页抓取和决策支持等功能。系统采用 TypedDict 进行状态管理,借助 Playwright 实现异步网页抓取,并集成外部 API 以完成全面的产品分析。此外,还配备了 Gradio 界面用于实时聊天交互,以及模块化的爬虫架构,便于扩展到其他商品类别。
补充资源 📚
🎯 任务管理与 productivity 智能体
-
概述 🔎
这是一个智能任务管理系统,能够分析用户的工作风格并制定个性化的任务分解策略。其设计灵感来源于观察:拖延症往往源于学生和职场新人对任务目标的模糊不清。该系统会评估用户的历史工作模式,通过网络搜索收集相关任务信息,并生成定制化的分步执行方案,以优化工作效率、缓解工作流程中的停滞感。
实现方式 🛠️
利用 LangGraph 编排一个多步骤的工作流,包含工作风格分析、通过 Tavily API 收集信息以及生成个性化计划等环节。系统在整个过程中维护状态,将历史工作模式数据与最新的任务研究相结合,最终输出符合用户自然工作习惯的详细、个性化的任务执行计划。
补充资源 📚
-
概述 🔎
这是一个基于 CrewAI 构建的多智能体系统,可自动化处理杂货管理相关的各项任务,包括收据解析、保质期追踪、库存管理以及食谱推荐等。该系统利用专门的智能体从收据中提取商品信息、借助网络资源估算商品保质期、根据消费情况跟踪库存,并基于现有食材推荐菜谱,从而最大限度地减少食物浪费。
实现方式 🛠️
使用 CrewAI 实现四个专用智能体:收据解析器负责从收据中提取商品明细;保质期估算器则利用线上资源判断商品的保质期;杂货追踪器根据消费记录维护库存;食谱推荐器则根据现有食材提出烹饪建议。每个智能体都配备特定工具和任务,由 Crew 工作流统一协调运行。
补充资源 📚
🔍 质量保证与测试代理
-
概述 🔎
这是一个针对基于 LangGraph 的应用的全面测试与验证工具,能够自动分析系统架构、生成测试用例,并通过多智能体检查识别潜在漏洞。该检查器采用专门的 AI 测试代理来评估系统的各个方面,从基本功能到安全问题以及边缘情况。
实现 🛠️
集成了 LangGraph 用于工作流编排、多个由 LLM 驱动的测试代理,以及包含静态分析、测试用例生成和结果验证的结构化评估流程。系统使用 Pydantic 进行数据验证,NetworkX 用于图表示,并实现了模块化架构,支持并行测试执行和全面的结果分析。
补充资源 📚
-
概述 🔎
欧盟绿色协议 FAQ 机器人展示了如何构建一个基于 RAG 的 AI 代理,帮助企业管理者理解欧盟绿色协议的相关政策。该系统将复杂的法规文件分解为易于管理的片段,并针对环境合规、排放报告及废物管理要求等常见问题提供即时、准确的答案。
实现 🛠️
使用 FAISS 向量存储实现了一套复杂的 RAG 流程,结合语义分块进行预处理,并配备多个专业代理(检索器、摘要生成器、评估器)来处理查询。系统具备查询改写功能以提高准确性,可与黄金问答数据集进行交叉引用以验证答案,并采用全面的评估指标确保响应的质量和相关性。
补充资源 📚
-
概述 🔎
这是一个利用有向图架构和 LangChain 组件来自动化学术系统综述的综合系统。该系统能够生成完整的、可直接发表的系统综述论文,从文献检索到最终草稿生成,全程自动完成,并经过多次修订循环。
实现 🛠️
采用基于状态的图工作流,负责论文的搜索与筛选(最多 3 篇)、PDF 处理,并生成包含所有标准部分(摘要、引言、方法、结果、结论、参考文献)的完整学术论文。系统内置多轮修订机制,包含自动批评与改进阶段,全部由 LangGraph 的状态管理进行协调。
补充资源 📚
-
概述 🔎
这是一款基于 LangGraph 的工作流驱动的人工智能招聘助手,用于需求收集、职位描述生成、LinkedIn 候选人搜索以及简历分析。
实现 🛠️
利用 LangChain 和 LangGraph 编排一个多步骤的招聘流程,实现结构化的状态管理;同时借助 OpenAI 进行语言生成,并自动化候选人评估工作流。
-
概述 🔎
这是一个综合性的机器学习助手,结合 LangGraph 和 OpenAI,能够加载数据集、执行预处理、特征工程、模型训练、评估和可视化,整个过程通过智能体式的工作流完成。
实现 🛠️
使用 LangGraph 来编排机器学习流水线工具,包括数据预处理、模型选择、超参数调优和结果可视化。展示了端到端的智能体式机器学习工作流,并与 Kaggle 数据集集成。
-
概述 🔎
这是一款交互式艺术导览助手,采用 LightRAG(知识图谱 RAG)和 LangGraph 技术,通过对话式探索艺术收藏,并结合结构化数据检索。
实现 🛠️
将 LightRAG 的知识图谱检索与 LangGraph 智能体链相结合,辅以交互式小部件 UI 和自定义的艺术数据准备。展示了图-based RAG 在创意领域中的新颖应用。
-
概述 🔎
这是一个用于探索古腾堡计划文本的对话式智能体,通过 Ollama 使用本地 LLM,并结合 Chroma/Pinecone 的向量存储 RAG 以及 spaCy 的命名实体识别技术。
实现 🛠️
利用 LangGraph + Ollama 实现完全本地化的 LLM 推理,支持多用户会话管理,增强 NER 的检索能力,并集成双层向量存储(Chroma 用于本地,Pinecone 用于云端)。
-
概述 🔎
这是一个复杂的多智能体保险/商业报价系统,基于 LangGraph 和 RAG 技术,配备专门的检索、推理、分类和报价生成智能体。
实现 🛠️
使用 ChromaDB 进行 RAG 检索,SQLite 存储结构化数据,Pydantic 模式用于验证,并通过 OpenAI + Groq 协调一系列专业智能体(检索器、推理器、分类器、报价生成器)的工作流程。这是本系列中最具生产实用价值的多智能体实现之一。
📖 想了解这些智能体背后所使用的 RAG 技术吗? RAG 简易指南 以可视化方式介绍了 22 种 RAG 技术。Kindle Unlimited 用户可免费阅读。
🌟 特别进阶技术 🌟
-
概述 🔎
这是一种先进的 RAG 解决方案,旨在应对简单基于语义相似度的检索无法解决的复杂问题。该方法使用一个复杂的确定性图作为高度可控的自主智能体的“大脑” 🧠,能够根据您自己的数据回答非平凡的问题。
实现 🛠️
• 实现一个多步骤流程,包括问题匿名化、高层次规划、任务分解、自适应信息检索与问答、持续重规划以及严格的答案验证,以确保生成的答案具有事实依据且准确可靠。
前置条件
- Python 3.9+
- 已安装并运行 Docker(部分智能体和设置需要)
开始使用
要开始探索和构建 GenAI 智能体:
- 克隆本仓库:
git clone https://github.com/NirDiamant/GenAI_Agents.git - 导航到您感兴趣的技术目录:
cd all_agents_tutorials/technique-name - 按照每项技术笔记本中的详细实现指南进行操作。
📚 推荐阅读
本列表包含亚马逊联盟链接。作为亚马逊联盟会员,我将从符合条件的购买中获得收入。以下每一本书都是我亲自阅读过,并真诚推荐给从事该领域工作的工程师们。本仓库的配套书籍已单独列在 README 的顶部。
- 从零构建大型语言模型 作者:塞巴斯蒂安·拉斯奇卡。使用 PyTorch 从头到尾构建一个类似 GPT 的模型。
- AI 工程:使用基础模型构建应用 作者:奇普·休恩。生产级基础模型应用开发的经典参考书。
- 动手实践大型语言模型 作者:杰伊·阿拉马尔和马尔滕·赫鲁滕多斯特。图文并茂、注重实战的 LLM 全景解析。
- 使用 Transformer 的自然语言处理 作者:刘易斯·坦斯托尔、莱昂德罗·冯·韦拉和托马斯·沃尔夫。由 Hugging Face 团队编写。
- 机器学习系统设计 作者:奇普·休恩。关于生产环境中机器学习系统的经典参考书。
贡献
我们欢迎社区的贡献!如果您有新的技术或改进建议:
- 分支本仓库
- 创建您的功能分支:
git checkout -b feature/AmazingFeature - 提交您的更改:
git commit -m '添加一些 AmazingFeature' - 推送到分支:
git push origin feature/AmazingFeature - 打开一个拉取请求
贡献者
许可证
本项目采用自定义的非商业许可——详情请参阅 LICENSE 文件。
⭐️ 如果您觉得本仓库有所帮助,请考虑给它点个赞!
关键词:GenAI,生成式 AI,智能体,NLP,AI,机器学习,自然语言处理,LLM,对话式 AI,面向任务的 AI
常见问题
相似工具推荐
openclaw
OpenClaw 是一款专为个人打造的本地化 AI 助手,旨在让你在自己的设备上拥有完全可控的智能伙伴。它打破了传统 AI 助手局限于特定网页或应用的束缚,能够直接接入你日常使用的各类通讯渠道,包括微信、WhatsApp、Telegram、Discord、iMessage 等数十种平台。无论你在哪个聊天软件中发送消息,OpenClaw 都能即时响应,甚至支持在 macOS、iOS 和 Android 设备上进行语音交互,并提供实时的画布渲染功能供你操控。 这款工具主要解决了用户对数据隐私、响应速度以及“始终在线”体验的需求。通过将 AI 部署在本地,用户无需依赖云端服务即可享受快速、私密的智能辅助,真正实现了“你的数据,你做主”。其独特的技术亮点在于强大的网关架构,将控制平面与核心助手分离,确保跨平台通信的流畅性与扩展性。 OpenClaw 非常适合希望构建个性化工作流的技术爱好者、开发者,以及注重隐私保护且不愿被单一生态绑定的普通用户。只要具备基础的终端操作能力(支持 macOS、Linux 及 Windows WSL2),即可通过简单的命令行引导完成部署。如果你渴望拥有一个懂你
n8n
n8n 是一款面向技术团队的公平代码(fair-code)工作流自动化平台,旨在让用户在享受低代码快速构建便利的同时,保留编写自定义代码的灵活性。它主要解决了传统自动化工具要么过于封闭难以扩展、要么完全依赖手写代码效率低下的痛点,帮助用户轻松连接 400 多种应用与服务,实现复杂业务流程的自动化。 n8n 特别适合开发者、工程师以及具备一定技术背景的业务人员使用。其核心亮点在于“按需编码”:既可以通过直观的可视化界面拖拽节点搭建流程,也能随时插入 JavaScript 或 Python 代码、调用 npm 包来处理复杂逻辑。此外,n8n 原生集成了基于 LangChain 的 AI 能力,支持用户利用自有数据和模型构建智能体工作流。在部署方面,n8n 提供极高的自由度,支持完全自托管以保障数据隐私和控制权,也提供云端服务选项。凭借活跃的社区生态和数百个现成模板,n8n 让构建强大且可控的自动化系统变得简单高效。
stable-diffusion-webui
stable-diffusion-webui 是一个基于 Gradio 构建的网页版操作界面,旨在让用户能够轻松地在本地运行和使用强大的 Stable Diffusion 图像生成模型。它解决了原始模型依赖命令行、操作门槛高且功能分散的痛点,将复杂的 AI 绘图流程整合进一个直观易用的图形化平台。 无论是希望快速上手的普通创作者、需要精细控制画面细节的设计师,还是想要深入探索模型潜力的开发者与研究人员,都能从中获益。其核心亮点在于极高的功能丰富度:不仅支持文生图、图生图、局部重绘(Inpainting)和外绘(Outpainting)等基础模式,还独创了注意力机制调整、提示词矩阵、负向提示词以及“高清修复”等高级功能。此外,它内置了 GFPGAN 和 CodeFormer 等人脸修复工具,支持多种神经网络放大算法,并允许用户通过插件系统无限扩展能力。即使是显存有限的设备,stable-diffusion-webui 也提供了相应的优化选项,让高质量的 AI 艺术创作变得触手可及。
everything-claude-code
everything-claude-code 是一套专为 AI 编程助手(如 Claude Code、Codex、Cursor 等)打造的高性能优化系统。它不仅仅是一组配置文件,而是一个经过长期实战打磨的完整框架,旨在解决 AI 代理在实际开发中面临的效率低下、记忆丢失、安全隐患及缺乏持续学习能力等核心痛点。 通过引入技能模块化、直觉增强、记忆持久化机制以及内置的安全扫描功能,everything-claude-code 能显著提升 AI 在复杂任务中的表现,帮助开发者构建更稳定、更智能的生产级 AI 代理。其独特的“研究优先”开发理念和针对 Token 消耗的优化策略,使得模型响应更快、成本更低,同时有效防御潜在的攻击向量。 这套工具特别适合软件开发者、AI 研究人员以及希望深度定制 AI 工作流的技术团队使用。无论您是在构建大型代码库,还是需要 AI 协助进行安全审计与自动化测试,everything-claude-code 都能提供强大的底层支持。作为一个曾荣获 Anthropic 黑客大奖的开源项目,它融合了多语言支持与丰富的实战钩子(hooks),让 AI 真正成长为懂上
opencode
OpenCode 是一款开源的 AI 编程助手(Coding Agent),旨在像一位智能搭档一样融入您的开发流程。它不仅仅是一个代码补全插件,而是一个能够理解项目上下文、自主规划任务并执行复杂编码操作的智能体。无论是生成全新功能、重构现有代码,还是排查难以定位的 Bug,OpenCode 都能通过自然语言交互高效完成,显著减少开发者在重复性劳动和上下文切换上的时间消耗。 这款工具专为软件开发者、工程师及技术研究人员设计,特别适合希望利用大模型能力来提升编码效率、加速原型开发或处理遗留代码维护的专业人群。其核心亮点在于完全开源的架构,这意味着用户可以审查代码逻辑、自定义行为策略,甚至私有化部署以保障数据安全,彻底打破了传统闭源 AI 助手的“黑盒”限制。 在技术体验上,OpenCode 提供了灵活的终端界面(Terminal UI)和正在测试中的桌面应用程序,支持 macOS、Windows 及 Linux 全平台。它兼容多种包管理工具,安装便捷,并能无缝集成到现有的开发环境中。无论您是追求极致控制权的资深极客,还是渴望提升产出的独立开发者,OpenCode 都提供了一个透明、可信
ComfyUI
ComfyUI 是一款功能强大且高度模块化的视觉 AI 引擎,专为设计和执行复杂的 Stable Diffusion 图像生成流程而打造。它摒弃了传统的代码编写模式,采用直观的节点式流程图界面,让用户通过连接不同的功能模块即可构建个性化的生成管线。 这一设计巧妙解决了高级 AI 绘图工作流配置复杂、灵活性不足的痛点。用户无需具备编程背景,也能自由组合模型、调整参数并实时预览效果,轻松实现从基础文生图到多步骤高清修复等各类复杂任务。ComfyUI 拥有极佳的兼容性,不仅支持 Windows、macOS 和 Linux 全平台,还广泛适配 NVIDIA、AMD、Intel 及苹果 Silicon 等多种硬件架构,并率先支持 SDXL、Flux、SD3 等前沿模型。 无论是希望深入探索算法潜力的研究人员和开发者,还是追求极致创作自由度的设计师与资深 AI 绘画爱好者,ComfyUI 都能提供强大的支持。其独特的模块化架构允许社区不断扩展新功能,使其成为当前最灵活、生态最丰富的开源扩散模型工具之一,帮助用户将创意高效转化为现实。



