aie-book

GitHub
14.8k 2.1k 非常简单 1 次阅读 今天语言模型开发框架Agent
AI 解读 由 AI 自动生成,仅供参考

aie-book 是知名技术作家 Chip Huyen 为其新书《AI Engineering》打造的配套开源资源库。它并非传统的代码教程,而是一套面向实战的 AI 工程化指南,旨在帮助从业者系统性地掌握如何利用基础模型(如大语言模型和多模态模型)解决现实世界的问题。

在 AI 技术快速迭代的今天,开发者常面临“何时微调模型”、“如何评估应用效果”、“怎样抑制幻觉”以及"RAG 最佳实践”等关键决策难题。aie-book 通过提供书籍章节摘要、学习笔记、丰富的提示词(Prompt)案例、深度行业案例分析以及独特的对话热力图生成工具,为这些问题提供了经过验证的方法论和评估框架。它强调超越具体工具的生命周期,聚焦于构建可靠、高效且安全 AI 系统的核心原则。

这套资源特别适合 AI 工程师、机器学习研究者以及希望将大模型落地到生产环境的技术决策者。无论你是想从零构建 AI 应用,还是希望优化现有系统,aie-book 都能助你理清思路,避开常见陷阱,建立起扎实的 AI 工程化思维。

使用场景

某初创团队正试图将大语言模型集成到客服系统中,但在技术选型和效果评估阶段陷入了盲目试错的困境。

没有 aie-book 时

  • 团队在“微调模型”还是“构建 RAG 系统”之间犹豫不决,缺乏系统的决策框架,导致资源浪费在错误的技术路线上。
  • 面对模型产生的幻觉问题,开发人员只能凭直觉修补提示词,无法定位根本原因或缺乏科学的检测与缓解策略。
  • 由于缺乏端到端的工程视角,团队不知道如何建立有效的反馈闭环,导致应用上线后迭代缓慢,难以持续提升准确率。
  • 成员被市面上层出不穷的新工具和新基准测试搞得晕头转向,难以分辨哪些是营销噱头,哪些是真正适用的最佳实践。

使用 aie-book 后

  • 借助书中提供的评估框架,团队快速明确了场景需求,果断选择了更适合动态知识库的 RAG 方案,避免了不必要的微调成本。
  • 利用书中关于幻觉成因的深度解析,团队实施了针对性的检测机制和上下文优化策略,显著降低了错误回答率。
  • 参考书中的持续改进章节,团队设计了一套自动化的用户反馈收集与评估流程,使模型表现能够随数据积累不断进化。
  • 通过阅读真实的案例研究和基础原理,团队成员统一了认知,不再盲目追逐新工具,而是专注于构建稳健的工程架构。

aie-book 不仅提供了应对具体技术难题的实操指南,更赋予了工程师在复杂 AI landscape 中做出正确战略决策的系统性思维。

运行环境要求

GPU

未说明

内存

未说明

依赖
notes该项目主要是一本关于 AI 工程的书籍及其相关资源(如目录、案例研究、提示词示例等),并非一个需要特定运行环境的可执行软件工具或代码库。README 中提到的唯一代码文件是用于生成聊天热图的脚本 (scripts/ai-heatmap.ipynb),但未在提供的文本中列出具体的环境依赖、操作系统要求或硬件配置。
python未说明
aie-book hero image

快速开始

AI 工程书籍及其他资源

本仓库将在接下来的几周内持续更新更多资源。

关于本书

基础模型的出现,使 AI 从一门专业学科转变为人人都能使用的强大开发工具。本书涵盖了将基础模型应用于解决现实世界问题的端到端流程,既包括来自其他工程领域的成熟技术,也涵盖了随着基础模型兴起而出现的新方法。

本书可在以下平台购买:

以及大多数销售技术类书籍的渠道。

本书并非教程类书籍,因此不包含大量代码片段。

本书内容概述

本书提供了一套框架,用于将包括大型语言模型(LLM)和大型多模态模型(LMM)在内的基础模型适配到具体应用场景中。它不仅概述了构建 AI 应用的各种方案,还提出了可以帮助您评估最适合自身需求的解决方案的问题。以下是本书能够帮助您解答的部分问题:

  1. 我是否应该构建这个 AI 应用?
  2. 如何评估我的应用?能否使用 AI 来评估 AI 的输出?
  3. 幻觉现象由什么引起?如何检测并缓解幻觉?
  4. 提示工程的最佳实践是什么?
  5. RAG 为何有效?实施 RAG 的策略有哪些?
  6. 什么是智能体?如何构建并评估一个智能体?
  7. 何时需要对模型进行微调?何时不需要?
  8. 我需要多少数据?如何验证数据的质量?
  9. 如何让我的模型更快、更便宜且更安全?
  10. 如何建立反馈循环以持续改进我的应用?

此外,本书还将帮助您理清纷繁复杂的 AI 领域:模型类型、评估基准,以及数量看似无穷无尽的应用场景和模式。

书中内容通过实际案例加以说明,其中许多是我亲自参与过的项目,并辅以丰富的参考文献,同时经过来自不同背景的专家广泛审阅。尽管本书耗时两年完成,但它基于我在过去十年中使用语言模型和机器学习系统的工作经验。

与我之前的著作《设计机器学习系统》(DMLS)一样,本书聚焦于 AI 工程的基础知识,而非特定的工具或 API。工具会迅速过时,而基础原理则更为持久。

结合阅读《AI 工程》(AIE)与《设计机器学习系统》(DMLS)

AIE 可以作为 DMLS 的补充读物。DMLS 主要关注在传统机器学习模型之上构建应用,涉及更多的表格型数据标注、特征工程和模型训练;而 AIE 则侧重于在基础模型之上构建应用,涉及更多的提示工程、上下文构建和参数高效的微调。两本书均为独立且模块化的结构,您可以单独阅读其中任何一本。

由于基础模型本质上也是机器学习模型,因此部分概念在两者中都适用。如果某个主题虽然与 AIE 相关,但在 DMLS 中已有详尽讨论,则本书仍会提及该主题,但篇幅会相对较少,并提供相关资源的链接。

需要注意的是,许多主题仅在 DMLS 或 AIE 中有所涉及,反之亦然。本书的第一章还详细探讨了传统机器学习工程与 AI 工程之间的区别。

在实际系统中,往往同时涉及传统机器学习模型和基础模型,因此掌握两者的相关知识通常是必要的。

本书适合哪些读者

本书面向所有希望利用基础模型解决现实世界问题的人士。这是一本技术类书籍,因此其语言风格主要针对技术岗位,包括 AI 工程师、机器学习工程师、数据科学家、工程经理和技术产品经理等。如果您符合以下任一情况,本书都将对您有所帮助:

  • 您正在构建或优化 AI 应用,无论是从零开始,还是希望从演示阶段进入生产就绪状态。您可能还面临幻觉、安全性、延迟或成本等问题,亟需针对性的解决方案。
  • 您希望简化团队的 AI 开发流程,使其更加系统化、高效化和可靠化。
  • 您希望了解组织如何利用基础模型提升业务效益,以及如何组建相应的团队来实现这一目标。

此外,以下群体也能从本书中受益:

  • 工具开发者:希望识别 AI 工程领域中尚未被充分覆盖的空白点,从而更好地定位您的产品在生态系统中的位置。
  • 研究人员:希望更深入地理解 AI 的各种应用场景。
  • 求职者:希望明确从事 AI 工程师职业所需的技能。
  • 任何希望更好地理解 AI 的能力与局限性,以及它可能对不同角色产生的影响的人士。

我喜欢深入探究事物的本质,因此书中某些章节会更深入地剖析技术细节。尽管许多早期读者喜欢这种细致入微的描述,但我明白这并不一定适合所有人。当内容变得过于技术化时,我会提前告知您,请随时跳过那些感觉过于复杂的部分!

书评

  • “本书为构建生成式AI系统的关键环节提供了一套全面且结构清晰的指南。对于任何希望在企业范围内规模化应用AI的专业人士而言,这都是一本必读之作。” —— 维托里奥·克雷特拉,宝洁与玛氏前全球首席信息官

  • “希普·休恩深谙生成式AI之道。她是一位杰出的导师与作家,其著作对帮助团队将AI落地生产发挥了至关重要的作用。凭借其深厚的专业积累,《AI工程》是一部全面而系统性的指南,指导如何在生产环境中构建生成式AI应用。” —— 卢克·梅茨,ChatGPT联合开发者、前OpenAI研究经理

  • “每一位构建真实世界应用的AI工程师都应当阅读此书。它是一本关于端到端AI系统设计的重要指南,涵盖从模型开发与评估,到大规模部署与运维的全流程。” —— 安德烈·洛帕滕科,Neuron7搜索与AI总监

  • “本书是构建可规模化AI产品的必备指南。不同于那些聚焦于工具或瞬息万变的最新趋势的书籍,希普提供了历久弥新的基础性知识。无论你是产品经理还是工程师,这本书都能有效弥合跨职能团队之间的协作鸿沟,因此对于所有参与AI开发的人来说,都堪称必读之作。” —— 艾琳·布依,谷歌AI产品运营经理

  • “这是机器学习工程领域大师向AI工程领域过渡的权威之作!希普在其职业生涯中亲历了公司各个发展阶段的成功项目,并首次将她的丰富经验浓缩成册,献给刚入行的新一代AI工程师。” —— swyx,AI.Engineer策展人

  • “《AI工程》是一本实用指南,提供了最前沿的AI开发资讯,既适合初学者,也便于资深领导者理解。对于任何希望构建稳健且可扩展的AI系统的人来说,这本书都是不可或缺的资源。” —— 维姬·雷兹尔曼,Mave Sparks首席AI解决方案架构师

  • “《AI工程》是一部内容全面的指南,既是理解AI系统的关键参考,也是将其付诸实践的实用手册。” —— 韩·李,穆迪公司数据科学总监

  • “《AI工程》是所有使用生成式AI进行软件开发人员的必备指南!它揭开了这项技术的神秘面纱,强调了评估的重要性,并分享了在开始代价高昂的微调之前,应当采取哪些措施来确保质量。” —— 拉法尔·卡瓦拉,高级AI工程总监,拥有16年财富500强企业工作经验

快来Twitter上看看大家对这本书的讨论吧@aisysbooks

致谢

如果没有众多杰出人士在写作过程中给予的帮助,这本书的完成将会耗费更长的时间,并且会遗漏许多重要内容。

由于项目时间紧迫——仅用两年时间就要完成一部涵盖广泛内容、字数达15万字的书籍——我非常感激那些技术审稿人,他们不惜牺牲宝贵时间,迅速完成了本书的审阅工作。

Luke Metz 是一位极好的“思想伙伴”,他帮助我检验假设,避免我走入误区。Han-chung Lee 始终紧跟人工智能领域的最新动态和社区发展,为我指出了许多被我忽略的重要资源。Luke 和 Han 是在我将稿件递交给下一轮技术审稿人之前,最早审阅我的初稿的人,我永远感激他们对我种种失误与不足的包容。

曾在世界500强企业领导人工智能创新的 Vittorio CretellaAndrei Lopatenko 提供了极具价值的反馈,他们的意见既深入技术细节,又兼具高管视角。Vicki Reyzelman 则帮助我确保内容扎实可靠,并使其对具备软件工程背景的读者更具相关性。

Eugene Yan 是一位挚友兼杰出的应用科学家,他不仅在技术上给予了我支持,也在情感上给了我莫大的鼓励。Shawn Wang(swyx)则为我提供了重要的方向性建议,让我对整本书的信心倍增。Sanyam Bhutani 是我所认识的最佳学习者之一,也是一位极为谦逊的人。他不仅撰写了细致入微的文字反馈,还录制视频来进一步阐释自己的意见。

Kyle Krannen 是一位卓越的深度学习负责人,他采访了自己的同事,并与我分享了一份关于他们微调流程的精彩报告,这为微调章节的撰写提供了重要指导。Mark Saroufim,这位充满求知欲、时刻关注最前沿问题的人,向我推荐了许多关于效率优化的优质资源。Kyle 和 Mark 的反馈对于第7章和第9章的写作至关重要。

Kittipat “Bot” Kampa 除了耐心解答我提出的诸多问题外,还与我分享了他对人工智能平台的独特思考方式及其详细可视化呈现。我同样感谢 Denys Linkov 在评估与平台开发方面所展现出的系统化方法。Chetan Tekur 则提供了许多精彩的案例,帮助我梳理了人工智能应用模式。此外,我还想感谢 Alex (Shengzhi Li) LiHien Luu 对我关于人工智能架构的草稿所提出的深刻见解。

Aileen Bui 是一位难得的宝藏,她从产品经理的角度出发,提供了独到的反馈和实例。感谢 Todor Markov 对 RAG 和 Agent 章节提出的切实可行的建议。同时也要感谢 Tal Kachman 在最后关头挺身而出,推动微调章节顺利完成。

还有许许多多令人敬佩的朋友,他们的陪伴与交流为本书的内容提供了源源不断的灵感。我已尽力在此列出所有曾给予我帮助的人士姓名,但由于人类记忆难免有疏漏,我肯定遗漏了不少名字。如果我的名单中遗漏了您的大名,请您谅解,这绝非我不重视您的贡献;请您不吝提醒我,我会尽快予以补正!

Andrew Francis、Anish Nag、Anthony GalczakAnton Bacaj、Balázs Galambosi、Charles Frye、Charles Packer、Chris Brousseau、Eric Hartford、Goku Mohandas、Hamel Husain、Harpreet Sahota、Hassan El Mghari、Huu Nguyen、Jeremy Howard、Jesse Silver、John Cook、Juan Pablo Bottaro、Kyle Gallatin、Lance Martin、Lucio Dery、Matt Ross、Maxime Labonne、Miles Brundage、Nathan Lambert、Omar Khattab、Phong Nguyen、Purnendu Mukherjee、Sam Reiswig、Sebastian Raschka、Shahul ES、Sharif Shameem、Soumith Chintala、Teknium、Tim Dettmers、Undi5、Val Andrei Fajardo、Vern Liang、Victor Sanh、Wing Lian、Xiquan Cui、Ying Sheng,以及 Kristofer。

我也要感谢所有早期读者,他们纷纷主动提出宝贵意见。Douglas Bailley 是一位超级热心的读者,他分享了大量富有洞见的反馈。Nutan Sahoo 则提出了一个优雅的方式来解释困惑度这一概念。

在与各位在线交流的过程中,我也受益匪浅。感谢每一位曾经回答过我问题、评论过我的帖子,或通过邮件与我分享想法的朋友。

当然,没有 O'Reilly 团队的支持,尤其是我的编辑团队(Melissa Potter、Corbin Collins、Jill Leonard)以及制作编辑团队(Kristen Brown 和 Elizabeth Kelly),这本书根本无法问世。Liz Wheeler 是我合作过的最具洞察力的编辑。Nicole Butterfield 则是整个项目的幕后推手,她全程主导了本书从构思到最终成品的每一个环节。

归根结底,这本书是我职业生涯中所积累的宝贵经验的结晶。这些经验离不开我那些能力出众且耐心十足的同事及前同事们。与我共事过的每一个人,都教会了我如何将机器学习真正落地并造福社会。




Chip Huyen,《AI 工程》。O'Reilly Media 出版社,2025年。

@book{aiebook2025,  
    address = {美国},  
    author = {Chip Huyen},  
    isbn = {978-1801819312},   
    publisher = {O'Reilly Media},  
    title = {{AI 工程}},  
    year = {2025}  
}

相似工具推荐

openclaw

OpenClaw 是一款专为个人打造的本地化 AI 助手,旨在让你在自己的设备上拥有完全可控的智能伙伴。它打破了传统 AI 助手局限于特定网页或应用的束缚,能够直接接入你日常使用的各类通讯渠道,包括微信、WhatsApp、Telegram、Discord、iMessage 等数十种平台。无论你在哪个聊天软件中发送消息,OpenClaw 都能即时响应,甚至支持在 macOS、iOS 和 Android 设备上进行语音交互,并提供实时的画布渲染功能供你操控。 这款工具主要解决了用户对数据隐私、响应速度以及“始终在线”体验的需求。通过将 AI 部署在本地,用户无需依赖云端服务即可享受快速、私密的智能辅助,真正实现了“你的数据,你做主”。其独特的技术亮点在于强大的网关架构,将控制平面与核心助手分离,确保跨平台通信的流畅性与扩展性。 OpenClaw 非常适合希望构建个性化工作流的技术爱好者、开发者,以及注重隐私保护且不愿被单一生态绑定的普通用户。只要具备基础的终端操作能力(支持 macOS、Linux 及 Windows WSL2),即可通过简单的命令行引导完成部署。如果你渴望拥有一个懂你

349.3k|★★★☆☆|2周前
Agent开发框架图像

n8n

n8n 是一款面向技术团队的公平代码(fair-code)工作流自动化平台,旨在让用户在享受低代码快速构建便利的同时,保留编写自定义代码的灵活性。它主要解决了传统自动化工具要么过于封闭难以扩展、要么完全依赖手写代码效率低下的痛点,帮助用户轻松连接 400 多种应用与服务,实现复杂业务流程的自动化。 n8n 特别适合开发者、工程师以及具备一定技术背景的业务人员使用。其核心亮点在于“按需编码”:既可以通过直观的可视化界面拖拽节点搭建流程,也能随时插入 JavaScript 或 Python 代码、调用 npm 包来处理复杂逻辑。此外,n8n 原生集成了基于 LangChain 的 AI 能力,支持用户利用自有数据和模型构建智能体工作流。在部署方面,n8n 提供极高的自由度,支持完全自托管以保障数据隐私和控制权,也提供云端服务选项。凭借活跃的社区生态和数百个现成模板,n8n 让构建强大且可控的自动化系统变得简单高效。

184.7k|★★☆☆☆|今天
数据工具开发框架Agent

AutoGPT

AutoGPT 是一个旨在让每个人都能轻松使用和构建 AI 的强大平台,核心功能是帮助用户创建、部署和管理能够自动执行复杂任务的连续型 AI 智能体。它解决了传统 AI 应用中需要频繁人工干预、难以自动化长流程工作的痛点,让用户只需设定目标,AI 即可自主规划步骤、调用工具并持续运行直至完成任务。 无论是开发者、研究人员,还是希望提升工作效率的普通用户,都能从 AutoGPT 中受益。开发者可利用其低代码界面快速定制专属智能体;研究人员能基于开源架构探索多智能体协作机制;而非技术背景用户也可直接选用预置的智能体模板,立即投入实际工作场景。 AutoGPT 的技术亮点在于其模块化“积木式”工作流设计——用户通过连接功能块即可构建复杂逻辑,每个块负责单一动作,灵活且易于调试。同时,平台支持本地自托管与云端部署两种模式,兼顾数据隐私与使用便捷性。配合完善的文档和一键安装脚本,即使是初次接触的用户也能在几分钟内启动自己的第一个 AI 智能体。AutoGPT 正致力于降低 AI 应用门槛,让人人都能成为 AI 的创造者与受益者。

183.6k|★★★☆☆|今天
Agent语言模型插件

stable-diffusion-webui

stable-diffusion-webui 是一个基于 Gradio 构建的网页版操作界面,旨在让用户能够轻松地在本地运行和使用强大的 Stable Diffusion 图像生成模型。它解决了原始模型依赖命令行、操作门槛高且功能分散的痛点,将复杂的 AI 绘图流程整合进一个直观易用的图形化平台。 无论是希望快速上手的普通创作者、需要精细控制画面细节的设计师,还是想要深入探索模型潜力的开发者与研究人员,都能从中获益。其核心亮点在于极高的功能丰富度:不仅支持文生图、图生图、局部重绘(Inpainting)和外绘(Outpainting)等基础模式,还独创了注意力机制调整、提示词矩阵、负向提示词以及“高清修复”等高级功能。此外,它内置了 GFPGAN 和 CodeFormer 等人脸修复工具,支持多种神经网络放大算法,并允许用户通过插件系统无限扩展能力。即使是显存有限的设备,stable-diffusion-webui 也提供了相应的优化选项,让高质量的 AI 艺术创作变得触手可及。

162.1k|★★★☆☆|2周前
开发框架图像Agent

everything-claude-code

everything-claude-code 是一套专为 AI 编程助手(如 Claude Code、Codex、Cursor 等)打造的高性能优化系统。它不仅仅是一组配置文件,而是一个经过长期实战打磨的完整框架,旨在解决 AI 代理在实际开发中面临的效率低下、记忆丢失、安全隐患及缺乏持续学习能力等核心痛点。 通过引入技能模块化、直觉增强、记忆持久化机制以及内置的安全扫描功能,everything-claude-code 能显著提升 AI 在复杂任务中的表现,帮助开发者构建更稳定、更智能的生产级 AI 代理。其独特的“研究优先”开发理念和针对 Token 消耗的优化策略,使得模型响应更快、成本更低,同时有效防御潜在的攻击向量。 这套工具特别适合软件开发者、AI 研究人员以及希望深度定制 AI 工作流的技术团队使用。无论您是在构建大型代码库,还是需要 AI 协助进行安全审计与自动化测试,everything-claude-code 都能提供强大的底层支持。作为一个曾荣获 Anthropic 黑客大奖的开源项目,它融合了多语言支持与丰富的实战钩子(hooks),让 AI 真正成长为懂上

161.1k|★★☆☆☆|今天
开发框架Agent语言模型

opencode

OpenCode 是一款开源的 AI 编程助手(Coding Agent),旨在像一位智能搭档一样融入您的开发流程。它不仅仅是一个代码补全插件,而是一个能够理解项目上下文、自主规划任务并执行复杂编码操作的智能体。无论是生成全新功能、重构现有代码,还是排查难以定位的 Bug,OpenCode 都能通过自然语言交互高效完成,显著减少开发者在重复性劳动和上下文切换上的时间消耗。 这款工具专为软件开发者、工程师及技术研究人员设计,特别适合希望利用大模型能力来提升编码效率、加速原型开发或处理遗留代码维护的专业人群。其核心亮点在于完全开源的架构,这意味着用户可以审查代码逻辑、自定义行为策略,甚至私有化部署以保障数据安全,彻底打破了传统闭源 AI 助手的“黑盒”限制。 在技术体验上,OpenCode 提供了灵活的终端界面(Terminal UI)和正在测试中的桌面应用程序,支持 macOS、Windows 及 Linux 全平台。它兼容多种包管理工具,安装便捷,并能无缝集成到现有的开发环境中。无论您是追求极致控制权的资深极客,还是渴望提升产出的独立开发者,OpenCode 都提供了一个透明、可信

144.3k|★☆☆☆☆|4天前
Agent插件