llm-python

GitHub
916 316 简单 1 次阅读 3天前MIT开发框架插件语言模型
AI 解读 由 AI 自动生成,仅供参考

llm-python 是一套专为 Python 开发者打造的开源学习资源库,汇集了构建大语言模型(LLM)应用所需的教程、代码示例和实战脚本。它旨在解决初学者在入门 LLM 开发时面临的“理论多、实操少”的痛点,通过提供独立且聚焦的代码片段,帮助用户快速掌握如何利用 LangChain、LlamaIndex、OpenAI、ChromaDB 及 Pinecone 等主流框架搭建智能应用。

无论是希望构建问答系统、本地知识库查询工具,还是想尝试离线部署开源模型或开发 AI 游戏,llm-python 都提供了从基础 API 调用到复杂 Agent 构建的完整路径。其独特亮点在于“视频 + 代码”的双模教学模式:每个核心概念都配有作者亲自讲解的 YouTube 视频教程,并与仓库中的自包含代码一一对应,让用户能边看边练,直观理解嵌入向量、提示词工程及缓存优化等关键技术。

这套资源非常适合具有一定 Python 基础的软件工程师、技术爱好者及希望转型 AI 领域的研究人员使用。如果你不想被冗长的文档劝退,而是希望通过动手实践快速上手大模型开发,llm-python 将是你理想的起步伙伴。

使用场景

某初创公司的数据分析师需要快速构建一个能基于公司内部 PDF 文档和 CSV 销售数据进行智能问答的原型系统,以向投资人演示 AI 落地能力。

没有 llm-python 时

  • 开发者需在 LangChain、LlamaIndex 和向量数据库之间反复摸索,缺乏标准化的代码参考,导致环境配置和依赖安装耗时数天。
  • 面对“如何连接私有数据”、“如何处理 Embedding"等关键问题,只能零散搜索碎片化教程,难以形成完整的开发链路。
  • 缺乏针对特定场景(如查询 CSV 或本地离线模型)的独立脚本,每次尝试新功能都要重写大量样板代码,试错成本极高。
  • 无法快速验证想法,往往在基础架构搭建阶段就耗尽精力,导致原型演示延期甚至取消。

使用 llm-python 后

  • 直接复用仓库中"LangChain + OpenAI 构建问答系统”或“查询数据库/CSV"的自包含脚本,几小时内即可跑通核心功能。
  • 依托配套的视频教程与分模块代码,清晰掌握从数据加载、向量化存储到检索生成的完整流程,学习曲线大幅平缓。
  • 按需选取“本地离线 LLM"或"Pinecone 向量检索”等特定场景示例,无需修改底层逻辑即可快速迁移到自己的业务数据上。
  • 借助成熟的代码模板迅速完成原型开发,将节省下来的时间专注于优化提示词工程和业务逻辑调整,按时高质量完成演示。

llm-python 通过提供模块化、视频配套的实战代码库,将大应用开发的入门门槛从“数周摸索”降低为“数小时落地”,极大加速了 AI 原型的迭代效率。

运行环境要求

操作系统
  • Linux
  • macOS
  • Windows
GPU
  • 非必需
  • 仅在使用本地托管的开源模型(如 OPT)或特定架构包(如 triton)时可能需要
  • triton 包仅支持 x86_64 架构
内存

未说明

依赖
notes1. 必须配置 .env 文件并设置 OPENAI_API_KEY,其他 API 密钥(如 HuggingFace, Pinecone, Cohere 等)为可选。2. 核心依赖包 triton 仅支持 x86_64 架构处理器,在其他架构上安装可能会失败。3. 代码示例旨在独立运行,部分高级示例需要访问真实的金融数据 API(如 Sectors)。4. 教程视频中的代码可能与仓库最新代码有细微差异,请以仓库代码为准。
python未说明 (需支持 pip 安装 requirements.txt)
llamaindex>=0.6.31
langchain>=0.0.209
openai-agents
chromadb
pinecone-client
triton (仅限 x86_64)
llm-python hero image

快速开始

llm-python

一组教学材料、代码示例和 Python 脚本,重点介绍使用 LLM(如 GPT 等)并通过 llamaindex、LangChain、OpenAI 的 Agent SDK、Chroma (Chromadb)、Pinecone 等接口实现的应用。

这些代码示例旨在帮助您学习如何使用 Python 构建 LLM 应用程序和智能体。代码设计为自包含且目标单一,您可以根据自身需求选择最相关的使用模式。

许多示例都配有视频,可在我的 YouTube 频道观看:samuelchan

LangChain YouTube 教程

通过我的 YouTube 频道学习 LangChain(约 9 小时的 LLM 实战构建教程);每节课都附有本仓库中的对应代码,并且设计为自包含——同时聚焦于 LLM(大型语言模型)开发与工具链中的关键概念。

请根据您的学习目标自由选择起点:

部分 LLM 教程 链接 视频时长
1 OpenAI 教程及视频演示 教程视频 26 分 56 秒
2 LangChain + OpenAI 教程:基于自有文本数据构建问答系统 教程视频 20 分钟
3 LangChain + OpenAI 与自有数据库/CSV 对话 教程视频 19 分 30 秒
4 LangChain + HuggingFace 推理 API(无需 OpenAI 积分!) 教程视频 24 分 36 秒
5 理解 LLM 中的嵌入技术 教程视频 29 分 22 秒
6 使用 LlamaIndex + GPT3 查询任意网站(结合 Chromadb、Trafilatura) 教程视频 11 分 11 秒
7 使用 LlamaIndex + OPT 在本地部署离线 LLM(开源、指令微调 LLM) 教程视频 32 分 27 秒
8 构建 AI 语言辅导助手:Pinecone + LlamaIndex + GPT-3 + BeautifulSoup 教程视频 51 分 08 秒
9 使用 OpenAI、Markdown 和 LlamaIndex 🦙 构建可查询的日志 💬 教程视频 40 分 29 秒
10 使用 Cohere LLM + Stability.ai 制作科幻游戏:生成式 AI 教程 教程视频 1 小时 02 分 20 秒
11 GPT 根据提示词构建完整的派对邀请应用(联合 SMOL Developer) 教程视频 41 分 33 秒
12 一种用于 LLM 提示词设计的语言:指导原则 教程视频 43 分 15 秒
13 您应该使用 LangChain 的缓存功能! 教程视频 25 分 37 秒
14 使用 Streamlit + LangChain 构建聊天 AI 应用 教程视频 32 分 11 秒

完整课程播放列表请见:这里

更新

多智能体与代理模式更新:2025 年 5 月 3 日

我向仓库推送了 6 个新脚本,从 19_agents_handsoff.py24_agents_guardrails.py,旨在作为本公开课程的代码参考:

这些新增内容展示了构建 AI 智能体(尤其是多智能体系统)的 6 种关键模式,并采用了截至 2025 年 5 月的最新版 OpenAI Agent SDK (openai-agents)。

这 6 种代理模式按在本仓库中的出现顺序如下:

  • 1 手动交接与委派模式 (19_agents_handsoff.py)
  • 2 工具使用与函数调用模式 (20_agents_tooluse.py)
  • 3 确定性与顺序链模式 (21_agents_deterministic.py)
  • 4 评判与批评模式 (22_agents_critic.py)
  • 5 并行化模式 (23_agents_parallelization.py)
  • 6 安全约束模式 (24_agents_guardrails.py)

更新:2025 年 2 月 5 日

我向仓库推送了 4 个新脚本,从 15_sql.py18_chroma.py,旨在作为以下公开课程的代码参考:

此外,我还在此仓库中托管了 Sectors 发布的 生成式 AI 系列 的示例代码。

  1. 金融领域的生成式 AI:概述了为金融行业设计生成式 AI 系统的方法,以及检索增强生成(RAG)系统的动机。

  2. 工具使用型检索增强生成(RAG):利用信息检索工具构建 RAG 系统的实用指南(在 LLM 中称为“工具使用”或“函数调用”)。

  3. AI 的结构化输出:从使用生成式 AI 从非结构化数据中提取信息,到执行数据库查询、API 调用、JSON 解析等操作,AI 的输出都需要明确的模式和结构。

  4. 带有流式处理的 ReAct 智能体:针对 LangChain v0.3.2 进行了更新,我们探讨了流式处理、LCEL 表达式以及 ReAct 智能体,遵循创建对话型 AI 智能体的最新实践。

  5. 具有会话记忆的 AI 智能体:针对 LangChain v0.2.3 进行了更新,深入探讨了具有会话记忆的 AI 智能体的创建方法。

以上两个系列均为公开且免费开放。本仓库中的代码旨在作为这些课程的参考。

快速入门

  1. 克隆此仓库
  2. 安装依赖:pip install -r requirements.txt
  3. news 文件夹中提供了一些示例数据,但你也可以用自己的数据替换(或添加)文本文件。
  4. 创建一个 .env 文件,其中包含你的 OpenAI API 密钥。你可以从 这里 获取。HUGGINGFACEHUB_API_TOKENPINECONE_API_KEY 是可选的,但在部分课程中会用到。
    • 第 10 课 使用了 Cohere 和 Stability AI,两者都提供免费层级(无需信用卡)。你可以在 .env 文件中添加相应的密钥:COHERE_API_KEYSTABILITY_API_KEY
    • 一些涉及工具使用和函数调用智能体的高级示例,需要与真实的金融数据 API 集成。我和 Supertype 团队构建了一个以 LLM 为核心的金融 API 平台 Sectors。你可以注册一个免费账户,阅读我们的 API 文档和生成式 AI 五课系列,学习如何使用该 API 构建复杂的 LLM 应用程序。这些应用的示例都包含在本仓库中。

你的 .env 文件应如下所示:

# 推荐
OPENAI_API_KEY=...

# 可选但有用
SECTORS_API_KEY=...
GROQ_API_KEY=...

# 完全可选(根据需求选择)
HUGGINGFACEHUB_API_TOKEN=...
PINECONE_API_KEY=...
DEEPSEEK_API_KEY=...
COHERE_API_KEY=...
STABILITY_API_KEY=...

HuggingFace 和 Pinecone 是可选的,但如果你希望使用推理 API 并探索 OpenAI 生态之外的模型,建议安装。这在教程系列的第 3 部分中有演示。 5. 按任意顺序运行示例。例如,python 6_team.py 将运行网站问答示例,该示例使用 GPT-3 回答关于公司及 Supertype.ai 团队成员的问题。观看对应的视频,可以跟随每个示例的操作步骤。

依赖项

💡 感谢 @VanillaMacchiato 的工作,该项目已于 2023-06-30 更新至使用最新版本的 LlamaIndex (0.6.31) 和 LangChain (0.0.209)。安装依赖只需执行 pip install -r requirements.txt 即可。如遇任何问题,请随时告知我。

如果你正在观看 LLM 视频教程,它们可能与本仓库中的代码存在细微差异(通常只需更改 1-2 行代码),因为这些视频是在录制时使用相应版本发布的(LlamaIndex 0.5.7 和 LangChain 0.0.157)。请参考本仓库中的代码以获取最新版本。

我会尽量保持本仓库与最新库版本同步,但如果你遇到任何问题,请:(1) 通过 Issues 提出讨论;或 (2) 自愿提交 PR 来更新代码。

注意:triton 包仅支持 x86_64 架构。如果安装遇到问题,请参阅 triton 兼容性指南。常见错误包括:ERROR: Could not find a version that satisfies the requirement triton (from versions: none) ERROR: No matching distribution found for triton。 运行 uname -p 命令可查看处理器名称。

导师指导与支持

我在 Supertype Fellowship 下运营一个导师计划。该计划为自定进度、免费形式,拥有来自全球各地(英语使用者)的学习者和从业者社区。你还可以选择预约与我的导师团队进行一对一辅导,获得视频教学和代码审查的帮助。

许可证

MIT © Supertype 2024

常见问题

相似工具推荐

stable-diffusion-webui

stable-diffusion-webui 是一个基于 Gradio 构建的网页版操作界面,旨在让用户能够轻松地在本地运行和使用强大的 Stable Diffusion 图像生成模型。它解决了原始模型依赖命令行、操作门槛高且功能分散的痛点,将复杂的 AI 绘图流程整合进一个直观易用的图形化平台。 无论是希望快速上手的普通创作者、需要精细控制画面细节的设计师,还是想要深入探索模型潜力的开发者与研究人员,都能从中获益。其核心亮点在于极高的功能丰富度:不仅支持文生图、图生图、局部重绘(Inpainting)和外绘(Outpainting)等基础模式,还独创了注意力机制调整、提示词矩阵、负向提示词以及“高清修复”等高级功能。此外,它内置了 GFPGAN 和 CodeFormer 等人脸修复工具,支持多种神经网络放大算法,并允许用户通过插件系统无限扩展能力。即使是显存有限的设备,stable-diffusion-webui 也提供了相应的优化选项,让高质量的 AI 艺术创作变得触手可及。

162.1k|★★★☆☆|今天
开发框架图像Agent

everything-claude-code

everything-claude-code 是一套专为 AI 编程助手(如 Claude Code、Codex、Cursor 等)打造的高性能优化系统。它不仅仅是一组配置文件,而是一个经过长期实战打磨的完整框架,旨在解决 AI 代理在实际开发中面临的效率低下、记忆丢失、安全隐患及缺乏持续学习能力等核心痛点。 通过引入技能模块化、直觉增强、记忆持久化机制以及内置的安全扫描功能,everything-claude-code 能显著提升 AI 在复杂任务中的表现,帮助开发者构建更稳定、更智能的生产级 AI 代理。其独特的“研究优先”开发理念和针对 Token 消耗的优化策略,使得模型响应更快、成本更低,同时有效防御潜在的攻击向量。 这套工具特别适合软件开发者、AI 研究人员以及希望深度定制 AI 工作流的技术团队使用。无论您是在构建大型代码库,还是需要 AI 协助进行安全审计与自动化测试,everything-claude-code 都能提供强大的底层支持。作为一个曾荣获 Anthropic 黑客大奖的开源项目,它融合了多语言支持与丰富的实战钩子(hooks),让 AI 真正成长为懂上

139k|★★☆☆☆|今天
开发框架Agent语言模型

ComfyUI

ComfyUI 是一款功能强大且高度模块化的视觉 AI 引擎,专为设计和执行复杂的 Stable Diffusion 图像生成流程而打造。它摒弃了传统的代码编写模式,采用直观的节点式流程图界面,让用户通过连接不同的功能模块即可构建个性化的生成管线。 这一设计巧妙解决了高级 AI 绘图工作流配置复杂、灵活性不足的痛点。用户无需具备编程背景,也能自由组合模型、调整参数并实时预览效果,轻松实现从基础文生图到多步骤高清修复等各类复杂任务。ComfyUI 拥有极佳的兼容性,不仅支持 Windows、macOS 和 Linux 全平台,还广泛适配 NVIDIA、AMD、Intel 及苹果 Silicon 等多种硬件架构,并率先支持 SDXL、Flux、SD3 等前沿模型。 无论是希望深入探索算法潜力的研究人员和开发者,还是追求极致创作自由度的设计师与资深 AI 绘画爱好者,ComfyUI 都能提供强大的支持。其独特的模块化架构允许社区不断扩展新功能,使其成为当前最灵活、生态最丰富的开源扩散模型工具之一,帮助用户将创意高效转化为现实。

107.7k|★★☆☆☆|2天前
开发框架图像Agent

NextChat

NextChat 是一款轻量且极速的 AI 助手,旨在为用户提供流畅、跨平台的大模型交互体验。它完美解决了用户在多设备间切换时难以保持对话连续性,以及面对众多 AI 模型不知如何统一管理的痛点。无论是日常办公、学习辅助还是创意激发,NextChat 都能让用户随时随地通过网页、iOS、Android、Windows、MacOS 或 Linux 端无缝接入智能服务。 这款工具非常适合普通用户、学生、职场人士以及需要私有化部署的企业团队使用。对于开发者而言,它也提供了便捷的自托管方案,支持一键部署到 Vercel 或 Zeabur 等平台。 NextChat 的核心亮点在于其广泛的模型兼容性,原生支持 Claude、DeepSeek、GPT-4 及 Gemini Pro 等主流大模型,让用户在一个界面即可自由切换不同 AI 能力。此外,它还率先支持 MCP(Model Context Protocol)协议,增强了上下文处理能力。针对企业用户,NextChat 提供专业版解决方案,具备品牌定制、细粒度权限控制、内部知识库整合及安全审计等功能,满足公司对数据隐私和个性化管理的高标准要求。

87.6k|★★☆☆☆|今天
开发框架语言模型

ML-For-Beginners

ML-For-Beginners 是由微软推出的一套系统化机器学习入门课程,旨在帮助零基础用户轻松掌握经典机器学习知识。这套课程将学习路径规划为 12 周,包含 26 节精炼课程和 52 道配套测验,内容涵盖从基础概念到实际应用的完整流程,有效解决了初学者面对庞大知识体系时无从下手、缺乏结构化指导的痛点。 无论是希望转型的开发者、需要补充算法背景的研究人员,还是对人工智能充满好奇的普通爱好者,都能从中受益。课程不仅提供了清晰的理论讲解,还强调动手实践,让用户在循序渐进中建立扎实的技能基础。其独特的亮点在于强大的多语言支持,通过自动化机制提供了包括简体中文在内的 50 多种语言版本,极大地降低了全球不同背景用户的学习门槛。此外,项目采用开源协作模式,社区活跃且内容持续更新,确保学习者能获取前沿且准确的技术资讯。如果你正寻找一条清晰、友好且专业的机器学习入门之路,ML-For-Beginners 将是理想的起点。

85k|★★☆☆☆|今天
图像数据工具视频

ragflow

RAGFlow 是一款领先的开源检索增强生成(RAG)引擎,旨在为大语言模型构建更精准、可靠的上下文层。它巧妙地将前沿的 RAG 技术与智能体(Agent)能力相结合,不仅支持从各类文档中高效提取知识,还能让模型基于这些知识进行逻辑推理和任务执行。 在大模型应用中,幻觉问题和知识滞后是常见痛点。RAGFlow 通过深度解析复杂文档结构(如表格、图表及混合排版),显著提升了信息检索的准确度,从而有效减少模型“胡编乱造”的现象,确保回答既有据可依又具备时效性。其内置的智能体机制更进一步,使系统不仅能回答问题,还能自主规划步骤解决复杂问题。 这款工具特别适合开发者、企业技术团队以及 AI 研究人员使用。无论是希望快速搭建私有知识库问答系统,还是致力于探索大模型在垂直领域落地的创新者,都能从中受益。RAGFlow 提供了可视化的工作流编排界面和灵活的 API 接口,既降低了非算法背景用户的上手门槛,也满足了专业开发者对系统深度定制的需求。作为基于 Apache 2.0 协议开源的项目,它正成为连接通用大模型与行业专有知识之间的重要桥梁。

77.1k|★★★☆☆|昨天
Agent图像开发框架