[{"data":1,"prerenderedAt":-1},["ShallowReactive",2],{"similar-microsoft--agent-lightning":3,"tool-microsoft--agent-lightning":64},[4,17,27,35,43,56],{"id":5,"name":6,"github_repo":7,"description_zh":8,"stars":9,"difficulty_score":10,"last_commit_at":11,"category_tags":12,"status":16},3808,"stable-diffusion-webui","AUTOMATIC1111\u002Fstable-diffusion-webui","stable-diffusion-webui 是一个基于 Gradio 构建的网页版操作界面，旨在让用户能够轻松地在本地运行和使用强大的 Stable Diffusion 图像生成模型。它解决了原始模型依赖命令行、操作门槛高且功能分散的痛点，将复杂的 AI 绘图流程整合进一个直观易用的图形化平台。\n\n无论是希望快速上手的普通创作者、需要精细控制画面细节的设计师，还是想要深入探索模型潜力的开发者与研究人员，都能从中获益。其核心亮点在于极高的功能丰富度：不仅支持文生图、图生图、局部重绘（Inpainting）和外绘（Outpainting）等基础模式，还独创了注意力机制调整、提示词矩阵、负向提示词以及“高清修复”等高级功能。此外，它内置了 GFPGAN 和 CodeFormer 等人脸修复工具，支持多种神经网络放大算法，并允许用户通过插件系统无限扩展能力。即使是显存有限的设备，stable-diffusion-webui 也提供了相应的优化选项，让高质量的 AI 艺术创作变得触手可及。",162132,3,"2026-04-05T11:01:52",[13,14,15],"开发框架","图像","Agent","ready",{"id":18,"name":19,"github_repo":20,"description_zh":21,"stars":22,"difficulty_score":23,"last_commit_at":24,"category_tags":25,"status":16},1381,"everything-claude-code","affaan-m\u002Feverything-claude-code","everything-claude-code 是一套专为 AI 编程助手（如 Claude Code、Codex、Cursor 等）打造的高性能优化系统。它不仅仅是一组配置文件，而是一个经过长期实战打磨的完整框架，旨在解决 AI 代理在实际开发中面临的效率低下、记忆丢失、安全隐患及缺乏持续学习能力等核心痛点。\n\n通过引入技能模块化、直觉增强、记忆持久化机制以及内置的安全扫描功能，everything-claude-code 能显著提升 AI 在复杂任务中的表现，帮助开发者构建更稳定、更智能的生产级 AI 代理。其独特的“研究优先”开发理念和针对 Token 消耗的优化策略，使得模型响应更快、成本更低，同时有效防御潜在的攻击向量。\n\n这套工具特别适合软件开发者、AI 研究人员以及希望深度定制 AI 工作流的技术团队使用。无论您是在构建大型代码库，还是需要 AI 协助进行安全审计与自动化测试，everything-claude-code 都能提供强大的底层支持。作为一个曾荣获 Anthropic 黑客大奖的开源项目，它融合了多语言支持与丰富的实战钩子（hooks），让 AI 真正成长为懂上",140436,2,"2026-04-05T23:32:43",[13,15,26],"语言模型",{"id":28,"name":29,"github_repo":30,"description_zh":31,"stars":32,"difficulty_score":23,"last_commit_at":33,"category_tags":34,"status":16},2271,"ComfyUI","Comfy-Org\u002FComfyUI","ComfyUI 是一款功能强大且高度模块化的视觉 AI 引擎，专为设计和执行复杂的 Stable Diffusion 图像生成流程而打造。它摒弃了传统的代码编写模式，采用直观的节点式流程图界面，让用户通过连接不同的功能模块即可构建个性化的生成管线。\n\n这一设计巧妙解决了高级 AI 绘图工作流配置复杂、灵活性不足的痛点。用户无需具备编程背景，也能自由组合模型、调整参数并实时预览效果，轻松实现从基础文生图到多步骤高清修复等各类复杂任务。ComfyUI 拥有极佳的兼容性，不仅支持 Windows、macOS 和 Linux 全平台，还广泛适配 NVIDIA、AMD、Intel 及苹果 Silicon 等多种硬件架构，并率先支持 SDXL、Flux、SD3 等前沿模型。\n\n无论是希望深入探索算法潜力的研究人员和开发者，还是追求极致创作自由度的设计师与资深 AI 绘画爱好者，ComfyUI 都能提供强大的支持。其独特的模块化架构允许社区不断扩展新功能，使其成为当前最灵活、生态最丰富的开源扩散模型工具之一，帮助用户将创意高效转化为现实。",107662,"2026-04-03T11:11:01",[13,14,15],{"id":36,"name":37,"github_repo":38,"description_zh":39,"stars":40,"difficulty_score":23,"last_commit_at":41,"category_tags":42,"status":16},3704,"NextChat","ChatGPTNextWeb\u002FNextChat","NextChat 是一款轻量且极速的 AI 助手，旨在为用户提供流畅、跨平台的大模型交互体验。它完美解决了用户在多设备间切换时难以保持对话连续性，以及面对众多 AI 模型不知如何统一管理的痛点。无论是日常办公、学习辅助还是创意激发，NextChat 都能让用户随时随地通过网页、iOS、Android、Windows、MacOS 或 Linux 端无缝接入智能服务。\n\n这款工具非常适合普通用户、学生、职场人士以及需要私有化部署的企业团队使用。对于开发者而言，它也提供了便捷的自托管方案，支持一键部署到 Vercel 或 Zeabur 等平台。\n\nNextChat 的核心亮点在于其广泛的模型兼容性，原生支持 Claude、DeepSeek、GPT-4 及 Gemini Pro 等主流大模型，让用户在一个界面即可自由切换不同 AI 能力。此外，它还率先支持 MCP（Model Context Protocol）协议，增强了上下文处理能力。针对企业用户，NextChat 提供专业版解决方案，具备品牌定制、细粒度权限控制、内部知识库整合及安全审计等功能，满足公司对数据隐私和个性化管理的高标准要求。",87618,"2026-04-05T07:20:52",[13,26],{"id":44,"name":45,"github_repo":46,"description_zh":47,"stars":48,"difficulty_score":23,"last_commit_at":49,"category_tags":50,"status":16},2268,"ML-For-Beginners","microsoft\u002FML-For-Beginners","ML-For-Beginners 是由微软推出的一套系统化机器学习入门课程，旨在帮助零基础用户轻松掌握经典机器学习知识。这套课程将学习路径规划为 12 周，包含 26 节精炼课程和 52 道配套测验，内容涵盖从基础概念到实际应用的完整流程，有效解决了初学者面对庞大知识体系时无从下手、缺乏结构化指导的痛点。\n\n无论是希望转型的开发者、需要补充算法背景的研究人员，还是对人工智能充满好奇的普通爱好者，都能从中受益。课程不仅提供了清晰的理论讲解，还强调动手实践，让用户在循序渐进中建立扎实的技能基础。其独特的亮点在于强大的多语言支持，通过自动化机制提供了包括简体中文在内的 50 多种语言版本，极大地降低了全球不同背景用户的学习门槛。此外，项目采用开源协作模式，社区活跃且内容持续更新，确保学习者能获取前沿且准确的技术资讯。如果你正寻找一条清晰、友好且专业的机器学习入门之路，ML-For-Beginners 将是理想的起点。",84991,"2026-04-05T10:45:23",[14,51,52,53,15,54,26,13,55],"数据工具","视频","插件","其他","音频",{"id":57,"name":58,"github_repo":59,"description_zh":60,"stars":61,"difficulty_score":10,"last_commit_at":62,"category_tags":63,"status":16},3128,"ragflow","infiniflow\u002Fragflow","RAGFlow 是一款领先的开源检索增强生成（RAG）引擎，旨在为大语言模型构建更精准、可靠的上下文层。它巧妙地将前沿的 RAG 技术与智能体（Agent）能力相结合，不仅支持从各类文档中高效提取知识，还能让模型基于这些知识进行逻辑推理和任务执行。\n\n在大模型应用中，幻觉问题和知识滞后是常见痛点。RAGFlow 通过深度解析复杂文档结构（如表格、图表及混合排版），显著提升了信息检索的准确度，从而有效减少模型“胡编乱造”的现象，确保回答既有据可依又具备时效性。其内置的智能体机制更进一步，使系统不仅能回答问题，还能自主规划步骤解决复杂问题。\n\n这款工具特别适合开发者、企业技术团队以及 AI 研究人员使用。无论是希望快速搭建私有知识库问答系统，还是致力于探索大模型在垂直领域落地的创新者，都能从中受益。RAGFlow 提供了可视化的工作流编排界面和灵活的 API 接口，既降低了非算法背景用户的上手门槛，也满足了专业开发者对系统深度定制的需求。作为基于 Apache 2.0 协议开源的项目，它正成为连接通用大模型与行业专有知识之间的重要桥梁。",77062,"2026-04-04T04:44:48",[15,14,13,26,54],{"id":65,"github_repo":66,"name":67,"description_en":68,"description_zh":69,"ai_summary_zh":70,"readme_en":71,"readme_zh":72,"quickstart_zh":73,"use_case_zh":74,"hero_image_url":75,"owner_login":76,"owner_name":77,"owner_avatar_url":78,"owner_bio":79,"owner_company":80,"owner_location":80,"owner_email":81,"owner_twitter":82,"owner_website":83,"owner_url":84,"languages":85,"stars":117,"forks":118,"last_commit_at":119,"license":120,"difficulty_score":23,"env_os":121,"env_gpu":122,"env_ram":123,"env_deps":124,"category_tags":128,"github_topics":129,"view_count":10,"oss_zip_url":80,"oss_zip_packed_at":80,"status":16,"created_at":135,"updated_at":136,"faqs":137,"releases":168},3159,"microsoft\u002Fagent-lightning","agent-lightning","The absolute trainer to light up AI agents.","Agent Lightning 是一款由微软推出的开源训练框架，旨在让开发者能够轻松优化和增强 AI 智能体（AI Agents）的性能。它的核心使命是解决当前 AI 智能体训练中代码改造成本高、框架兼容性差的痛点。传统方法往往需要针对特定框架重写大量逻辑，而 Agent Lightning 实现了“几乎零代码修改”即可将现有智能体转化为可优化模型，极大地降低了技术门槛。\n\n该工具具有极高的灵活性，支持 LangChain、AutoGen、CrewAI 等主流智能体框架，甚至可以直接用于原生 Python 开发环境。它允许用户在多智能体系统中选择性地优化特定节点，并内置了强化学习、自动提示词优化及监督微调等多种先进算法。这意味着无论是希望提升任务执行准确率的工程师，还是探索新型训练策略的研究人员，都能利用它快速验证想法。\n\nAgent Lightning 特别适合 AI 开发者、算法研究人员以及需要构建复杂多智能体系统的技术团队使用。其独特的技术亮点在于通用的接口设计，打破了不同框架间的壁垒，让强化学习等高级训练方法能够像插件一样无缝接入各类智能体应用。通过加入其活跃的社区，用户还能获","Agent Lightning 是一款由微软推出的开源训练框架，旨在让开发者能够轻松优化和增强 AI 智能体（AI Agents）的性能。它的核心使命是解决当前 AI 智能体训练中代码改造成本高、框架兼容性差的痛点。传统方法往往需要针对特定框架重写大量逻辑，而 Agent Lightning 实现了“几乎零代码修改”即可将现有智能体转化为可优化模型，极大地降低了技术门槛。\n\n该工具具有极高的灵活性，支持 LangChain、AutoGen、CrewAI 等主流智能体框架，甚至可以直接用于原生 Python 开发环境。它允许用户在多智能体系统中选择性地优化特定节点，并内置了强化学习、自动提示词优化及监督微调等多种先进算法。这意味着无论是希望提升任务执行准确率的工程师，还是探索新型训练策略的研究人员，都能利用它快速验证想法。\n\nAgent Lightning 特别适合 AI 开发者、算法研究人员以及需要构建复杂多智能体系统的技术团队使用。其独特的技术亮点在于通用的接口设计，打破了不同框架间的壁垒，让强化学习等高级训练方法能够像插件一样无缝接入各类智能体应用。通过加入其活跃的社区，用户还能获取最新的技术实践案例，共同推动智能体技术的进化。","\u003Cp align=\"center\">\n  \u003Cimg src=\"docs\u002Fassets\u002Freadme-banner.svg\" alt=\"Agent-lightning-banner\" style=\"width:600px\"\u002F>\n\u003C\u002Fp>\n\n# Agent Lightning⚡\n\n[![Unit Tests](https:\u002F\u002Fgithub.com\u002Fmicrosoft\u002Fagent-lightning\u002Factions\u002Fworkflows\u002Fbadge-unit.yml\u002Fbadge.svg)](https:\u002F\u002Fgithub.com\u002Fmicrosoft\u002Fagent-lightning\u002Factions\u002Fworkflows\u002Fbadge-unit.yml)\n[![Documentation](https:\u002F\u002Fimg.shields.io\u002Fbadge\u002FGitHub%20Pages-Documentation-blue)](https:\u002F\u002Fmicrosoft.github.io\u002Fagent-lightning\u002F)\n[![PyPI version](https:\u002F\u002Fbadge.fury.io\u002Fpy\u002Fagentlightning.svg)](https:\u002F\u002Fbadge.fury.io\u002Fpy\u002Fagentlightning)\n[![License](https:\u002F\u002Fimg.shields.io\u002Fbadge\u002Flicense-MIT-blue.svg)](LICENSE)\n[![Ask DeepWiki](https:\u002F\u002Fdeepwiki.com\u002Fbadge.svg)](https:\u002F\u002Fdeepwiki.com\u002Fmicrosoft\u002Fagent-lightning)\n[![Discord](https:\u002F\u002Fimg.shields.io\u002Fbadge\u002FDiscord-Join-5865F2?logo=discord&logoColor=white)](https:\u002F\u002Fdiscord.gg\u002FRYk7CdvDR7)\n\n**The absolute trainer to light up AI agents.**\n\nJoin our [Discord community](https:\u002F\u002Fdiscord.gg\u002FRYk7CdvDR7) to connect with other users and contributors.\n\n## ⚡ Core Features\n\n- Turn your agent into an optimizable beast with **ZERO CODE CHANGE** (almost)! 💤\n- Build with **ANY** agent framework (LangChain, OpenAI Agent SDK, AutoGen, CrewAI, Microsoft Agent Framework...); or even WITHOUT agent framework (Python OpenAI). You name it! 🤖\n- **Selectively** optimize one or more agents in a multi-agent system. 🎯\n- Embraces **Algorithms** like Reinforcement Learning, Automatic Prompt Optimization, Supervised Fine-tuning and more. 🤗\n\nRead more on our [documentation website](https:\u002F\u002Fmicrosoft.github.io\u002Fagent-lightning\u002F).\n\n\u003Cp align=\"center\">\n  \u003Cimg src=\"docs\u002Fassets\u002Freadme-diff.svg\" alt=\"Agent-Lightning Core Quickstart\" style=\"width:100%\"\u002F>\n\u003C\u002Fp>\n\n## ⚡ Installation\n\n```bash\npip install agentlightning\n```\n\nFor the latest nightly build (cutting-edge features), you can install from Test PyPI:\n\n```bash\npip install --upgrade --index-url https:\u002F\u002Ftest.pypi.org\u002Fsimple\u002F --extra-index-url https:\u002F\u002Fpypi.org\u002Fsimple\u002F --pre agentlightning\n```\n\nPlease refer to our [installation guide](https:\u002F\u002Fmicrosoft.github.io\u002Fagent-lightning\u002Fstable\u002Ftutorials\u002Finstallation\u002F) for more details.\n\nTo start using Agent-lightning, check out our [documentation](https:\u002F\u002Fmicrosoft.github.io\u002Fagent-lightning\u002F) and [examples](.\u002Fexamples).\n\n## ⚡ Articles\n\n- 12\u002F17\u002F2025 [Adopting the Trajectory Level Aggregation for Faster Training](https:\u002F\u002Fagent-lightning.github.io\u002Fposts\u002Ftrajectory_level_aggregation\u002F) Agent-lightning blog.\n- 11\u002F4\u002F2025 [Tuning ANY AI agent with Tinker ✕ Agent-lightning](https:\u002F\u002Fmedium.com\u002F@yugez\u002Ftuning-any-ai-agent-with-tinker-agent-lightning-part-1-1d8c9a397f0e) Medium. See also [Part 2](https:\u002F\u002Fmedium.com\u002F@yugez\u002Ftuning-any-ai-agent-with-tinker-agent-lightning-part-2-332c5437f0dc).\n- 10\u002F22\u002F2025 [No More Retokenization Drift: Returning Token IDs via the OpenAI Compatible API Matters in Agent RL](https:\u002F\u002Fblog.vllm.ai\u002F2025\u002F10\u002F22\u002Fagent-lightning.html) vLLM blog. See also [Zhihu writeup](https:\u002F\u002Fzhuanlan.zhihu.com\u002Fp\u002F1965067274642785725).\n- 8\u002F11\u002F2025 [Training AI Agents to Write and Self-correct SQL with Reinforcement Learning](https:\u002F\u002Fmedium.com\u002F@yugez\u002Ftraining-ai-agents-to-write-and-self-correct-sql-with-reinforcement-learning-571ed31281ad) Medium.\n- 8\u002F5\u002F2025 [Agent Lightning: Train ANY AI Agents with Reinforcement Learning](https:\u002F\u002Farxiv.org\u002Fabs\u002F2508.03680) arXiv paper.\n- 7\u002F26\u002F2025 [We discovered an approach to train any AI agent with RL, with (almost) zero code changes.](https:\u002F\u002Fwww.reddit.com\u002Fr\u002FLocalLLaMA\u002Fcomments\u002F1m9m670\u002Fwe_discovered_an_approach_to_train_any_ai_agent\u002F) Reddit.\n- 6\u002F6\u002F2025 [Agent Lightning - Microsoft Research](https:\u002F\u002Fwww.microsoft.com\u002Fen-us\u002Fresearch\u002Fproject\u002Fagent-lightning\u002F) Project page.\n\n## ⚡ Community Projects\n\n- [DeepWerewolf](https:\u002F\u002Fgithub.com\u002Faf-74413592\u002FDeepWerewolf) — A case study of agent RL training for the Chinese Werewolf game built with AgentScope and Agent Lightning.\n- [AgentFlow](https:\u002F\u002Fagentflow.stanford.edu\u002F) — A modular multi-agent framework that combines planner, executor, verifier, and generator agents with the Flow-GRPO algorithm to tackle long-horizon, sparse-reward tasks.\n- [Youtu-Agent](https:\u002F\u002Fgithub.com\u002FTencentCloudADP\u002FYoutu-agent) — Youtu-Agent lets you build and train your agent with ease. Built with [a modified branch](https:\u002F\u002Fgithub.com\u002Fmicrosoft\u002Fagent-lightning\u002Ftree\u002Fcontrib\u002Fyoutu-agent-lightning) of Agent Lightning, Youtu-Agent has verified up to 128 GPUs RL training on maths\u002Fcode and search capabilities with steady convergence. Also check [the recipe](https:\u002F\u002Fgithub.com\u002FTencentCloudADP\u002Fyoutu-agent\u002Ftree\u002Frl\u002Fagl) and their blog [*Stop Wrestling with Your Agent RL: How Youtu-Agent Achieved Stable, 128-GPU Scaling Without Breaking a Sweat*](https:\u002F\u002Fspotted-coconut-df8.notion.site\u002FStop-Wrestling-with-Your-Agent-RL-How-Youtu-Agent-Achieved-Stable-128-GPU-Scaling-Without-Breaking-2ca5e8f089ba80539a98c582b65e0233).\n\n## ⚡ Architecture\n\nAgent Lightning keeps the moving parts to a minimum so you can focus on your idea, not the plumbing. Your agent continues to run as usual; you can still use any agent framework you like; you drop in the lightweight `agl.emit_xxx()` helper, or let the tracer collect every prompt, tool call, and reward. Those events become structured spans that flow into the LightningStore, a central hub that keeps tasks, resources, and traces in sync.\n\nOn the other side of the store sits the algorithm you choose, or write yourself. The algorithm reads spans, learns from them, and posts updated resources such as refined prompt templates or new policy weights. The Trainer ties it all together: it streams datasets to runners, ferries resources between the store and the algorithm, and updates the inference engine when improvements land. You can either stop there, or simply let the same loop keep turning.\n\nNo rewrites, no lock-in, just a clear path from first rollout to steady improvement.\n\n\u003Cp align=\"center\">\n  \u003Cimg src=\"docs\u002Fassets\u002Freadme-architecture.svg\" alt=\"Agent-lightning Architecture\" style=\"width:100%\"\u002F>\n\u003C\u002Fp>\n\n## ⚡ CI Status\n\n| Workflow | Status |\n|----------|--------|\n| CPU Tests | [![tests workflow status](https:\u002F\u002Fgithub.com\u002Fmicrosoft\u002Fagent-lightning\u002Factions\u002Fworkflows\u002Ftests.yml\u002Fbadge.svg)](https:\u002F\u002Fgithub.com\u002Fmicrosoft\u002Fagent-lightning\u002Factions\u002Fworkflows\u002Ftests.yml) |\n| Full Tests | [![tests summary workflow status](https:\u002F\u002Fgithub.com\u002Fmicrosoft\u002Fagent-lightning\u002Factions\u002Fworkflows\u002Fbadge-unit.yml\u002Fbadge.svg)](https:\u002F\u002Fgithub.com\u002Fmicrosoft\u002Fagent-lightning\u002Factions\u002Fworkflows\u002Fbadge-unit.yml) |\n| UI Tests | [![UI Tests](https:\u002F\u002Fgithub.com\u002Fmicrosoft\u002Fagent-lightning\u002Factions\u002Fworkflows\u002Fdashboard.yml\u002Fbadge.svg)](https:\u002F\u002Fgithub.com\u002Fmicrosoft\u002Fagent-lightning\u002Factions\u002Fworkflows\u002Fdashboard.yml) |\n| Examples Integration | [![examples summary workflow status](https:\u002F\u002Fgithub.com\u002Fmicrosoft\u002Fagent-lightning\u002Factions\u002Fworkflows\u002Fbadge-examples.yml\u002Fbadge.svg)](https:\u002F\u002Fgithub.com\u002Fmicrosoft\u002Fagent-lightning\u002Factions\u002Fworkflows\u002Fbadge-examples.yml) |\n| Latest Dependency Compatibility | [![latest summary workflow status](https:\u002F\u002Fgithub.com\u002Fmicrosoft\u002Fagent-lightning\u002Factions\u002Fworkflows\u002Fbadge-latest.yml\u002Fbadge.svg)](https:\u002F\u002Fgithub.com\u002Fmicrosoft\u002Fagent-lightning\u002Factions\u002Fworkflows\u002Fbadge-latest.yml) |\n| Legacy Examples Compatibility | [![compat summary workflow status](https:\u002F\u002Fgithub.com\u002Fmicrosoft\u002Fagent-lightning\u002Factions\u002Fworkflows\u002Fbadge-compat.yml\u002Fbadge.svg)](https:\u002F\u002Fgithub.com\u002Fmicrosoft\u002Fagent-lightning\u002Factions\u002Fworkflows\u002Fbadge-compat.yml) |\n\n## ⚡ Citation\n\nIf you find Agent Lightning useful in your research or projects, please cite our paper:\n\n```bibtex\n@misc{luo2025agentlightningtrainai,\n      title={Agent Lightning: Train ANY AI Agents with Reinforcement Learning},\n      author={Xufang Luo and Yuge Zhang and Zhiyuan He and Zilong Wang and Siyun Zhao and Dongsheng Li and Luna K. Qiu and Yuqing Yang},\n      year={2025},\n      eprint={2508.03680},\n      archivePrefix={arXiv},\n      primaryClass={cs.AI},\n      url={https:\u002F\u002Farxiv.org\u002Fabs\u002F2508.03680},\n}\n```\n\n## ⚡ Contributing\n\nThis project welcomes contributions and suggestions. Start by reading the [Contributing Guide](docs\u002Fcommunity\u002Fcontributing.md) for recommended contribution points, environment setup, branching conventions, and pull request expectations. Most contributions require you to agree to a Contributor License Agreement (CLA) declaring that you have the right to, and actually do, grant us the rights to use your contribution. For details, visit https:\u002F\u002Fcla.opensource.microsoft.com.\n\nWhen you submit a pull request, a CLA bot will automatically determine whether you need to provide a CLA and decorate the PR appropriately (e.g., status check, comment). Simply follow the instructions provided by the bot. You will only need to do this once across all repos using our CLA.\n\nThis project has adopted the [Microsoft Open Source Code of Conduct](https:\u002F\u002Fopensource.microsoft.com\u002Fcodeofconduct\u002F). For more information see the [Code of Conduct FAQ](https:\u002F\u002Fopensource.microsoft.com\u002Fcodeofconduct\u002Ffaq\u002F) or contact [opencode@microsoft.com](mailto:opencode@microsoft.com) with any additional questions or comments.\n\n## ⚡ Trademarks\n\nThis project may contain trademarks or logos for projects, products, or services. Authorized use of Microsoft trademarks or logos is subject to and must follow [Microsoft's Trademark & Brand Guidelines](https:\u002F\u002Fwww.microsoft.com\u002Fen-us\u002Flegal\u002Fintellectualproperty\u002Ftrademarks\u002Fusage\u002Fgeneral). Use of Microsoft trademarks or logos in modified versions of this project must not cause confusion or imply Microsoft sponsorship. Any use of third-party trademarks or logos are subject to those third-party's policies.\n\n## ⚡ Responsible AI\n\nThis project has been evaluated and certified to comply with the Microsoft Responsible AI Standard. The team will continue to monitor and maintain the repository, addressing any severe issues, including potential harms, if they arise.\n\n## ⚡ License\n\nThis project is licensed under the MIT License. See the [LICENSE](LICENSE) file for details.\n","\u003Cp align=\"center\">\n  \u003Cimg src=\"docs\u002Fassets\u002Freadme-banner.svg\" alt=\"Agent-lightning-banner\" style=\"width:600px\"\u002F>\n\u003C\u002Fp>\n\n# Agent Lightning⚡\n\n[![单元测试](https:\u002F\u002Fgithub.com\u002Fmicrosoft\u002Fagent-lightning\u002Factions\u002Fworkflows\u002Fbadge-unit.yml\u002Fbadge.svg)](https:\u002F\u002Fgithub.com\u002Fmicrosoft\u002Fagent-lightning\u002Factions\u002Fworkflows\u002Fbadge-unit.yml)\n[![文档](https:\u002F\u002Fimg.shields.io\u002Fbadge\u002FGitHub%20Pages-Documentation-blue)](https:\u002F\u002Fmicrosoft.github.io\u002Fagent-lightning\u002F)\n[![PyPI版本](https:\u002F\u002Fbadge.fury.io\u002Fpy\u002Fagentlightning.svg)](https:\u002F\u002Fbadge.fury.io\u002Fpy\u002Fagentlightning)\n[![许可证](https:\u002F\u002Fimg.shields.io\u002Fbadge\u002Flicense-MIT-blue.svg)](LICENSE)\n[![Ask DeepWiki](https:\u002F\u002Fdeepwiki.com\u002Fbadge.svg)](https:\u002F\u002Fdeepwiki.com\u002Fmicrosoft\u002Fagent-lightning)\n[![Discord](https:\u002F\u002Fimg.shields.io\u002Fbadge\u002FDiscord-Join-5865F2?logo=discord&logoColor=white)](https:\u002F\u002Fdiscord.gg\u002FRYk7CdvDR7)\n\n**点亮AI智能体的终极训练工具。**\n\n加入我们的[Discord社区](https:\u002F\u002Fdiscord.gg\u002FRYk7CdvDR7)，与其他用户和贡献者交流互动。\n\n## ⚡ 核心特性\n\n- 无需任何代码修改（几乎！），即可将你的智能体转变为可优化的强大模型！💤\n- 支持使用**任意**智能体框架（LangChain、OpenAI Agent SDK、AutoGen、CrewAI、Microsoft Agent Framework等）；甚至无需任何智能体框架，直接用Python OpenAI API即可。你想怎么来就怎么来！🤖\n- 在多智能体系统中，**有选择地**优化一个或多个智能体。🎯\n- 内置强化学习、自动提示优化、监督微调等多种算法。🤗\n\n更多详情请访问我们的[文档网站](https:\u002F\u002Fmicrosoft.github.io\u002Fagent-lightning\u002F)。\n\n\u003Cp align=\"center\">\n  \u003Cimg src=\"docs\u002Fassets\u002Freadme-diff.svg\" alt=\"Agent-Lightning核心快速入门\" style=\"width:100%\"\u002F>\n\u003C\u002Fp>\n\n## ⚡ 安装\n\n```bash\npip install agentlightning\n```\n\n如需最新夜间构建版（抢先体验前沿功能），可从Test PyPI安装：\n\n```bash\npip install --upgrade --index-url https:\u002F\u002Ftest.pypi.org\u002Fsimple\u002F --extra-index-url https:\u002F\u002Fpypi.org\u002Fsimple\u002F --pre agentlightning\n```\n\n更多详细信息请参阅我们的[安装指南](https:\u002F\u002Fmicrosoft.github.io\u002Fagent-lightning\u002Fstable\u002Ftutorials\u002Finstallation\u002F)。\n\n开始使用Agent-lightning，请查看我们的[文档](https:\u002F\u002Fmicrosoft.github.io\u002Fagent-lightning\u002F)和[示例](.\u002Fexamples)。\n\n## ⚡ 文章\n\n- 2025年12月17日 [采用轨迹级聚合加速训练](https:\u002F\u002Fagent-lightning.github.io\u002Fposts\u002Ftrajectory_level_aggregation\u002F) — Agent-lightning博客。\n- 2025年11月4日 [用Tinker ✕ Agent-lightning调优任意AI智能体](https:\u002F\u002Fmedium.com\u002F@yugez\u002Ftuning-any-ai-agent-with-tinker-agent-lightning-part-1-1d8c9a397f0e) — Medium。另见[第二部分](https:\u002F\u002Fmedium.com\u002F@yugez\u002Ftuning-any-ai-agent-with-tinker-agent-lightning-part-2-332c5437f0dc)。\n- 2025年10月22日 [不再出现重令牌化漂移：通过兼容OpenAI的API返回Token ID对智能体强化学习至关重要](https:\u002F\u002Fblog.vllm.ai\u002F2025\u002F10\u002F22\u002Fagent-lightning.html) — vLLM博客。另见[Zhihu文章](https:\u002F\u002Fzhuanlan.zhihu.com\u002Fp\u002F1965067274642785725)。\n- 2025年8月11日 [利用强化学习训练AI智能体编写并自我修正SQL语句](https:\u002F\u002Fmedium.com\u002F@yugez\u002Ftraining-ai-agents-to-write-and-self-correct-sql-with-reinforcement-learning-571ed31281ad) — Medium。\n- 2025年8月5日 [Agent Lightning：用强化学习训练任意AI智能体](https:\u002F\u002Farxiv.org\u002Fabs\u002F2508.03680) — arXiv论文。\n- 2025年7月26日 [我们发现了一种方法，可以在几乎不修改代码的情况下，用强化学习训练任意AI智能体。](https:\u002F\u002Fwww.reddit.com\u002Fr\u002FLocalLLaMA\u002Fcomments\u002F1m9m670\u002Fwe_discovered_an_approach_to_train_any_ai_agent\u002F) — Reddit。\n- 2025年6月6日 [Agent Lightning - 微软研究院](https:\u002F\u002Fwww.microsoft.com\u002Fen-us\u002Fresearch\u002Fproject\u002Fagent-lightning\u002F) — 项目页面。\n\n## ⚡ 社区项目\n\n- [DeepWerewolf](https:\u002F\u002Fgithub.com\u002Faf-74413592\u002FDeepWerewolf) — 基于AgentScope和Agent Lightning构建的中国狼人杀游戏智能体强化学习案例研究。\n- [AgentFlow](https:\u002F\u002Fagentflow.stanford.edu\u002F) — 一个模块化的多智能体框架，结合规划者、执行者、验证者和生成者智能体，以及Flow-GRPO算法，用于解决长周期、稀疏奖励的任务。\n- [Youtu-Agent](https:\u002F\u002Fgithub.com\u002FTencentCloudADP\u002FYoutu-agent) — Youtu-Agent让你轻松构建和训练自己的智能体。基于Agent Lightning的[定制分支](https:\u002F\u002Fgithub.com\u002Fmicrosoft\u002Fagent-lightning\u002Ftree\u002Fcontrib\u002Fyoutu-agent-lightning)开发，Youtu-Agent已成功验证在数学、代码和搜索任务上进行多达128张GPU的强化学习训练，并实现稳定的收敛。更多信息请参阅[配方](https:\u002F\u002Fgithub.com\u002FTencentCloudADP\u002Fyoutu-agent\u002Ftree\u002Frl\u002Fagl)及他们的博客[*停止与你的智能体强化学习斗争：Youtu-Agent如何轻松实现128 GPU规模稳定扩展*](https:\u002F\u002Fspotted-coconut-df8.notion.site\u002FStop-Wrestling-with-Your-Agent-RL-How-Youtu-Agent-Achieved-Stable-128-GPU-Scaling-Without-Breaking-2ca5e8f089ba80539a98c582b65e0233)。\n\n## ⚡ 架构\n\nAgent Lightning将系统组件保持在最低限度，让你专注于创意本身，而非繁琐的底层实现。你的智能体仍可按常规方式运行，你依然可以自由选择喜欢的智能体框架；只需引入轻量级的`agl.emit_xxx()`辅助函数，或让追踪器自动收集每个提示、工具调用和奖励。这些事件会被转化为结构化的跨度数据，流入LightningStore——一个集中管理任务、资源和追踪信息的枢纽。\n\n在LightningStore的另一端，则是你选择或自行编写的算法。算法会读取这些跨度数据，从中学习，并发布更新后的资源，例如优化后的提示模板或新的策略权重。Trainer则负责将这一切串联起来：它向运行引擎输送数据集，往返于LightningStore和算法之间传递资源，并在模型得到改进时更新推理引擎。你可以到此为止，也可以让整个流程持续循环下去。\n\n无需重写代码，没有供应商锁定，只有一条清晰的路径，从首次部署到持续优化。\n\n\u003Cp align=\"center\">\n  \u003Cimg src=\"docs\u002Fassets\u002Freadme-architecture.svg\" alt=\"Agent-lightning架构\" style=\"width:100%\"\u002F>\n\u003C\u002Fp>\n\n## ⚡ CI 状态\n\n| 工作流 | 状态 |\n|----------|--------|\n| CPU 测试 | [![测试工作流动态](https:\u002F\u002Fgithub.com\u002Fmicrosoft\u002Fagent-lightning\u002Factions\u002Fworkflows\u002Ftests.yml\u002Fbadge.svg)](https:\u002F\u002Fgithub.com\u002Fmicrosoft\u002Fagent-lightning\u002Factions\u002Fworkflows\u002Ftests.yml) |\n| 全量测试 | [![测试汇总工作流动态](https:\u002F\u002Fgithub.com\u002Fmicrosoft\u002Fagent-lightning\u002Factions\u002Fworkflows\u002Fbadge-unit.yml\u002Fbadge.svg)](https:\u002F\u002Fgithub.com\u002Fmicrosoft\u002Fagent-lightning\u002Factions\u002Fworkflows\u002Fbadge-unit.yml) |\n| UI 测试 | [![UI 测试](https:\u002F\u002Fgithub.com\u002Fmicrosoft\u002Fagent-lightning\u002Factions\u002Fworkflows\u002Fdashboard.yml\u002Fbadge.svg)](https:\u002F\u002Fgithub.com\u002Fmicrosoft\u002Fagent-lightning\u002Factions\u002Fworkflows\u002Fdashboard.yml) |\n| 示例集成 | [![示例汇总工作流动态](https:\u002F\u002Fgithub.com\u002Fmicrosoft\u002Fagent-lightning\u002Factions\u002Fworkflows\u002Fbadge-examples.yml\u002Fbadge.svg)](https:\u002F\u002Fgithub.com\u002Fmicrosoft\u002Fagent-lightning\u002Factions\u002Fworkflows\u002Fbadge-examples.yml) |\n| 最新依赖兼容性 | [![最新汇总工作流动态](https:\u002F\u002Fgithub.com\u002Fmicrosoft\u002Fagent-lightning\u002Factions\u002Fworkflows\u002Fbadge-latest.yml\u002Fbadge.svg)](https:\u002F\u002Fgithub.com\u002Fmicrosoft\u002Fagent-lightning\u002Factions\u002Fworkflows\u002Fbadge-latest.yml) |\n| 旧版示例兼容性 | [![兼容性汇总工作流动态](https:\u002F\u002Fgithub.com\u002Fmicrosoft\u002Fagent-lightning\u002Factions\u002Fworkflows\u002Fbadge-compat.yml\u002Fbadge.svg)](https:\u002F\u002Fgithub.com\u002Fmicrosoft\u002Fagent-lightning\u002Factions\u002Fworkflows\u002Fbadge-compat.yml) |\n\n## ⚡ 引用\n\n如果您在研究或项目中发现 Agent Lightning 非常有用，请引用我们的论文：\n\n```bibtex\n@misc{luo2025agentlightningtrainai,\n      title={Agent Lightning: 使用强化学习训练任何 AI 代理},\n      author={Xufang Luo 和 Yuge Zhang 和 Zhiyuan He 和 Zilong Wang 和 Siyun Zhao 和 Dongsheng Li 和 Luna K. Qiu 和 Yuqing Yang},\n      year={2025},\n      eprint={2508.03680},\n      archivePrefix={arXiv},\n      primaryClass={cs.AI},\n      url={https:\u002F\u002Farxiv.org\u002Fabs\u002F2508.03680},\n}\n```\n\n## ⚡ 贡献\n\n本项目欢迎各种贡献和建议。请先阅读[贡献指南](docs\u002Fcommunity\u002Fcontributing.md)，了解推荐的贡献点、环境搭建、分支规范以及对拉取请求的期望。大多数贡献都需要您签署一份贡献者许可协议（CLA），声明您有权且确实授予我们使用您贡献的权利。有关详细信息，请访问 https:\u002F\u002Fcla.opensource.microsoft.com。\n\n当您提交拉取请求时，CLA 机器人会自动判断您是否需要提供 CLA，并相应地标记 PR（例如状态检查、评论）。您只需按照机器人提供的指示操作即可。对于所有使用我们 CLA 的仓库，您只需完成一次此步骤。\n\n本项目已采纳[微软开源行为准则](https:\u002F\u002Fopensource.microsoft.com\u002Fcodeofconduct\u002F)。如需更多信息，请参阅[行为准则常见问题解答](https:\u002F\u002Fopensource.microsoft.com\u002Fcodeofconduct\u002Ffaq\u002F)或发送邮件至 [opencode@microsoft.com](mailto:opencode@microsoft.com) 咨询更多问题或意见。\n\n## ⚡ 商标\n\n本项目可能包含与项目、产品或服务相关的商标或标识。未经授权使用微软商标或标识须遵守并遵循[微软商标与品牌指南](https:\u002F\u002Fwww.microsoft.com\u002Fen-us\u002Flegal\u002Fintellectualproperty\u002Ftrademarks\u002Fusage\u002Fgeneral)。在本项目的修改版本中使用微软商标或标识不得造成混淆或暗示微软的赞助关系。任何第三方商标或标识的使用均应遵守该第三方的相关政策。\n\n## ⚡ 负责任的人工智能\n\n本项目已通过评估并认证符合微软负责任人工智能标准。团队将继续监控和维护代码库，及时处理可能出现的严重问题，包括潜在的危害。\n\n## ⚡ 许可证\n\n本项目采用 MIT 许可证授权。详情请参阅[LICENSE](LICENSE)文件。","# Agent Lightning 快速上手指南\n\nAgent Lightning 是一款由微软研发的开源工具，旨在通过强化学习（RL）、自动提示优化等算法训练和优化 AI Agent。其核心优势在于**几乎无需修改代码**即可接入现有的任何 Agent 框架（如 LangChain、AutoGen、CrewAI 或原生 Python OpenAI），让开发者能够轻松将 Agent 转化为可优化的智能体。\n\n## 环境准备\n\n在开始之前，请确保您的开发环境满足以下要求：\n\n*   **操作系统**：Linux、macOS 或 Windows。\n*   **Python 版本**：建议 Python 3.9 及以上版本。\n*   **前置依赖**：\n    *   已安装任意主流 Agent 框架（可选，如 `langchain`, `autogen`, `crewai` 等）或直接使用 `openai` 库。\n    *   具备访问 PyPI 的网络环境。\n    *   *注：国内用户若遇到网络延迟，建议配置 pip 国内镜像源（如清华源、阿里源）以加速下载。*\n\n## 安装步骤\n\n### 1. 稳定版安装\n通过 pip 直接安装最新稳定版本：\n\n```bash\npip install agentlightning\n```\n\n**国内加速推荐**：\n如果您在中国大陆地区，建议使用清华镜像源进行安装以提升速度：\n\n```bash\npip install agentlightning -i https:\u002F\u002Fpypi.tuna.tsinghua.edu.cn\u002Fsimple\n```\n\n### 2. 夜间版安装（可选）\n如需体验最新的前沿功能（Nightly Build），可从 Test PyPI 安装：\n\n```bash\npip install --upgrade --index-url https:\u002F\u002Ftest.pypi.org\u002Fsimple\u002F --extra-index-url https:\u002F\u002Fpypi.org\u002Fsimple\u002F --pre agentlightning\n```\n\n## 基本使用\n\nAgent Lightning 的设计理念是“零代码侵入”。您无需重写现有的 Agent 逻辑，只需引入轻量级的辅助函数或使用追踪器即可开始训练。\n\n### 核心工作流程\n1.  **保持原有逻辑**：您的 Agent 代码照常运行。\n2.  **插入探针**：使用 `agl.emit_xxx()`  helper 函数标记关键事件（如 Prompt、工具调用、奖励信号），或让内置 Tracer 自动收集。\n3.  **数据流转**：事件被结构化并流入 `LightningStore`。\n4.  **算法优化**：选择的算法（如 RL、SFT）读取数据，更新策略或提示模板，并通过 Trainer 反馈给推理引擎。\n\n### 最简单的使用示例\n\n假设您有一个基于原生 OpenAI 的简单 Agent，以下是接入 Agent Lightning 的最小化改动示例：\n\n```python\nimport openai\nimport agentlightning as agl\n\n# 1. 初始化 Lightning (通常在程序入口处)\nagl.init()\n\n# 2. 定义您的原始 Agent 逻辑 (此处以简单的 Chat Completion 为例)\ndef run_agent(user_input):\n    # 使用 agl.tracer 自动记录或通过 emit 手动记录关键跨度\n    with agl.trace(\"agent_step\"):\n        response = openai.ChatCompletion.create(\n            model=\"gpt-3.5-turbo\",\n            messages=[{\"role\": \"user\", \"content\": user_input}]\n        )\n        \n        # 模拟获取奖励信号 (在实际 RL 场景中，这通常来自环境反馈)\n        reward = calculate_reward(response) \n        \n        # 发射奖励信号到 LightningStore\n        agl.emit_reward(reward)\n        \n        return response.choices[0].message.content\n\n# 3. 运行循环\n# Trainer 会自动拦截流程，收集轨迹，并利用算法更新策略\nif __name__ == \"__main__\":\n    task = \"Write a SQL query to select all users.\"\n    result = run_agent(task)\n    print(f\"Agent Response: {result}\")\n```\n\n### 关键特性说明\n*   **框架无关性**：上述示例同样适用于 LangChain、AutoGen 等框架，只需在相应的位置插入 `agl` 的追踪或发射命令。\n*   **选择性优化**：在多 Agent 系统中，您可以指定仅优化特定的一个或多个 Agent。\n*   **算法支持**：支持强化学习（RL）、自动提示优化（APO）、监督微调（SFT）等多种算法，只需在配置中切换即可。\n\n更多详细教程、架构说明及完整示例代码，请访问 [官方文档](https:\u002F\u002Fmicrosoft.github.io\u002Fagent-lightning\u002F) 或查看仓库中的 `examples` 目录。","某电商公司的数据团队正在构建一个多智能体系统，旨在让 AI 自动分析销售数据并生成可执行的 SQL 查询报表，但模型经常写出语法错误或逻辑不通的语句。\n\n### 没有 agent-lightning 时\n- **改造成本极高**：若要引入强化学习（RL）来优化 SQL 生成能力，必须重构现有的 LangChain 或 AutoGen 代码架构，开发周期长达数周。\n- **调试困难**：在多智能体协作中，难以单独定位并优化负责“写 SQL\"的那个特定智能体，往往需要整体重新训练，效率低下。\n- **算法集成复杂**：手动实现奖励函数和轨迹聚合算法（如 PPO）门槛高，容易因 Token 漂移等技术细节导致训练失败。\n- **框架受限**：团队被绑定在特定的 Agent 框架上，无法灵活尝试不同的底层模型或混合使用原生 Python 脚本。\n\n### 使用 agent-lightning 后\n- **零代码侵入升级**：无需修改任何现有的业务逻辑代码，仅需几行配置即可将现有智能体转化为可优化的强化学习对象。\n- **精准定向优化**：能够选择性地在多智能体系统中只针对\"SQL 生成智能体”进行训练，其他规划或验证智能体保持不变，资源利用率大幅提升。\n- **内置先进算法**：直接复用内置的强化学习、自动提示词优化等算法，自动处理 Token ID 返回等底层细节，训练稳定性显著增强。\n- **框架无关性**：无论底层是基于 OpenAI SDK、CrewAI 还是纯 Python 编写，agent-lightning 都能无缝接入，赋予团队极大的技术选型自由。\n\nagent-lightning 的核心价值在于它以近乎零代码改动的代价，打破了传统 AI 智能体难以通过强化学习持续进化的技术壁垒。","https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002Fmicrosoft_agent-lightning_6f30ec03.png","microsoft","Microsoft","https:\u002F\u002Foss.gittoolsai.com\u002Favatars\u002Fmicrosoft_4900709c.png","Open source projects and samples from Microsoft",null,"opensource@microsoft.com","OpenAtMicrosoft","https:\u002F\u002Fopensource.microsoft.com","https:\u002F\u002Fgithub.com\u002Fmicrosoft",[86,90,94,98,101,105,109,113],{"name":87,"color":88,"percentage":89},"Python","#3572A5",81.7,{"name":91,"color":92,"percentage":93},"TypeScript","#3178c6",15.6,{"name":95,"color":96,"percentage":97},"JavaScript","#f1e05a",0.8,{"name":99,"color":100,"percentage":97},"Shell","#89e051",{"name":102,"color":103,"percentage":104},"CSS","#663399",0.7,{"name":106,"color":107,"percentage":108},"Dockerfile","#384d54",0.2,{"name":110,"color":111,"percentage":112},"Makefile","#427819",0.1,{"name":114,"color":115,"percentage":116},"HTML","#e34c26",0,16517,1429,"2026-04-04T05:19:57","MIT","","未说明（但在社区项目案例中提及支持高达 128 张 GPU 的强化学习训练）","未说明",{"notes":125,"python":123,"dependencies":126},"该工具是一个轻量级框架，旨在以‘几乎零代码更改’的方式优化任何 AI Agent（支持 LangChain, AutoGen, CrewAI 等或纯 Python OpenAI）。它本身不强制绑定特定的深度学习后端，而是通过拦截提示词、工具调用和奖励信号来工作。具体的底层依赖（如 PyTorch, CUDA 版本）取决于用户选择的强化学习算法及所集成的 Agent 框架。安装可通过 PyPI (`pip install agentlightning`) 完成。",[127],"agentlightning",[15,26,13],[130,131,132,133,134],"agent","agentic-ai","llm","mlops","reinforcement-learning","2026-03-27T02:49:30.150509","2026-04-06T08:35:14.943000",[138,143,148,153,158,163],{"id":139,"question_zh":140,"answer_zh":141,"source_url":142},14552,"使用本地路径加载模型时，vLLM 报错 404 'The model ... does not exist' 怎么办？","这是因为 vLLM 注册模型时仅使用目录名称（如 Qwen2.5-Coder-1.5B-Instruct），而不是完整路径。解决方法是将配置中的 `llm.model` 路径替换为仅包含最后两级目录的有效路径。具体代码修改为：`valid_llm_path = \"\u002F\".join(llm.model.split(\"\u002F\")[-2:])`。例如，将 `\u002Fdata\u002Fmodels\u002FQwen2.5-Coder-1.5B-Instruct` 改为 `models\u002FQwen2.5-Coder-1.5B-Instruct` 或直接使用模型文件夹名，即可解决 404 错误。","https:\u002F\u002Fgithub.com\u002Fmicrosoft\u002Fagent-lightning\u002Fissues\u002F37",{"id":144,"question_zh":145,"answer_zh":146,"source_url":147},14553,"训练过程中遇到数据格式不一致导致的 PyArrow 错误（如 cannot mix list and non-list）如何提前发现？","这类错误通常发生在合并不同来源的数据时，字段类型不一致（例如有的 target 是列表，有的是字符串）。目前建议在开发阶段（`trainer.dev`）手动运行数据验证步骤，或者检查数据预处理逻辑，确保所有字段的类型一致。例如，确保所有 \"target\" 字段都是列表格式 `[\"answer\"]` 而不是字符串 \"answer\"。维护者已意识到该问题并计划将 `trainer.fit` 中的数据验证步骤添加到 `trainer.dev` 中以便更早发现错误。","https:\u002F\u002Fgithub.com\u002Fmicrosoft\u002Fagent-lightning\u002Fissues\u002F385",{"id":149,"question_zh":150,"answer_zh":151,"source_url":152},14554,"项目是否支持华为昇腾（Ascend NPU）？","是的，项目已经支持 Ascend NPU。虽然环境配置默认可能要求较高版本的 torch，但已有专门的 PR 实现了相关支持。用户可以参考 PR #272 (https:\u002F\u002Fgithub.com\u002Fmicrosoft\u002Fagent-lightning\u002Fpull\u002F272) 获取具体的配置示例和适配方法。","https:\u002F\u002Fgithub.com\u002Fmicrosoft\u002Fagent-lightning\u002Fissues\u002F108",{"id":154,"question_zh":155,"answer_zh":156,"source_url":157},14555,"运行脚本时遇到 'AgentOps: Authentication failed: 504' 错误如何解决？","该问题通常是由于 AgentOps 库升级导致的兼容性问题。维护者建议固定 AgentOps 的版本以避免意外升级带来的破坏。如果遇到此错误，请尝试检查并锁定 `requirements.txt` 或安装命令中的 agentops 版本，或者升级到项目的最新版本，因为该问题在新版本中已通过版本锁定得到缓解。","https:\u002F\u002Fgithub.com\u002Fmicrosoft\u002Fagent-lightning\u002Fissues\u002F47",{"id":159,"question_zh":160,"answer_zh":161,"source_url":162},14556,"如何解决 langchain 1.0 更新相关的依赖问题？","该项目正在处理 langchain 1.0 的适配问题，相关修复已在 PR #364 中进行。此外，如果遇到 numpy 版本冲突（verl 限制 numpy \u003C 2.0），可以尝试强制覆盖依赖以使用 numpy >= 2.0 并进行测试，但这可能需要自行验证兼容性。建议关注项目更新以获取官方支持的版本。","https:\u002F\u002Fgithub.com\u002Fmicrosoft\u002Fagent-lightning\u002Fissues\u002F333",{"id":164,"question_zh":165,"answer_zh":166,"source_url":167},14557,"查询 vLLM 的 \u002Fv1\u002Fmodels 接口返回 'Not Found' 是什么原因？","这通常与模型路径配置错误有关，本质上与本地路径导致的 404 错误相同。vLLM 无法识别完整的文件系统路径作为模型 ID。请确保在请求中使用的是 vLLM 注册的模型名称（通常是模型文件夹的名称），而不是绝对路径。参考解决方案：提取路径的最后两部分作为模型名，即 `\"\u002F\".join(path.split(\"\u002F\")[-2:])`。","https:\u002F\u002Fgithub.com\u002Fmicrosoft\u002Fagent-lightning\u002Fissues\u002F63",[169,174,179,184,189,194,199],{"id":170,"version":171,"summary_zh":172,"released_at":173},81466,"v0.3.0","Agent-lightning v0.3.0 是一个重大版本，引入了多项新功能和错误修复。该版本是 Agent-lightning 核心团队与社区共同努力的成果。感谢所有为此次发布做出贡献的开发者。\n\n## 亮点\n\n* **Tinker 集成**：支持 Tinker 作为强化学习的替代后端 (#226 #245 #264 #269 #327)。请参阅 [示例代码](https:\u002F\u002Fgithub.com\u002Fmicrosoft\u002Fagent-lightning\u002Ftree\u002Fv0.3.0\u002Fexamples\u002Ftinker)、[博客 1](https:\u002F\u002Fmedium.com\u002F@yugez\u002Ftuning-any-ai-agent-with-tinker-agent-lightning-part-1-1d8c9a397f0e) 和 [博客 2](https:\u002F\u002Fmedium.com\u002F@yugez\u002Ftuning-any-ai-agent-with-tinker-agent-lightning-part-2-332c5437f0dc)。\n* **Azure OpenAI 集成**：支持 Azure OpenAI 作为 LLM 推理和监督微调的后端 (#256 #327)。[示例代码](https:\u002F\u002Fgithub.com\u002Fmicrosoft\u002Fagent-lightning\u002Ftree\u002Fv0.3.0\u002Fexamples\u002Fazure)。\n* **基于 MongoDB 的 Lightning Store** 被添加为 Lightning Store 的替代后端 (#323)。[文档](https:\u002F\u002Fmicrosoft.github.io\u002Fagent-lightning\u002F0.3.0\u002Ftutorials\u002Fparallelize\u002F#parallelizing-lightningstore)。\n* **Contrib 包**：新增用于社区项目的 contrib 包。Search-R1 已集成为 contrib 配方。更多内容即将推出。(#239 #396 #410 #412 #417)。\n* **RESTful API**：稳定并记录 Lightning Store 的 RESTful API (#241 #275)。[文档](https:\u002F\u002Fmicrosoft.github.io\u002Fagent-lightning\u002F0.3.0\u002Freference\u002Frestful\u002F)。\n* **专为智能体优化领域设计的 OTel 语义约定** (#340)。[文档](http:\u002F\u002Fmicrosoft.github.io\u002Fagent-lightning\u002F0.3.0\u002Freference\u002Fsemconv\u002F)。\n* *[预览]* **Agent-lightning 仪表板** 现已可用 (#288 #289 #291 #296 #371 #375)。这是用于检查和调试 Agent-lightning 实验的官方 Web 应用程序。详情请见 [这里](https:\u002F\u002Fmicrosoft.github.io\u002Fagent-lightning\u002F0.3.0\u002Ftutorials\u002Fdebug\u002F)。\n* *[预览]* **多模态示例**，展示了 VERL 和 LangGraph 智能体在 ChartQA 数据集上的应用 (#379)。[示例代码](https:\u002F\u002Fgithub.com\u002Fmicrosoft\u002Fagent-lightning\u002Ftree\u002Fv0.3.0\u002Fexamples\u002Fchartqa)。\n* *[预览]* 将 **Claude Code** 集成为 LitAgent，并支持在 SWE-Bench 上进行训练 (#332 #346 #348)。[示例代码](https:\u002F\u002Fgithub.com\u002Fmicrosoft\u002Fagent-lightning\u002Ftree\u002Fv0.3.0\u002Fexamples\u002Fclaude_code)。\n* *[预览]* **Weave 追踪器** 可作为 AgentOps 追踪器的替代品 (#277 #411 #420 #423)。[文档](https:\u002F\u002Fmicrosoft.github.io\u002Fagent-lightning\u002F0.3.0\u002Ftutorials\u002Ftraces\u002F#weave-tracer-experimental)。\n* *[预览]* **轨迹级聚合**，用于更高效地使用 VERL 进行训练。请参阅 [博客](https:\u002F\u002Fagent-lightning.github.io\u002Fposts\u002Ftrajectory_level_aggregation\u002F) 和 [文档](https:\u002F\u002Fmicrosoft.github.io\u002Fagent-lightning\u002F0.3.0\u002Falgorithm-zoo\u002Fverl\u002F)。\n\n\u003Cimg width=\"1817\" height=\"917\" alt=\"image\" src=\"https:\u002F\u002Fgithub.com\u002Fuser-attachments\u002Fassets\u002F96c23fba-4999-456f-922c-d7fc40919094\" \u002F>\n\n## Store 基准测试\n\n在本版本中，Lightning Store 的核心进行了重新设计。","2025-12-24T01:54:25",{"id":175,"version":176,"summary_zh":177,"released_at":178},81467,"v0.2.2","Agent-lightning v0.2.2 是 v0.2.1 的稳定版发布，引入了多项错误修复。\n\n* 修复与 VERL 0.6.0 的兼容性问题。\n* 修复 VERL 中预下载模型的模型名称。\n* 修复在创建尝试时，rollout 过程中的准备状态转换问题。\n* 修复 OpenAI Agents SDK 的兼容性问题。\n\n**完整变更日志**：https:\u002F\u002Fgithub.com\u002Fmicrosoft\u002Fagent-lightning\u002Fcompare\u002Fv0.2.1...v0.2.2","2025-11-12T16:06:41",{"id":180,"version":181,"summary_zh":182,"released_at":183},81468,"v0.2.1","Agent-lightning v0.2.1 是 v0.2.0 的稳定版发布。它引入了多项错误修复和新功能，以及一些未公开的 CI 改进。\n\n## 错误修复\n\n* 修复在同一进程中多次重启代理时 LiteLLM 出现的问题 (#174 #206)\n* 修复当多个服务器使用同一模型时 LiteLLM 模型名称选择的问题 (#197)\n* 修复存储端口冲突处理问题 (#227)\n\n## 新功能\n\n* 为客户端-服务器策略添加训练器端口选项 (#198)\n\n## 文档更新\n\n* 添加在独立机器上启动工作节点的教程 (#213)\n* 增加 VERL 框架的链接 (#210)\n* 增加 vLLM 博客的链接 (#215)\n* 修正了几处错别字，并避免生成 Emacs 备份文件 (#237)\n\n## 新贡献者\n\n热烈欢迎我们的首次贡献者：@scott-vsi、@ddsfda99、@jeis4wpi 🎉\n\n**完整变更日志**：https:\u002F\u002Fgithub.com\u002Fmicrosoft\u002Fagent-lightning\u002Fcompare\u002Fv0.2.0...v0.2.1","2025-10-30T01:48:29",{"id":185,"version":186,"summary_zh":187,"released_at":188},81469,"v0.2.0","Agent-Lightning v0.2.0 引入了重大的框架改进、新的执行策略、更丰富的文档以及在整个代理训练和部署工作流中增强的可靠性。自 v0.1.2 以来，本次发布共包含了 **78 个拉取请求**。\n\n## 核心增强功能\n\n* **Lightning Store**：为 Agent-lightning 的核心存储添加了统一的接口和实现。\n* **Emitter**：可将任意对象作为跨度（span）发送到存储中。\n* **Adapter** 和 **Tracer**：适配 OpenAI 风格的消息格式，并引入 OpenTelemetry 的模拟追踪器。\n* **LLM Proxy**：LLM 代理现已成为 Agent-lightning 中的一等公民。\n* **Agent Runner**：全新版本提供了更加模块化和健壮的运行器设计。\n* **嵌入式算法**：算法现已直接嵌入到训练器中，以简化使用。\n* **新的执行策略**：引入了 *客户端-服务器* 和 *共享内存* 执行模型。\n* **训练器更新**：集成了 v0.2 的接口，并增加了 FastAlgorithm 验证。\n\n## 文档与示例\n\n* 重构了文档，新增了关于 **代理创建**、**训练**、**调试** 以及 **存储概念** 的指南。\n* 改进了快速入门教程，明确了安装步骤，并推出了全新的深度解析文章。\n* 新增并更新了多个示例：*SQL 代理*、*Calc-X*、*本地 SFT*、*Search-R1* 以及 *APO 算法*。\n\n## 开发者体验\n\n* 将构建和 CI 流水线迁移到 **1ES**，拆分工作流程并聚合状态徽章，以提高清晰度。\n* 采用 **uv** 作为依赖管理工具。\n* 添加了基于 GPU 的 pytest 工作流，以实现全面的测试覆盖。\n* 优化了调试用户体验，改进了 pre-commit 配置和代码检查（包括 Pyright 修复和导入排序）。\n\n## 生态系统与集成\n\n* 增加了对使用 [**Agent-framework**](https:\u002F\u002Fgithub.com\u002Fmicrosoft\u002Fagent-framework) 构建的代理的支持。\n* 新增了社区项目列表：[*DeepWerewolf*](https:\u002F\u002Fgithub.com\u002Faf-74413592\u002FDeepWerewolf) 和 [*AgentFlow*](https:\u002F\u002Fagentflow.stanford.edu\u002F)。\n\n## 新贡献者\n\n热烈欢迎以下首次参与贡献的开发者：\n@hzy46、@lunaqiu、@syeehyn、@linhx1999、@SiyunZhao 和 @acured 🎉\n\n**完整变更日志**：[v0.1.2 → v0.2.0](https:\u002F\u002Fgithub.com\u002Fmicrosoft\u002Fagent-lightning\u002Fcompare\u002Fv0.1.2...v0.2.0)","2025-10-22T06:09:28",{"id":190,"version":191,"summary_zh":192,"released_at":193},81470,"v0.1.2","## 变更内容\n* 在 https:\u002F\u002Fgithub.com\u002Fmicrosoft\u002Fagent-lightning\u002Fpull\u002F33 中添加了基础文档\n* @wizardlancet 在 https:\u002F\u002Fgithub.com\u002Fmicrosoft\u002Fagent-lightning\u002Fpull\u002F21 中提供了 RAG 示例\n\n## 新贡献者\n* @wizardlancet 在 https:\u002F\u002Fgithub.com\u002Fmicrosoft\u002Fagent-lightning\u002Fpull\u002F21 中完成了首次贡献\n\n**完整变更日志**: https:\u002F\u002Fgithub.com\u002Fmicrosoft\u002Fagent-lightning\u002Fcompare\u002Fv0.1.1...v0.1.2","2025-08-12T07:48:15",{"id":195,"version":196,"summary_zh":197,"released_at":198},81471,"v0.1.1","## 变更内容\n* 禁用 HTTP 跟踪测试，并在 https:\u002F\u002Fgithub.com\u002Fmicrosoft\u002Fagent-lightning\u002Fpull\u002F26 中升级至 0.1.1 版本\n* 修复 https:\u002F\u002Fgithub.com\u002Fmicrosoft\u002Fagent-lightning\u002Fpull\u002F24 中 v0.1 版本的训练器 bug\n\n**完整变更日志**: https:\u002F\u002Fgithub.com\u002Fmicrosoft\u002Fagent-lightning\u002Fcompare\u002Fv0.1...v0.1.1","2025-08-06T00:49:11",{"id":200,"version":201,"summary_zh":202,"released_at":203},81472,"v0.1","Agent-lightning 首次发布！\n\n- 无需任何代码改动（几乎！），就能让您的智能体蜕变为可优化的“猛兽” 💤\n- 可以基于**任意**智能体框架构建（LangChain、OpenAI Agent SDK、AutoGen、CrewAI 等）；甚至无需任何智能体框架，直接使用 Python OpenAI API 也行。您想用啥就用啥！ 🤖\n- 在多智能体系统中，**有选择地**优化一个或多个智能体。 🎯\n- 支持强化学习、自动提示优化等多种**算法**。 🤗\n\n通过 `pip install agentlightning` 即可安装。","2025-08-04T10:22:11"]