autogen

56.7k 8.5k 简单 4 次阅读今天CC-BY-4.0Agent图像语言模型开发框架

AI 解读由 AI 自动生成，仅供参考

AutoGen 是一个由微软推出的编程框架，旨在帮助开发者构建能够自主行动或与人类协作的多智能体（Multi-Agent）AI 应用。它主要解决了单一 AI 模型在处理复杂任务时能力有限的问题，通过让多个具备不同角色的智能体进行对话、协作和工具调用，从而高效完成代码生成、数据分析、网页浏览等复杂工作流。

这款工具特别适合软件开发者和 AI 研究人员使用。对于希望探索下一代 AI 应用架构的技术人员，AutoGen 提供了高度灵活的定制能力；同时，它也提供了 AutoGen Studio 图形界面，让不熟悉代码的用户也能直观地编排智能体流程。

AutoGen 的核心亮点在于其独特的“会话式”协作机制：智能体之间可以像人类团队一样自动交流、互相纠正错误并迭代解决方案。此外，它原生支持模型上下文协议（MCP），能轻松连接外部工具和服务（如浏览器自动化），并兼容多种大语言模型。需要注意的是，虽然 AutoGen 仍在维护中，但微软已推出新的"Microsoft Agent Framework"作为未来演进方向，新用户可根据需求选择适合的技术栈。

使用场景

某电商数据团队需要每日从多个新闻源抓取竞品动态，提取关键数据并生成结构化分析报告。

没有 autogen 时

流程割裂：开发人员需分别编写爬虫脚本、调用 NLP 接口进行摘要、再手动整理数据入库，环节间依赖人工衔接。
异常处理困难：一旦某个新闻网站改版导致爬取失败，整个流水线中断，缺乏自动重试或切换源的机制。
维护成本高：每增加一个新的数据源或调整报告格式，都需要修改大量硬编码的逻辑，迭代周期长。
无法自主决策：脚本只能机械执行预设指令，遇到模糊信息（如“销量大幅增长”）无法主动搜索具体数值进行验证。

使用 autogen 后

多代理协同：构建“采集员”、“分析师”和“审核员”三个代理，自动完成从抓取、清洗到撰写报告的全闭环，无需人工干预。
自愈能力：当采集任务失败时，代理间可自主协商切换备用数据源或调整抓取策略，确保任务持续运行。
灵活扩展：新增数据源只需配置新的工具接口，autogen 会自动调度代理调用相应能力，大幅降低代码耦合度。
主动推理：遇到模糊描述时，“分析师”代理能自主调用搜索工具核实具体数据，并在报告中注明信息来源，提升准确性。

autogen 通过将单一脚本升级为可自主协作、具备反思能力的智能体团队，让复杂数据工程从“自动化”迈向了“智能化”。

运行环境要求

操作系统

未说明

GPU

未说明

内存

未说明

依赖

notes该工具是一个多智能体框架，主要依赖外部大模型 API（如 OpenAI），本地运行无需高性能 GPU。若使用 MCP Server 进行网页浏览任务，需预先安装 Node.js 及 Playwright (@playwright/mcp)。AutoGen Studio 仅提供无代码原型设计界面，不建议直接用于生产环境，生产部署需自行实现认证与安全机制。

python3.10+

autogen-agentchat

autogen-ext[openai]

autogenstudio

OpenAI Chat Completion Client

快速开始

AutoGen

AutoGen 是一个用于构建多智能体 AI 应用的框架，这些应用可以自主运行，也可以与人类协作。

重要提示：如果您是 AutoGen 的新用户，请查看 Microsoft Agent Framework。 AutoGen 仍将继续维护，并会持续接收错误修复和关键安全补丁。请阅读我们的公告。

安装

AutoGen 需要 Python 3.10 或更高版本。

# 从 Extensions 安装 AgentChat 和 OpenAI 客户端
pip install -U "autogen-agentchat" "autogen-ext[openai]"

当前的稳定版本可以在 releases 中找到。如果您是从 AutoGen v0.2 升级而来，请参阅迁移指南，以获取有关如何更新代码和配置的详细说明。

# 安装 AutoGen Studio 以获得无代码 GUI
pip install -U "autogenstudio"

快速入门

以下示例会调用 OpenAI API，因此您首先需要创建一个账户，并将您的密钥导出为 export OPENAI_API_KEY="sk-..."。

Hello World

使用 OpenAI 的 GPT-4o 模型创建一个助理代理。请参阅其他支持的模型。

import asyncio
from autogen_agentchat.agents import AssistantAgent
from autogen_ext.models.openai import OpenAIChatCompletionClient

async def main() -> None:
    model_client = OpenAIChatCompletionClient(model="gpt-4.1")
    agent = AssistantAgent("assistant", model_client=model_client)
    print(await agent.run(task="说'Hello World!'"))
    await model_client.close()

asyncio.run(main())

MCP 服务器

创建一个使用 Playwright MCP 服务器的网页浏览助理代理。

# 首先运行 `npm install -g @playwright/mcp@latest` 来安装 MCP 服务器。
import asyncio
from autogen_agentchat.agents import AssistantAgent
from autogen_agentchat.ui import Console
from autogen_ext.models.openai import OpenAIChatCompletionClient
from autogen_ext.tools.mcp import McpWorkbench, StdioServerParams


async def main() -> None:
    model_client = OpenAIChatCompletionClient(model="gpt-4.1")
    server_params = StdioServerParams(
        command="npx",
        args=[
            "@playwright/mcp@latest",
            "--headless",
        ],
    )
    async with McpWorkbench(server_params) as mcp:
        agent = AssistantAgent(
            "web_browsing_assistant",
            model_client=model_client,
            workbench=mcp, # 如果有多个 MCP 服务器，可以将它们放入列表中。
            model_client_stream=True，
            max_tool_iterations=10,
        )
        await Console(agent.run_stream(task="查询 microsoft/autogen 仓库有多少贡献者"))


asyncio.run(main())

警告：仅连接到受信任的 MCP 服务器，因为它们可能会在您的本地环境中执行命令或泄露敏感信息。

多智能体编排

您可以使用 AgentTool 创建一个基本的多智能体编排设置。

import asyncio

from autogen_agentchat.agents import AssistantAgent
from autogen_agentchat.tools import AgentTool
from autogen_agentchat.ui import Console
from autogen_ext.models.openai import OpenAIChatCompletionClient


async def main() -> None:
    model_client = OpenAIChatCompletionClient(model="gpt-4.1")

    数学专家助手 = AssistantAgent(
        "math_expert",
        model_client=model_client,
        system_message="你是一位数学专家。",
        description="一位数学专家助手。",
        model_client_stream=True，
    )
    数学工具 = AgentTool(math_agent, return_value_as_last_message=True)

    化学专家助手 = AssistantAgent(
        "chemistry_expert",
        model_client=model_client,
        system_message="你是一位化学专家。",
        description="一位化学专家助手。",
        model_client_stream=True，
    )
    化学工具 = AgentTool(chemistry_agent, return_value_as_last_message=True)

    助理助手 = AssistantAgent(
        "assistant",
        system_message="你是一位通用助手。必要时可使用专家工具。",
        model_client=model_client,
        model_client_stream=True，
        tools=[数学工具, 化学工具],
        max_tool_iterations=10，
    )
    await Console(agent.run_stream(task="x^2 的积分是多少？"))
    await Console(agent.run_stream(task="水的分子量是多少？"))


asyncio.run(main())

如需更高级的多智能体编排和工作流，请参阅 AgentChat 文档。

AutoGen Studio

使用 AutoGen Studio 可以在无需编写代码的情况下原型设计并运行多智能体工作流。

注意：AutoGen Studio 旨在帮助您快速原型化多智能体工作流，并展示使用 AutoGen 构建的终端用户界面示例。它 并非生产就绪的应用程序。建议开发者使用 AutoGen 框架来构建自己的应用程序，实现身份验证、安全性以及其他部署应用所需的特性。更多详情请参阅安全注意事项。

# 在 http://localhost:8080 上运行 AutoGen Studio
autogenstudio ui --port 8080 --appdir ./my-app

为什么使用 AutoGen？

AutoGen 生态系统提供了创建 AI 代理所需的一切，尤其是多代理工作流——框架、开发者工具和应用。

该_框架_采用分层且可扩展的设计。各层职责分明，并在下层的基础上构建。这种设计使您能够在不同抽象层次上使用该框架，从高级 API 到低级组件均可适用。

Core API 实现消息传递、事件驱动型代理以及本地和分布式运行时，以提供灵活性和强大功能。它还支持 .NET 和 Python 的跨语言调用。
AgentChat API 提供更简单但具有明确观点的 API，用于快速原型开发。该 API 构建在 Core API 之上，最接近 v0.2 用户熟悉的接口，并支持常见的多代理模式，如双代理对话或群组聊天。
Extensions API 允许第一方和第三方扩展持续增强框架的功能。它支持特定 LLM 客户端的实现（例如 OpenAI、AzureOpenAI），以及代码执行等功能。

该生态系统还支持两种重要的_开发者工具_：

AutoGen Studio 提供无代码 GUI，用于构建多代理应用。
AutoGen Bench 提供用于评估代理性能的基准测试套件。

您可以使用 AutoGen 框架和开发者工具为您的领域创建应用。例如，Magentic-One 是一个基于 AgentChat API 和 Extensions API 构建的先进多代理团队，能够处理需要网络浏览、代码执行和文件操作的各种任务。

通过 AutoGen，您可以加入并贡献于一个蓬勃发展的生态系统。我们每周都会举办维护者与社区成员的线上交流会和讲座。此外，我们还有一个 Discord 社区用于实时聊天，GitHub Discussions 用于问答交流，以及博客用于教程和最新动态分享。

接下来该做什么？


安装
快速入门
教程
API 参考
软件包

有兴趣贡献吗？请参阅 CONTRIBUTING.md，了解如何开始的指南。我们欢迎各种形式的贡献，包括修复 bug、新增功能和改进文档。加入我们的社区，帮助我们让 AutoGen 更加完善！

还有疑问吗？请查看我们的常见问题解答 (FAQ)，获取常见问题的答案。如果您没有找到所需信息，欢迎在我们的GitHub 讨论区提问，或加入我们的Discord 服务器，以获得实时支持。您也可以阅读我们的博客以获取最新动态。

法律声明

微软及任何贡献者在此授予您本仓库中微软文档及其他内容的许可，许可协议为知识共享署名 4.0 国际许可协议，详情请参阅LICENSE文件；同时，也授予您本仓库中任何代码的许可，许可协议为MIT 许可证，详情请参阅LICENSE-CODE文件。

文档中提及的 Microsoft、Windows、Microsoft Azure 及其他微软产品和服务，可能是微软在美国或其他国家的商标或注册商标。本项目的许可证并未授予您使用任何微软名称、徽标或商标的权利。微软的一般商标使用准则可在 http://go.microsoft.com/fwlink/?LinkID=254653 查阅。

隐私信息请参见 https://go.microsoft.com/fwlink/?LinkId=521839。

微软及任何贡献者保留所有其他权利，无论这些权利是基于各自的版权、专利或商标，还是通过暗示、禁止反言或其他方式产生。

↑ 返回顶部 ↑

AutoGen 快速上手指南

AutoGen 是一个用于创建多智能体 AI 应用的框架，支持智能体自主运行或与人类协作。本指南将帮助你快速搭建环境并运行第一个智能体。

环境准备

在开始之前，请确保你的开发环境满足以下要求：

操作系统：Windows, macOS 或 Linux
Python 版本：3.10 或更高版本
API Key：需要拥有 OpenAI API Key（或其他支持的模型提供商 Key）
环境变量：在终端中设置 Key，例如：
```
export OPENAI_API_KEY="sk-..."
```
(Windows PowerShell 用户请使用 $env:OPENAI_API_KEY="sk-...")

提示：国内开发者若访问 PyPI 源较慢，可使用清华或阿里镜像源加速安装（见下文安装步骤）。

安装步骤

1. 安装核心库

使用 pip 安装 AgentChat 模块及 OpenAI 扩展包。

官方源安装：

pip install -U "autogen-agentchat" "autogen-ext[openai]"

国内镜像源加速安装（推荐）：

pip install -U "autogen-agentchat" "autogen-ext[openai]" -i https://pypi.tuna.tsinghua.edu.cn/simple

2. (可选) 安装 AutoGen Studio

如果你希望通过图形界面（GUI）无代码构建工作流，可额外安装：

pip install -U "autogenstudio"

基本使用

以下示例展示如何创建一个基于 GPT-4o 模型的助理智能体，并让它输出 "Hello World!"。

新建一个 Python 文件（例如 hello_world.py）。
复制以下代码：

import asyncio
from autogen_agentchat.agents import AssistantAgent
from autogen_ext.models.openai import OpenAIChatCompletionClient

async def main() -> None:
    # 初始化模型客户端，此处以 gpt-4.1 为例，也可替换为 gpt-4o 等其他模型
    model_client = OpenAIChatCompletionClient(model="gpt-4.1")
    
    # 创建助理智能体
    agent = AssistantAgent("assistant", model_client=model_client)
    
    # 运行任务并打印结果
    print(await agent.run(task="Say 'Hello World!'"))
    
    # 关闭客户端连接
    await model_client.close()

if __name__ == "__main__":
    asyncio.run(main())

在终端运行脚本：

python hello_world.py

运行成功后，你将看到智能体返回的 "Hello World!" 消息。

注：若需体验无代码界面，可在终端运行 autogenstudio ui --port 8080，然后在浏览器访问 http://localhost:8080。

版本历史

python-v0.7.52025/09/30

python-v0.7.42025/08/19

python-v0.7.32025/08/19

python-v0.7.22025/08/07

python-v0.7.12025/07/28

python-v0.6.42025/07/09

python-v0.6.22025/07/01

python-v0.6.12025/06/05

python-v0.6.02025/06/05

python-v0.5.72025/05/14

python-v0.5.62025/05/02

python-v0.5.52025/04/25

python-v0.5.42025/04/22

python-v0.5.32025/04/17

python-v0.5.22025/04/15

python-v0.5.12025/04/03

python-v0.4.9.32025/03/29

autogenstudio-v0.4.22025/03/17

python-v0.4.9.22025/03/14

python-v0.4.92025/03/12

常见问题

如何配置 AutoGen 以使用 OpenAI 项目/组织生成的 API Key（非个人用户 Key）？

遇到 'AttributeError: str object has no attribute get' 错误该如何解决？

AutoGen 是否支持集成开源大语言模型（如 LLaMa, Vicuna 等）？

任务执行完毕后出现空消息或助手不知道如何继续，如何处理？

如何获取贡献者的 Discord ID 以便在社区中致谢？

使用本地或兼容 OpenAI 的 API 时，为什么会出现 UnicodeEncodeError 编码错误？

相似工具推荐

stable-diffusion-webui

stable-diffusion-webui 是一个基于 Gradio 构建的网页版操作界面，旨在让用户能够轻松地在本地运行和使用强大的 Stable Diffusion 图像生成模型。它解决了原始模型依赖命令行、操作门槛高且功能分散的痛点，将复杂的 AI 绘图流程整合进一个直观易用的图形化平台。无论是希望快速上手的普通创作者、需要精细控制画面细节的设计师，还是想要深入探索模型潜力的开发者与研究人员，都能从中获益。其核心亮点在于极高的功能丰富度：不仅支持文生图、图生图、局部重绘（Inpainting）和外绘（Outpainting）等基础模式，还独创了注意力机制调整、提示词矩阵、负向提示词以及“高清修复”等高级功能。此外，它内置了 GFPGAN 和 CodeFormer 等人脸修复工具，支持多种神经网络放大算法，并允许用户通过插件系统无限扩展能力。即使是显存有限的设备，stable-diffusion-webui 也提供了相应的优化选项，让高质量的 AI 艺术创作变得触手可及。

★ 162.1k|★★★☆☆|今天

开发框架图像Agent

everything-claude-code

everything-claude-code 是一套专为 AI 编程助手（如 Claude Code、Codex、Cursor 等）打造的高性能优化系统。它不仅仅是一组配置文件，而是一个经过长期实战打磨的完整框架，旨在解决 AI 代理在实际开发中面临的效率低下、记忆丢失、安全隐患及缺乏持续学习能力等核心痛点。通过引入技能模块化、直觉增强、记忆持久化机制以及内置的安全扫描功能，everything-claude-code 能显著提升 AI 在复杂任务中的表现，帮助开发者构建更稳定、更智能的生产级 AI 代理。其独特的“研究优先”开发理念和针对 Token 消耗的优化策略，使得模型响应更快、成本更低，同时有效防御潜在的攻击向量。这套工具特别适合软件开发者、AI 研究人员以及希望深度定制 AI 工作流的技术团队使用。无论您是在构建大型代码库，还是需要 AI 协助进行安全审计与自动化测试，everything-claude-code 都能提供强大的底层支持。作为一个曾荣获 Anthropic 黑客大奖的开源项目，它融合了多语言支持与丰富的实战钩子（hooks），让 AI 真正成长为懂上

★ 140.4k|★★☆☆☆|今天

开发框架Agent语言模型

ComfyUI

ComfyUI 是一款功能强大且高度模块化的视觉 AI 引擎，专为设计和执行复杂的 Stable Diffusion 图像生成流程而打造。它摒弃了传统的代码编写模式，采用直观的节点式流程图界面，让用户通过连接不同的功能模块即可构建个性化的生成管线。这一设计巧妙解决了高级 AI 绘图工作流配置复杂、灵活性不足的痛点。用户无需具备编程背景，也能自由组合模型、调整参数并实时预览效果，轻松实现从基础文生图到多步骤高清修复等各类复杂任务。ComfyUI 拥有极佳的兼容性，不仅支持 Windows、macOS 和 Linux 全平台，还广泛适配 NVIDIA、AMD、Intel 及苹果 Silicon 等多种硬件架构，并率先支持 SDXL、Flux、SD3 等前沿模型。无论是希望深入探索算法潜力的研究人员和开发者，还是追求极致创作自由度的设计师与资深 AI 绘画爱好者，ComfyUI 都能提供强大的支持。其独特的模块化架构允许社区不断扩展新功能，使其成为当前最灵活、生态最丰富的开源扩散模型工具之一，帮助用户将创意高效转化为现实。

★ 107.7k|★★☆☆☆|2天前

开发框架图像Agent

NextChat

NextChat 是一款轻量且极速的 AI 助手，旨在为用户提供流畅、跨平台的大模型交互体验。它完美解决了用户在多设备间切换时难以保持对话连续性，以及面对众多 AI 模型不知如何统一管理的痛点。无论是日常办公、学习辅助还是创意激发，NextChat 都能让用户随时随地通过网页、iOS、Android、Windows、MacOS 或 Linux 端无缝接入智能服务。这款工具非常适合普通用户、学生、职场人士以及需要私有化部署的企业团队使用。对于开发者而言，它也提供了便捷的自托管方案，支持一键部署到 Vercel 或 Zeabur 等平台。 NextChat 的核心亮点在于其广泛的模型兼容性，原生支持 Claude、DeepSeek、GPT-4 及 Gemini Pro 等主流大模型，让用户在一个界面即可自由切换不同 AI 能力。此外，它还率先支持 MCP（Model Context Protocol）协议，增强了上下文处理能力。针对企业用户，NextChat 提供专业版解决方案，具备品牌定制、细粒度权限控制、内部知识库整合及安全审计等功能，满足公司对数据隐私和个性化管理的高标准要求。

★ 87.6k|★★☆☆☆|昨天

开发框架语言模型

ML-For-Beginners

ML-For-Beginners 是由微软推出的一套系统化机器学习入门课程，旨在帮助零基础用户轻松掌握经典机器学习知识。这套课程将学习路径规划为 12 周，包含 26 节精炼课程和 52 道配套测验，内容涵盖从基础概念到实际应用的完整流程，有效解决了初学者面对庞大知识体系时无从下手、缺乏结构化指导的痛点。无论是希望转型的开发者、需要补充算法背景的研究人员，还是对人工智能充满好奇的普通爱好者，都能从中受益。课程不仅提供了清晰的理论讲解，还强调动手实践，让用户在循序渐进中建立扎实的技能基础。其独特的亮点在于强大的多语言支持，通过自动化机制提供了包括简体中文在内的 50 多种语言版本，极大地降低了全球不同背景用户的学习门槛。此外，项目采用开源协作模式，社区活跃且内容持续更新，确保学习者能获取前沿且准确的技术资讯。如果你正寻找一条清晰、友好且专业的机器学习入门之路，ML-For-Beginners 将是理想的起点。

★ 85k|★★☆☆☆|今天

图像数据工具视频

ragflow

RAGFlow 是一款领先的开源检索增强生成（RAG）引擎，旨在为大语言模型构建更精准、可靠的上下文层。它巧妙地将前沿的 RAG 技术与智能体（Agent）能力相结合，不仅支持从各类文档中高效提取知识，还能让模型基于这些知识进行逻辑推理和任务执行。在大模型应用中，幻觉问题和知识滞后是常见痛点。RAGFlow 通过深度解析复杂文档结构（如表格、图表及混合排版），显著提升了信息检索的准确度，从而有效减少模型“胡编乱造”的现象，确保回答既有据可依又具备时效性。其内置的智能体机制更进一步，使系统不仅能回答问题，还能自主规划步骤解决复杂问题。这款工具特别适合开发者、企业技术团队以及 AI 研究人员使用。无论是希望快速搭建私有知识库问答系统，还是致力于探索大模型在垂直领域落地的创新者，都能从中受益。RAGFlow 提供了可视化的工作流编排界面和灵活的 API 接口，既降低了非算法背景用户的上手门槛，也满足了专业开发者对系统深度定制的需求。作为基于 Apache 2.0 协议开源的项目，它正成为连接通用大模型与行业专有知识之间的重要桥梁。

★ 77.1k|★★★☆☆|2天前

Agent图像开发框架