[{"data":1,"prerenderedAt":-1},["ShallowReactive",2],{"similar-microsoft--magentic-ui":3,"tool-microsoft--magentic-ui":62},[4,18,26,36,46,54],{"id":5,"name":6,"github_repo":7,"description_zh":8,"stars":9,"difficulty_score":10,"last_commit_at":11,"category_tags":12,"status":17},4358,"openclaw","openclaw\u002Fopenclaw","OpenClaw 是一款专为个人打造的本地化 AI 助手，旨在让你在自己的设备上拥有完全可控的智能伙伴。它打破了传统 AI 助手局限于特定网页或应用的束缚，能够直接接入你日常使用的各类通讯渠道，包括微信、WhatsApp、Telegram、Discord、iMessage 等数十种平台。无论你在哪个聊天软件中发送消息，OpenClaw 都能即时响应，甚至支持在 macOS、iOS 和 Android 设备上进行语音交互，并提供实时的画布渲染功能供你操控。\n\n这款工具主要解决了用户对数据隐私、响应速度以及“始终在线”体验的需求。通过将 AI 部署在本地，用户无需依赖云端服务即可享受快速、私密的智能辅助，真正实现了“你的数据，你做主”。其独特的技术亮点在于强大的网关架构，将控制平面与核心助手分离，确保跨平台通信的流畅性与扩展性。\n\nOpenClaw 非常适合希望构建个性化工作流的技术爱好者、开发者，以及注重隐私保护且不愿被单一生态绑定的普通用户。只要具备基础的终端操作能力（支持 macOS、Linux 及 Windows WSL2），即可通过简单的命令行引导完成部署。如果你渴望拥有一个懂你",349277,3,"2026-04-06T06:32:30",[13,14,15,16],"Agent","开发框架","图像","数据工具","ready",{"id":19,"name":20,"github_repo":21,"description_zh":22,"stars":23,"difficulty_score":10,"last_commit_at":24,"category_tags":25,"status":17},3808,"stable-diffusion-webui","AUTOMATIC1111\u002Fstable-diffusion-webui","stable-diffusion-webui 是一个基于 Gradio 构建的网页版操作界面，旨在让用户能够轻松地在本地运行和使用强大的 Stable Diffusion 图像生成模型。它解决了原始模型依赖命令行、操作门槛高且功能分散的痛点，将复杂的 AI 绘图流程整合进一个直观易用的图形化平台。\n\n无论是希望快速上手的普通创作者、需要精细控制画面细节的设计师，还是想要深入探索模型潜力的开发者与研究人员，都能从中获益。其核心亮点在于极高的功能丰富度：不仅支持文生图、图生图、局部重绘（Inpainting）和外绘（Outpainting）等基础模式，还独创了注意力机制调整、提示词矩阵、负向提示词以及“高清修复”等高级功能。此外，它内置了 GFPGAN 和 CodeFormer 等人脸修复工具，支持多种神经网络放大算法，并允许用户通过插件系统无限扩展能力。即使是显存有限的设备，stable-diffusion-webui 也提供了相应的优化选项，让高质量的 AI 艺术创作变得触手可及。",162132,"2026-04-05T11:01:52",[14,15,13],{"id":27,"name":28,"github_repo":29,"description_zh":30,"stars":31,"difficulty_score":32,"last_commit_at":33,"category_tags":34,"status":17},1381,"everything-claude-code","affaan-m\u002Feverything-claude-code","everything-claude-code 是一套专为 AI 编程助手（如 Claude Code、Codex、Cursor 等）打造的高性能优化系统。它不仅仅是一组配置文件，而是一个经过长期实战打磨的完整框架，旨在解决 AI 代理在实际开发中面临的效率低下、记忆丢失、安全隐患及缺乏持续学习能力等核心痛点。\n\n通过引入技能模块化、直觉增强、记忆持久化机制以及内置的安全扫描功能，everything-claude-code 能显著提升 AI 在复杂任务中的表现，帮助开发者构建更稳定、更智能的生产级 AI 代理。其独特的“研究优先”开发理念和针对 Token 消耗的优化策略，使得模型响应更快、成本更低，同时有效防御潜在的攻击向量。\n\n这套工具特别适合软件开发者、AI 研究人员以及希望深度定制 AI 工作流的技术团队使用。无论您是在构建大型代码库，还是需要 AI 协助进行安全审计与自动化测试，everything-claude-code 都能提供强大的底层支持。作为一个曾荣获 Anthropic 黑客大奖的开源项目，它融合了多语言支持与丰富的实战钩子（hooks），让 AI 真正成长为懂上",158594,2,"2026-04-16T23:34:05",[14,13,35],"语言模型",{"id":37,"name":38,"github_repo":39,"description_zh":40,"stars":41,"difficulty_score":42,"last_commit_at":43,"category_tags":44,"status":17},8272,"opencode","anomalyco\u002Fopencode","OpenCode 是一款开源的 AI 编程助手（Coding Agent），旨在像一位智能搭档一样融入您的开发流程。它不仅仅是一个代码补全插件，而是一个能够理解项目上下文、自主规划任务并执行复杂编码操作的智能体。无论是生成全新功能、重构现有代码，还是排查难以定位的 Bug，OpenCode 都能通过自然语言交互高效完成，显著减少开发者在重复性劳动和上下文切换上的时间消耗。\n\n这款工具专为软件开发者、工程师及技术研究人员设计，特别适合希望利用大模型能力来提升编码效率、加速原型开发或处理遗留代码维护的专业人群。其核心亮点在于完全开源的架构，这意味着用户可以审查代码逻辑、自定义行为策略，甚至私有化部署以保障数据安全，彻底打破了传统闭源 AI 助手的“黑盒”限制。\n\n在技术体验上，OpenCode 提供了灵活的终端界面（Terminal UI）和正在测试中的桌面应用程序，支持 macOS、Windows 及 Linux 全平台。它兼容多种包管理工具，安装便捷，并能无缝集成到现有的开发环境中。无论您是追求极致控制权的资深极客，还是渴望提升产出的独立开发者，OpenCode 都提供了一个透明、可信",144296,1,"2026-04-16T14:50:03",[13,45],"插件",{"id":47,"name":48,"github_repo":49,"description_zh":50,"stars":51,"difficulty_score":32,"last_commit_at":52,"category_tags":53,"status":17},2271,"ComfyUI","Comfy-Org\u002FComfyUI","ComfyUI 是一款功能强大且高度模块化的视觉 AI 引擎，专为设计和执行复杂的 Stable Diffusion 图像生成流程而打造。它摒弃了传统的代码编写模式，采用直观的节点式流程图界面，让用户通过连接不同的功能模块即可构建个性化的生成管线。\n\n这一设计巧妙解决了高级 AI 绘图工作流配置复杂、灵活性不足的痛点。用户无需具备编程背景，也能自由组合模型、调整参数并实时预览效果，轻松实现从基础文生图到多步骤高清修复等各类复杂任务。ComfyUI 拥有极佳的兼容性，不仅支持 Windows、macOS 和 Linux 全平台，还广泛适配 NVIDIA、AMD、Intel 及苹果 Silicon 等多种硬件架构，并率先支持 SDXL、Flux、SD3 等前沿模型。\n\n无论是希望深入探索算法潜力的研究人员和开发者，还是追求极致创作自由度的设计师与资深 AI 绘画爱好者，ComfyUI 都能提供强大的支持。其独特的模块化架构允许社区不断扩展新功能，使其成为当前最灵活、生态最丰富的开源扩散模型工具之一，帮助用户将创意高效转化为现实。",108322,"2026-04-10T11:39:34",[14,15,13],{"id":55,"name":56,"github_repo":57,"description_zh":58,"stars":59,"difficulty_score":32,"last_commit_at":60,"category_tags":61,"status":17},6121,"gemini-cli","google-gemini\u002Fgemini-cli","gemini-cli 是一款由谷歌推出的开源 AI 命令行工具，它将强大的 Gemini 大模型能力直接集成到用户的终端环境中。对于习惯在命令行工作的开发者而言，它提供了一条从输入提示词到获取模型响应的最短路径，无需切换窗口即可享受智能辅助。\n\n这款工具主要解决了开发过程中频繁上下文切换的痛点，让用户能在熟悉的终端界面内直接完成代码理解、生成、调试以及自动化运维任务。无论是查询大型代码库、根据草图生成应用，还是执行复杂的 Git 操作，gemini-cli 都能通过自然语言指令高效处理。\n\n它特别适合广大软件工程师、DevOps 人员及技术研究人员使用。其核心亮点包括支持高达 100 万 token 的超长上下文窗口，具备出色的逻辑推理能力；内置 Google 搜索、文件操作及 Shell 命令执行等实用工具；更独特的是，它支持 MCP（模型上下文协议），允许用户灵活扩展自定义集成，连接如图像生成等外部能力。此外，个人谷歌账号即可享受免费的额度支持，且项目基于 Apache 2.0 协议完全开源，是提升终端工作效率的理想助手。",100752,"2026-04-10T01:20:03",[45,13,15,14],{"id":63,"github_repo":64,"name":65,"description_en":66,"description_zh":67,"ai_summary_zh":67,"readme_en":68,"readme_zh":69,"quickstart_zh":70,"use_case_zh":71,"hero_image_url":72,"owner_login":73,"owner_name":74,"owner_avatar_url":75,"owner_bio":76,"owner_company":77,"owner_location":77,"owner_email":78,"owner_twitter":79,"owner_website":80,"owner_url":81,"languages":82,"stars":107,"forks":108,"last_commit_at":109,"license":110,"difficulty_score":32,"env_os":111,"env_gpu":112,"env_ram":112,"env_deps":113,"category_tags":120,"github_topics":121,"view_count":32,"oss_zip_url":77,"oss_zip_packed_at":77,"status":17,"created_at":129,"updated_at":130,"faqs":131,"releases":166},8147,"microsoft\u002Fmagentic-ui","magentic-ui","A research prototype of a human-centered web agent","Magentic-UI 是一款以人为核心的 AI 网页代理研究原型，旨在帮助用户自动化处理复杂的网页操作与编程任务。与传统“黑盒”式自动化工具不同，Magentic-UI 强调透明性与可控性：它在执行前会清晰展示计划，允许用户实时引导操作方向，并在涉及敏感步骤（如浏览特定网站、执行代码或分析文件）时主动请求批准。\n\n它主要解决了长周期监控任务和复杂工作流中缺乏人工干预机制的痛点。例如，用户可以设定\"Tell me When\"功能，让代理在数分钟甚至数天内持续监测网页或 API 状态，仅在需要时采取行动。此外，它还支持文件上传分析、集成 MCP 服务器扩展能力，并最新适配了微软高效的 Fara-7B 代理模型。\n\nMagentic-UI 特别适合研究人员、开发者以及需要处理重复性高、逻辑复杂网页任务的专业人士使用。对于希望探索人机协作新模式的团队，它提供了一个安全、可解释的实验平台。普通用户若具备基础技术环境（如 Docker 和 Python），也能通过直观的界面轻松上手，体验“人在回路”的智能自动化服务。","\u003Cdiv align=\"center\">\n\u003Cimg src=\"docs\u002Fimg\u002Fmagui-readme-logo.svg\" alt=\"Magentic-UI Logo\">\n\n\n_Automate your web tasks while you stay in control_\n\n[![image](https:\u002F\u002Fimg.shields.io\u002Fpypi\u002Fv\u002Fmagentic_ui.svg)](https:\u002F\u002Fpypi.python.org\u002Fpypi\u002Fmagentic_ui)\n[![image](https:\u002F\u002Fimg.shields.io\u002Fpypi\u002Fl\u002Fmagentic_ui.svg)](https:\u002F\u002Fpypi.python.org\u002Fpypi\u002Fmagentic_ui)\n![Python Versions](https:\u002F\u002Fimg.shields.io\u002Fbadge\u002Fpython-3.10%20%7C%203.11%20%7C%203.12%20%7C%203.13-blue)\n[![arXiv](https:\u002F\u002Fimg.shields.io\u002Fbadge\u002FarXiv-2507.22358-b31b1b.svg)](https:\u002F\u002Farxiv.org\u002Fabs\u002F2507.22358)\n\n\u003C\u002Fdiv>\n\n---\n\nMagentic-UI is a **research prototype** human-centered AI agent that solves complex web and coding tasks that may require monitoring. Unlike other black-box agents, the system reveals its plan before executions, lets you guide its actions, and requests approval for sensitive operations while browsing websites, executing code, and analyzing files.\n*Check out the [demo section](#demos) for inspiration on what tasks you can accomplish.*\n\n## ✨ What's New\n\nMicrosoft latest agentic model [Fara-7B](https:\u002F\u002Fwww.microsoft.com\u002Fen-us\u002Fresearch\u002Fblog\u002Ffara-7b-an-efficient-agentic-model-for-computer-use\u002F) is now integrated in Magentic-UI, read how to launch in \u003Ca href=\"#fara-7b\"> Fara-7B guide\u003C\u002Fa>\n\n\n- **\"Tell me When\"**: Automate monitoring tasks and repeatable workflows that require web or API access that span minutes to days. *Learn more [here](https:\u002F\u002Fwww.microsoft.com\u002Fen-us\u002Fresearch\u002Fblog\u002Ftell-me-when-building-agents-that-can-wait-monitor-and-act\u002F).*\n- **File Upload Support**: Upload any file through the UI for analysis or modification\n- **MCP Agents**: Extend capabilities with your favorite MCP servers\n- **Easier Installation**: We have uploaded our docker containers to GHCR so you no longer need to build any containers! Installation time now is much quicker.\n\n\n## 🚀 Quick Start\n\nHere's how you can get started with Magentic-UI:\n\n```bash\n# 1. Setup environment\npython3 -m venv .venv\nsource .venv\u002Fbin\u002Factivate\npip install magentic-ui --upgrade\n\n# 2. Set your API key\nexport OPENAI_API_KEY=\"your-api-key-here\"\n\n# 3. Launch Magentic-UI\nmagentic-ui --port 8081\n```\n\nThen open \u003Chttp:\u002F\u002Flocalhost:8081> in your browser to interact with Magentic-UI!\n\n> **Prerequisites**: Requires Docker and Python 3.10+. Windows users should use WSL2. See [detailed installation](#️-installation) for more info.\n\n## Alternative Usage Options\n\n**Without Docker** (limited functionality: no code execution):\n```bash\nmagentic-ui --run-without-docker --port 8081\n```\n\n**Command Line Interface**:\n```bash\nmagentic-cli --work-dir PATH\u002FTO\u002FSTORE\u002FDATA\n```\n\n**Custom LLM Clients**:\n```bash\n# Azure\npip install magentic-ui[azure]\n\n# Ollama (local models)\npip install magentic-ui[ollama]\n```\n\nYou can then pass a config file to the `magentic-ui` command (\u003Ca href=\"#model-client-configuration\"> client config\u003C\u002Fa>) or change the model client inside the UI settings.\n\nFor further details on installation please read the   \u003Ca href=\"#️-installation\">🛠️ Installation\u003C\u002Fa> section. For common installation issues and their solutions, please refer to the [troubleshooting document](TROUBLESHOOTING.md). See advanced usage instructions with the command `magentic-ui --help`. \n\n## Quick Navigation:\n\u003Cp align=\"center\">\n  \u003Ca href=\"#demos\">🎬 Demos\u003C\u002Fa> &nbsp;|&nbsp;\n  \u003Ca href=\"#how-it-works\">🟪 How it Works\u003C\u002Fa> &nbsp;|&nbsp;\n  \u003Ca href=\"#installation\">🛠️ Installation\u003C\u002Fa> &nbsp;|&nbsp;\n  \u003Ca href=\"#troubleshooting\">⚠️ Troubleshooting\u003C\u002Fa> &nbsp;|&nbsp; \n  \u003Ca href=\"#contributing\">🤝 Contributing\u003C\u002Fa> &nbsp;|&nbsp;\n  \u003Ca href=\"#license\">📄 License\u003C\u002Fa>\n\u003C\u002Fp>\n\n---\n\n## Demos\n\n\u003Ctable>\n\u003Ctr>\n\u003Ctd width=\"33%\" align=\"center\">\n\n**🍕 Pizza Ordering**  \n*Web automation with human-in-the-loop*\n\n\u003Cvideo src=\"https:\u002F\u002Fgithub.com\u002Fuser-attachments\u002Fassets\u002Fdc95cf5f-c4b4-4fe0-b708-158ff071e5a9\" width=\"100%\" style=\"max-height: 300px;\">\n\u003C\u002Fvideo>\n\n\u003C\u002Ftd>\n\u003Ctd width=\"33%\" align=\"center\">\n\n**🏠 Airbnb Price Analysis**  \n*MCP agent integration*\n\n\u003Cvideo src=\"https:\u002F\u002Fgithub.com\u002Fuser-attachments\u002Fassets\u002Fc19ed8c2-e06f-43b7-bee3-5e2ffc4c5e02\" width=\"100%\" style=\"max-height: 300px;\">\n\u003C\u002Fvideo>\n\n\u003C\u002Ftd>\n\u003Ctd width=\"33%\" align=\"center\">\n\n**⭐ Star Monitoring**  \n*Long-running monitoring task*\n\n\u003Cvideo src=\"https:\u002F\u002Fgithub.com\u002Fuser-attachments\u002Fassets\u002Fd2a463ca-7a94-4414-932d-a69f30fff63b\" width=\"100%\" style=\"max-height: 300px;\">\n\u003C\u002Fvideo>\n\n\u003C\u002Ftd>\n\u003C\u002Ftr>\n\u003C\u002Ftable>\n\n\n\n## How it Works\n\u003Cp align=\"center\">\n  \u003Cimg src=\"https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002Fmicrosoft_magentic-ui_readme_05d495839733.png\" alt=\"Magentic-UI\" height=\"400\">\n\u003C\u002Fp>\n\nMagentic-UI is especially useful for web tasks that require actions on the web (e.g., filling a form, customizing a food order), deep navigation through websites not indexed by search engines (e.g., filtering flights, finding a link from a personal site) or tasks that need web navigation and code execution (e.g., generate a chart from online data).\n\nWhat differentiates Magentic-UI from other browser use offerings is its transparent and controllable interface that allows for efficient human-in-the-loop involvement. Magentic-UI is built using [AutoGen](https:\u002F\u002Fgithub.com\u002Fmicrosoft\u002Fautogen) and provides a platform to study human-agent interaction and experiment with web agents. Key features include:\n\n- 🧑‍🤝‍🧑 **Co-Planning**: Collaboratively create and approve step-by-step plans using chat and the plan editor.\n- 🤝 **Co-Tasking**: Interrupt and guide the task execution using the web browser directly or through chat. Magentic-UI can also ask for clarifications and help when needed.\n- 🛡️ **Action Guards**: Sensitive actions are only executed with explicit user approvals.\n- 🧠 **Plan Learning and Retrieval**: Learn from previous runs to improve future task automation and save them in a plan gallery. Automatically or manually retrieve saved plans in future tasks.\n- 🔀 **Parallel Task Execution**: You can run multiple tasks in parallel and session status indicators will let you know when Magentic-UI needs your input or has completed the task.\n\n\u003Cdiv align=\"center\">\n  \u003Ca href=\"https:\u002F\u002Fwww.youtube.com\u002Fwatch?v=wOs-5SR8xOc\" target=\"_blank\">\n    \u003Cimg src=\"https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002Fmicrosoft_magentic-ui_readme_433e1582831b.jpg\" alt=\"Watch the demo video\" width=\"600\"\u002F>\n  \u003C\u002Fa>\n  \u003Cbr>\n  ▶️ \u003Cem> Click to watch a video and learn more about Magentic-UI \u003C\u002Fem>\n\u003C\u002Fdiv>\n\n\n### Autonomous Evaluation\n\nTo evaluate its autonomous capabilities, Magentic-UI has been tested against several benchmarks when running with o4-mini: [GAIA](https:\u002F\u002Fhuggingface.co\u002Fdatasets\u002Fgaia-benchmark\u002FGAIA) test set (42.52%), which assesses general AI assistants across reasoning, tool use, and web interaction tasks ; [AssistantBench](https:\u002F\u002Fhuggingface.co\u002FAssistantBench) test set (27.60%), focusing on realistic, time-consuming web tasks; [WebVoyager](https:\u002F\u002Fgithub.com\u002FMinorJerry\u002FWebVoyager) (82.2%), measuring end-to-end web navigation in real-world scenarios; and [WebGames](https:\u002F\u002Fwebgames.convergence.ai\u002F) (45.5%), evaluating general-purpose web-browsing agents through interactive challenges.\nTo reproduce these experimental results, please see the following [instructions](experiments\u002Feval\u002FREADME.md).\n\n\n\nIf you're interested in reading more checkout our [technical report](https:\u002F\u002Fwww.microsoft.com\u002Fen-us\u002Fresearch\u002Fwp-content\u002Fuploads\u002F2025\u002F07\u002Fmagentic-ui-report.pdf) and [blog post](https:\u002F\u002Fwww.microsoft.com\u002Fen-us\u002Fresearch\u002Fblog\u002Fmagentic-ui-an-experimental-human-centered-web-agent\u002F).\n\n\n## Installation\n### Pre-Requisites\n\n**Note**: If you're using Windows, we highly recommend using [WSL2](https:\u002F\u002Fdocs.microsoft.com\u002Fen-us\u002Fwindows\u002Fwsl\u002Finstall) (Windows Subsystem for Linux).\n\n1. If running on **Windows** or **Mac** you should use [Docker Desktop](https:\u002F\u002Fwww.docker.com\u002Fproducts\u002Fdocker-desktop\u002F) or if inside WSL2 you can install Docker directly inside WSL [docker in WSL2 guide](https:\u002F\u002Fgist.github.com\u002Fdehsilvadeveloper\u002Fc3bdf0f4cdcc5c177e2fe9be671820c7). If running on **Linux**, you should use [Docker Engine](https:\u002F\u002Fdocs.docker.com\u002Fengine\u002Finstall\u002F). \n\nIf using Docker Desktop, make sure it is set up to use WSL2:\n    - Go to Settings > Resources > WSL Integration\n    - Enable integration with your development distro You can find more detailed instructions about this step [here](https:\u002F\u002Fdocs.microsoft.com\u002Fen-us\u002Fwindows\u002Fwsl\u002Ftutorials\u002Fwsl-containers).\n\n\n\n2. During the Installation step, you will need to set up your `OPENAI_API_KEY`. To use other models, review the [Model Client Configuration](#model-client-configuration) section below.\n\n3. You need at least [Python 3.10](https:\u002F\u002Fwww.python.org\u002Fdownloads\u002F) installed.\n\n\nIf you are on Windows, we recommend to run Magentic-UI inside [WSL2](https:\u002F\u002Fdocs.microsoft.com\u002Fen-us\u002Fwindows\u002Fwsl\u002Finstall) (Windows Subsystem for Linux) for correct Docker and file path compatibility.\n\n\n\n### PyPI Installation\n\nMagentic-UI is available on PyPI. We recommend using a virtual environment to avoid conflicts with other packages.\n\n```bash\npython3 -m venv .venv\nsource .venv\u002Fbin\u002Factivate\npip install magentic-ui\n```\n\nAlternatively, if you use [`uv`](https:\u002F\u002Fdocs.astral.sh\u002Fuv\u002Fgetting-started\u002Finstallation\u002F) for dependency management, you can install Magentic-UI with:\n\n```bash\nuv venv --python=3.12 .venv\n. .venv\u002Fbin\u002Factivate\nuv pip install magentic-ui\n```\n\n\n### Running Magentic-UI\n\nTo run Magentic-UI, make sure that Docker is running, then run the following command:\n\n```bash\nmagentic-ui --port 8081\n```\n\n>**Note**: Running this command for the first time will pull two docker images required for the Magentic-UI agents. If you encounter problems, you can build them directly with the following command:\n```bash\ncd docker\nsh build-all.sh\n```\n\nIf you face issues with Docker, please refer to the [TROUBLESHOOTING.md](TROUBLESHOOTING.md) document.\n\nOnce the server is running, you can access the UI at \u003Chttp:\u002F\u002Flocalhost:8081>.\n\n\n\n### Fara-7B\n\n1) First install magentic-ui with the fara extras:\n\n```bash\npython3 -m venv .venv\nsource .venv\u002Fbin\u002Factivate\npip install magentic-ui[fara]\n```\n\n2) In a seperate process, serve the Fara-7B model using vLLM:\n\n```bash\nvllm serve \"microsoft\u002FFara-7B\" --port 5000 --dtype auto \n```\n\n3) First create a `fara_config.yaml` file with the following content:\n\n```yaml\nmodel_config_local_surfer: &client_surfer\n  provider: OpenAIChatCompletionClient\n  config:\n    model: \"microsoft\u002FFara-7B\"\n    base_url: http:\u002F\u002Flocalhost:5000\u002Fv1\n    api_key: not-needed\n    model_info:\n      vision: true\n      function_calling: true\n      json_output: false\n      family: \"unknown\" \n      structured_output: false\n      multiple_system_messages: false\n\norchestrator_client: *client_surfer\ncoder_client: *client_surfer\nweb_surfer_client: *client_surfer\nfile_surfer_client: *client_surfer\naction_guard_client: *client_surfer\nmodel_client: *client_surfer\n```\nNote: if you are hosting vLLM on a different port or host, change the `base_url` accordingly.\n\n\nThen launch Magentic-UI with the fara agent:\n\n```bash\nmagentic-ui --fara --port 8081 --config fara_config.yaml \n```\n\nFinally, navigate to \u003Chttp:\u002F\u002Flocalhost:8081> to access the interface!\n\n### Configuration\n\n#### Model Client Configuration\n\nIf you want to use a different OpenAI key, or if you want to configure use with Azure OpenAI or Ollama, you can do so inside the UI by navigating to settings (top right icon) and changing model configuration. Another option is to pass a yaml config file when you start Magentic-UI which will override any settings in the UI:\n\n```bash\nmagentic-ui --port 8081 --config config.yaml\n```\n\nWhere the `config.yaml` should look as follows with an AutoGen model client configuration:\n\n```yaml\ngpt4o_client: &gpt4o_client\n    provider: OpenAIChatCompletionClient\n    config:\n      model: gpt-4o-2024-08-06\n      api_key: null\n      base_url: null\n      max_retries: 5\n\norchestrator_client: *gpt4o_client\ncoder_client: *gpt4o_client\nweb_surfer_client: *gpt4o_client\nfile_surfer_client: *gpt4o_client\naction_guard_client: *gpt4o_client\nplan_learning_client: *gpt4o_client\n```\nYou can change the client for each of the agents using the config file and use AzureOpenAI (`AzureOpenAIChatCompletionClient`), Ollama and other clients.\n\n#### MCP Server Configuration\n\nYou can also extend Magentic-UI's capabilities by adding custom \"McpAgents\" to the multi-agent team. Each McpAgent can have access to one or more MCP Servers. You can specify these agents via the `mcp_agent_configs` parameter in your `config.yaml`.\n\nFor example, here's an agent called \"airbnb_surfer\" that has access to the OpenBnb MCP Server running locally via Stdio.\n\n```yaml\nmcp_agent_configs:\n  - name: airbnb_surfer\n    description: \"The airbnb_surfer has direct access to AirBnB.\"\n    model_client: \n      provider: OpenAIChatCompletionClient\n      config:\n        model: gpt-4.1-2025-04-14\n      max_retries: 10\n    system_message: |-\n      You are AirBnb Surfer, a helpful digital assistant that can help users acces AirBnB.\n\n      You have access to a suite of tools provided by the AirBnB API. Use those tools to satisfy the users requests.\n    reflect_on_tool_use: false\n    mcp_servers:\n      - server_name: AirBnB\n        server_params:\n          type: StdioServerParams\n          command: npx\n          args:\n            - -y\n            - \"@openbnb\u002Fmcp-server-airbnb\"\n            - --ignore-robots-txt\n```\n\nUnder the hood, each `McpAgent` is just a `autogen_agentchat.agents.AssistantAgent` with the set of MCP Servers exposed as an `AggregateMcpWorkbench` which is simply a named collection of `autogen_ext.tools.mcp.McpWorkbench` objects (one per MCP Server).\n\nCurrently the supported MCP Server types are `autogen_ext.tools.mcp.StdioServerParams` and `autogen_ext.tools.mcp.SseServerParams`.\n\n### Building Magentic-UI from source\n\nThis step is primarily for users seeking to make modifications to the code, are having trouble with the pypi installation or want the latest code before a pypi version release.\n\n#### 1. Make sure the above prerequisites are installed, and that Docker is running.\n\n#### 2. Clone the repository to your local machine:\n\n```bash\ngit clone https:\u002F\u002Fgithub.com\u002Fmicrosoft\u002Fmagentic-ui.git\ncd magentic-ui\n```\n\n#### 3. Install Magentic-UI's dependencies with uv or your favorite package manager:\n\n```bash\n# install uv through https:\u002F\u002Fdocs.astral.sh\u002Fuv\u002Fgetting-started\u002Finstallation\u002F\nuv venv --python=3.12 .venv\nuv sync --all-extras\nsource .venv\u002Fbin\u002Factivate\n```\n\n#### 4. Build the frontend:\n\nFirst make sure to install node:\n\n```bash\n# install nvm to install node\ncurl -o- https:\u002F\u002Fraw.githubusercontent.com\u002Fnvm-sh\u002Fnvm\u002Fv0.40.1\u002Finstall.sh | bash\nnvm install node\n```\n\nThen install the frontend:\n\n```bash\ncd frontend\nnpm install -g gatsby-cli\nnpm install --global yarn\nyarn install\nyarn build\n```\n\n#### 5. Run Magentic-UI, as usual.\n\n```bash\nmagentic-ui --port 8081\n```\n\n\n#### Running the UI from source\n\nIf you are making changes to the source code of the UI, you can run the frontend in development mode so that it will automatically update when you make changes for faster development.\n\n1. Open a separate terminal and change directory to the frontend\n\n```bash\ncd frontend\n```\n\n2. Create a `.env.development` file.\n\n```bash\ncp .env.default .env.development\n```\n\n3. Launch frontend server\n\n```bash\nnpm run start\n```\n\n4. Then run the UI:\n\n```bash\nmagentic-ui --port 8081\n```\n\nThe frontend from source will be available at \u003Chttp:\u002F\u002Flocalhost:8000>, and the compiled frontend will be available at \u003Chttp:\u002F\u002Flocalhost:8081>.\n\n\n\n\n## Troubleshooting\n\n\nIf you were unable to get Magentic-UI running, do not worry! The first step is to make sure you have followed the steps outlined above, particularly with the [pre-requisites](#pre-requisites).\n\nFor common issues and their solutions, please refer to the [TROUBLESHOOTING.md](TROUBLESHOOTING.md) file in this repository. If you do not see your problem there, please open a `GitHub Issue`. \n\n## Contributing\n\nThis project welcomes contributions and suggestions. For information about contributing to Magentic-UI, please see our [CONTRIBUTING.md](CONTRIBUTING.md) guide, which includes current issues to be resolved and other forms of contributing.\n\nThis project has adopted the [Microsoft Open Source Code of Conduct](https:\u002F\u002Fopensource.microsoft.com\u002Fcodeofconduct\u002F). For more information, see the [Code of Conduct FAQ](https:\u002F\u002Fopensource.microsoft.com\u002Fcodeofconduct\u002Ffaq\u002F) or contact [opencode@microsoft.com](mailto:opencode@microsoft.com) with any additional questions or comments.\n\n\n## Citation\n\nPlease cite our paper if you use our work in your research:\n\n```\n@article{mozannar2025magentic,\n  title={Magentic-UI: Towards Human-in-the-loop Agentic Systems},\n  author={Mozannar, Hussein and Bansal, Gagan and Tan, Cheng and Fourney, Adam and Dibia, Victor and Chen, Jingya and Gerrits, Jack and Payne, Tyler and Maldaner, Matheus Kunzler and Grunde-McLaughlin, Madeleine and others},\n  journal={arXiv preprint arXiv:2507.22358},\n  year={2025}\n}\n```\n\n## License\n\nMicrosoft, and any contributors, grant you a license to any code in the repository under the [MIT License](https:\u002F\u002Fopensource.org\u002Flicenses\u002FMIT). See the [LICENSE](LICENSE) file.\n\nMicrosoft, Windows, Microsoft Azure, and\u002For other Microsoft products and services referenced in the documentation\nmay be either trademarks or registered trademarks of Microsoft in the United States and\u002For other countries.\nThe licenses for this project do not grant you rights to use any Microsoft names, logos, or trademarks.\nMicrosoft's general trademark guidelines can be found at \u003Chttp:\u002F\u002Fgo.microsoft.com\u002Ffwlink\u002F?LinkID=254653>.\n\nAny use of third-party trademarks or logos are subject to those third-party's policies.\n\nPrivacy information can be found at \u003Chttps:\u002F\u002Fgo.microsoft.com\u002Ffwlink\u002F?LinkId=521839>\n\nMicrosoft and any contributors reserve all other rights, whether under their respective copyrights, patents, or trademarks, whether by implication, estoppel, or otherwise.\n\n","\u003Cdiv align=\"center\">\n\u003Cimg src=\"docs\u002Fimg\u002Fmagui-readme-logo.svg\" alt=\"Magentic-UI Logo\">\n\n\n_在保持控制的同时自动化您的Web任务_\n\n[![image](https:\u002F\u002Fimg.shields.io\u002Fpypi\u002Fv\u002Fmagentic_ui.svg)](https:\u002F\u002Fpypi.python.org\u002Fpypi\u002Fmagentic_ui)\n[![image](https:\u002F\u002Fimg.shields.io\u002Fpypi\u002Fl\u002Fmagentic_ui.svg)](https:\u002F\u002Fpypi.python.org\u002Fpypi\u002Fmagentic_ui)\n![Python版本](https:\u002F\u002Fimg.shields.io\u002Fbadge\u002Fpython-3.10%20%7C%203.11%20%7C%203.12%20%7C%203.13-blue)\n[![arXiv](https:\u002F\u002Fimg.shields.io\u002Fbadge\u002FarXiv-2507.22358-b31b1b.svg)](https:\u002F\u002Farxiv.org\u002Fabs\u002F2507.22358)\n\n\u003C\u002Fdiv>\n\n---\n\nMagentic-UI是一个以人类为中心的**研究原型**AI智能体，能够解决复杂的Web和编码任务，这些任务可能需要监控。与其他黑盒智能体不同，该系统会在执行前展示其计划，允许您指导其行动，并在浏览网站、执行代码和分析文件时为敏感操作请求批准。\n*请查看[演示部分](#demos)，获取您可以完成的任务灵感。*\n\n## ✨ 最新动态\n\n微软最新的智能体模型[Fara-7B](https:\u002F\u002Fwww.microsoft.com\u002Fen-us\u002Fresearch\u002Fblog\u002Ffara-7b-an-efficient-agentic-model-for-computer-use\u002F)现已集成到Magentic-UI中，如何启动请参阅\u003Ca href=\"#fara-7b\">Fara-7B指南\u003C\u002Fa>。\n\n\n- **“告诉我何时”**：自动化需要访问Web或API的监控任务和可重复的工作流程，时间跨度从几分钟到几天不等。*更多信息请见[这里](https:\u002F\u002Fwww.microsoft.com\u002Fen-us\u002Fresearch\u002Fblog\u002Ftell-me-when-building-agents-that-can-wait-monitor-and-act\u002F)。*\n- **文件上传支持**：通过UI上传任何文件进行分析或修改\n- **MCP智能体**：使用您喜爱的MCP服务器扩展功能\n- **更简便的安装**：我们已将Docker容器上传至GHCR，因此您不再需要构建任何容器！现在安装时间大大缩短了。\n\n\n## 🚀 快速入门\n\n以下是如何开始使用Magentic-UI的方法：\n\n```bash\n# 1. 设置环境\npython3 -m venv .venv\nsource .venv\u002Fbin\u002Factivate\npip install magentic-ui --upgrade\n\n# 2. 设置您的API密钥\nexport OPENAI_API_KEY=\"your-api-key-here\"\n\n# 3. 启动Magentic-UI\nmagentic-ui --port 8081\n```\n\n然后在浏览器中打开\u003Chttp:\u002F\u002Flocalhost:8081>即可与Magentic-UI互动！\n\n> **先决条件**：需要Docker和Python 3.10+。Windows用户应使用WSL2。更多详细信息请参阅[详细安装说明](#️-installation)。\n\n## 其他使用方式\n\n**无需Docker**（功能受限：无法执行代码）：\n```bash\nmagentic-ui --run-without-docker --port 8081\n```\n\n**命令行界面**：\n```bash\nmagentic-cli --work-dir PATH\u002FTO\u002FSTORE\u002FDATA\n```\n\n**自定义LLM客户端**：\n```bash\n# Azure\npip install magentic-ui[azure]\n\n# Ollama（本地模型）\npip install magentic-ui[ollama]\n```\n\n随后您可以将配置文件传递给`magentic-ui`命令（\u003Ca href=\"#model-client-configuration\">客户端配置\u003C\u002Fa>)，或者在UI设置中更改模型客户端。\n\n有关安装的更多详细信息，请阅读\u003Ca href=\"#️-installation\">🛠️ 安装\u003C\u002Fa>部分。如遇常见安装问题及解决方案，请参阅[故障排除文档](TROUBLESHOOTING.md)。高级使用说明可通过命令`magentic-ui --help`查看。\n\n## 快速导航：\n\u003Cp align=\"center\">\n  \u003Ca href=\"#demos\">🎬 演示\u003C\u002Fa> &nbsp;|&nbsp;\n  \u003Ca href=\"#how-it-works\">🟪 工作原理\u003C\u002Fa> &nbsp;|&nbsp;\n  \u003Ca href=\"#installation\">🛠️ 安装\u003C\u002Fa> &nbsp;|&nbsp;\n  \u003Ca href=\"#troubleshooting\">⚠️ 故障排除\u003C\u002Fa> &nbsp;|&nbsp; \n  \u003Ca href=\"#contributing\">🤝 贡献\u003C\u002Fa> &nbsp;|&nbsp;\n  \u003Ca href=\"#license\">📄 许可证\u003C\u002Fa>\n\u003C\u002Fp>\n\n---\n\n## 演示\n\n\u003Ctable>\n\u003Ctr>\n\u003Ctd width=\"33%\" align=\"center\">\n\n**🍕 披萨订购**  \n*人机协作的Web自动化*\n\n\u003Cvideo src=\"https:\u002F\u002Fgithub.com\u002Fuser-attachments\u002Fassets\u002Fdc95cf5f-c4b4-4fe0-b708-158ff071e5a9\" width=\"100%\" style=\"max-height: 300px;\">\n\u003C\u002Fvideo>\n\n\u003C\u002Ftd>\n\u003Ctd width=\"33%\" align=\"center\">\n\n**🏠 Airbnb价格分析**  \n*MCP智能体集成*\n\n\u003Cvideo src=\"https:\u002F\u002Fgithub.com\u002Fuser-attachments\u002Fassets\u002Fc19ed8c2-e06f-43b7-bee3-5e2ffc4c5e02\" width=\"100%\" style=\"max-height: 300px;\">\n\u003C\u002Fvideo>\n\n\u003C\u002Ftd>\n\u003Ctd width=\"33%\" align=\"center\">\n\n**⭐ 星星监控**  \n*长期运行的监控任务*\n\n\u003Cvideo src=\"https:\u002F\u002Fgithub.com\u002Fuser-attachments\u002Fassets\u002Fd2a463ca-7a94-4414-932d-a69f30fff63b\" width=\"100%\" style=\"max-height: 300px;\">\n\u003C\u002Fvideo>\n\n\u003C\u002Ftd>\n\u003C\u002Ftr>\n\u003C\u002Ftable>\n\n\n\n## 工作原理\n\u003Cp align=\"center\">\n  \u003Cimg src=\"https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002Fmicrosoft_magentic-ui_readme_05d495839733.png\" alt=\"Magentic-UI\" height=\"400\">\n\u003C\u002Fp>\n\nMagentic-UI特别适用于需要在Web上执行操作的任务（例如填写表单、定制食物订单）、深入导航未被搜索引擎索引的网站（例如筛选航班、从个人网站查找链接），或需要Web导航和代码执行的任务（例如根据在线数据生成图表）。\n\nMagentic-UI与其他浏览器使用工具的不同之处在于其透明且可控的界面，允许高效的人机协作。Magentic-UI基于[AutoGen](https:\u002F\u002Fgithub.com\u002Fmicrosoft\u002Fautogen)构建，提供了一个研究人机交互和试验Web智能体的平台。其主要特性包括：\n\n- 🧑‍🤝‍🧑 **协同规划**：通过聊天和计划编辑器共同创建并批准逐步计划。\n- 🤝 **协同任务执行**：直接通过网页浏览器或聊天中断并指导任务执行。Magentic-UI还可在需要时请求澄清和帮助。\n- 🛡️ **动作防护**：敏感操作仅在获得用户明确批准后才会执行。\n- 🧠 **计划学习与检索**：从之前的运行中学习，以改进未来的任务自动化，并将其保存在计划库中。未来任务中可自动或手动检索已保存的计划。\n- 🔀 **并行任务执行**：您可以同时运行多个任务，会话状态指示器会告知您Magentic-UI何时需要您的输入或已完成任务。\n\n\u003Cdiv align=\"center\">\n  \u003Ca href=\"https:\u002F\u002Fwww.youtube.com\u002Fwatch?v=wOs-5SR8xOc\" target=\"_blank\">\n    \u003Cimg src=\"https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002Fmicrosoft_magentic-ui_readme_433e1582831b.jpg\" alt=\"观看演示视频\" width=\"600\"\u002F>\n  \u003C\u002Fa>\n  \u003Cbr>\n  ▶️ \u003Cem> 点击观看视频，了解更多关于Magentic-UI的信息 \u003C\u002Fem>\n\u003C\u002Fdiv>\n\n### 自主导航评估\n\n为评估其自主能力，Magentic-UI 已在使用 o4-mini 模型时，针对多个基准测试进行了测试：[GAIA](https:\u002F\u002Fhuggingface.co\u002Fdatasets\u002Fgaia-benchmark\u002FGAIA) 测试集（42.52%），该测试集从推理、工具使用和网络交互任务等方面评估通用 AI 助手；[AssistantBench](https:\u002F\u002Fhuggingface.co\u002FAssistantBench) 测试集（27.60%），专注于真实且耗时的网络任务；[WebVoyager](https:\u002F\u002Fgithub.com\u002FMinorJerry\u002FWebVoyager)（82.2%），用于衡量真实场景下的端到端网页导航能力；以及 [WebGames](https:\u002F\u002Fwebgames.convergence.ai\u002F)（45.5%），通过互动挑战来评估通用网页浏览代理。\n\n如需复现这些实验结果，请参阅以下[说明](experiments\u002Feval\u002FREADME.md)。\n\n\n\n如果您有兴趣进一步了解，请查阅我们的[技术报告](https:\u002F\u002Fwww.microsoft.com\u002Fen-us\u002Fresearch\u002Fwp-content\u002Fuploads\u002F2025\u002F07\u002Fmagentic-ui-report.pdf)和[博客文章](https:\u002F\u002Fwww.microsoft.com\u002Fen-us\u002Fresearch\u002Fblog\u002Fmagentic-ui-an-experimental-human-centered-web-agent\u002F).\n\n\n## 安装\n### 先决条件\n\n**注意**：如果您使用的是 Windows，我们强烈建议您使用 [WSL2](https:\u002F\u002Fdocs.microsoft.com\u002Fen-us\u002Fwindows\u002Fwsl\u002Finstall)（Windows Subsystem for Linux）。\n\n1. 如果您在 **Windows** 或 **Mac** 上运行，应使用 [Docker Desktop](https:\u002F\u002Fwww.docker.com\u002Fproducts\u002Fdocker-desktop\u002F)；如果在 WSL2 中运行，则可以直接在 WSL 内安装 Docker，具体请参考 [WSL2 中安装 Docker 的指南](https:\u002F\u002Fgist.github.com\u002Fdehsilvadeveloper\u002Fc3bdf0f4cdcc5c177e2fe9be671820c7)。如果您在 **Linux** 上运行，则应使用 [Docker Engine](https:\u002F\u002Fdocs.docker.com\u002Fengine\u002Finstall\u002F)。\n\n若使用 Docker Desktop，请确保其已配置为使用 WSL2：\n    - 前往“设置”>“资源”>“WSL 集成”\n    - 启用与您的开发发行版的集成。有关此步骤的更详细说明，请参阅 [此处](https:\u002F\u002Fdocs.microsoft.com\u002Fen-us\u002Fwindows\u002Fwsl\u002Ftutorials\u002Fwsl-containers)。\n\n\n\n2. 在安装过程中，您需要设置 `OPENAI_API_KEY`。如需使用其他模型，请参阅下方的[模型客户端配置](#model-client-configuration)部分。\n\n3. 您至少需要安装 [Python 3.10](https:\u002F\u002Fwww.python.org\u002Fdownloads\u002F)。\n\n\n如果您使用的是 Windows，我们建议将 Magentic-UI 运行在 [WSL2](https:\u002F\u002Fdocs.microsoft.com\u002Fen-us\u002Fwindows\u002Fwsl\u002Finstall)（Windows 子系统 for Linux）中，以确保 Docker 和文件路径的正确兼容性。\n\n\n\n### PyPI 安装\n\nMagentic-UI 已在 PyPI 上发布。我们建议使用虚拟环境，以避免与其他软件包发生冲突。\n\n```bash\npython3 -m venv .venv\nsource .venv\u002Fbin\u002Factivate\npip install magentic-ui\n```\n\n或者，如果您使用 [`uv`](https:\u002F\u002Fdocs.astral.sh\u002Fuv\u002Fgetting-started\u002Finstallation\u002F) 进行依赖管理，可以按以下方式安装 Magentic-UI：\n\n```bash\nuv venv --python=3.12 .venv\n. .venv\u002Fbin\u002Factivate\nuv pip install magentic-ui\n```\n\n\n### 运行 Magentic-UI\n\n要运行 Magentic-UI，请确保 Docker 已启动，然后执行以下命令：\n\n```bash\nmagentic-ui --port 8081\n```\n\n>**注意**：首次运行此命令时，系统将拉取 Magentic-UI 代理所需的两个 Docker 镜像。如果遇到问题，您可以直接使用以下命令构建它们：\n```bash\ncd docker\nsh build-all.sh\n```\n\n如果在使用 Docker 时遇到问题，请参阅 [TROUBLESHOOTING.md](TROUBLESHOOTING.md) 文档。\n\n服务器启动后，您可以通过 \u003Chttp:\u002F\u002Flocalhost:8081> 访问 UI 界面。\n\n\n\n### Fara-7B\n\n1) 首先使用 fara 扩展安装 Magentic-UI：\n\n```bash\npython3 -m venv .venv\nsource .venv\u002Fbin\u002Factivate\npip install magentic-ui[fara]\n```\n\n2) 在另一个进程中，使用 vLLM 提供 Fara-7B 模型服务：\n\n```bash\nvllm serve \"microsoft\u002FFara-7B\" --port 5000 --dtype auto \n```\n\n3) 首先创建一个名为 `fara_config.yaml` 的配置文件，内容如下：\n\n```yaml\nmodel_config_local_surfer: &client_surfer\n  provider: OpenAIChatCompletionClient\n  config:\n    model: \"microsoft\u002FFara-7B\"\n    base_url: http:\u002F\u002Flocalhost:5000\u002Fv1\n    api_key: not-needed\n    model_info:\n      vision: true\n      function_calling: true\n      json_output: false\n      family: \"unknown\" \n      structured_output: false\n      multiple_system_messages: false\n\norchestrator_client: *client_surfer\ncoder_client: *client_surfer\nweb_surfer_client: *client_surfer\nfile_surfer_client: *client_surfer\naction_guard_client: *client_surfer\nmodel_client: *client_surfer\n```\n注意：如果您在不同的端口或主机上托管 vLLM，请相应地更改 `base_url`。\n\n\n然后使用 Fara 代理启动 Magentic-UI：\n\n```bash\nmagentic-ui --fara --port 8081 --config fara_config.yaml \n```\n\n最后，访问 \u003Chttp:\u002F\u002Flocalhost:8081> 即可进入界面！\n\n### 配置\n\n#### 模型客户端配置\n\n如果您想使用不同的 OpenAI 密钥，或者希望配置与 Azure OpenAI 或 Ollama 的集成，您可以在 UI 中通过导航到设置（右上角图标）并更改模型配置来完成。另一种方法是在启动 Magentic-UI 时传递一个 YAML 配置文件，该文件将覆盖 UI 中的所有设置：\n\n```bash\nmagentic-ui --port 8081 --config config.yaml\n```\n\n其中 `config.yaml` 文件应如下所示，包含 AutoGen 模型客户端配置：\n\n```yaml\ngpt4o_client: &gpt4o_client\n    provider: OpenAIChatCompletionClient\n    config:\n      model: gpt-4o-2024-08-06\n      api_key: null\n      base_url: null\n      max_retries: 5\n\norchestrator_client: *gpt4o_client\ncoder_client: *gpt4o_client\nweb_surfer_client: *gpt4o_client\nfile_surfer_client: *gpt4o_client\naction_guard_client: *gpt4o_client\nplan_learning_client: *gpt4o_client\n```\n您可以使用配置文件为每个代理更改客户端，并使用 AzureOpenAI (`AzureOpenAIChatCompletionClient`)、Ollama 等其他客户端。\n\n#### MCP 服务器配置\n\n您还可以通过向多智能体团队添加自定义的“McpAgents”来扩展 Magentic-UI 的功能。每个 McpAgent 可以访问一个或多个 MCP 服务器。您可以通过 `config.yaml` 文件中的 `mcp_agent_configs` 参数指定这些代理。\n\n例如，以下是一个名为“airbnb_surfer”的代理，它可以通过 Stdio 在本地运行的 OpenBnb MCP 服务器进行访问：\n\n```yaml\nmcp_agent_configs:\n  - name: airbnb_surfer\n    description: \"The airbnb_surfer has direct access to AirBnB.\"\n    model_client: \n      provider: OpenAIChatCompletionClient\n      config:\n        model: gpt-4.1-2025-04-14\n      max_retries: 10\n    system_message: |-\n      You are AirBnb Surfer, a helpful digital assistant that can help users acces AirBnB.\n\n      You have access to a suite of tools provided by the AirBnB API. Use those tools to satisfy the users requests.\n    reflect_on_tool_use: false\n    mcp_servers:\n      - server_name: AirBnB\n        server_params:\n          type: StdioServerParams\n          command: npx\n          args:\n            - -y\n            - \"@openbnb\u002Fmcp-server-airbnb\"\n            - --ignore-robots-txt\n```\n\n在底层，每个 `McpAgent` 实际上只是一个 `autogen_agentchat.agents.AssistantAgent`，其 MCP 服务器集合被暴露为一个 `AggregateMcpWorkbench`，这只是一个命名的 `autogen_ext.tools.mcp.McpWorkbench` 对象集合（每个 MCP 服务器对应一个）。\n\n目前支持的 MCP 服务器类型包括 `autogen_ext.tools.mcp.StdioServerParams` 和 `autogen_ext.tools.mcp.SseServerParams`。\n\n### 从源代码构建 Magentic-UI\n\n此步骤主要适用于希望对代码进行修改、在 PyPI 安装过程中遇到问题，或希望在 PyPI 版本发布之前获取最新代码的用户。\n\n#### 1. 确保已安装上述先决条件，并且 Docker 正在运行。\n\n#### 2. 将仓库克隆到您的本地机器：\n\n```bash\ngit clone https:\u002F\u002Fgithub.com\u002Fmicrosoft\u002Fmagentic-ui.git\ncd magentic-ui\n```\n\n#### 3. 使用 uv 或您喜欢的包管理器安装 Magentic-UI 的依赖项：\n\n```bash\n# 通过 https:\u002F\u002Fdocs.astral.sh\u002Fuv\u002Fgetting-started\u002Finstallation\u002F 安装 uv\nuv venv --python=3.12 .venv\nuv sync --all-extras\nsource .venv\u002Fbin\u002Factivate\n```\n\n#### 4. 构建前端：\n\n首先确保已安装 Node.js：\n\n```bash\n# 安装 nvm 来安装 Node.js\ncurl -o- https:\u002F\u002Fraw.githubusercontent.com\u002Fnvm-sh\u002Fnvm\u002Fv0.40.1\u002Finstall.sh | bash\nnvm install node\n```\n\n然后安装前端：\n\n```bash\ncd frontend\nnpm install -g gatsby-cli\nnpm install --global yarn\nyarn install\nyarn build\n```\n\n#### 5. 像往常一样运行 Magentic-UI：\n\n```bash\nmagentic-ui --port 8081\n```\n\n\n#### 从源代码运行 UI\n\n如果您正在对 UI 的源代码进行修改，可以以开发模式运行前端，这样在您进行更改时，前端会自动更新，从而加快开发速度。\n\n1. 打开另一个终端，并切换到前端目录：\n\n```bash\ncd frontend\n```\n\n2. 创建 `.env.development` 文件。\n\n```bash\ncp .env.default .env.development\n```\n\n3. 启动前端服务器：\n\n```bash\nnpm run start\n```\n\n4. 然后运行 UI：\n\n```bash\nmagentic-ui --port 8081\n```\n\n来自源代码的前端将在 \u003Chttp:\u002F\u002Flocalhost:8000> 提供服务，而编译后的前端将在 \u003Chttp:\u002F\u002Flocalhost:8081> 提供服务。\n\n\n\n\n## 故障排除\n\n\n如果您未能成功运行 Magentic-UI，请不要担心！第一步是确保您已按照上述步骤操作，尤其是 [先决条件](#pre-requisites)。\n\n有关常见问题及其解决方案，请参阅此仓库中的 [TROUBLESHOOTING.md](TROUBLESHOOTING.md) 文件。如果您未在此处找到您的问题，请提交一个 `GitHub Issue`。\n\n## 贡献\n\n本项目欢迎贡献和建议。有关如何为 Magentic-UI 做出贡献的信息，请参阅我们的 [CONTRIBUTING.md](CONTRIBUTING.md) 指南，其中包含当前待解决的问题和其他贡献方式。\n\n本项目已采用 [Microsoft 开源行为准则](https:\u002F\u002Fopensource.microsoft.com\u002Fcodeofconduct\u002F)。如需更多信息，请参阅 [行为准则常见问题解答](https:\u002F\u002Fopensource.microsoft.com\u002Fcodeofconduct\u002Ffaq\u002F) 或发送电子邮件至 [opencode@microsoft.com](mailto:opencode@microsoft.com) 以获取更多疑问或意见。\n\n\n## 引用\n\n如果您在研究中使用了我们的工作，请引用我们的论文：\n\n```\n@article{mozannar2025magentic,\n  title={Magentic-UI: Towards Human-in-the-loop Agentic Systems},\n  author={Mozannar, Hussein and Bansal, Gagan and Tan, Cheng and Fourney, Adam and Dibia, Victor and Chen, Jingya and Gerrits, Jack and Payne, Tyler and Maldaner, Matheus Kunzler and Grunde-McLaughlin, Madeleine and others},\n  journal={arXiv preprint arXiv:2507.22358},\n  year={2025}\n}\n```\n\n## 许可证\n\n微软及任何贡献者根据 [MIT 许可证](https:\u002F\u002Fopensource.org\u002Flicenses\u002FMIT) 授予您对仓库中任何代码的使用许可。请参阅 [LICENSE](LICENSE) 文件。\n\n文档中提及的 Microsoft、Windows、Microsoft Azure 及其他 Microsoft 产品和服务可能是 Microsoft 在美国或其他国家的商标或注册商标。\n本项目的许可证并不授予您使用任何 Microsoft 名称、徽标或商标的权利。\nMicrosoft 的一般商标指南可在 \u003Chttp:\u002F\u002Fgo.microsoft.com\u002Ffwlink\u002F?LinkID=254653> 找到。\n\n任何第三方商标或徽标的使用均受其各自政策的约束。\n\n隐私信息可在 \u003Chttps:\u002F\u002Fgo.microsoft.com\u002Ffwlink\u002F?LinkId=521839> 查找。\n\n微软及任何贡献者保留所有其他权利，无论这些权利是否基于各自的版权、专利或商标，无论是通过暗示、禁止反言或其他方式。","# Magentic-UI 快速上手指南\n\nMagentic-UI 是一个以人为中心的 AI 代理研究原型，旨在自动化复杂的网页操作和编程任务。与黑盒代理不同，它会在执行前展示计划，允许用户引导操作，并在敏感操作时请求批准，实现“人在回路”的控制体验。\n\n## 环境准备\n\n在开始之前，请确保您的系统满足以下要求：\n\n*   **操作系统**：\n    *   **Linux \u002F macOS**：原生支持。\n    *   **Windows**：强烈建议使用 **WSL2** (Windows Subsystem for Linux) 以获得最佳的 Docker 兼容性和文件路径支持。\n*   **Python 版本**：3.10, 3.11, 3.12 或 3.13。\n*   **核心依赖**：必须安装并运行 **Docker**。\n    *   Windows\u002FMac 用户推荐安装 [Docker Desktop](https:\u002F\u002Fwww.docker.com\u002Fproducts\u002Fdocker-desktop\u002F)。\n    *   Linux 用户推荐安装 [Docker Engine](https:\u002F\u002Fdocs.docker.com\u002Fengine\u002Finstall\u002F)。\n    *   *注意*：若使用 Docker Desktop，请在设置中启用 WSL2 集成 (Settings > Resources > WSL Integration)。\n*   **API Key**：默认需要 OpenAI API Key (`OPENAI_API_KEY`)。如需使用 Azure OpenAI 或本地模型 (Ollama)，可在后续配置中调整。\n\n## 安装步骤\n\n推荐使用 Python 虚拟环境进行安装，以避免依赖冲突。\n\n### 1. 创建并激活虚拟环境\n\n```bash\npython3 -m venv .venv\nsource .venv\u002Fbin\u002Factivate\n```\n\n*(Windows PowerShell 用户使用 `.venv\\Scripts\\Activate.ps1`)*\n\n### 2. 安装 Magentic-UI\n\n从 PyPI 安装最新稳定版：\n\n```bash\npip install magentic-ui --upgrade\n```\n\n> **提示**：如果您使用 `uv` 进行包管理，可以使用以下命令加速安装：\n> ```bash\n> uv venv --python=3.12 .venv\n> source .venv\u002Fbin\u002Factivate\n> uv pip install magentic-ui\n> ```\n\n### 3. 配置 API Key\n\n设置您的 OpenAI API Key 环境变量：\n\n```bash\nexport OPENAI_API_KEY=\"your-api-key-here\"\n```\n\n## 基本使用\n\n### 启动服务\n\n确保 Docker 正在运行，然后执行以下命令启动 Magentic-UI 服务器：\n\n```bash\nmagentic-ui --port 8081\n```\n\n> **注意**：首次运行时，系统会自动拉取所需的 Docker 镜像，这可能需要几分钟时间。如果拉取失败，可手动进入 `docker` 目录运行 `sh build-all.sh` 构建镜像。\n\n### 访问界面\n\n在浏览器中打开以下地址即可开始交互：\n\n\u003Chttp:\u002F\u002Flocalhost:8081>\n\n### 核心功能概览\n\n进入界面后，您可以体验以下核心功能：\n*   **协同规划 (Co-Planning)**：通过聊天或计划编辑器，与 AI 共同制定并审批逐步执行计划。\n*   **协同任务 (Co-Tasking)**：在任务执行过程中随时介入，通过浏览器直接操作或聊天进行指导。\n*   **安全守卫 (Action Guards)**：敏感操作（如支付、删除文件）需经您明确批准后方可执行。\n*   **长期监控**：支持跨分钟至数天的长时间监控任务（\"Tell me When\" 功能）。\n\n### 其他运行模式\n\n*   **无 Docker 模式**（功能受限，不支持代码执行）：\n    ```bash\n    magentic-ui --run-without-docker --port 8081\n    ```\n*   **命令行模式**：\n    ```bash\n    magentic-cli --work-dir PATH\u002FTO\u002FSTORE\u002FDATA\n    ```","某电商运营专员需要每日监控竞品在多个网站上的价格变动、库存状态及促销活动，并在发现异常时自动截图存档并发送警报。\n\n### 没有 magentic-ui 时\n- **全程黑盒操作**：传统自动化脚本一旦运行就无法干预，若网页结构微调或弹出验证码，任务直接失败且难以察觉。\n- **缺乏敏感操作管控**：脚本可能误执行删除数据或错误下单等高风险操作，用户无法在关键步骤前进行确认。\n- **长周期监控困难**：难以处理跨度数分钟的等待或需隔夜监测的任务，脚本通常因超时中断或缺乏“适时行动”机制而失效。\n- **文件交互繁琐**：分析本地销售报表或上传新配置时，需手动切换上下文，无法在自动化流中直接调用本地文件。\n\n### 使用 magentic-ui 后\n- **透明化执行计划**：magentic-ui 会在行动前展示详细规划，允许用户在每一步引导方向，遇到网页变动时可实时介入修正。\n- **人机协同审批**：涉及下单、提交表单等敏感操作时，系统会自动暂停并请求用户批准，确保操作安全可控。\n- **智能长时监测**：利用\"Tell me When\"功能，轻松设定跨时段监控任务，代理能自主等待、观察并在触发条件满足时立即行动。\n- **无缝文件集成**：直接在界面拖拽上传本地报表进行分析，或让代理修改文件后下载，实现了网页浏览与本地数据的流畅闭环。\n\nmagentic-ui 通过将“黑盒”自动化转变为透明、可控的人机协作模式，让用户在享受高效网页任务自动化的同时，始终掌握最终决策权。","https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002Fmicrosoft_magentic-ui_05d49583.png","microsoft","Microsoft","https:\u002F\u002Foss.gittoolsai.com\u002Favatars\u002Fmicrosoft_4900709c.png","Open source projects and samples from Microsoft",null,"opensource@microsoft.com","OpenAtMicrosoft","https:\u002F\u002Fopensource.microsoft.com","https:\u002F\u002Fgithub.com\u002Fmicrosoft",[83,87,91,95,99,103],{"name":84,"color":85,"percentage":86},"Python","#3572A5",70.4,{"name":88,"color":89,"percentage":90},"TypeScript","#3178c6",26.8,{"name":92,"color":93,"percentage":94},"JavaScript","#f1e05a",1.6,{"name":96,"color":97,"percentage":98},"CSS","#663399",0.8,{"name":100,"color":101,"percentage":102},"Dockerfile","#384d54",0.2,{"name":104,"color":105,"percentage":106},"Shell","#89e051",0.1,9772,973,"2026-04-16T03:55:55","MIT","Linux, macOS, Windows (需通过 WSL2)","未说明",{"notes":114,"python":115,"dependencies":116},"必须安装 Docker（Windows 用户强烈建议使用 WSL2 以确保兼容性和文件路径正确）。默认使用 OpenAI API，若需本地运行微软 Fara-7B 模型，需额外安装 vLLM 并配置 YAML 文件。支持通过 pip 或 uv 安装。首次运行会自动拉取所需的 Docker 镜像。若无 Docker 环境可使用 --run-without-docker 参数启动，但将失去代码执行功能。","3.10, 3.11, 3.12, 3.13",[65,117,118,119],"docker","autogen","vllm (仅用于 Fara-7B 本地部署)",[15,13,14],[122,123,124,118,125,126,127,128],"agents","ai","ai-ux","browser-use","computer-use-agent","ui","cua","2026-03-27T02:49:30.150509","2026-04-17T08:25:18.826395",[132,137,142,147,151,156,161],{"id":133,"question_zh":134,"answer_zh":135,"source_url":136},36438,"安装 magentic-ui 后运行命令提示 'magentic: command not found' 怎么办？","请尝试将 magentic-ui 升级到最新版本。运行命令：`pip install magentic-ui --upgrade`。如果问题仍然存在，请参考项目中的 TROUBLESHOOTING.md 文档获取更多帮助。","https:\u002F\u002Fgithub.com\u002Fmicrosoft\u002Fmagentic-ui\u002Fissues\u002F146",{"id":138,"question_zh":139,"answer_zh":140,"source_url":141},36439,"Docker 已经启动，但运行 magentic-ui 时仍提示 'Docker is not running' 或检测失败如何解决？","这通常是因为 Docker socket 路径未被正确识别。请尝试设置环境变量指向正确的 socket 文件。例如，在终端执行：`export DOCKER_HOST=\"unix:\u002F\u002F$HOME\u002F.docker\u002Frun\u002Fdocker.sock\"`（具体路径可能因系统而异，如 Colima 用户可能是 `$HOME\u002F.colima\u002Fdefault\u002Fdocker.sock`）。设置完成后再次运行 magentic-ui 命令。该解决方案已添加到项目的 TROUBLESHOOTING.md 文档中。","https:\u002F\u002Fgithub.com\u002Fmicrosoft\u002Fmagentic-ui\u002Fissues\u002F81",{"id":143,"question_zh":144,"answer_zh":145,"source_url":146},36440,"使用 Ollama 本地运行时程序崩溃或报错 'does not support tools' 是什么原因？","这是因为您选择的模型（如 gemma3）不支持工具调用（function calling\u002Ftools），而 magentic-ui 依赖此功能。请更换为支持工具调用的模型，例如 `qwen3:32b-fp16`。您可以在 Ollama 库中寻找明确标注支持 tools 或 function calling 的模型。","https:\u002F\u002Fgithub.com\u002Fmicrosoft\u002Fmagentic-ui\u002Fissues\u002F206",{"id":148,"question_zh":149,"answer_zh":150,"source_url":136},36441,"界面响应变慢或长时间使用后卡顿是怎么回事？","随着使用时间增加，代理之间传递的上下文信息（tokens）会不断累积，导致处理速度变慢。建议定期重启 magentic-ui 服务以清除累积的上下文记忆，从而恢复响应速度。目前暂无关闭屏幕显示或直接清理记忆的选项。",{"id":152,"question_zh":153,"answer_zh":154,"source_url":155},36442,"如何添加更多的模型提供商（如 Ollama, OpenRouter 等）？","项目目前已支持 Ollama 和 OpenRouter。如果您想使用这些提供商，请确保安装了包含相应依赖的版本（例如 `pip install magentic-ui[ollama]`），并在配置文件中正确设置 `provider` 和 `host` 参数。具体配置示例可参考相关 Issue 讨论或官方文档。","https:\u002F\u002Fgithub.com\u002Fmicrosoft\u002Fmagentic-ui\u002Fissues\u002F57",{"id":157,"question_zh":158,"answer_zh":159,"source_url":160},36443,"上传图片后代理似乎无法识别或要求重新上传怎么办？","这是一个已知的问题，可能与浏览器缓存、文件大小或特定 MCP 服务器的兼容性有关。建议尝试以下操作：1. 更换浏览器（如从 Chrome 换到 Firefox）；2. 缩小图片尺寸；3. 尝试不同的文件格式（PNG 或 JPG）。如果问题依旧，可能需要检查后端日志或等待后续版本修复。","https:\u002F\u002Fgithub.com\u002Fmicrosoft\u002Fmagentic-ui\u002Fissues\u002F293",{"id":162,"question_zh":163,"answer_zh":164,"source_url":165},36444,"遇到 WebSocket 连接错误 'ECONNREFUSED' 导致连接超时怎么办？","该错误通常表示后端服务未在预期端口运行或防火墙阻止了连接。请确认 magentic-ui 服务已完全启动且无报错退出。检查是否有其他进程占用了相关端口。如果是本地开发环境，尝试重启服务或检查网络配置允许 localhost 通信。","https:\u002F\u002Fgithub.com\u002Fmicrosoft\u002Fmagentic-ui\u002Fissues\u002F86",[167,172,177,182,187,192,197,202,207],{"id":168,"version":169,"summary_zh":170,"released_at":171},289289,"v0.1.6","微软最新的智能体模型 [Fara-7B](https:\u002F\u002Fwww.microsoft.com\u002Fen-us\u002Fresearch\u002Fblog\u002Ffara-7b-an-efficient-agentic-model-for-computer-use\u002F) 现已集成到 Magentic-UI 中：\n\n1) 首先安装带有 Fara 附加组件的 Magentic-UI：\n\n```bash\npython3 -m venv .venv\nsource .venv\u002Fbin\u002Factivate\npip install magentic-ui[fara]\n```\n\n2) 在另一个进程中，使用 vLLM 提供 Fara-7B 模型服务：\n\n```bash\nvllm serve \"microsoft\u002FFara-7B\" --port 5000 --dtype auto\n```\n\n3) 首先创建一个名为 `fara_config.yaml` 的配置文件，内容如下：\n\n```yaml\nmodel_config_local_surfer: &client_surfer\n  provider: OpenAIChatCompletionClient\n  config:\n    model: \"microsoft\u002FFara-7B\"\n    base_url: http:\u002F\u002Flocalhost:5000\u002Fv1\n    api_key: not-needed\n    model_info:\n      vision: true\n      function_calling: true\n      json_output: false\n      family: \"unknown\" \n      structured_output: false\n      multiple_system_messages: false\n\norchestrator_client: *client_surfer\ncoder_client: *client_surfer\nweb_surfer_client: *client_surfer\nfile_surfer_client: *client_surfer\naction_guard_client: *client_surfer\nmodel_client: *client_surfer\n```\n\n注意：如果您将 vLLM 部署在不同的端口或主机上，请相应地修改 `base_url`。\n\n然后启动带有 Fara 智能体的 Magentic-UI：\n\n```bash\nmagentic-ui --fara --port 8081 --config fara_config.yaml\n```\n\n最后，访问 \u003Chttp:\u002F\u002Flocalhost:8081> 即可进入界面！\n\n## 变更内容\n* 更新了由 @husseinmozannar 在 https:\u002F\u002Fgithub.com\u002Fmicrosoft\u002Fmagentic-ui\u002Fpull\u002F402 中提出的“告诉我何时”功能的链接。\n* [进行中] 由 @husseinmozannar 在 https:\u002F\u002Fgithub.com\u002Fmicrosoft\u002Fmagentic-ui\u002Fpull\u002F448 中实现的 Fara-7B 集成到 Magentic-UI。\n\n**完整变更日志**：https:\u002F\u002Fgithub.com\u002Fmicrosoft\u002Fmagentic-ui\u002Fcompare\u002F0.1.5...v0.1.6","2025-11-29T01:31:15",{"id":173,"version":174,"summary_zh":175,"released_at":176},289290,"0.1.5","这是一次令人振奋的新发布，我们在 Magentic-UI 编排器中实现了我们称为“哨兵步骤”的功能，使您能够执行长时间运行的监控任务和可重复的工作流。现在已默认启用！\n\n详情请见：https:\u002F\u002Fwww.microsoft.com\u002Fen-us\u002Fresearch\u002Fblog\u002Ftell-me-when-building-agents-that-can-wait-monitor-and-act\u002F\n\n## 变更内容\n* 哨兵步骤状态检查，由 @husseinmozannar 在 https:\u002F\u002Fgithub.com\u002Fmicrosoft\u002Fmagentic-ui\u002Fpull\u002F313 中完成  \n* 哨兵步骤 UI 修复，由 @husseinmozannar 在 https:\u002F\u002Fgithub.com\u002Fmicrosoft\u002Fmagentic-ui\u002Fpull\u002F314 中完成  \n* 移除当前会话标签页，由 @cheng-tan 在 https:\u002F\u002Fgithub.com\u002Fmicrosoft\u002Fmagentic-ui\u002Fpull\u002F318 中完成  \n* MCP 服务器列表，由 @cheng-tan 在 https:\u002F\u002Fgithub.com\u002Fmicrosoft\u002Fmagentic-ui\u002Fpull\u002F319 中完成  \n* 解决问题 #137，由 @matheusmaldaner 在 https:\u002F\u002Fgithub.com\u002Fmicrosoft\u002Fmagentic-ui\u002Fpull\u002F339 中完成  \n* 添加用于自动部署 GitHub Pages 的 GitHub Actions 工作流，由 @mmurad2 在 https:\u002F\u002Fgithub.com\u002Fmicrosoft\u002Fmagentic-ui\u002Fpull\u002F317 中完成  \n* 撤销“添加用于自动部署 GitHub Pages 的 GitHub Actions 工作流”，由 @husseinmozannar 在 https:\u002F\u002Fgithub.com\u002Fmicrosoft\u002Fmagentic-ui\u002Fpull\u002F341 中完成  \n* 添加 GitHub Pages，由 @husseinmozannar 在 https:\u002F\u002Fgithub.com\u002Fmicrosoft\u002Fmagentic-ui\u002Fpull\u002F342 中完成  \n* 哨兵步骤 UI 和动态休眠功能，由 @matheusmaldaner 在 https:\u002F\u002Fgithub.com\u002Fmicrosoft\u002Fmagentic-ui\u002Fpull\u002F330 中完成  \n* 更改为 DuckDuckGo 并添加 GPT-5，由 @husseinmozannar 在 https:\u002F\u002Fgithub.com\u002Fmicrosoft\u002Fmagentic-ui\u002Fpull\u002F371 中完成  \n* 添加和编辑 MCP 服务器，由 @cheng-tan 在 https:\u002F\u002Fgithub.com\u002Fmicrosoft\u002Fmagentic-ui\u002Fpull\u002F326 中完成  \n* 功能（teammanager）：将 MCP 代理配置从配置文件和前端设置中合并，由 @weicanie 在 https:\u002F\u002Fgithub.com\u002Fmicrosoft\u002Fmagentic-ui\u002Fpull\u002F320 中完成  \n* 功能：实现带有持久化的会话级 MCP 服务器选择，由 @tylerpayne 在 https:\u002F\u002Fgithub.com\u002Fmicrosoft\u002Fmagentic-ui\u002Fpull\u002F372 中完成  \n* 修复导致构建失败的语法错误，由 @tylerpayne 在 https:\u002F\u002Fgithub.com\u002Fmicrosoft\u002Fmagentic-ui\u002Fpull\u002F374 中完成  \n* 哨兵步骤更新，由 @husseinmozannar 在 https:\u002F\u002Fgithub.com\u002Fmicrosoft\u002Fmagentic-ui\u002Fpull\u002F386 中完成  \n* 文档：使用新功能、演示并优化结构更新 README，由 @mmurad2 在 https:\u002F\u002Fgithub.com\u002Fmicrosoft\u002Fmagentic-ui\u002Fpull\u002F399 中完成  \n* 更多哨兵相关修复，由 @husseinmozannar 在 https:\u002F\u002Fgithub.com\u002Fmicrosoft\u002Fmagentic-ui\u002Fpull\u002F401 中完成  \n\n## 新贡献者\n* @mmurad2 在 https:\u002F\u002Fgithub.com\u002Fmicrosoft\u002Fmagentic-ui\u002Fpull\u002F317 中完成了首次贡献  \n* @weicanie 在 https:\u002F\u002Fgithub.com\u002Fmicrosoft\u002Fmagentic-ui\u002Fpull\u002F320 中完成了首次贡献  \n\n**完整变更日志**：https:\u002F\u002Fgithub.com\u002Fmicrosoft\u002Fmagentic-ui\u002Fcompare\u002Fv0.1.2...0.1.5","2025-10-21T09:57:23",{"id":178,"version":179,"summary_zh":180,"released_at":181},289291,"v0.1.2","## 变更内容\n\nLLM 配置的 UI 设置修复\n\n\n如果您看到以下错误信息：\n\n2025-07-31 21:57:16.261 | 错误    | magentic_ui.backend.database.schema_manager:upgrade_schema:442 - 模式升级失败：SQLite 方言不支持对约束进行 ALTER 操作。请参阅批处理模式功能，该功能允许使用复制和移动策略对 SQLite 数据库进行迁移。\n\n您可以安全地忽略此错误，它不会影响 Magentic-UI 的行为，这是由于设置数据库发生了变化所致。\n\n要消除此错误信息，您需要通过删除 .magentic_ui 目录或更改应用程序目录来重置您的数据库。\n\n* 由 @husseinmozannar 在 https:\u002F\u002Fgithub.com\u002Fmicrosoft\u002Fmagentic-ui\u002Fpull\u002F309 中修复了在设置中传递客户端配置的问题\n\n\n**完整变更日志**：https:\u002F\u002Fgithub.com\u002Fmicrosoft\u002Fmagentic-ui\u002Fcompare\u002Fv0.1.1...v0.1.2","2025-07-31T21:54:46",{"id":183,"version":184,"summary_zh":185,"released_at":186},289292,"v0.1.1","## 变更内容\n修复了三个 bug：\n\n- UI 中的设置因序列化问题无法保存\u002F加载\n- 由于状态和智能体的压缩问题，加载\u002F保存状态功能失效\n- `--config` 参数未被正确识别\n\n次要问题：\n\n- OpenAI 模型配置中未显示自定义基础 URL 的高级选项\n\n* Sentinel 步骤，由 @husseinmozannar 在 https:\u002F\u002Fgithub.com\u002Fmicrosoft\u002Fmagentic-ui\u002Fpull\u002F299 中完成\n* 大量修复：包括加载状态、配置、设置保存等，由 @husseinmozannar 在 https:\u002F\u002Fgithub.com\u002Fmicrosoft\u002Fmagentic-ui\u002Fpull\u002F304 中完成\n\n\n**完整变更日志**：https:\u002F\u002Fgithub.com\u002Fmicrosoft\u002Fmagentic-ui\u002Fcompare\u002Fv0.1.0...v0.1.1","2025-07-30T22:58:48",{"id":188,"version":189,"summary_zh":190,"released_at":191},289293,"v0.1.0","## 变更内容\n本次发布对 Magentic-UI 进行了优化，主要修复了 UI 问题、减少了 WebSurfer 错误、新增了文件上传功能，并简化了安装流程，无需构建 Docker 镜像等。\n\n* 修复 Playwright 填充 ID 的问题，由 @husseinmozannar 在 https:\u002F\u002Fgithub.com\u002Fmicrosoft\u002Fmagentic-ui\u002Fpull\u002F212 中完成  \n* 更新 README.md 中的 Docker 运行说明，由 @husseinmozannar 在 https:\u002F\u002Fgithub.com\u002Fmicrosoft\u002Fmagentic-ui\u002Fpull\u002F224 中完成  \n* 为 Evals 添加 QA 支持，由 @vballoli 在 https:\u002F\u002Fgithub.com\u002Fmicrosoft\u002Fmagentic-ui\u002Fpull\u002F210 中完成  \n* 修复 README 中的失效链接，由 @Lee-WonJun 在 https:\u002F\u002Fgithub.com\u002Fmicrosoft\u002Fmagentic-ui\u002Fpull\u002F221 中完成  \n* 修复配置中 API Key 和基础 URL 的标签显示问题，由 @Geertvdc 在 https:\u002F\u002Fgithub.com\u002Fmicrosoft\u002Fmagentic-ui\u002Fpull\u002F231 中完成  \n* Sentinel\u002F提示词变更，由 @husseinmozannar 在 https:\u002F\u002Fgithub.com\u002Fmicrosoft\u002Fmagentic-ui\u002Fpull\u002F225 中完成  \n* 构建 Docker 容器并推送到 GHCR，由 @tylerpayne 在 https:\u002F\u002Fgithub.com\u002Fmicrosoft\u002Fmagentic-ui\u002Fpull\u002F245 中完成  \n* 将 Logo 更新为 SVG 版本，由 @matheusmaldaner 在 https:\u002F\u002Fgithub.com\u002Fmicrosoft\u002Fmagentic-ui\u002Fpull\u002F248 中完成  \n* 向 pyproject.toml 中添加缺失的 PyPI 元数据字段，由 @Copilot 在 https:\u002F\u002Fgithub.com\u002Fmicrosoft\u002Fmagentic-ui\u002Fpull\u002F252 中完成  \n* 修复 env dind（Docker in Docker）中的 network_name 问题，由 @dkzjq 在 https:\u002F\u002Fgithub.com\u002Fmicrosoft\u002Fmagentic-ui\u002Fpull\u002F259 中完成  \n* 多项修复：计划折叠、自动滚动到底部、用户输入超时、数据库管理并发问题，由 @husseinmozannar 在 https:\u002F\u002Fgithub.com\u002Fmicrosoft\u002Fmagentic-ui\u002Fpull\u002F257 中完成  \n* 对所有代理进行懒加载初始化，由 @cheng-tan 在 https:\u002F\u002Fgithub.com\u002Fmicrosoft\u002Fmagentic-ui\u002Fpull\u002F254 中完成  \n* 最终答案的提示词变更，由 @husseinmozannar 在 https:\u002F\u002Fgithub.com\u002Fmicrosoft\u002Fmagentic-ui\u002Fpull\u002F268 中完成  \n* 仅在前序检查通过后才执行后续检查，由 @tylerpayne 在 https:\u002F\u002Fgithub.com\u002Fmicrosoft\u002Fmagentic-ui\u002Fpull\u002F272 中完成  \n* WebSurfer 相关修复，由 @husseinmozannar 在 https:\u002F\u002Fgithub.com\u002Fmicrosoft\u002Fmagentic-ui\u002Fpull\u002F269 中完成  \n* 从 ghcr.io 拉取托管的 Docker 镜像，而非自行构建，由 @tylerpayne 在 https:\u002F\u002Fgithub.com\u002Fmicrosoft\u002Fmagentic-ui\u002Fpull\u002F271 中完成  \n* 修复 WebSurfer 的小 Bug，由 @husseinmozannar 在 https:\u002F\u002Fgithub.com\u002Fmicrosoft\u002Fmagentic-ui\u002Fpull\u002F275 中完成  \n* 修复设置模态框问题，由 @husseinmozannar 在 https:\u002F\u002Fgithub.com\u002Fmicrosoft\u002Fmagentic-ui\u002Fpull\u002F274 中完成  \n* 实现文件上传功能，由 @husseinmozannar 在 https:\u002F\u002Fgithub.com\u002Fmicrosoft\u002Fmagentic-ui\u002Fpull\u002F270 中完成  \n* 为 Sentinel 步骤添加 PlanStep 逻辑，由 @matheusmaldaner 在 https:\u002F\u002Fgithub.com\u002Fmicrosoft\u002Fmagentic-ui\u002Fpull\u002F243 中完成  \n* 使 approval guard 与 Gemini OAI API 兼容，由 @bordeauxred 在 https:\u002F\u002Fgithub.com\u002Fmicrosoft\u002Fmagentic-ui\u002Fpull\u002F277 中完成  \n\n## 新贡献者\n* @vballoli 在 https:\u002F\u002Fgithub.com\u002Fmicrosoft\u002Fmagentic-ui\u002Fpull\u002F210 中完成了首次贡献  \n* @Lee-WonJun 在 https:\u002F\u002Fgithub.com\u002Fmicrosoft\u002Fmagentic-ui\u002Fpull\u002F221 中完成了首次贡献  \n* @Geertvdc 在 https:\u002F\u002Fgithub.com\u002Fmicrosoft\u002Fmagentic-ui\u002Fpull\u002F231 中完成了首次贡献  \n* @dkzjq 在 https:\u002F\u002Fgithub.com\u002Fmicrosoft\u002Fmagentic-ui\u002Fpull\u002F259 中完成了首次贡献  \n* @bordeauxred 在 https:\u002F\u002Fgithub.com\u002Fmicr","2025-07-25T20:45:09",{"id":193,"version":194,"summary_zh":195,"released_at":196},289294,"v0.0.6","## 变更内容\n此版本允许您在不使用 Docker 的情况下运行 Magentic-UI，但代码执行功能将被禁用，因为在没有 Docker 的情况下执行代码可能存在安全风险：\n\n```bash\nmagentic-ui --run-without-docker --port 8081\n```\n\n此外，我们现在也推出了 Magentic-UI 的命令行界面，可以通过以下命令运行：\n\n```bash\nmagentic-cli --work-dir PATH\u002FTO\u002FSTORE\u002FDATA\n```\n\n* 移除与 Python 3.10 不兼容的导入，由 @tylerpayne 在 https:\u002F\u002Fgithub.com\u002Fmicrosoft\u002Fmagentic-ui\u002Fpull\u002F208 中完成\n* 修复阻止 Ollama 模型配置的 `model_info` 错误，由 @tylerpayne 在 https:\u002F\u002Fgithub.com\u002Fmicrosoft\u002Fmagentic-ui\u002Fpull\u002F207 中完成\n* 使 Docker 成为可选配置，由 @husseinmozannar 在 https:\u002F\u002Fgithub.com\u002Fmicrosoft\u002Fmagentic-ui\u002Fpull\u002F209 中完成\n* 版本升级至 0.0.6，由 @husseinmozannar 在 https:\u002F\u002Fgithub.com\u002Fmicrosoft\u002Fmagentic-ui\u002Fpull\u002F211 中完成\n\n\n**完整变更日志**: https:\u002F\u002Fgithub.com\u002Fmicrosoft\u002Fmagentic-ui\u002Fcompare\u002Fv0.0.5...v0.0.6","2025-06-20T22:46:17",{"id":198,"version":199,"summary_zh":200,"released_at":201},289295,"v0.0.5","## 变更内容\n\n此版本使 Magentic-UI 具备可扩展性，允许您向 Magentic-UI 团队添加任意数量的 MCP 代理。此外，该版本还修复了若干 UI 问题（模型配置），并在多个位置改进了错误处理和日志记录功能。\n\n\n完整的 PR 列表：\n\n* 更新 learner.py，作者：@bharanialapilla，链接：https:\u002F\u002Fgithub.com\u002Fmicrosoft\u002Fmagentic-ui\u002Fpull\u002F92\n* [杂项] 移除 `chatinput.tsx` 中未使用的导入，作者：@stefanoamorelli，链接：https:\u002F\u002Fgithub.com\u002Fmicrosoft\u002Fmagentic-ui\u002Fpull\u002F108\n* 删除重复的 --user-proxy-type 定义，作者：@matheusmaldaner，链接：https:\u002F\u002Fgithub.com\u002Fmicrosoft\u002Fmagentic-ui\u002Fpull\u002F117\n* 将原始字符串字面量替换为具有类型安全性的 FileType 枚举，作者：@dr-salman-ahmad，链接：https:\u002F\u002Fgithub.com\u002Fmicrosoft\u002Fmagentic-ui\u002Fpull\u002F101\n* 更新 README.md，作者：@norci，链接：https:\u002F\u002Fgithub.com\u002Fmicrosoft\u002Fmagentic-ui\u002Fpull\u002F119\n* 添加 TROUBLESHOOTING.md，作者：@matheusmaldaner，链接：https:\u002F\u002Fgithub.com\u002Fmicrosoft\u002Fmagentic-ui\u002Fpull\u002F139\n* 添加 CONTRIBUTING.md，作者：@matheusmaldaner，链接：https:\u002F\u002Fgithub.com\u002Fmicrosoft\u002Fmagentic-ui\u002Fpull\u002F140\n* 实验可复现性，作者：@husseinmozannar，链接：https:\u002F\u002Fgithub.com\u002Fmicrosoft\u002Fmagentic-ui\u002Fpull\u002F147\n* 从计划模板中移除“我会”措辞，以方便协作编辑，作者：@copilot-swe-agent，链接：https:\u002F\u002Fgithub.com\u002Fmicrosoft\u002Fmagentic-ui\u002Fpull\u002F55\n* 更新 READ.md，优化导航和安装说明，作者：@matheusmaldaner，链接：https:\u002F\u002Fgithub.com\u002Fmicrosoft\u002Fmagentic-ui\u002Fpull\u002F143\n* 对 Experiments 目录下的 README 进行小幅修复，作者：@matheusmaldaner，链接：https:\u002F\u002Fgithub.com\u002Fmicrosoft\u002Fmagentic-ui\u002Fpull\u002F151\n* [杂项] 实现相关计划的排序功能，作者：@stefanoamorelli，链接：https:\u002F\u002Fgithub.com\u002Fmicrosoft\u002Fmagentic-ui\u002Fpull\u002F107\n* 改进各代理的错误日志记录，作者：@husseinmozannar，链接：https:\u002F\u002Fgithub.com\u002Fmicrosoft\u002Fmagentic-ui\u002Fpull\u002F153\n* 进行小幅文件夹重组，作者：@matheusmaldaner，链接：https:\u002F\u002Fgithub.com\u002Fmicrosoft\u002Fmagentic-ui\u002Fpull\u002F157\n* 修复 README，作者：@husseinmozannar，链接：https:\u002F\u002Fgithub.com\u002Fmicrosoft\u002Fmagentic-ui\u002Fpull\u002F152\n* 添加故障排除方案，作者：@matheusmaldaner，链接：https:\u002F\u002Fgithub.com\u002Fmicrosoft\u002Fmagentic-ui\u002Fpull\u002F166\n* DevOps：更新工作流中的版本号，作者：@tylerpayne，链接：https:\u002F\u002Fgithub.com\u002Fmicrosoft\u002Fmagentic-ui\u002Fpull\u002F173\n* 更新 TROUBLESHOOTING.md，作者：@husseinmozannar，链接：https:\u002F\u002Fgithub.com\u002Fmicrosoft\u002Fmagentic-ui\u002Fpull\u002F182\n* 修复链接并新增横幅，作者：@matheusmaldaner，链接：https:\u002F\u002Fgithub.com\u002Fmicrosoft\u002Fmagentic-ui\u002Fpull\u002F167\n* 增加入口点，作者：@matheusmaldaner，链接：https:\u002F\u002Fgithub.com\u002Fmicrosoft\u002Fmagentic-ui\u002Fpull\u002F171\n* 优化控制台以提升用户体验，作者：@matheusmaldaner，链接：https:\u002F\u002Fgithub.com\u002Fmicrosoft\u002Fmagentic-ui\u002Fpull\u002F175\n* 可配置的启用 MCP 的 AssistantAgents，作者：@tylerpayne，链接：https:\u002F\u002Fgithub.com\u002Fmicrosoft\u002Fmagentic-ui\u002Fpull\u002F174\n* 修复侧边栏溢出问题，并添加会话 ID 检查，作者：@matheusmaldaner，链接：https:\u002F\u002Fgithub.com\u002Fmicrosoft\u002Fmagentic-ui\u002Fpull\u002F188\n* 修复：通过使用 IPv4 地址解决 macOS 上的浏览器连接超时问题…，作者：@suifengpiaosan，链接：https:\u002F\u002Fgithub.com\u002Fmicroso","2025-06-18T20:34:32",{"id":203,"version":204,"summary_zh":205,"released_at":206},289296,"v0.0.4","主要更新 https:\u002F\u002Fpypi.org\u002Fproject\u002Fmagentic_ui\u002F0.0.4\u002F：\n- 更新了设置中的模型配置编辑器，使其在使用 Ollama 和 OpenRouter 时更加清晰易用。\n- 对代理进行了更新，以支持 Claude 3.7 Sonnet、Qwen 2.5 VL 等非 OpenAI 模型。WebSurfer 现在可以与不支持工具调用但能输出有效 JSON 的模型协同工作。\n\n\n\n## 变更内容\n* @copilot-swe-agent 在 https:\u002F\u002Fgithub.com\u002Fmicrosoft\u002Fmagentic-ui\u002Fpull\u002F59 中将软件包版本统一到单一的事实来源。\n* @copilot-swe-agent 在 https:\u002F\u002Fgithub.com\u002Fmicrosoft\u002Fmagentic-ui\u002Fpull\u002F62 中修复了 tiktoken 警告问题。\n* @husseinmozannar 在 https:\u002F\u002Fgithub.com\u002Fmicrosoft\u002Fmagentic-ui\u002Fpull\u002F63 中更新了 README 文件。\n* @husseinmozannar 在 https:\u002F\u002Fgithub.com\u002Fmicrosoft\u002Fmagentic-ui\u002Fpull\u002F64 中移除了对 opentelemetry 的严格依赖。\n* @husseinmozannar 在 https:\u002F\u002Fgithub.com\u002Fmicrosoft\u002Fmagentic-ui\u002Fpull\u002F68 中改进了 Docker 日志记录并修复了 README 文件。\n* @husseinmozannar 在 https:\u002F\u002Fgithub.com\u002Fmicrosoft\u002Fmagentic-ui\u002Fpull\u002F66 中通过小幅调整代理配置，增加了对更多模型的支持。\n* @copilot-swe-agent 在 https:\u002F\u002Fgithub.com\u002Fmicrosoft\u002Fmagentic-ui\u002Fpull\u002F70 中修复了用于计划检索的设置下拉菜单中的拼写错误。\n* @ksachdeva 在 https:\u002F\u002Fgithub.com\u002Fmicrosoft\u002Fmagentic-ui\u002Fpull\u002F75 中修复了 FileSurfer 和 CoderAgent 中的一个问题：确保在运行时而非对象创建时替换提示中的日期时间变量。\n* @ksachdeva 在 https:\u002F\u002Fgithub.com\u002Fmicrosoft\u002Fmagentic-ui\u002Fpull\u002F77 中修正了 Coder 和 FileSurfer 代理中的一些拼写错误。\n* @husseinmozannar 在 https:\u002F\u002Fgithub.com\u002Fmicrosoft\u002Fmagentic-ui\u002Fpull\u002F80 中改进了 Coder 对代码异常的处理方式。\n* @husseinmozannar 在 https:\u002F\u002Fgithub.com\u002Fmicrosoft\u002Fmagentic-ui\u002Fpull\u002F78 中添加了 Ollama 配置。\n* @husseinmozannar 在 https:\u002F\u002Fgithub.com\u002Fmicrosoft\u002Fmagentic-ui\u002Fpull\u002F87 中更新了版本号至 0.0.4。\n\n## 新贡献者\n* @copilot-swe-agent 在 https:\u002F\u002Fgithub.com\u002Fmicrosoft\u002Fmagentic-ui\u002Fpull\u002F59 中做出了首次贡献。\n* @ksachdeva 在 https:\u002F\u002Fgithub.com\u002Fmicrosoft\u002Fmagentic-ui\u002Fpull\u002F75 中做出了首次贡献。\n\n**完整变更日志**：https:\u002F\u002Fgithub.com\u002Fmicrosoft\u002Fmagentic-ui\u002Fcompare\u002Fv0.0.3...v0.0.4","2025-05-23T15:59:06",{"id":208,"version":209,"summary_zh":210,"released_at":211},289297,"v0.0.3","Magentic-UI首个版本公开发布：magentic_ui 0.0.3","2025-05-19T17:28:20"]