[{"data":1,"prerenderedAt":-1},["ShallowReactive",2],{"similar-yuruotong1--autoMate":3,"tool-yuruotong1--autoMate":62},[4,18,26,36,46,54],{"id":5,"name":6,"github_repo":7,"description_zh":8,"stars":9,"difficulty_score":10,"last_commit_at":11,"category_tags":12,"status":17},4358,"openclaw","openclaw\u002Fopenclaw","OpenClaw 是一款专为个人打造的本地化 AI 助手，旨在让你在自己的设备上拥有完全可控的智能伙伴。它打破了传统 AI 助手局限于特定网页或应用的束缚，能够直接接入你日常使用的各类通讯渠道，包括微信、WhatsApp、Telegram、Discord、iMessage 等数十种平台。无论你在哪个聊天软件中发送消息，OpenClaw 都能即时响应，甚至支持在 macOS、iOS 和 Android 设备上进行语音交互，并提供实时的画布渲染功能供你操控。\n\n这款工具主要解决了用户对数据隐私、响应速度以及“始终在线”体验的需求。通过将 AI 部署在本地，用户无需依赖云端服务即可享受快速、私密的智能辅助，真正实现了“你的数据，你做主”。其独特的技术亮点在于强大的网关架构，将控制平面与核心助手分离，确保跨平台通信的流畅性与扩展性。\n\nOpenClaw 非常适合希望构建个性化工作流的技术爱好者、开发者，以及注重隐私保护且不愿被单一生态绑定的普通用户。只要具备基础的终端操作能力（支持 macOS、Linux 及 Windows WSL2），即可通过简单的命令行引导完成部署。如果你渴望拥有一个懂你",349277,3,"2026-04-06T06:32:30",[13,14,15,16],"Agent","开发框架","图像","数据工具","ready",{"id":19,"name":20,"github_repo":21,"description_zh":22,"stars":23,"difficulty_score":10,"last_commit_at":24,"category_tags":25,"status":17},3808,"stable-diffusion-webui","AUTOMATIC1111\u002Fstable-diffusion-webui","stable-diffusion-webui 是一个基于 Gradio 构建的网页版操作界面，旨在让用户能够轻松地在本地运行和使用强大的 Stable Diffusion 图像生成模型。它解决了原始模型依赖命令行、操作门槛高且功能分散的痛点，将复杂的 AI 绘图流程整合进一个直观易用的图形化平台。\n\n无论是希望快速上手的普通创作者、需要精细控制画面细节的设计师，还是想要深入探索模型潜力的开发者与研究人员，都能从中获益。其核心亮点在于极高的功能丰富度：不仅支持文生图、图生图、局部重绘（Inpainting）和外绘（Outpainting）等基础模式，还独创了注意力机制调整、提示词矩阵、负向提示词以及“高清修复”等高级功能。此外，它内置了 GFPGAN 和 CodeFormer 等人脸修复工具，支持多种神经网络放大算法，并允许用户通过插件系统无限扩展能力。即使是显存有限的设备，stable-diffusion-webui 也提供了相应的优化选项，让高质量的 AI 艺术创作变得触手可及。",162132,"2026-04-05T11:01:52",[14,15,13],{"id":27,"name":28,"github_repo":29,"description_zh":30,"stars":31,"difficulty_score":32,"last_commit_at":33,"category_tags":34,"status":17},1381,"everything-claude-code","affaan-m\u002Feverything-claude-code","everything-claude-code 是一套专为 AI 编程助手（如 Claude Code、Codex、Cursor 等）打造的高性能优化系统。它不仅仅是一组配置文件，而是一个经过长期实战打磨的完整框架，旨在解决 AI 代理在实际开发中面临的效率低下、记忆丢失、安全隐患及缺乏持续学习能力等核心痛点。\n\n通过引入技能模块化、直觉增强、记忆持久化机制以及内置的安全扫描功能，everything-claude-code 能显著提升 AI 在复杂任务中的表现，帮助开发者构建更稳定、更智能的生产级 AI 代理。其独特的“研究优先”开发理念和针对 Token 消耗的优化策略，使得模型响应更快、成本更低，同时有效防御潜在的攻击向量。\n\n这套工具特别适合软件开发者、AI 研究人员以及希望深度定制 AI 工作流的技术团队使用。无论您是在构建大型代码库，还是需要 AI 协助进行安全审计与自动化测试，everything-claude-code 都能提供强大的底层支持。作为一个曾荣获 Anthropic 黑客大奖的开源项目，它融合了多语言支持与丰富的实战钩子（hooks），让 AI 真正成长为懂上",160411,2,"2026-04-18T23:33:24",[14,13,35],"语言模型",{"id":37,"name":38,"github_repo":39,"description_zh":40,"stars":41,"difficulty_score":42,"last_commit_at":43,"category_tags":44,"status":17},8272,"opencode","anomalyco\u002Fopencode","OpenCode 是一款开源的 AI 编程助手（Coding Agent），旨在像一位智能搭档一样融入您的开发流程。它不仅仅是一个代码补全插件，而是一个能够理解项目上下文、自主规划任务并执行复杂编码操作的智能体。无论是生成全新功能、重构现有代码，还是排查难以定位的 Bug，OpenCode 都能通过自然语言交互高效完成，显著减少开发者在重复性劳动和上下文切换上的时间消耗。\n\n这款工具专为软件开发者、工程师及技术研究人员设计，特别适合希望利用大模型能力来提升编码效率、加速原型开发或处理遗留代码维护的专业人群。其核心亮点在于完全开源的架构，这意味着用户可以审查代码逻辑、自定义行为策略，甚至私有化部署以保障数据安全，彻底打破了传统闭源 AI 助手的“黑盒”限制。\n\n在技术体验上，OpenCode 提供了灵活的终端界面（Terminal UI）和正在测试中的桌面应用程序，支持 macOS、Windows 及 Linux 全平台。它兼容多种包管理工具，安装便捷，并能无缝集成到现有的开发环境中。无论您是追求极致控制权的资深极客，还是渴望提升产出的独立开发者，OpenCode 都提供了一个透明、可信",144296,1,"2026-04-16T14:50:03",[13,45],"插件",{"id":47,"name":48,"github_repo":49,"description_zh":50,"stars":51,"difficulty_score":32,"last_commit_at":52,"category_tags":53,"status":17},2271,"ComfyUI","Comfy-Org\u002FComfyUI","ComfyUI 是一款功能强大且高度模块化的视觉 AI 引擎，专为设计和执行复杂的 Stable Diffusion 图像生成流程而打造。它摒弃了传统的代码编写模式，采用直观的节点式流程图界面，让用户通过连接不同的功能模块即可构建个性化的生成管线。\n\n这一设计巧妙解决了高级 AI 绘图工作流配置复杂、灵活性不足的痛点。用户无需具备编程背景，也能自由组合模型、调整参数并实时预览效果，轻松实现从基础文生图到多步骤高清修复等各类复杂任务。ComfyUI 拥有极佳的兼容性，不仅支持 Windows、macOS 和 Linux 全平台，还广泛适配 NVIDIA、AMD、Intel 及苹果 Silicon 等多种硬件架构，并率先支持 SDXL、Flux、SD3 等前沿模型。\n\n无论是希望深入探索算法潜力的研究人员和开发者，还是追求极致创作自由度的设计师与资深 AI 绘画爱好者，ComfyUI 都能提供强大的支持。其独特的模块化架构允许社区不断扩展新功能，使其成为当前最灵活、生态最丰富的开源扩散模型工具之一，帮助用户将创意高效转化为现实。",109154,"2026-04-18T11:18:24",[14,15,13],{"id":55,"name":56,"github_repo":57,"description_zh":58,"stars":59,"difficulty_score":32,"last_commit_at":60,"category_tags":61,"status":17},6121,"gemini-cli","google-gemini\u002Fgemini-cli","gemini-cli 是一款由谷歌推出的开源 AI 命令行工具，它将强大的 Gemini 大模型能力直接集成到用户的终端环境中。对于习惯在命令行工作的开发者而言，它提供了一条从输入提示词到获取模型响应的最短路径，无需切换窗口即可享受智能辅助。\n\n这款工具主要解决了开发过程中频繁上下文切换的痛点，让用户能在熟悉的终端界面内直接完成代码理解、生成、调试以及自动化运维任务。无论是查询大型代码库、根据草图生成应用，还是执行复杂的 Git 操作，gemini-cli 都能通过自然语言指令高效处理。\n\n它特别适合广大软件工程师、DevOps 人员及技术研究人员使用。其核心亮点包括支持高达 100 万 token 的超长上下文窗口，具备出色的逻辑推理能力；内置 Google 搜索、文件操作及 Shell 命令执行等实用工具；更独特的是，它支持 MCP（模型上下文协议），允许用户灵活扩展自定义集成，连接如图像生成等外部能力。此外，个人谷歌账号即可享受免费的额度支持，且项目基于 Apache 2.0 协议完全开源，是提升终端工作效率的理想助手。",100752,"2026-04-10T01:20:03",[45,13,15,14],{"id":63,"github_repo":64,"name":65,"description_en":66,"description_zh":67,"ai_summary_zh":67,"readme_en":68,"readme_zh":69,"quickstart_zh":70,"use_case_zh":71,"hero_image_url":72,"owner_login":73,"owner_name":74,"owner_avatar_url":75,"owner_bio":76,"owner_company":76,"owner_location":76,"owner_email":76,"owner_twitter":76,"owner_website":76,"owner_url":77,"languages":78,"stars":83,"forks":84,"last_commit_at":85,"license":86,"difficulty_score":32,"env_os":87,"env_gpu":88,"env_ram":88,"env_deps":89,"category_tags":95,"github_topics":96,"view_count":32,"oss_zip_url":76,"oss_zip_packed_at":76,"status":17,"created_at":108,"updated_at":109,"faqs":110,"releases":139},9353,"yuruotong1\u002FautoMate","autoMate","Like Manus, Computer Use Agent(CUA) and Omniparser, we are computer-using agents.AI-driven local automation assistant that uses natural language to make computers work by themselves","autoMate 是一款专为桌面应用打造的 AI 自动化助手，旨在让大语言模型（如 Claude）具备“手”和“眼”，能够像人类一样直接操作电脑界面。它核心解决了传统自动化工具难以应对“无 API、无插件支持”的桌面软件这一痛点。无论是剪映、Photoshop、AutoCAD，还是企业内部系统，只要拥有图形界面，autoMate 都能通过自然语言指令驱动其自动完成任务，无需编写复杂代码或配置繁琐的环境变量。\n\n这款工具非常适合希望提升工作效率的普通办公人员、需要批量处理重复任务的设计师，以及想要探索 AI Agent 落地场景的开发者与研究人員。与普通用户熟悉的流程自动化工具不同，autoMate 采用 MCP 服务器架构，跨平台支持 Windows、macOS 和 Linux。其独特亮点在于内置了可复用的脚本库，用户可以将一次成功的操作流程保存为脚本，随时调用或分享给社区；同时支持屏幕截图、坐标点击、文本输入等底层控制能力，让 AI 能精准理解并执行复杂的 GUI 交互任务。只需简单配置，即可让 AI 真正接管桌面工作流，实现“所说即所得”的智能自动化体验。","\u003Cdiv align=\"center\">\u003Ca name=\"readme-top\">\u003C\u002Fa>\n\n\u003Cimg src=\"https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002Fyuruotong1_autoMate_readme_732480f66aa4.png\" width=\"120\" height=\"120\" alt=\"autoMate logo\">\n\u003Ch1>autoMate\u003C\u002Fh1>\n\u003Cp>\u003Cb>🤖 Desktop Automation for Apps Without APIs\u003C\u002Fb>\u003C\u002Fp>\n\n[中文](.\u002FREADME_CN.md) | [日本語](.\u002FREADME_JA.md)\n\n[![PyPI](https:\u002F\u002Fimg.shields.io\u002Fpypi\u002Fv\u002Fautomate-mcp)](https:\u002F\u002Fpypi.org\u002Fproject\u002Fautomate-mcp\u002F)\n[![License](https:\u002F\u002Fimg.shields.io\u002Fgithub\u002Flicense\u002Fyuruotong1\u002FautoMate)](LICENSE)\n\n> Give Claude hands and eyes — automate any desktop app, even if it has no API\n\nhttps:\u002F\u002Fgithub.com\u002Fuser-attachments\u002Fassets\u002Fbf27f8bd-136b-402e-bc7d-994b99bcc368\n\n\u003C\u002Fdiv>\n\n---\n\n## 💡 What is autoMate?\n\nautoMate is an MCP server that gives AI assistants (Claude, GPT, etc.) the ability to **control any desktop application** — even apps with no API, no plugin system, and no automation support.\n\nThink of it as the cross-platform, AI-native alternative to [Quicker](https:\u002F\u002Fwww.getquicker.net) — but instead of building workflows by dragging blocks, you just describe what you want.\n\n**What makes it different from filesystem \u002F browser \u002F Windows MCP:**\n\n| MCP Server | What it automates |\n|------------|------------------|\n| filesystem MCP | Files and folders |\n| browser MCP | Web pages |\n| Windows MCP | OS settings and system calls |\n| **autoMate** | **Any desktop GUI app with no API** — 剪映, Photoshop, AutoCAD, WeChat, SAP, internal tools… |\n\n---\n\n## ✨ Features\n\n- 🖥️ **Automates apps with no API** — if it has a GUI, autoMate can drive it\n- 📚 **Reusable script library** — save workflows once, run forever; install community scripts in one command\n- 🧠 **Claude knows when to use it** — clear identity prevents autoMate from being bypassed by other MCPs\n- 🤖 **Zero config** — no API keys, no env vars; the host LLM does the thinking\n- 🌍 **Cross-platform** — Windows, macOS, Linux (Quicker is Windows-only)\n\n---\n\n## 🔌 Setup\n\n> **Prerequisite:** `pip install uv`\n\n### Claude Desktop\n\nOpen **Settings → Developer → Edit Config**, then add:\n\n```json\n{\n  \"mcpServers\": {\n    \"automate\": {\n      \"command\": \"uvx\",\n      \"args\": [\"automate-mcp@latest\"]\n    }\n  }\n}\n```\n\nRestart Claude Desktop — done. autoMate auto-updates every restart.\n\n### OpenClaw\n\nEdit `~\u002F.openclaw\u002Fopenclaw.json`:\n\n```json\n{\n  \"mcpServers\": {\n    \"automate\": {\n      \"command\": \"uvx\",\n      \"args\": [\"automate-mcp@latest\"]\n    }\n  }\n}\n```\n\n```bash\nopenclaw gateway restart\n```\n\n### Cursor \u002F Windsurf \u002F Cline\n\nSettings → MCP Servers → Add:\n\n```json\n{\n  \"automate\": {\n    \"command\": \"uvx\",\n    \"args\": [\"automate-mcp@latest\"]\n  }\n}\n```\n\n---\n\n## 🛠️ MCP Tools\n\n**Script library** — the core value: save a workflow once, run it forever.\n\n| Tool | Description |\n|------|-------------|\n| `list_scripts` | Show all saved automation scripts |\n| `run_script` | Run a saved script by name |\n| `save_script` | Save the current workflow as a reusable script |\n| `show_script` | View a script's contents |\n| `delete_script` | Delete a script |\n| `install_script` | Install a script from a URL or the community library |\n\n**Low-level desktop control** — used by Claude when building or executing scripts.\n\n| Tool | Description |\n|------|-------------|\n| `screenshot` | Capture the screen and return as base64 PNG |\n| `click` | Click at screen coordinates |\n| `double_click` | Double-click at screen coordinates |\n| `type_text` | Type text (full Unicode \u002F CJK support) |\n| `press_key` | Press a key or combo (e.g. `ctrl+c`, `win`) |\n| `scroll` | Scroll up or down |\n| `mouse_move` | Move cursor without clicking |\n| `drag` | Drag from one position to another |\n\n---\n\n## 📚 Script Library\n\nScripts are saved as `.md` files in `~\u002F.automate\u002Fscripts\u002F` — human-readable, git-friendly, shareable.\n\n**Example script:**\n\n```markdown\n---\nname: jianying_export_douyin\ndescription: Export the current 剪映 project as a 9:16 Douyin video\ncreated: 2025-01-01\n---\n\n## Steps\n\n1. Open export dialog [key:ctrl+e]\n2. Select resolution 1080×1920 [click:coord=320,480]\n3. Set format to MP4 [click:coord=320,560]\n4. Click export [click:coord=800,650]\n5. Wait for export to finish [wait:5]\n```\n\n**Inline hint syntax:**\n\n| Hint | Action |\n|------|--------|\n| `[click:coord=320,240]` | Click at absolute screen coordinates |\n| `[type:hello]` | Type text |\n| `[key:ctrl+s]` | Press keyboard shortcut |\n| `[wait:2]` | Wait 2 seconds |\n| `[scroll_up]` \u002F `[scroll_down]` | Scroll the page |\n\nSteps without hints are interpreted by the AI vision model at runtime.\n\n**Install a community script:**\n\n```\nTell Claude: \"install the automate script from \u003Curl>\"\n```\n\nor Claude calls `install_script` directly with a raw GitHub URL.\n\n---\n\n## 📝 FAQ\n\n**Q: How is this different from just using Claude's computer-use capability?**  \nautoMate provides persistent, reusable scripts. Once you automate a task, it's saved and runs instantly next time — no re-reasoning required.\n\n**Q: Why does Claude sometimes use Windows MCP \u002F filesystem MCP instead of autoMate?**  \nUpdate to v0.4.0+ — the server description now explicitly tells Claude when to use autoMate vs other MCPs.\n\n**Q: Does it work with apps that change their UI frequently?**  \nCoordinate-based hints (`[click:coord=x,y]`) are fragile to UI changes. For resilient scripts, describe the step in natural language and let Claude re-locate the element each run.\n\n**Q: Does it work on macOS \u002F Linux?**  \nYes — all three platforms. This is the main advantage over Quicker (Windows-only).\n\n---\n\n## 🤝 Contributing\n\n\u003Ca href=\"https:\u002F\u002Fgithub.com\u002Fyuruotong1\u002FautoMate\u002Fgraphs\u002Fcontributors\">\n  \u003Cimg src=\"https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002Fyuruotong1_autoMate_readme_40a1da6de82c.png\" \u002F>\n\u003C\u002Fa>\n\n---\n\n\u003Cdiv align=\"center\">\n⭐ Every star encourages the creators and helps more people discover autoMate ⭐\n\u003C\u002Fdiv>\n","\u003Cdiv align=\"center\">\u003Ca name=\"readme-top\">\u003C\u002Fa>\n\n\u003Cimg src=\"https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002Fyuruotong1_autoMate_readme_732480f66aa4.png\" width=\"120\" height=\"120\" alt=\"autoMate logo\">\n\u003Ch1>autoMate\u003C\u002Fh1>\n\u003Cp>\u003Cb>🤖 无API应用的桌面自动化工具\u003C\u002Fb>\u003C\u002Fp>\n\n[中文](.\u002FREADME_CN.md) | [日本語](.\u002FREADME_JA.md)\n\n[![PyPI](https:\u002F\u002Fimg.shields.io\u002Fpypi\u002Fv\u002Fautomate-mcp)](https:\u002F\u002Fpypi.org\u002Fproject\u002Fautomate-mcp\u002F)\n[![License](https:\u002F\u002Fimg.shields.io\u002Fgithub\u002Flicense\u002Fyuruotong1\u002FautoMate)](LICENSE)\n\n> 给Claude装上“手”和“眼”——无需API即可自动化任何桌面应用\n\nhttps:\u002F\u002Fgithub.com\u002Fuser-attachments\u002Fassets\u002Fbf27f8bd-136b-402e-bc7d-994b99bcc368\n\n\u003C\u002Fdiv>\n\n---\n\n## 💡 autoMate是什么？\n\nautoMate是一个MCP服务器，赋予AI助手（如Claude、GPT等）**控制任何桌面应用程序**的能力——即使是那些没有API、没有插件系统、也不支持自动化操作的应用程序。\n\n你可以把它看作是跨平台、原生支持AI的[Quicker](https:\u002F\u002Fwww.getquicker.net)替代方案——但与通过拖拽模块来构建工作流不同，你只需简单描述想要完成的任务即可。\n\n**它与文件系统\u002FMCP、浏览器\u002FMCP、Windows\u002FMCP的区别：**\n\n| MCP服务器 | 自动化对象 |\n|------------|------------------|\n| 文件系统MCP | 文件和文件夹 |\n| 浏览器MCP | 网页 |\n| Windows MCP | 操作系统的设置和系统调用 |\n| **autoMate** | **任何没有API的桌面GUI应用** — 剪映、Photoshop、AutoCAD、微信、SAP、内部工具…… |\n\n---\n\n## ✨ 功能特性\n\n- 🖥️ **自动化无API的应用程序** — 只要有GUI界面，autoMate就能操控\n- 📚 **可复用的脚本库** — 一次保存工作流，永久使用；只需一条命令即可安装社区脚本\n- 🧠 **Claude知道何时使用它** — 清晰的身份标识避免了被其他MCP绕过\n- 🤖 **零配置** — 无需API密钥、环境变量；由主机LLM负责思考\n- 🌍 **跨平台** — 支持Windows、macOS和Linux（而Quicker仅限Windows）\n\n---\n\n## 🔌 安装与配置\n\n> **前提条件：** `pip install uv`\n\n### Claude Desktop\n\n打开 **设置 → 开发者 → 编辑配置**，然后添加：\n\n```json\n{\n  \"mcpServers\": {\n    \"automate\": {\n      \"command\": \"uvx\",\n      \"args\": [\"automate-mcp@latest\"]\n    }\n  }\n}\n```\n\n重启Claude Desktop——完成。autoMate会在每次重启时自动更新。\n\n### OpenClaw\n\n编辑 `~\u002F.openclaw\u002Fopenclaw.json`：\n\n```json\n{\n  \"mcpServers\": {\n    \"automate\": {\n      \"command\": \"uvx\",\n      \"args\": [\"automate-mcp@latest\"]\n    }\n  }\n}\n```\n\n```bash\nopenclaw gateway restart\n```\n\n### Cursor \u002F Windsurf \u002F Cline\n\n设置 → MCP服务器 → 添加：\n\n```json\n{\n  \"automate\": {\n    \"command\": \"uvx\",\n    \"args\": [\"automate-mcp@latest\"]\n  }\n}\n```\n\n---\n\n## 🛠️ MCP工具集\n\n**脚本库**——核心价值：一次保存工作流，永久运行。\n\n| 工具 | 描述 |\n|------|-------------|\n| `list_scripts` | 显示所有已保存的自动化脚本 |\n| `run_script` | 根据名称运行已保存的脚本 |\n| `save_script` | 将当前工作流保存为可复用的脚本 |\n| `show_script` | 查看脚本内容 |\n| `delete_script` | 删除脚本 |\n| `install_script` | 从URL或社区库安装脚本 |\n\n**底层桌面控制**——Claude在构建或执行脚本时会用到这些工具。\n\n| 工具 | 描述 |\n|------|-------------|\n| `screenshot` | 截取屏幕并以Base64编码的PNG格式返回 |\n| `click` | 在屏幕坐标处点击 |\n| `double_click` | 在屏幕坐标处双击 |\n| `type_text` | 输入文本（全面支持Unicode\u002FCJK字符） |\n| `press_key` | 按下某个键或组合键（如`ctrl+c`、`win`） |\n| `scroll` | 上下滚动页面 |\n| `mouse_move` | 移动鼠标指针而不点击 |\n| `drag` | 从一个位置拖动到另一个位置 |\n\n---\n\n## 📚 脚本库\n\n脚本以`.md`文件形式保存在`~\u002F.automate\u002Fscripts\u002F`目录中——人类可读、便于Git管理且易于分享。\n\n**示例脚本：**\n\n```markdown\n---\nname: jianying_export_douyin\ndescription: 将当前剪映项目导出为9:16比例的抖音视频\ncreated: 2025-01-01\n---\n\n## 步骤\n\n1. 打开导出对话框 [key:ctrl+e]\n2. 选择分辨率为1080×1920 [click:coord=320,480]\n3. 将格式设置为MP4 [click:coord=320,560]\n4. 点击导出 [click:coord=800,650]\n5. 等待导出完成 [wait:5]\n```\n\n**内联提示语法：**\n\n| 提示 | 动作 |\n|------|--------|\n| `[click:coord=320,240]` | 在绝对屏幕坐标处点击 |\n| `[type:hello]` | 输入文本 |\n| `[key:ctrl+s]` | 按下键盘快捷键 |\n| `[wait:2]` | 等待2秒 |\n| `[scroll_up]` \u002F `[scroll_down]` | 滚动页面 |\n\n未加提示的步骤将在运行时由AI视觉模型进行解释。\n\n**安装社区脚本：**\n\n```\n告诉Claude：“从\u003Curl>安装autoMate脚本”\n```\n\n或者Claude直接调用`install_script`，传入原始的GitHub URL。\n\n---\n\n## 📝 常见问题解答\n\n**问：这与直接使用Claude的电脑操作能力有何不同？**  \nautoMate提供了持久且可复用的脚本。一旦你将某项任务自动化，它就会被保存下来，下次可以直接运行——无需再次推理。\n\n**问：为什么Claude有时会使用Windows MCP\u002F文件系统MCP而不是autoMate？**  \n请升级到v0.4.0及以上版本——现在的服务器描述会明确告知Claude何时使用autoMate，何时使用其他MCP。\n\n**问：对于UI经常变化的应用程序，它是否有效？**  \n基于坐标的提示（`[click:coord=x,y]`）对UI变化较为敏感。为了使脚本更具鲁棒性，建议用自然语言描述步骤，让Claude在每次运行时重新定位元素。\n\n**问：它能在macOS\u002FLinux上运行吗？**  \n可以——三个平台都支持。这也是它相比仅支持Windows的Quicker的主要优势。\n\n---\n\n## 🤝 贡献\n\n\u003Ca href=\"https:\u002F\u002Fgithub.com\u002Fyuruotong1\u002FautoMate\u002Fgraphs\u002Fcontributors\">\n  \u003Cimg src=\"https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002Fyuruotong1_autoMate_readme_40a1da6de82c.png\" \u002F>\n\u003C\u002Fa>\n\n---\n\n\u003Cdiv align=\"center\">\n⭐ 每一颗星都在鼓励开发者，并帮助更多人发现autoMate ⭐\n\u003C\u002Fdiv>","# autoMate 快速上手指南\n\nautoMate 是一个 MCP 服务器，旨在赋予 AI 助手（如 Claude）控制任何桌面应用程序的能力，即使这些应用没有 API、插件系统或原生自动化支持。它通过视觉识别和模拟操作，让你能用自然语言描述任务，自动执行剪映、Photoshop、微信等 GUI 软件的操作。\n\n## 环境准备\n\n在开始之前，请确保满足以下要求：\n\n*   **操作系统**：支持 Windows、macOS 和 Linux。\n*   **前置依赖**：必须安装 Python 包管理工具 `uv`。\n*   **AI 客户端**：已安装并配置好支持 MCP 的客户端（如 Claude Desktop、Cursor、Windsurf 或 OpenClaw）。\n\n**安装前置依赖：**\n\n```bash\npip install uv\n```\n\n> **提示**：国内用户若遇到 `pip` 下载缓慢问题，可指定国内镜像源安装：\n> ```bash\n> pip install uv -i https:\u002F\u002Fpypi.tuna.tsinghua.edu.cn\u002Fsimple\n> ```\n\n## 安装步骤\n\n根据你的 AI 客户端类型，选择对应的配置方式。核心原理是在 MCP 配置中添加 `automate-mcp` 服务。\n\n### 1. Claude Desktop\n\n1.  打开 **Settings → Developer → Edit Config**。\n2.  在配置文件中添加以下内容：\n\n```json\n{\n  \"mcpServers\": {\n    \"automate\": {\n      \"command\": \"uvx\",\n      \"args\": [\"automate-mcp@latest\"]\n    }\n  }\n}\n```\n\n3.  重启 Claude Desktop 即可生效。autoMate 会在每次重启时自动更新到最新版本。\n\n### 2. Cursor \u002F Windsurf \u002F Cline\n\n1.  进入 **Settings → MCP Servers**。\n2.  点击 **Add** 添加新服务器。\n3.  填入以下 JSON 配置：\n\n```json\n{\n  \"automate\": {\n    \"command\": \"uvx\",\n    \"args\": [\"automate-mcp@latest\"]\n  }\n}\n```\n\n### 3. OpenClaw\n\n1.  编辑配置文件 `~\u002F.openclaw\u002Fopenclaw.json`，添加上述 JSON 配置到 `mcpServers` 字段。\n2.  重启网关使配置生效：\n\n```bash\nopenclaw gateway restart\n```\n\n## 基本使用\n\n安装完成后，你可以直接在对话框中用自然语言指挥 AI 操作桌面应用。\n\n### 场景示例：自动化导出视频\n\n假设你需要将当前的“剪映”项目导出为抖音格式（9:16）的视频。\n\n**操作步骤：**\n\n1.  确保目标应用（如剪映）已打开并处于前台。\n2.  在聊天窗口输入指令：\n    > “帮我把当前剪映项目导出为 9:16 的抖音视频，分辨率设为 1080x1920，格式为 MP4。”\n\n3.  autoMate 会自动截取屏幕画面，分析界面元素，并依次执行点击、选择分辨率、设置格式和确认导出等操作。\n\n### 进阶：保存复用脚本\n\n为了避免每次重复推理，你可以将成功的工作流保存为脚本：\n\n*   **保存脚本**：告诉 AI“将刚才的操作保存为脚本，命名为 `jianying_export`\"。\n*   **运行脚本**：下次只需说“运行 `jianying_export` 脚本”，即可瞬间完成相同任务。\n*   **查看脚本**：脚本以人类可读的 `.md` 文件形式存储在 `~\u002F.automate\u002Fscripts\u002F` 目录下，支持手动编辑和版本控制。\n\n### 核心能力概览\n\nautoMate 底层支持以下原子操作，AI 会根据需要组合使用：\n\n*   `screenshot`: 截屏分析\n*   `click` \u002F `double_click`: 鼠标点击\n*   `type_text`: 输入文本（支持中文）\n*   `press_key`: 键盘快捷键（如 `ctrl+c`）\n*   `scroll`: 滚动页面\n*   `drag`: 拖拽操作","某视频运营团队每天需将数十个剪映工程文件导出为抖音专用的 9:16 竖屏 MP4 格式，并统一命名归档。\n\n### 没有 autoMate 时\n- **重复机械操作**：员工必须手动打开每个工程，依次点击“导出”、选择分辨率 1080×1920、切换格式为 MP4，全程无法并行处理其他工作。\n- **易出错且标准不一**：高频重复点击容易导致选错参数（如误选横屏比例），不同员工的操作习惯也导致输出文件规格不一致。\n- **无 API 集成困境**：剪映等桌面软件缺乏开放 API，传统 RPA 工具配置复杂且难以适应界面微调，无法通过代码直接调用导出功能。\n- **跨平台支持缺失**：团队中部分成员使用 macOS，而主流自动化工具（如 Quicker）仅限 Windows，导致工作流无法统一。\n\n### 使用 autoMate 后\n- **自然语言一键执行**：只需对 Claude 说“把当前剪映项目导出为抖音格式”，autoMate 即可自动控制鼠标键盘完成全套导出流程，释放人力。\n- **标准化脚本复用**：将首次成功的操作保存为 `jianying_export_douyin` 脚本，后续无论谁执行，都能确保分辨率、格式等参数绝对一致，消除人为失误。\n- **突破 API 限制**：autoMate 直接基于屏幕视觉识别和 GUI 控件操作，无需软件提供接口，完美解决剪映、Photoshop 等封闭软件的自动化难题。\n- **全平台无缝协作**：无论是 Windows 还是 Mac 电脑，只需安装 autoMate 即可运行同一套自动化脚本，彻底打通跨操作系统的工作流。\n\nautoMate 让 AI 拥有了操控任意桌面软件的“手和眼”，将原本需要人工反复点击的封闭软件操作，转化为可复用、零配置的自然语言指令。","https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002Fyuruotong1_autoMate_ff304046.png","yuruotong1","Dongle","https:\u002F\u002Foss.gittoolsai.com\u002Favatars\u002Fyuruotong1_30e4c887.png",null,"https:\u002F\u002Fgithub.com\u002Fyuruotong1",[79],{"name":80,"color":81,"percentage":82},"Python","#3572A5",100,3894,490,"2026-04-18T12:48:17","MIT","Windows, macOS, Linux","未说明",{"notes":90,"python":91,"dependencies":92},"该工具是一个 MCP 服务器，用于通过 AI 控制桌面 GUI 应用。安装前必须先运行 'pip install uv'。它不依赖特定的 GPU 或大模型本地运行（由宿主 LLM 负责推理），而是通过坐标点击、键盘输入等方式操作界面。脚本保存在 ~\u002F.automate\u002Fscripts\u002F 目录下。","未说明 (需安装 uv 包管理器)",[93,94],"uv","automate-mcp",[35,13,15,14],[97,98,99,100,101,102,103,104,105,106,107],"agent","ai","deepseek","ollama","omniparser","rpa","computeruse","manus","openai","response","openmanus","2026-03-27T02:49:30.150509","2026-04-19T09:17:51.822768",[111,116,121,126,131,135],{"id":112,"question_zh":113,"answer_zh":114,"source_url":115},41950,"运行时报错 JSONDecodeError: Expecting value，如何解决？","该错误通常由模型返回数据格式不正确或网络请求失败导致。请确保：1. 安装的 torchvision 版本与 PyTorch 及 CUDA 版本完全兼容（参考 README 中的版本对应表）；2. 不要使用不稳定的模型（如 GPT-4.5），建议使用官方测试通过的模型列表（如 gpt-4o）；3. 检查 API Key 是否正确且从官网获取；4. 若使用国内网络，确认无需 VPN 即可连接目标 API，或检查代理设置。","https:\u002F\u002Fgithub.com\u002Fyuruotong1\u002FautoMate\u002Fissues\u002F64",{"id":117,"question_zh":118,"answer_zh":119,"source_url":120},41951,"启动服务后访问 http:\u002F\u002F0.0.0.0:7888 出现 502 错误或无法连接怎么办？","http:\u002F\u002F0.0.0.0:7888 是监听地址，不是可访问的 URL。请改为访问 http:\u002F\u002F127.0.0.1:7888。此外，请确保代码已更新到最新 master 分支（旧版本代码行号可能不一致导致报错），并检查是否因浏览器自动翻译导致配置理解错误。若仍报错，尝试降低 numpy 版本至 1.x 系列以兼容当前环境。","https:\u002F\u002Fgithub.com\u002Fyuruotong1\u002FautoMate\u002Fissues\u002F56",{"id":122,"question_zh":123,"answer_zh":124,"source_url":125},41952,"使用 GPT-4 模型时出现 TaskPlanResponse 解析 JSON 格式错误，如何处理？","不要使用 gpt-4 或 gpt-4.5 模型，目前资源紧张且兼容性差。请改用 gpt-4o 模型，该项目 README 首页提供了已测试通过的模型列表。同时可通过 README 中的微信二维码联系作者获取进一步支持。","https:\u002F\u002Fgithub.com\u002Fyuruotong1\u002FautoMate\u002Fissues\u002F98",{"id":127,"question_zh":128,"answer_zh":129,"source_url":130},41953,"无法连接到 Hugging Face 服务器导致超时（TimeoutError），如何解决？","此问题多因国内网络无法直接访问 Hugging Face 所致。解决方案包括：1. 配置系统级代理或使用科学上网工具；2. 使用镜像源下载模型文件（如 huggingface.co 的国内镜像）；3. 手动下载所需模型文件并放置到项目指定的模型目录中，避免程序自动拉取。同时请根据 README 安装与 GPU 驱动匹配的 PyTorch 版本。","https:\u002F\u002Fgithub.com\u002Fyuruotong1\u002FautoMate\u002Fissues\u002F97",{"id":132,"question_zh":133,"answer_zh":134,"source_url":130},41954,"GPU 未被识别（cuda is_available: False），但已安装显卡驱动，怎么办？","请严格按照 README 指示安装与当前 CUDA 版本匹配的 PyTorch 和 torchvision 版本。常见错误是安装了 CPU 版 PyTorch 或版本不匹配。可通过命令 `pip install torch torchvision torchaudio --index-url https:\u002F\u002Fdownload.pytorch.org\u002Fwhl\u002Fcu118`（根据实际 CUDA 版本调整）重新安装 GPU 版本。安装后运行 `python -c \"import torch; print(torch.cuda.is_available())\"` 验证。",{"id":136,"question_zh":137,"answer_zh":138,"source_url":120},41955,"Server process terminated unexpectedly 错误如何排查？","该错误通常由后端服务启动失败引起。请按以下步骤排查：1. 确认端口未被占用（可使用 `netstat -ano | findstr :7888` 检查）；2. 重新克隆最新代码确保与 master 分支一致；3. 重装依赖（特别是 PyTorch 和 numpy，建议 numpy 降至 1.x 版本）；4. 检查是否有权限问题或防火墙拦截。若问题依旧，查看完整日志定位具体异常堆栈。",[140,145,150,155,160,165,170,175,180,185,190,195],{"id":141,"version":142,"summary_zh":143,"released_at":144},333955,"v3.1","## 📦 下载安装\n\n| 平台 | 文件 |\n|------|------|\n| Windows x64 | `autoMate-windows-x64.zip` |\n| macOS Apple Silicon (M1\u002FM2\u002FM3) | `autoMate-macos-arm64.zip` |\n| Linux x64 | `autoMate-linux-x64.tar.gz` |\n\n### Windows\n1. 解压 `autoMate-windows-x64.zip`\n2. 运行 `autoMate\\autoMate.exe`\n\n### macOS\n1. 解压 zip\n2. 右键 → 打开 `autoMate.app`（首次需右键绕过 Gatekeeper）\n3. 在系统设置 → 隐私与安全性 中授予**辅助功能**和**屏幕录制**权限\n\n### Linux\n1. 解压：`tar xzf autoMate-linux-x64.tar.gz`\n2. 运行：`.\u002FautoMate\u002FautoMate`\n3. 如需剪贴板支持：`sudo apt install xclip`\n\n---\n> 首次启动会自动下载模型权重（~50 MB），请在设置中填写 LLM API Key。\n\n\n## 变更内容\n* 功能：使用 OpenAI SDK 替代 pyxbrain，以实现跨平台的 LLM 支持，由 @yuruotong1 在 https:\u002F\u002Fgithub.com\u002Fyuruotong1\u002FautoMate\u002Fpull\u002F146 中完成\n* 功能：新增 MCP 服务器支持，并更新 README 文档以适应多平台，由 @yuruotong1 在 https:\u002F\u002Fgithub.com\u002Fyuruotong1\u002FautoMate\u002Fpull\u002F147 中完成\n\n\n**完整变更日志**: https:\u002F\u002Fgithub.com\u002Fyuruotong1\u002FautoMate\u002Fcompare\u002Fv3.0...v3.1","2026-03-30T23:19:16",{"id":146,"version":147,"summary_zh":148,"released_at":149},333956,"v3.0","1. 新版本。 2. 使用 YOLO，通过 OpenAI 控制电脑 3. Windows 版本","2025-03-20T14:43:28",{"id":151,"version":152,"summary_zh":153,"released_at":154},333957,"v2.2.3","1. 智子生成代码后，在下方新增“运行”和“应用”两个按钮，点击“应用”后会将代码覆盖到代码编辑区 #9；\r\n2. 搜索界面增加版本号，便于用户查看当前版本；\r\n3. 新增“关于”界面，右键托盘中的图标即可进入“关于”界面，可查看当前版本 #24；\r\n4. 自动更新功能移至“关于”界面，更新过程中会显示进度 #14；\r\n5. 智子进行全面升级，具备代码记忆功能，理论上可以对已有代码进行修改 #5。","2024-07-15T02:00:53",{"id":156,"version":157,"summary_zh":158,"released_at":159},333958,"v2.2.2","1. 配置出错时增加更详细的信息 #20 2. 优化代码生成逻辑，取消自动更新code","2024-07-10T15:01:45",{"id":161,"version":162,"summary_zh":163,"released_at":164},333959,"v2.2.1","1. 自动检测新版本，可一键下载自动安装更新 #8 2. 将通义千问设置为 Ollama 的默认模型 #13","2024-07-09T11:22:06",{"id":166,"version":167,"summary_zh":168,"released_at":169},333960,"v2.2","1. 将大模型配置界面改为输入框；\r\n2. 配置好大模型信息后，可以点击“检测”按钮；\r\n3. 在大模型信息配置界面增加“取消”和“保存”按钮；\r\n4. 在搜索框中输入内容并按下回车键，即可跳转到代码编辑界面，并自动与智子开始对话。","2024-07-05T12:59:33",{"id":171,"version":172,"summary_zh":173,"released_at":174},333961,"v2.1","1. 理论上，已经支持几乎所有的大模型，包括api和本地大模型（ollama）；\r\n2. 代码运行支持selenium、requests、python-docx，意味着你可以控制浏览器、发送http请求以及操作word文档；\r\n3. 修复聊天窗口上跳问题；\r\n4. 生成代码中和生成代码后，智子会给出友好的提示。\r\n\r\nhttps:\u002F\u002Fs0soyusc93k.feishu.cn\u002Fwiki\u002FJhhIwAUXJiBHG9kmt3YcXisWnec?from=from_copylink","2024-07-04T02:54:37",{"id":176,"version":177,"summary_zh":178,"released_at":179},333962,"v2.0","autoMate 2.0 全新界面，所有界面全面重构，为你带来全新体验！\n\n1. 新增搜索界面，一键直达操作，快速便捷；\n2. 新增代码编辑\u002F执行界面，无需安装任何环境，支持 Python 代码高亮与语法检查、代码执行；\n3. 新增配置界面，可自定义唤醒快捷键，也可配置大模型相关信息；\n4. 新增系统托盘功能，在右下角轻松管理 autoMate；\n5. 新增快捷键隐藏与打开功能，默认按 Alt+D 可呼出隐藏的主界面；\n6. 新增 AI 智子助手的右下角隐藏与打开功能；\n7. 新增代码块保存与分类功能，智子自动生成的自动化代码可保存、命名、分类；\n8. 新增错误提示：若未配置大模型信息，将显示醒目的错误提示，10 秒后自动消失；\n9. 还有更多超多新功能，等你来体验！","2024-07-02T15:13:07",{"id":181,"version":182,"summary_zh":183,"released_at":184},333963,"v1.2","增加了代码生成、代码运行！","2024-06-05T07:29:01",{"id":186,"version":187,"summary_zh":188,"released_at":189},333964,"v1.1","1. 添加 Python 编辑器  \n2. 添加运行监控中间件  \n3. 修复若干 bug","2024-05-06T02:31:58",{"id":191,"version":192,"summary_zh":193,"released_at":194},333965,"v1.0","1. 增加组件拖拽能力，加强问答能力；\r\n2. 修复若干bug。","2024-04-18T12:35:37",{"id":196,"version":197,"summary_zh":76,"released_at":198},333966,"v0.1","2024-04-10T13:02:07"]