[{"data":1,"prerenderedAt":-1},["ShallowReactive",2],{"similar-CursorTouch--Windows-MCP":3,"tool-CursorTouch--Windows-MCP":64},[4,17,27,35,43,56],{"id":5,"name":6,"github_repo":7,"description_zh":8,"stars":9,"difficulty_score":10,"last_commit_at":11,"category_tags":12,"status":16},3808,"stable-diffusion-webui","AUTOMATIC1111\u002Fstable-diffusion-webui","stable-diffusion-webui 是一个基于 Gradio 构建的网页版操作界面，旨在让用户能够轻松地在本地运行和使用强大的 Stable Diffusion 图像生成模型。它解决了原始模型依赖命令行、操作门槛高且功能分散的痛点，将复杂的 AI 绘图流程整合进一个直观易用的图形化平台。\n\n无论是希望快速上手的普通创作者、需要精细控制画面细节的设计师，还是想要深入探索模型潜力的开发者与研究人员，都能从中获益。其核心亮点在于极高的功能丰富度：不仅支持文生图、图生图、局部重绘（Inpainting）和外绘（Outpainting）等基础模式，还独创了注意力机制调整、提示词矩阵、负向提示词以及“高清修复”等高级功能。此外，它内置了 GFPGAN 和 CodeFormer 等人脸修复工具，支持多种神经网络放大算法，并允许用户通过插件系统无限扩展能力。即使是显存有限的设备，stable-diffusion-webui 也提供了相应的优化选项，让高质量的 AI 艺术创作变得触手可及。",162132,3,"2026-04-05T11:01:52",[13,14,15],"开发框架","图像","Agent","ready",{"id":18,"name":19,"github_repo":20,"description_zh":21,"stars":22,"difficulty_score":23,"last_commit_at":24,"category_tags":25,"status":16},1381,"everything-claude-code","affaan-m\u002Feverything-claude-code","everything-claude-code 是一套专为 AI 编程助手（如 Claude Code、Codex、Cursor 等）打造的高性能优化系统。它不仅仅是一组配置文件，而是一个经过长期实战打磨的完整框架，旨在解决 AI 代理在实际开发中面临的效率低下、记忆丢失、安全隐患及缺乏持续学习能力等核心痛点。\n\n通过引入技能模块化、直觉增强、记忆持久化机制以及内置的安全扫描功能，everything-claude-code 能显著提升 AI 在复杂任务中的表现，帮助开发者构建更稳定、更智能的生产级 AI 代理。其独特的“研究优先”开发理念和针对 Token 消耗的优化策略，使得模型响应更快、成本更低，同时有效防御潜在的攻击向量。\n\n这套工具特别适合软件开发者、AI 研究人员以及希望深度定制 AI 工作流的技术团队使用。无论您是在构建大型代码库，还是需要 AI 协助进行安全审计与自动化测试，everything-claude-code 都能提供强大的底层支持。作为一个曾荣获 Anthropic 黑客大奖的开源项目，它融合了多语言支持与丰富的实战钩子（hooks），让 AI 真正成长为懂上",138956,2,"2026-04-05T11:33:21",[13,15,26],"语言模型",{"id":28,"name":29,"github_repo":30,"description_zh":31,"stars":32,"difficulty_score":23,"last_commit_at":33,"category_tags":34,"status":16},2271,"ComfyUI","Comfy-Org\u002FComfyUI","ComfyUI 是一款功能强大且高度模块化的视觉 AI 引擎，专为设计和执行复杂的 Stable Diffusion 图像生成流程而打造。它摒弃了传统的代码编写模式，采用直观的节点式流程图界面，让用户通过连接不同的功能模块即可构建个性化的生成管线。\n\n这一设计巧妙解决了高级 AI 绘图工作流配置复杂、灵活性不足的痛点。用户无需具备编程背景，也能自由组合模型、调整参数并实时预览效果，轻松实现从基础文生图到多步骤高清修复等各类复杂任务。ComfyUI 拥有极佳的兼容性，不仅支持 Windows、macOS 和 Linux 全平台，还广泛适配 NVIDIA、AMD、Intel 及苹果 Silicon 等多种硬件架构，并率先支持 SDXL、Flux、SD3 等前沿模型。\n\n无论是希望深入探索算法潜力的研究人员和开发者，还是追求极致创作自由度的设计师与资深 AI 绘画爱好者，ComfyUI 都能提供强大的支持。其独特的模块化架构允许社区不断扩展新功能，使其成为当前最灵活、生态最丰富的开源扩散模型工具之一，帮助用户将创意高效转化为现实。",107662,"2026-04-03T11:11:01",[13,14,15],{"id":36,"name":37,"github_repo":38,"description_zh":39,"stars":40,"difficulty_score":23,"last_commit_at":41,"category_tags":42,"status":16},3704,"NextChat","ChatGPTNextWeb\u002FNextChat","NextChat 是一款轻量且极速的 AI 助手，旨在为用户提供流畅、跨平台的大模型交互体验。它完美解决了用户在多设备间切换时难以保持对话连续性，以及面对众多 AI 模型不知如何统一管理的痛点。无论是日常办公、学习辅助还是创意激发，NextChat 都能让用户随时随地通过网页、iOS、Android、Windows、MacOS 或 Linux 端无缝接入智能服务。\n\n这款工具非常适合普通用户、学生、职场人士以及需要私有化部署的企业团队使用。对于开发者而言，它也提供了便捷的自托管方案，支持一键部署到 Vercel 或 Zeabur 等平台。\n\nNextChat 的核心亮点在于其广泛的模型兼容性，原生支持 Claude、DeepSeek、GPT-4 及 Gemini Pro 等主流大模型，让用户在一个界面即可自由切换不同 AI 能力。此外，它还率先支持 MCP（Model Context Protocol）协议，增强了上下文处理能力。针对企业用户，NextChat 提供专业版解决方案，具备品牌定制、细粒度权限控制、内部知识库整合及安全审计等功能，满足公司对数据隐私和个性化管理的高标准要求。",87618,"2026-04-05T07:20:52",[13,26],{"id":44,"name":45,"github_repo":46,"description_zh":47,"stars":48,"difficulty_score":23,"last_commit_at":49,"category_tags":50,"status":16},2268,"ML-For-Beginners","microsoft\u002FML-For-Beginners","ML-For-Beginners 是由微软推出的一套系统化机器学习入门课程，旨在帮助零基础用户轻松掌握经典机器学习知识。这套课程将学习路径规划为 12 周，包含 26 节精炼课程和 52 道配套测验，内容涵盖从基础概念到实际应用的完整流程，有效解决了初学者面对庞大知识体系时无从下手、缺乏结构化指导的痛点。\n\n无论是希望转型的开发者、需要补充算法背景的研究人员，还是对人工智能充满好奇的普通爱好者，都能从中受益。课程不仅提供了清晰的理论讲解，还强调动手实践，让用户在循序渐进中建立扎实的技能基础。其独特的亮点在于强大的多语言支持，通过自动化机制提供了包括简体中文在内的 50 多种语言版本，极大地降低了全球不同背景用户的学习门槛。此外，项目采用开源协作模式，社区活跃且内容持续更新，确保学习者能获取前沿且准确的技术资讯。如果你正寻找一条清晰、友好且专业的机器学习入门之路，ML-For-Beginners 将是理想的起点。",84991,"2026-04-05T10:45:23",[14,51,52,53,15,54,26,13,55],"数据工具","视频","插件","其他","音频",{"id":57,"name":58,"github_repo":59,"description_zh":60,"stars":61,"difficulty_score":10,"last_commit_at":62,"category_tags":63,"status":16},3128,"ragflow","infiniflow\u002Fragflow","RAGFlow 是一款领先的开源检索增强生成（RAG）引擎，旨在为大语言模型构建更精准、可靠的上下文层。它巧妙地将前沿的 RAG 技术与智能体（Agent）能力相结合，不仅支持从各类文档中高效提取知识，还能让模型基于这些知识进行逻辑推理和任务执行。\n\n在大模型应用中，幻觉问题和知识滞后是常见痛点。RAGFlow 通过深度解析复杂文档结构（如表格、图表及混合排版），显著提升了信息检索的准确度，从而有效减少模型“胡编乱造”的现象，确保回答既有据可依又具备时效性。其内置的智能体机制更进一步，使系统不仅能回答问题，还能自主规划步骤解决复杂问题。\n\n这款工具特别适合开发者、企业技术团队以及 AI 研究人员使用。无论是希望快速搭建私有知识库问答系统，还是致力于探索大模型在垂直领域落地的创新者，都能从中受益。RAGFlow 提供了可视化的工作流编排界面和灵活的 API 接口，既降低了非算法背景用户的上手门槛，也满足了专业开发者对系统深度定制的需求。作为基于 Apache 2.0 协议开源的项目，它正成为连接通用大模型与行业专有知识之间的重要桥梁。",77062,"2026-04-04T04:44:48",[15,14,13,26,54],{"id":65,"github_repo":66,"name":67,"description_en":68,"description_zh":69,"ai_summary_zh":69,"readme_en":70,"readme_zh":71,"quickstart_zh":72,"use_case_zh":73,"hero_image_url":74,"owner_login":75,"owner_name":75,"owner_avatar_url":76,"owner_bio":77,"owner_company":78,"owner_location":78,"owner_email":78,"owner_twitter":75,"owner_website":78,"owner_url":79,"languages":80,"stars":85,"forks":86,"last_commit_at":87,"license":88,"difficulty_score":23,"env_os":89,"env_gpu":90,"env_ram":90,"env_deps":91,"category_tags":96,"github_topics":97,"view_count":23,"oss_zip_url":78,"oss_zip_packed_at":78,"status":16,"created_at":104,"updated_at":105,"faqs":106,"releases":136},3855,"CursorTouch\u002FWindows-MCP","Windows-MCP","MCP Server for Computer Use in Windows","Windows-MCP 是一款轻量级开源项目，旨在搭建大语言模型（LLM）与 Windows 操作系统之间的桥梁。它作为 MCP 服务器运行，让 AI 智能体能够像真实用户一样直接操作电脑，执行文件管理、应用控制、界面交互及自动化测试等任务。\n\n这一工具解决了传统自动化方案依赖复杂计算机视觉技术或特定微调模型的痛点。Windows-MCP 无需额外的视觉识别模块，即可兼容任意大语言模型，显著降低了部署难度和系统资源消耗。其独特亮点包括支持“文档对象模型（DOM）模式”以高效处理浏览器自动化，以及低至 0.2 秒的实时交互响应速度。此外，它还提供了丰富的键盘鼠标模拟工具，并允许开发者根据需求灵活扩展功能。\n\nWindows-MCP 非常适合希望将 AI 能力落地到桌面端的开发者、研究人员及自动化测试工程师。无论是构建复杂的自主智能体，还是探索人机交互的新范式，它都提供了一个基于 MIT 协议、易于安装且高度可定制的坚实基础。目前该工具已支持从 Windows 7 到 Windows 11 的全系列系统，并可通过 Python 环境快速部署。","[![MseeP.ai Security Assessment Badge](https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002FCursorTouch_Windows-MCP_readme_e2bbb56b4f3b.png)](https:\u002F\u002Fmseep.ai\u002Fapp\u002Fcursortouch-windows-mcp)\n\n\u003Cdiv align=\"center\">\n  \u003Ch1>🪟 Windows-MCP\u003C\u002Fh1>\n\n  \u003Ca href=\"https:\u002F\u002Fgithub.com\u002FCursorTouch\u002FWindows-MCP\u002Fblob\u002Fmain\u002FLICENSE\">\n    \u003Cimg src=\"https:\u002F\u002Fimg.shields.io\u002Fbadge\u002Flicense-MIT-green\" alt=\"License\">\n  \u003C\u002Fa>\n  \u003Cimg src=\"https:\u002F\u002Fimg.shields.io\u002Fbadge\u002Fpython-3.13%2B-blue\" alt=\"Python\">\n  \u003Cimg src=\"https:\u002F\u002Fimg.shields.io\u002Fbadge\u002Fplatform-Windows%207–11-blue\" alt=\"Platform: Windows 7 to 11\">\n  \u003Cimg src=\"https:\u002F\u002Fimg.shields.io\u002Fgithub\u002Flast-commit\u002FCursorTouch\u002FWindows-MCP\" alt=\"Last Commit\">\n  \u003Cbr>\n  \u003Ca href=\"https:\u002F\u002Fx.com\u002FCursorTouch\">\n    \u003Cimg src=\"https:\u002F\u002Fimg.shields.io\u002Fbadge\u002Ffollow-%40CursorTouch-1DA1F2?logo=twitter&style=flat\" alt=\"Follow on Twitter\">\n  \u003C\u002Fa>\n  \u003Ca href=\"https:\u002F\u002Fdiscord.com\u002Finvite\u002FAue9Yj2VzS\">\n    \u003Cimg src=\"https:\u002F\u002Fimg.shields.io\u002Fbadge\u002FJoin%20on-Discord-5865F2?logo=discord&logoColor=white&style=flat\" alt=\"Join us on Discord\">\n  \u003C\u002Fa>\n\n\u003C\u002Fdiv>\n\n\u003Cbr>\n\n**Windows-MCP** is a lightweight, open-source project that enables seamless integration between AI agents and the Windows operating system. Acting as an MCP server bridges the gap between LLMs and the Windows operating system, allowing agents to perform tasks such as **file navigation, application control, UI interaction, QA testing,** and more.\n\nmcp-name: io.github.CursorTouch\u002FWindows-MCP\n\n## Updates\n- Added VM support for Windows-MCP. Check (windowsmcp.io)[https:\u002F\u002Fwindowsmcp.io\u002F] for more details.\n- Windows-MCP reached `2M+ Users` in [Claude Desktop Extensiosn](https:\u002F\u002Fclaude.ai\u002Fdirectory). \n- Try out [🪟Windows-Use](https:\u002F\u002Fpypi.org\u002Fproject\u002Fwindows-use\u002F), an agent built using Windows-MCP.\n- Windows-MCP is now available on [PyPI](https:\u002F\u002Fpypi.org\u002Fproject\u002Fwindows-mcp\u002F) (thus supports `uvx windows-mcp`)\n- Windows-MCP is added to [MCP Registry](https:\u002F\u002Fgithub.com\u002Fmodelcontextprotocol\u002Fregistry)\n\n### Supported Operating Systems\n\n- Windows 7\n- Windows 8, 8.1\n- Windows 10\n- Windows 11  \n\n## 🎥 Demos\n\n\u003Chttps:\u002F\u002Fgithub.com\u002Fuser-attachments\u002Fassets\u002Fd0e7ed1d-6189-4de6-838a-5ef8e1cad54e>\n\n\u003Chttps:\u002F\u002Fgithub.com\u002Fuser-attachments\u002Fassets\u002Fd2b372dc-8d00-4d71-9677-4c64f5987485>\n\n## ✨ Key Features\n\n- **Seamless Windows Integration**  \n  Interacts natively with Windows UI elements, opens apps, controls windows, simulates user input, and more.\n\n- **Use Any LLM (Vision Optional)**\n   Unlike many automation tools, Windows-MCP doesn't rely on any traditional computer vision techniques or specific fine-tuned models; it works with any LLMs, reducing complexity and setup time.\n\n- **Rich Toolset for UI Automation**  \n  Includes tools for basic keyboard, mouse operation and capturing window\u002FUI state.\n\n- **Lightweight & Open-Source**  \n  Minimal dependencies and easy setup with full source code available under MIT license.\n\n- **Customizable & Extendable**  \n  Easily adapt or extend tools to suit your unique automation or AI integration needs.\n\n- **Real-Time Interaction**  \n  Typical latency between actions (e.g., from one mouse click to the next) ranges from **0.2 to 0.9 secs**, and may slightly vary based on the number of active applications and system load, also the inferencing speed of the llm.\n\n- **DOM Mode for Browser Automation**  \n  Special `use_dom=True` mode for State-Tool that focuses exclusively on web page content, filtering out browser UI elements for cleaner, more efficient web automation.\n\n## 🛠️Installation\n\n**Note:** When you install this MCP server for the first time it may take a minute or two because of installing the dependencies in `pyproject.toml`. In the first run the server may timeout ignore it and restart it.\n\n### Prerequisites\n\n- Python 3.13+\n- UV (Package Manager) from Astra, install with `pip install uv` or `curl -LsSf https:\u002F\u002Fastral.sh\u002Fuv\u002Finstall.sh | sh`\n- `English` as the default language in Windows preferred else disable the `App-Tool` in the MCP Server for Windows with other languages.\n\u003Cdetails>\n  \u003Csummary>Install in Claude Desktop\u003C\u002Fsummary>\n\n  1. Install [Claude Desktop](https:\u002F\u002Fclaude.ai\u002Fdownload) and\n\n```shell\nnpm install -g @anthropic-ai\u002Fmcpb\n```\n\n\n  2. Configure the extension:\n\n  **Option A: Install from PyPI (Recommended)**\n  \n  Use `uvx` to run the latest version directly from PyPI.\n\n  Add this to your `claude_desktop_config.json`:\n  ```json\n  {\n    \"mcpServers\": {\n      \"windows-mcp\": {\n        \"command\": \"uvx\",\n        \"args\": [\n          \"windows-mcp\"\n        ]\n      }\n    }\n  }\n  ```\n\n  **Option B: Install from Source**\n\n  1. Clone the repository:\n  ```shell\n  git clone https:\u002F\u002Fgithub.com\u002FCursorTouch\u002FWindows-MCP.git\n  cd Windows-MCP\n  ```\n\n  2. Add this to your `claude_desktop_config.json`:\n  ```json\n  {\n    \"mcpServers\": {\n      \"windows-mcp\": {\n        \"command\": \"uv\",\n        \"args\": [\n          \"--directory\",\n          \"\u003Cpath to the windows-mcp directory>\",\n          \"run\",\n          \"windows-mcp\"\n        ]\n      }\n    }\n  }\n  ```\n\n\n\n  3. Open Claude Desktop and enjoy! 🥳\n\n\n  5. Enjoy 🥳.\n\n  **Claude Desktop MSIX (Windows Store)**\n\n  The MSIX-packaged Claude Desktop virtualizes `%APPDATA%`. Config lives at:\n  `%LOCALAPPDATA%\\Packages\\Claude_pzs8sxrjxfjjc\\LocalCache\\Roaming\\Claude\\claude_desktop_config.json`\n  (not `%APPDATA%\\Claude\\`). The \"Edit Config\" button may open the wrong file.\n\n  Electron apps also do not inherit PATH, so `uv`\u002F`uvx` can fail with `spawn ENOENT`. Use the **full absolute path** to `uv.exe`:\n\n  ```json\n  {\n    \"mcpServers\": {\n      \"windows-mcp\": {\n        \"command\": \"C:\\\\Users\\\\\u003Cuser>\\\\.local\\\\bin\\\\uv.exe\",\n        \"args\": [\n          \"--directory\",\n          \"C:\\\\Users\\\\\u003Cuser>\\\\AppData\\\\Local\\\\Packages\\\\Claude_pzs8sxrjxfjjc\\\\LocalCache\\\\Roaming\\\\Claude\\\\Claude Extensions\\\\ant.dir.cursortouch.windows-mcp\",\n          \"run\",\n          \"windows-mcp\"\n        ]\n      }\n    }\n  }\n  ```\n\n  Replace `\u003Cuser>` with your username. To find `uv.exe`, run `where uv` in a terminal; common location is `%USERPROFILE%\\.local\\bin\\uv.exe`. For PyPI install, use `args: [\"run\", \"windows-mcp\"]` instead of `--directory`\u002Fpath. Save as **UTF-8 without BOM** (PowerShell `Set-Content -Encoding UTF8` adds a BOM that breaks the JSON parser).\n\n  For additional Claude Desktop integration troubleshooting, see the [MCP documentation](https:\u002F\u002Fmodelcontextprotocol.io\u002Fquickstart\u002Fserver#claude-for-desktop-integration-issues).\n\u003C\u002Fdetails>\n\n\u003Cdetails>\n  \u003Csummary>Install in Perplexity Desktop\u003C\u002Fsummary>\n\n  1. Install [Perplexity Desktop](https:\u002F\u002Fapps.microsoft.com\u002Fdetail\u002Fxp8jnqfbqh6pvf):\n\n  2. Clone the repository.\n\n```shell\ngit clone https:\u002F\u002Fgithub.com\u002FCursorTouch\u002FWindows-MCP.git\n\ncd Windows-MCP\n```\n  \n  3. Open Perplexity Desktop:\n\nGo to `Settings->Connectors->Add Connector->Advanced`\n\n  4. Enter the name as `Windows-MCP`, then paste the following JSON in the text area.\n\n\n  **Option A: Install from PyPI (Recommended)**\n\n  ```json\n  {\n    \"command\": \"uvx\",\n    \"args\": [\n      \"windows-mcp\"\n    ]\n  }\n  ```\n\n  **Option B: Install from Source**\n\n  ```json\n  {\n    \"command\": \"uv\",\n    \"args\": [\n      \"--directory\",\n      \"\u003Cpath to the windows-mcp directory>\",\n      \"run\",\n      \"windows-mcp\"\n    ]\n  }\n  ```\n\n\n5. Click `Save` and Enjoy 🥳.\n\nFor additional Claude Desktop integration troubleshooting, see the [Perplexity MCP Support](https:\u002F\u002Fwww.perplexity.ai\u002Fhelp-center\u002Fen\u002Farticles\u002F11502712-local-and-remote-mcps-for-perplexity). The documentation includes helpful tips for checking logs and resolving common issues.\n\u003C\u002Fdetails>\n\n\u003Cdetails>\n  \u003Csummary> Install in Gemini CLI\u003C\u002Fsummary>\n\n  1. Install Gemini CLI:\n\n```shell\nnpm install -g @google\u002Fgemini-cli\n```\n\n\n  2. Configure the server in `%USERPROFILE%\u002F.gemini\u002Fsettings.json`:\n\n\n  3. Navigate to `%USERPROFILE%\u002F.gemini` in File Explorer and open `settings.json`.\n\n  4. Add the `windows-mcp` config in the `settings.json` and save it.\n\n```json\n{\n  \"theme\": \"Default\",\n  ...\n  \"mcpServers\": {\n    \"windows-mcp\": {\n      \"command\": \"uvx\",\n      \"args\": [\n        \"windows-mcp\"\n      ]\n    }\n  }\n}\n```\n*Note: To run from source, replace the command with `uv` and args with `[\"--directory\", \"\u003Cpath>\", \"run\", \"windows-mcp\"]`.*\n\n\n  5. Rerun Gemini CLI in terminal. Enjoy 🥳\n\u003C\u002Fdetails>\n\n\u003Cdetails>\n  \u003Csummary>Install in Qwen Code\u003C\u002Fsummary>\n  1. Install Qwen Code:\n\n```shell\nnpm install -g @qwen-code\u002Fqwen-code@latest\n```\n\n   2. Configure the server in `%USERPROFILE%\u002F.qwen\u002Fsettings.json`:\n\n\n  3. Navigate to `%USERPROFILE%\u002F.qwen\u002Fsettings.json`.\n\n  4. Add the `windows-mcp` config in the `settings.json` and save it.\n\n```json\n{\n  \"mcpServers\": {\n    \"windows-mcp\": {\n      \"command\": \"uvx\",\n      \"args\": [\n        \"windows-mcp\"\n      ]\n    }\n  }\n}\n```\n*Note: To run from source, replace the command with `uv` and args with `[\"--directory\", \"\u003Cpath>\", \"run\", \"windows-mcp\"]`.*\n\n\n  5. Rerun Qwen Code in terminal. Enjoy 🥳\n\u003C\u002Fdetails>\n\n\u003Cdetails>\n  \u003Csummary>Install in Codex CLI\u003C\u002Fsummary>\n  1. Install Codex CLI:\n\n```shell\nnpm install -g @openai\u002Fcodex\n```\n\n  2. Configure the server in `%USERPROFILE%\u002F.codex\u002Fconfig.toml`:\n\n  3. Navigate to `%USERPROFILE%\u002F.codex\u002Fconfig.toml`.\n\n  4. Add the `windows-mcp` config in the `config.toml` and save it.\n\n```toml\n[mcp_servers.windows-mcp]\ncommand=\"uvx\"\nargs=[\n  \"windows-mcp\"\n]\n```\n*Note: To run from source, replace the command with `uv` and args with `[\"--directory\", \"\u003Cpath>\", \"run\", \"windows-mcp\"]`.*\n\n\n  5. Rerun Codex CLI in terminal. Enjoy 🥳\n\u003C\u002Fdetails>\n\n\u003Cdetails>\n  \u003Csummary>Install in Claude Code\u003C\u002Fsummary>\n\n  1. Install [Claude Code](https:\u002F\u002Fdocs.anthropic.com\u002Fen\u002Fdocs\u002Fclaude-code\u002Foverview):\n\n```shell\nnpm install -g @anthropic-ai\u002Fclaude-code\n```\n\n  2. Configure the server:\n\n  **Option A: Install from PyPI (Recommended)**\n\n  Use `uvx` to run the latest version directly from PyPI.\n\n  ```shell\n  claude mcp add --transport stdio windows-mcp -- uvx windows-mcp\n  ```\n\n  **Option B: Install from Source**\n\n  1. Clone the repository:\n  ```shell\n  git clone https:\u002F\u002Fgithub.com\u002FCursorTouch\u002FWindows-MCP.git\n  cd Windows-MCP\n  ```\n\n  2. Run the following command in your terminal:\n  ```shell\n  claude mcp add --transport stdio windows-mcp -- uv --directory \"\u003Cpath>\" run windows-mcp\n  ```\n\n  *Note: To make the server available across all projects, add `--scope user` to the command.*\n\n  3. Rerun Claude Code in terminal. Enjoy 🥳\n\n  **Note:** On Windows, if you encounter \"Connection closed\" errors, use the full path to `uvx.exe`:\n\n  ```shell\n  claude mcp add --transport stdio windows-mcp -- C:\\Users\\\u003Cuser>\\.local\\bin\\uvx.exe windows-mcp\n  ```\n\n  To verify the server is registered, run `claude mcp list`. Inside Claude Code, use `\u002Fmcp` to check server status.\n\u003C\u002Fdetails>\n\n---\n\n## 🖥️ Modes\n\nWindows-MCP supports two operating modes: **Local** (default) and **Remote**.\n\n### Local Mode (Default)\n\nIn local mode, Windows-MCP runs directly on your Windows machine and exposes its tools to the connected MCP client. This is the standard setup for personal use.\n\n```shell\n# Runs with stdio transport (default)\nuvx windows-mcp\n\n# Or with SSE\u002FStreamable HTTP for network access\nuvx windows-mcp --transport sse --host localhost --port 8000\nuvx windows-mcp --transport streamable-http --host localhost --port 8000\n```\n\nOptional environment variables can be set to customize behavior — see [Environment Variables](#-environment-variables) below.\n\n### Remote Mode\n\nIn remote mode, Windows-MCP acts as a **proxy** that connects to the [windowsmcp.io](https:\u002F\u002Fwindowsmcp.io) enabling cloud-hosted Windows automation. This is designed for scenarios where the MCP client is remote and connects through the dashboard, which routes requests to a Windows VM running Windows-MCP.\n\nWhen installed as a desktop extension, remote mode should stay on that lightweight proxy path and must not require local Windows automation dependencies to build before startup.\n\n**Required environment variables:**\n\n| Variable | Description |\n|---|---|\n| `MODE` | Set to `remote` |\n| `SANDBOX_ID` | The sandbox\u002FVM identifier from the dashboard |\n| `API_KEY` | Your Windows-MCP API key |\n\n**Example configuration:**\n\n```json\n{\n  \"mcpServers\": {\n    \"windows-mcp\": {\n      \"command\": \"uvx\",\n      \"args\": [\n        \"windows-mcp\"\n      ],\n      \"env\": {\n        \"MODE\": \"remote\",\n        \"SANDBOX_ID\": \"your-sandbox-id\",\n        \"API_KEY\": \"your-api-key\"\n      }\n    }\n  }\n}\n```\n\n### Transport Options\n\n| Transport | Flag | Use Case |\n|---|---|---|\n| `stdio` (default) | `--transport stdio` | Direct connection from MCP clients like Claude Desktop, Cursor, etc. |\n| `sse` | `--transport sse --host HOST --port PORT` | Network-accessible via Server-Sent Events |\n| `streamable-http` | `--transport streamable-http --host HOST --port PORT` | Network-accessible via HTTP streaming (recommended for production) |\n\n---\n\n## ⚙️ Environment Variables\n\nAll variables are optional unless noted. Set them via the `env` key in `claude_desktop_config.json` (or your MCP client's equivalent config).\n\n### Screenshot & Snapshot\n\n| Variable | Default | Description |\n|---|---|---|\n| `WINDOWS_MCP_SCREENSHOT_SCALE` | `1.0` | Scale factor applied to screenshots before encoding. Accepts a float in the range `0.1`–`1.0`. Useful on high-resolution displays (1440p, 4K) where the default produces images that exceed Claude Desktop's 1 MB tool-result limit. Set to `0.5` to halve both dimensions (quarter the file size). |\n| `WINDOWS_MCP_SCREENSHOT_BACKEND` | `auto` | Screenshot capture backend. Accepted values: `auto` (tries dxcam → mss → pillow in order), `dxcam`, `mss`, `pillow`. Use `mss` or `pillow` if `dxcam` is unavailable or causes issues on your GPU. |\n| `WINDOWS_MCP_PROFILE_SNAPSHOT` | _(disabled)_ | Set to `1`, `true`, `yes`, or `on` to emit per-stage timing logs for Screenshot\u002FSnapshot calls. Useful for diagnosing slow captures. |\n\n### Telemetry\n\n| Variable | Default | Description |\n|---|---|---|\n| `ANONYMIZED_TELEMETRY` | `true` | Set to `false` to disable anonymous usage telemetry. No personal data, tool arguments, or outputs are ever collected regardless of this setting. |\n\n### Debug\n\n| Variable | Default | Description |\n|---|---|---|\n| `WINDOWS_MCP_DEBUG` | `false` | Set to `1`, `true`, `yes`, or `on` to enable debug mode, which sets the log level to DEBUG for verbose output. Also available as the `--debug` CLI flag. |\n\n### Remote Mode\n\n| Variable | Default | Description |\n|---|---|---|\n| `MODE` | `local` | Set to `remote` to run as a proxy to [windowsmcp.io](https:\u002F\u002Fwindowsmcp.io). |\n| `SANDBOX_ID` | _(none)_ | **Required for remote mode.** The sandbox\u002FVM identifier from the dashboard. |\n| `API_KEY` | _(none)_ | **Required for remote mode.** Your Windows-MCP API key. |\n\n**Example `claude_desktop_config.json` with all local-mode options:**\n\n```json\n{\n  \"mcpServers\": {\n    \"windows-mcp\": {\n      \"command\": \"uvx\",\n      \"args\": [\n        \"windows-mcp\"\n      ],\n      \"env\": {\n        \"WINDOWS_MCP_SCREENSHOT_SCALE\": \"0.5\",\n        \"WINDOWS_MCP_SCREENSHOT_BACKEND\": \"auto\",\n        \"WINDOWS_MCP_PROFILE_SNAPSHOT\": \"false\",\n        \"ANONYMIZED_TELEMETRY\": \"true\",\n        \"WINDOWS_MCP_DEBUG\": \"false\"\n      }\n    }\n  }\n}\n```\n\n---\n\n## 🔨MCP Tools\n\nMCP Client can access the following tools to interact with Windows:\n\n- `Click`: Click on the screen at the given coordinates.\n- `Type`: Type text on an element (optionally clears existing text).\n- `Scroll`: Scroll vertically or horizontally on the window or specific regions.\n- `Move`: Move mouse pointer or drag (set drag=True) to coordinates.\n- `Shortcut`: Press keyboard shortcuts (`Ctrl+c`, `Alt+Tab`, etc).\n- `Wait`: Pause for a defined duration.\n- `Screenshot`: Fast screenshot-first desktop capture with cursor position, active\u002Fopen windows, and an image. Skips UI tree extraction for speed and should be the default first call when you mainly need visual context. Supports `display=[0]` or `display=[0,1]` to capture specific screens.\n- `Snapshot`: Full desktop state capture for workflows that need interactive element ids, scrollable regions, or `use_dom=True` browser extraction. Supports `use_vision=True` for including screenshots and `display=[0]` or `display=[0,1]` for limiting all returned Snapshot information to specific screens.\n- `App`: To launch an application from the start menu, resize or move the window and switch between apps.\n- `Shell`: To execute PowerShell commands.\n- `Scrape`: To scrape the entire webpage for information.\n- `MultiSelect`: Select multiple items (files, folders, checkboxes) with optional Ctrl key.\n- `MultiEdit`: Enter text into multiple input fields at specified coordinates.\n- `Clipboard`: Read or set Windows clipboard content.\n- `Process`: List running processes or terminate them by PID or name.\n- `Notification`: Send a Windows toast notification with a title and message.\n- `Registry`: Read, write, delete, or list Windows Registry values and keys.\n\n## 🤝 Connect with Us\nStay updated and join our community:\n\n- 📢 Follow us on [X](https:\u002F\u002Fx.com\u002FCursorTouch) for the latest news and updates\n\n- 💬 Join our [Discord Community](https:\u002F\u002Fdiscord.com\u002Finvite\u002FAue9Yj2VzS)\n\n## Star History\n\n[![Star History Chart](https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002FCursorTouch_Windows-MCP_readme_518bfa2d49cc.png)](https:\u002F\u002Fwww.star-history.com\u002F#CursorTouch\u002FWindows-MCP&Date)\n\n## 👥 Contributors\n\nThanks to all the amazing people who have contributed to Windows-MCP! 🎉\n\n\u003Ca href=\"https:\u002F\u002Fgithub.com\u002FCursorTouch\u002FWindows-MCP\u002Fgraphs\u002Fcontributors\">\n  \u003Cimg src=\"https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002FCursorTouch_Windows-MCP_readme_e5a61ab22d12.png\" \u002F>\n\u003C\u002Fa>\n\nWe appreciate every contribution, whether it's code, documentation, bug reports, or feature suggestions. Want to contribute? Check out our [Contributing Guidelines](CONTRIBUTING)!\n\n## 🔒 Security\n\n**Important**: Windows-MCP operates with full system access and can perform irreversible operations. Please review our comprehensive security guidelines before deployment.\n\nFor detailed security information, including:\n- Tool-specific risk assessments\n- Deployment recommendations\n- Vulnerability reporting procedures\n- Compliance and auditing guidelines\n\nPlease read our [Security Policy](SECURITY.md).\n\n## 📊 Telemetry\n\nWindows-MCP collects usage data to help improve the MCP server. No personal information, no tool arguments, no outputs are tracked.\n\nTo disable telemetry, set `ANONYMIZED_TELEMETRY` to `false` in your MCP client configuration:\n\n```json\n{\n  \"mcpServers\": {\n    \"windows-mcp\": {\n      \"command\": \"uvx\",\n      \"args\": [\n        \"windows-mcp\"\n      ],\n      \"env\": {\n        \"ANONYMIZED_TELEMETRY\": \"false\"\n      }\n    }\n  }\n}\n```\n\nSee the [Environment Variables](#-environment-variables) section for the full list of configurable options.\n\nFor detailed information on what data is collected and how it is handled, please refer to the [Telemetry and Data Privacy](SECURITY.md#telemetry-and-data-privacy) section in our Security Policy.\n\n## 📝 Limitations\n\n- Selecting specific sections of the text in a paragraph, as the MCP is relying on a11y tree. (⌛ Working on it.)\n- `Type-Tool` is meant for typing text, not programming in IDE because of it types program as a whole in a file. (⌛ Working on it.)\n- This MCP server can't be used to play video games 🎮.\n\n## 🪪 License\n\nThis project is licensed under the MIT License - see the [LICENSE](LICENSE) file for details.\n\n## 🙏 Acknowledgements\n\nWindows-MCP makes use of several excellent open-source projects that power its Windows automation features:\n\n- [UIAutomation](https:\u002F\u002Fgithub.com\u002Fyinkaisheng\u002FPython-UIAutomation-for-Windows)\n\n- [PyAutoGUI](https:\u002F\u002Fgithub.com\u002Fasweigart\u002Fpyautogui)\n\nHuge thanks to the maintainers and contributors of these libraries for their outstanding work and open-source spirit.\n\n## 🤝Contributing\n\nContributions are welcome! Please see [CONTRIBUTING](CONTRIBUTING) for setup instructions and development guidelines.\n\nMade with ❤️ by [CursorTouch](https:\u002F\u002Fgithub.com\u002FCursorTouch)\n\n## Citation\n\n```bibtex\n@software{\n  author       = {CursorTouch},\n  title        = {Windows-MCP: Lightweight open-source project for integrating LLM agents with Windows},\n  year         = {2024},\n  publisher    = {GitHub},\n  url={https:\u002F\u002Fgithub.com\u002FCursorTouch\u002FWindows-MCP}\n}\n```\n","[![MseeP.ai 安全评估徽章](https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002FCursorTouch_Windows-MCP_readme_e2bbb56b4f3b.png)](https:\u002F\u002Fmseep.ai\u002Fapp\u002Fcursortouch-windows-mcp)\n\n\u003Cdiv align=\"center\">\n  \u003Ch1>🪟 Windows-MCP\u003C\u002Fh1>\n\n  \u003Ca href=\"https:\u002F\u002Fgithub.com\u002FCursorTouch\u002FWindows-MCP\u002Fblob\u002Fmain\u002FLICENSE\">\n    \u003Cimg src=\"https:\u002F\u002Fimg.shields.io\u002Fbadge\u002Flicense-MIT-green\" alt=\"许可证\">\n  \u003C\u002Fa>\n  \u003Cimg src=\"https:\u002F\u002Fimg.shields.io\u002Fbadge\u002Fpython-3.13%2B-blue\" alt=\"Python\">\n  \u003Cimg src=\"https:\u002F\u002Fimg.shields.io\u002Fbadge\u002Fplatform-Windows%207–11-blue\" alt=\"平台：Windows 7 至 11\">\n  \u003Cimg src=\"https:\u002F\u002Fimg.shields.io\u002Fgithub\u002Flast-commit\u002FCursorTouch\u002FWindows-MCP\" alt=\"最近一次提交\">\n  \u003Cbr>\n  \u003Ca href=\"https:\u002F\u002Fx.com\u002FCursorTouch\">\n    \u003Cimg src=\"https:\u002F\u002Fimg.shields.io\u002Fbadge\u002Ffollow-%40CursorTouch-1DA1F2?logo=twitter&style=flat\" alt=\"在 Twitter 上关注\">\n  \u003C\u002Fa>\n  \u003Ca href=\"https:\u002F\u002Fdiscord.com\u002Finvite\u002FAue9Yj2VzS\">\n    \u003Cimg src=\"https:\u002F\u002Fimg.shields.io\u002Fbadge\u002FJoin%20on-Discord-5865F2?logo=discord&logoColor=white&style=flat\" alt=\"加入我们的 Discord\">\n  \u003C\u002Fa>\n\n\u003C\u002Fdiv>\n\n\u003Cbr>\n\n**Windows-MCP** 是一个轻量级的开源项目，能够实现 AI 代理与 Windows 操作系统之间的无缝集成。作为 MCP 服务器，它弥合了大型语言模型与 Windows 操作系统之间的鸿沟，使代理能够执行诸如 **文件导航、应用程序控制、UI 交互、QA 测试** 等任务。\n\nmcp-name: io.github.CursorTouch\u002FWindows-MCP\n\n## 更新\n- 为 Windows-MCP 添加了虚拟机支持。更多详情请访问 (windowsmcp.io)[https:\u002F\u002Fwindowsmcp.io\u002F]。\n- Windows-MCP 在 [Claude Desktop 扩展](https:\u002F\u002Fclaude.ai\u002Fdirectory) 中用户数已突破 `200万`。\n- 试试使用 Windows-MCP 构建的代理 [🪟Windows-Use](https:\u002F\u002Fpypi.org\u002Fproject\u002Fwindows-use\u002F)。\n- Windows-MCP 现已在 [PyPI](https:\u002F\u002Fpypi.org\u002Fproject\u002Fwindows-mcp\u002F) 上发布（因此支持 `uvx windows-mcp`）。\n- Windows-MCP 已被添加到 [MCP 注册表](https:\u002F\u002Fgithub.com\u002Fmodelcontextprotocol\u002Fregistry)。\n\n### 支持的操作系统\n\n- Windows 7\n- Windows 8、8.1\n- Windows 10\n- Windows 11  \n\n## 🎥 演示\n\n\u003Chttps:\u002F\u002Fgithub.com\u002Fuser-attachments\u002Fassets\u002Fd0e7ed1d-6189-4de6-838a-5ef8e1cad54e>\n\n\u003Chttps:\u002F\u002Fgithub.com\u002Fuser-attachments\u002Fassets\u002Fd2b372dc-8d00-4d71-9677-4c64f5987485>\n\n## ✨ 核心特性\n\n- **无缝 Windows 集成**  \n  可原生与 Windows UI 元素交互，打开应用、控制窗口、模拟用户输入等。\n\n- **兼容任意 LLM（可选视觉功能）**\n   与许多自动化工具不同，Windows-MCP 不依赖传统的计算机视觉技术或特定的微调模型；它可与任何 LLM 配合使用，从而降低复杂性和设置时间。\n\n- **丰富的 UI 自动化工具集**  \n  包括用于基本键盘、鼠标操作以及捕获窗口\u002FUI 状态的工具。\n\n- **轻量级且开源**  \n  依赖项极少，安装简单，源代码完全开放，采用 MIT 许可证。\n\n- **可定制且可扩展**  \n  轻松调整或扩展工具，以满足您独特的自动化或 AI 集成需求。\n\n- **实时交互**  \n  操作之间的典型延迟（例如从一次鼠标点击到下一次）通常在 **0.2 至 0.9 秒** 之间，具体数值会因当前运行的应用程序数量、系统负载以及 LLM 的推理速度而略有变化。\n\n- **浏览器自动化 DOM 模式**  \n  State-Tool 提供特殊的 `use_dom=True` 模式，专门针对网页内容，过滤掉浏览器 UI 元素，从而实现更简洁高效的网页自动化。\n\n## 🛠️ 安装\n\n**注意：** 首次安装此 MCP 服务器时，可能需要一两分钟来安装 `pyproject.toml` 中的依赖项。首次运行时，服务器可能会超时，请忽略并重新启动。\n\n### 前置条件\n\n- Python 3.13+\n- Astra 提供的包管理器 UV，可通过 `pip install uv` 或 `curl -LsSf https:\u002F\u002Fastral.sh\u002Fuv\u002Finstall.sh | sh` 安装。\n- Windows 系统中将默认语言设置为 `English`；否则，在使用其他语言的 Windows MCP 服务器上，请禁用 `App-Tool` 功能。\n\u003Cdetails>\n  \u003Csummary>在 Claude Desktop 中安装\u003C\u002Fsummary>\n\n  1. 安装 [Claude Desktop](https:\u002F\u002Fclaude.ai\u002Fdownload)，然后运行以下命令：\n\n```shell\nnpm install -g @anthropic-ai\u002Fmcpb\n```\n\n\n  2. 配置扩展：\n\n  **选项 A：从 PyPI 安装（推荐）**\n\n  使用 `uvx` 直接从 PyPI 运行最新版本。\n\n  将以下内容添加到你的 `claude_desktop_config.json` 文件中：\n  ```json\n  {\n    \"mcpServers\": {\n      \"windows-mcp\": {\n        \"command\": \"uvx\",\n        \"args\": [\n          \"windows-mcp\"\n        ]\n      }\n    }\n  }\n  ```\n\n\n  **选项 B：从源代码安装**\n\n  1. 克隆仓库：\n  ```shell\n  git clone https:\u002F\u002Fgithub.com\u002FCursorTouch\u002FWindows-MCP.git\n  cd Windows-MCP\n  ```\n\n  2. 将以下内容添加到你的 `claude_desktop_config.json` 文件中：\n  ```json\n  {\n    \"mcpServers\": {\n      \"windows-mcp\": {\n        \"command\": \"uv\",\n        \"args\": [\n          \"--directory\",\n          \"\u003Cwindows-mcp 目录路径>\",\n          \"run\",\n          \"windows-mcp\"\n        ]\n      }\n    }\n  }\n  ```\n\n\n\n  3. 打开 Claude Desktop，尽情享受吧！🥳\n\n\n  5. 愉快使用 🥳。\n\n  **Claude Desktop MSIX（Windows 商店版）**\n\n  MSIX 打包的 Claude Desktop 会虚拟化 `%APPDATA%`。配置文件位于：\n  `%LOCALAPPDATA%\\Packages\\Claude_pzs8sxrjxfjjc\\LocalCache\\Roaming\\Claude\\claude_desktop_config.json`\n  （而非 `%APPDATA%\\Claude\\`）。此时，“编辑配置”按钮可能会打开错误的文件。\n\n  Electron 应用也不会继承系统 PATH，因此 `uv`\u002F`uvx` 可能会因 `spawn ENOENT` 而失败。请使用 `uv.exe` 的**完整绝对路径**：\n\n  ```json\n  {\n    \"mcpServers\": {\n      \"windows-mcp\": {\n        \"command\": \"C:\\\\Users\\\\\u003Cuser>\\\\.local\\\\bin\\\\uv.exe\",\n        \"args\": [\n          \"--directory\",\n          \"C:\\\\Users\\\\\u003Cuser>\\\\AppData\\\\Local\\\\Packages\\\\Claude_pzs8sxrjxfjjc\\\\LocalCache\\\\Roaming\\\\Claude\\\\Claude Extensions\\\\ant.dir.cursortouch.windows-mcp\",\n          \"run\",\n          \"windows-mcp\"\n        ]\n      }\n    }\n  }\n  ```\n\n  请将 `\u003Cuser>` 替换为你的用户名。要找到 `uv.exe`，可在终端中运行 `where uv`；常见位置是 `%USERPROFILE%\\.local\\bin\\uv.exe`。若采用 PyPI 安装，则使用 `args: [\"run\", \"windows-mcp\"]`，而非 `--directory`\u002F路径。保存时务必使用 **无 BOM 的 UTF-8 编码**（PowerShell 的 `Set-Content -Encoding UTF8` 会添加 BOM，导致 JSON 解析器出错）。\n\n  如需进一步排查 Claude Desktop 集成问题，请参阅 [MCP 文档](https:\u002F\u002Fmodelcontextprotocol.io\u002Fquickstart\u002Fserver#claude-for-desktop-integration-issues)。\n\u003C\u002Fdetails>\n\n\u003Cdetails>\n  \u003Csummary>在 Perplexity Desktop 中安装\u003C\u002Fsummary>\n\n  1. 安装 [Perplexity Desktop](https:\u002F\u002Fapps.microsoft.com\u002Fdetail\u002Fxp8jnqfbqh6pvf)：\n\n  2. 克隆仓库。\n\n```shell\ngit clone https:\u002F\u002Fgithub.com\u002FCursorTouch\u002FWindows-MCP.git\n\ncd Windows-MCP\n```\n  \n  3. 打开 Perplexity Desktop：\n\n前往 `Settings->Connectors->Add Connector->Advanced`\n\n  4. 输入名称为 `Windows-MCP`，然后将以下 JSON 粘贴到文本框中。\n\n\n  **选项 A：从 PyPI 安装（推荐）**\n\n  ```json\n  {\n    \"command\": \"uvx\",\n    \"args\": [\n      \"windows-mcp\"\n    ]\n  }\n  ```\n\n\n  **选项 B：从源代码安装**\n\n  ```json\n  {\n    \"command\": \"uv\",\n    \"args\": [\n      \"--directory\",\n      \"\u003Cwindows-mcp 目录路径>\",\n      \"run\",\n      \"windows-mcp\"\n    ]\n  }\n  ```\n\n\n5. 点击 `Save` 并享受吧 🥳。\n\n如需进一步排查 Claude Desktop 集成问题，请参阅 [Perplexity MCP 支持文档](https:\u002F\u002Fwww.perplexity.ai\u002Fhelp-center\u002Fen\u002Farticles\u002F11502712-local-and-remote-mcps-for-perplexity)。该文档包含检查日志和解决常见问题的实用技巧。\n\u003C\u002Fdetails>\n\n\u003Cdetails>\n  \u003Csummary>在 Gemini CLI 中安装\u003C\u002Fsummary>\n\n  1. 安装 Gemini CLI：\n\n```shell\nnpm install -g @google\u002Fgemini-cli\n```\n\n\n  2. 在 `%USERPROFILE%\u002F.gemini\u002Fsettings.json` 中配置服务器：\n\n\n  3. 打开文件资源管理器，进入 `%USERPROFILE%\u002F.gemini`，并打开 `settings.json`。\n\n  4. 在 `settings.json` 中添加 `windows-mcp` 配置，并保存。\n\n```json\n{\n  \"theme\": \"Default\",\n  ...\n  \"mcpServers\": {\n    \"windows-mcp\": {\n      \"command\": \"uvx\",\n      \"args\": [\n        \"windows-mcp\"\n      ]\n    }\n  }\n}\n```\n*注：若从源代码运行，需将命令替换为 `uv`，并将参数改为 `[\"--directory\", \"\u003C路径>\", \"run\", \"windows-mcp\"]`。*\n\n\n  5. 在终端中重新运行 Gemini CLI。尽情享受吧 🥳\n\u003C\u002Fdetails>\n\n\u003Cdetails>\n  \u003Csummary>在 Qwen Code 中安装\u003C\u002Fsummary>\n  1. 安装 Qwen Code：\n\n```shell\nnpm install -g @qwen-code\u002Fqwen-code@latest\n```\n\n   2. 在 `%USERPROFILE%\u002F.qwen\u002Fsettings.json` 中配置服务器：\n\n\n  3. 打开 `%USERPROFILE%\u002F.qwen\u002Fsettings.json`。\n\n  4. 在 `settings.json` 中添加 `windows-mcp` 配置，并保存。\n\n```json\n{\n  \"mcpServers\": {\n    \"windows-mcp\": {\n      \"command\": \"uvx\",\n      \"args\": [\n        \"windows-mcp\"\n      ]\n    }\n  }\n}\n```\n*注：若从源代码运行，需将命令替换为 `uv`，并将参数改为 `[\"--directory\", \"\u003C路径>\", \"run\", \"windows-mcp\"]`。*\n\n\n  5. 在终端中重新运行 Qwen Code。尽情享受吧 🥳\n\u003C\u002Fdetails>\n\n\u003Cdetails>\n  \u003Csummary>在 Codex CLI 中安装\u003C\u002Fsummary>\n  1. 安装 Codex CLI：\n\n```shell\nnpm install -g @openai\u002Fcodex\n```\n\n  2. 在 `%USERPROFILE%\u002F.codex\u002Fconfig.toml` 中配置服务器：\n\n  3. 打开 `%USERPROFILE%\u002F.codex\u002Fconfig.toml`。\n\n  4. 在 `config.toml` 中添加 `windows-mcp` 配置，并保存。\n\n```toml\n[mcp_servers.windows-mcp]\ncommand=\"uvx\"\nargs=[\n  \"windows-mcp\"\n]\n```\n*注：若从源代码运行，需将命令替换为 `uv`，并将参数改为 `[\"--directory\", \"\u003C路径>\", \"run\", \"windows-mcp\"]`。*\n\n\n  5. 在终端中重新运行 Codex CLI。尽情享受吧 🥳\n\u003C\u002Fdetails>\n\n\u003Cdetails>\n  \u003Csummary>在 Claude Code 中安装\u003C\u002Fsummary>\n\n  1. 安装 [Claude Code](https:\u002F\u002Fdocs.anthropic.com\u002Fen\u002Fdocs\u002Fclaude-code\u002Foverview)：\n\n```shell\nnpm install -g @anthropic-ai\u002Fclaude-code\n```\n\n  2. 配置服务器：\n\n  **选项 A：从 PyPI 安装（推荐）**\n\n  使用 `uvx` 直接从 PyPI 运行最新版本。\n\n  ```shell\n  claude mcp add --transport stdio windows-mcp -- uvx windows-mcp\n  ```\n\n  **选项 B：从源代码安装**\n\n  1. 先克隆仓库：\n  ```shell\n  git clone https:\u002F\u002Fgithub.com\u002FCursorTouch\u002FWindows-MCP.git\n  cd Windows-MCP\n  ```\n\n  2. 在终端中运行以下命令：\n  ```shell\n  claude mcp add --transport stdio windows-mcp -- uv --directory \"\u003C路径>\" run windows-mcp\n  ```\n\n  *注：若希望该服务器对所有项目可用，可在命令中添加 `--scope user`。*\n\n  3. 在终端中重新运行 Claude Code。尽情享受吧 🥳。\n\n  **注意**：在 Windows 系统上，如果遇到“连接已关闭”的错误，请使用 `uvx.exe` 的完整路径：\n\n  ```shell\n  claude mcp add --transport stdio windows-mcp -- C:\\Users\\\u003Cuser>\\.local\\bin\\uvx.exe windows-mcp\n  ```\n\n  要验证服务器是否已注册，可运行 `claude mcp list`。在 Claude Code 内部，可以使用 `\u002Fmcp` 来查看服务器状态。\n\u003C\u002Fdetails>\n\n---\n\n## 🖥️ 模式\n\nWindows-MCP 支持两种运行模式：**本地**（默认）和 **远程**。\n\n### 本地模式（默认）\n\n在本地模式下，Windows-MCP 直接在您的 Windows 设备上运行，并将其工具暴露给连接的 MCP 客户端。这是个人使用的标准配置。\n\n```shell\n# 使用 stdio 传输（默认）\nuvx windows-mcp\n\n# 或者使用 SSE\u002F可流式 HTTP 进行网络访问\nuvx windows-mcp --transport sse --host localhost --port 8000\nuvx windows-mcp --transport streamable-http --host localhost --port 8000\n```\n\n您可以设置可选的环境变量来自定义行为——请参阅下方的 [环境变量](#-environment-variables)。\n\n### 远程模式\n\n在远程模式下，Windows-MCP 充当一个 **代理**，连接到 [windowsmcp.io](https:\u002F\u002Fwindowsmcp.io)，从而实现云端托管的 Windows 自动化。此模式适用于 MCP 客户端位于远程并通过仪表板连接的情况，仪表板会将请求路由到运行 Windows-MCP 的 Windows 虚拟机。\n\n作为桌面扩展安装时，远程模式应保持在轻量级代理路径上，且在启动前无需构建本地 Windows 自动化依赖项。\n\n**必需的环境变量：**\n\n| 变量 | 描述 |\n|---|---|\n| `MODE` | 设置为 `remote` |\n| `SANDBOX_ID` | 来自仪表板的沙箱\u002F虚拟机标识符 |\n| `API_KEY` | 您的 Windows-MCP API 密钥 |\n\n**示例配置：**\n\n```json\n{\n  \"mcpServers\": {\n    \"windows-mcp\": {\n      \"command\": \"uvx\",\n      \"args\": [\n        \"windows-mcp\"\n      ],\n      \"env\": {\n        \"MODE\": \"remote\",\n        \"SANDBOX_ID\": \"your-sandbox-id\",\n        \"API_KEY\": \"your-api-key\"\n      }\n    }\n  }\n}\n```\n\n### 传输选项\n\n| 传输方式 | 标志 | 使用场景 |\n|---|---|---|\n| `stdio`（默认） | `--transport stdio` | 由 Claude Desktop、Cursor 等 MCP 客户端直接连接 |\n| `sse` | `--transport sse --host HOST --port PORT` | 通过服务器发送事件实现网络访问 |\n| `streamable-http` | `--transport streamable-http --host HOST --port PORT` | 通过 HTTP 流媒体实现网络访问（推荐用于生产环境） |\n\n---\n\n## ⚙️ 环境变量\n\n除非另有说明，所有变量均为可选。您可以通过 `claude_desktop_config.json`（或您的 MCP 客户端等效配置文件）中的 `env` 键进行设置。\n\n### 截图与快照\n\n| 变量 | 默认值 | 描述 |\n|---|---|---|\n| `WINDOWS_MCP_SCREENSHOT_SCALE` | `1.0` | 在编码前应用于截图的比例因子。接受范围为 `0.1`–`1.0` 的浮点数。在高分辨率显示器（1440p、4K）上，使用默认设置生成的图像可能会超过 Claude Desktop 的 1 MB 工具结果限制。将其设置为 `0.5` 可以使图像的两个维度减半，从而将文件大小缩小四分之一。 |\n| `WINDOWS_MCP_SCREENSHOT_BACKEND` | `auto` | 截图捕获后端。可选值：`auto`（依次尝试 dxcam → mss → pillow）、`dxcam`、`mss`、`pillow`。如果 `dxcam` 不可用或在您的 GPU 上导致问题，请使用 `mss` 或 `pillow`。 |\n| `WINDOWS_MCP_PROFILE_SNAPSHOT` | _(已禁用)_ | 设置为 `1`、`true`、`yes` 或 `on`，以输出针对截图\u002F快照调用的各阶段计时日志。有助于诊断捕获速度慢的问题。 |\n\n### 遥测\n\n| 变量 | 默认值 | 描述 |\n|---|---|---|\n| `ANONYMIZED_TELEMETRY` | `true` | 设置为 `false` 可禁用匿名使用遥测。无论此设置如何，绝不会收集任何个人数据、工具参数或输出。\n\n### 调试\n\n| 变量 | 默认值 | 描述 |\n|---|---|---|\n| `WINDOWS_MCP_DEBUG` | `false` | 设置为 `1`、`true`、`yes` 或 `on` 启用调试模式，将日志级别设置为 DEBUG 以获取详细输出。也可通过 `--debug` CLI 标志启用。\n\n### 远程模式\n\n| 变量 | 默认值 | 描述 |\n|---|---|---|\n| `MODE` | `local` | 设置为 `remote` 以作为 [windowsmcp.io](https:\u002F\u002Fwindowsmcp.io) 的代理运行。 |\n| `SANDBOX_ID` | _(无)_ | **远程模式必需。** 来自仪表板的沙箱\u002F虚拟机标识符。 |\n| `API_KEY` | _(无)_ | **远程模式必需。** 您的 Windows-MCP API 密钥。\n\n**包含所有本地模式选项的 `claude_desktop_config.json` 示例：**\n\n```json\n{\n  \"mcpServers\": {\n    \"windows-mcp\": {\n      \"command\": \"uvx\",\n      \"args\": [\n        \"windows-mcp\"\n      ],\n      \"env\": {\n        \"WINDOWS_MCP_SCREENSHOT_SCALE\": \"0.5\",\n        \"WINDOWS_MCP_SCREENSHOT_BACKEND\": \"auto\",\n        \"WINDOWS_MCP_PROFILE_SNAPSHOT\": \"false\",\n        \"ANONYMIZED_TELEMETRY\": \"true\",\n        \"WINDOWS_MCP_DEBUG\": \"false\"\n      }\n    }\n  }\n}\n```\n\n---\n\n## 🔨 MCP 工具\n\nMCP 客户端可以使用以下工具与 Windows 交互：\n\n- `Click`: 在指定坐标处单击屏幕。\n- `Type`: 在元素上输入文本（可选择性地清除现有文本）。\n- `Scroll`: 在窗口或特定区域中垂直或水平滚动。\n- `Move`: 将鼠标指针移动到指定坐标，或拖动（设置 `drag=True`）。\n- `Shortcut`: 按下键盘快捷键（如 `Ctrl+c`、`Alt+Tab` 等）。\n- `Wait`: 暂停指定时长。\n- `Screenshot`: 快速截取桌面并显示光标位置、当前活动\u002F打开的窗口以及图像。为提高速度，跳过 UI 树提取，因此在主要需要视觉上下文时应作为首次调用。支持 `display=[0]` 或 `display=[0,1]` 以捕获特定屏幕。\n- `Snapshot`: 捕获完整的桌面状态，适用于需要交互式元素 ID、可滚动区域或 `use_dom=True` 浏览器提取的工作流。支持 `use_vision=True` 以包含截图，并支持 `display=[0]` 或 `display=[0,1]` 以将返回的快照信息限制在特定屏幕上。\n- `App`: 从开始菜单启动应用程序、调整窗口大小或位置，以及在应用程序之间切换。\n- `Shell`: 执行 PowerShell 命令。\n- `Scrape`: 抓取整个网页的信息。\n- `MultiSelect`: 多选多个项目（文件、文件夹、复选框），可选择性按住 Ctrl 键。\n- `MultiEdit`: 在指定坐标处同时向多个输入字段输入文本。\n- `Clipboard`: 读取或设置 Windows 剪贴板内容。\n- `Process`: 列出正在运行的进程，或根据 PID 或名称终止进程。\n- `Notification`: 发送带有标题和消息的 Windows 通知气泡。\n- `Registry`: 读取、写入、删除或列出 Windows 注册表的值和键。\n\n## 🤝 与我们联系\n关注我们以获取最新资讯并加入社区：\n\n- 📢 在 [X](https:\u002F\u002Fx.com\u002FCursorTouch) 关注我们，了解最新动态\n\n- 💬 加入我们的 [Discord 社区](https:\u002F\u002Fdiscord.com\u002Finvite\u002FAue9Yj2VzS)\n\n## 星标历史\n\n[![星标历史图表](https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002FCursorTouch_Windows-MCP_readme_518bfa2d49cc.png)](https:\u002F\u002Fwww.star-history.com\u002F#CursorTouch\u002FWindows-MCP&Date)\n\n## 👥 贡献者\n\n感谢所有为 Windows-MCP 做出贡献的杰出人士！🎉\n\n\u003Ca href=\"https:\u002F\u002Fgithub.com\u002FCursorTouch\u002FWindows-MCP\u002Fgraphs\u002Fcontributors\">\n  \u003Cimg src=\"https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002FCursorTouch_Windows-MCP_readme_e5a61ab22d12.png\" \u002F>\n\u003C\u002Fa>\n\n我们感谢每一份贡献，无论是代码、文档、错误报告还是功能建议。想参与贡献吗？请查看我们的 [贡献指南](CONTRIBUTING)!\n\n## 🔒 安全\n\n**重要提示**：Windows-MCP 具有对系统的完全访问权限，并可执行不可逆的操作。请在部署前仔细阅读我们的全面安全指南。\n\n有关详细的安全信息，包括：\n- 工具特定的风险评估\n- 部署建议\n- 漏洞报告流程\n- 合规与审计指南\n\n请阅读我们的[安全政策](SECURITY.md)。\n\n## 📊 遥测\n\nWindows-MCP 会收集使用数据，以帮助改进 MCP 服务器。我们不会跟踪任何个人信息、工具参数或输出内容。\n\n如需禁用遥测，请在您的 MCP 客户端配置中将 `ANONYMIZED_TELEMETRY` 设置为 `false`：\n\n```json\n{\n  \"mcpServers\": {\n    \"windows-mcp\": {\n      \"command\": \"uvx\",\n      \"args\": [\n        \"windows-mcp\"\n      ],\n      \"env\": {\n        \"ANONYMIZED_TELEMETRY\": \"false\"\n      }\n    }\n  }\n}\n```\n\n有关所有可配置选项的完整列表，请参阅[环境变量](#-environment-variables)部分。\n\n如需详细了解所收集的数据及其处理方式，请参阅我们的安全政策中的[遥测与数据隐私](SECURITY.md#telemetry-and-data-privacy)章节。\n\n## 📝 限制\n\n- 由于 MCP 依赖于辅助功能树，因此无法选择段落中的特定文本部分。（⌛ 正在解决中。）\n- `Type-Tool` 旨在用于输入文本，而非在 IDE 中进行编程，因为它会将整个程序一次性输入到文件中。（⌛ 正在解决中。）\n- 此 MCP 服务器无法用于玩视频游戏 🎮。\n\n## 🪪 许可证\n\n本项目采用 MIT 许可证授权——详情请参阅[LICENSE](LICENSE)文件。\n\n## 🙏 致谢\n\nWindows-MCP 使用了多个优秀的开源项目来支持其 Windows 自动化功能：\n\n- [UIAutomation](https:\u002F\u002Fgithub.com\u002Fyinkaisheng\u002FPython-UIAutomation-for-Windows)\n\n- [PyAutoGUI](https:\u002F\u002Fgithub.com\u002Fasweigart\u002Fpyautogui)\n\n在此向这些库的维护者和贡献者致以衷心的感谢，感谢他们卓越的工作和开源精神。\n\n## 🤝 贡献\n\n欢迎贡献！请参阅[CONTRIBUTING](CONTRIBUTING)以获取设置说明和开发指南。\n\n由 [CursorTouch](https:\u002F\u002Fgithub.com\u002FCursorTouch) 用心打造 ❤️\n\n## 引用\n\n```bibtex\n@software{\n  author       = {CursorTouch},\n  title        = {Windows-MCP：用于将 LLM 代理与 Windows 集成的轻量级开源项目},\n  year         = {2024},\n  publisher    = {GitHub},\n  url={https:\u002F\u002Fgithub.com\u002FCursorTouch\u002FWindows-MCP}\n}\n```","# Windows-MCP 快速上手指南\n\nWindows-MCP 是一个轻量级开源项目，作为 MCP 服务器桥接大语言模型（LLM）与 Windows 操作系统。它允许 AI 智能体直接执行文件导航、应用控制、UI 交互、自动化测试等任务，无需依赖复杂的计算机视觉技术。\n\n## 环境准备\n\n在开始之前，请确保满足以下系统要求：\n\n*   **操作系统**：Windows 7, 8, 8.1, 10, 或 11。\n*   **Python 版本**：Python 3.13 或更高版本。\n*   **包管理器**：UV (由 Astral 开发)。\n    *   安装命令 (任选其一)：\n        ```shell\n        pip install uv\n        # 或\n        curl -LsSf https:\u002F\u002Fastral.sh\u002Fuv\u002Finstall.sh | sh\n        ```\n*   **语言设置**：建议将 Windows 系统默认语言设置为 **English**。如果使用其他语言，可能需要在 MCP 配置中禁用 `App-Tool` 以避免兼容性问题。\n\n> **注意**：首次安装时，由于需要安装 `pyproject.toml` 中的依赖项，启动可能需要 1-2 分钟。如果首次运行超时，请忽略错误并重新启动服务器。\n\n## 安装步骤\n\n以下以最常用的 **Claude Desktop** 和 **命令行直接运行** 为例介绍安装方法。\n\n### 方式一：在 Claude Desktop 中集成 (推荐)\n\n1.  **安装 Claude Desktop** 并确保证已安装全局 MCP 工具：\n    ```shell\n    npm install -g @anthropic-ai\u002Fmcpb\n    ```\n\n2.  **配置文件位置**：\n    *   **普通版**：`%APPDATA%\\Claude\\claude_desktop_config.json`\n    *   **Microsoft Store (MSIX) 版**：`%LOCALAPPDATA%\\Packages\\Claude_pzs8sxrjxfjjc\\LocalCache\\Roaming\\Claude\\claude_desktop_config.json`\n    *   *提示：如果是 MSIX 版本且遇到 `spawn ENOENT` 错误，请使用 `uv.exe` 的绝对路径。*\n\n3.  **编辑配置文件**：\n    打开 `claude_desktop_config.json`，添加以下配置（推荐使用 PyPI 源）：\n\n    ```json\n    {\n      \"mcpServers\": {\n        \"windows-mcp\": {\n          \"command\": \"uvx\",\n          \"args\": [\n            \"windows-mcp\"\n          ]\n        }\n      }\n    }\n    ```\n    *保存文件时请确保编码为 **UTF-8 without BOM**。*\n\n4.  **重启 Claude Desktop** 即可生效。\n\n### 方式二：其他客户端 (Gemini CLI \u002F Qwen Code \u002F Codex CLI 等)\n\n大多数支持 MCP 的 CLI 工具配置逻辑相似，只需在对应的配置文件中添加服务器定义。\n\n*   **Gemini CLI**: 编辑 `%USERPROFILE%\u002F.gemini\u002Fsettings.json`\n*   **Qwen Code**: 编辑 `%USERPROFILE%\u002F.qwen\u002Fsettings.json`\n*   **Codex CLI**: 编辑 `%USERPROFILE%\u002F.codex\u002Fconfig.toml`\n\n**JSON 配置示例** (适用于 Gemini\u002FQwen):\n```json\n{\n  \"mcpServers\": {\n    \"windows-mcp\": {\n      \"command\": \"uvx\",\n      \"args\": [\n        \"windows-mcp\"\n      ]\n    }\n  }\n}\n```\n\n**TOML 配置示例** (适用于 Codex):\n```toml\n[mcp_servers.windows-mcp]\ncommand=\"uvx\"\nargs=[\n  \"windows-mcp\"\n]\n```\n\n### 方式三：从源码安装 (高级用户)\n\n如果需要修改代码或使用最新开发版：\n\n1.  克隆仓库：\n    ```shell\n    git clone https:\u002F\u002Fgithub.com\u002FCursorTouch\u002FWindows-MCP.git\n    cd Windows-MCP\n    ```\n\n2.  在客户端配置中将 `command` 设为 `uv`，`args` 设为：\n    ```json\n    [\"--directory\", \"\u003C你的本地仓库绝对路径>\", \"run\", \"windows-mcp\"]\n    ```\n\n## 基本使用\n\n安装完成后，Windows-MCP 会自动作为后台服务运行，等待 AI 智能体调用。你无需手动运行额外的启动脚本（除非使用远程模式）。\n\n### 1. 启动验证\n在支持的 AI 客户端（如 Claude Desktop）中，通常可以通过输入 `\u002Fmcp` 命令查看服务器状态，确认 `windows-mcp` 已连接且状态正常。\n\n### 2. 简单使用示例\n在聊天窗口中，你可以直接用自然语言指示 AI 操作 Windows。例如：\n\n*   **文件操作**：\n    > \"请列出我桌面上所有的 PDF 文件，并将它们移动到一个名为 'Documents' 的新文件夹中。\"\n\n*   **应用控制**：\n    > \"打开记事本，输入 'Hello World'，然后保存文件到桌面，文件名为 test.txt。\"\n\n*   **UI 交互**：\n    > \"点击屏幕左下角的开始菜单，搜索 '计算器' 并打开它。\"\n\n### 3. 特殊模式：浏览器自动化 (DOM Mode)\n当需要操作浏览器时，可以指定使用 DOM 模式以获得更干净的状态捕获（过滤掉浏览器自身的 UI 元素）：\n> \"使用 `use_dom=True` 模式访问 google.com，搜索 'AI tools' 并提取前三个结果的标题。\"\n\n### 4. 运行模式说明\n*   **本地模式 (Local)**：默认模式。直接在当前机器运行，控制当前系统的 UI 和文件。\n*   **远程模式 (Remote)**：需设置环境变量 `MODE=remote` 并提供 `SANDBOX_ID` 和 `API_KEY`。此模式用于连接云端 Windows 虚拟机进行自动化，适合无头服务器场景。","某金融分析师需要在每天收盘后，从多个本地 Excel 报表中提取数据，汇总并录入到内部的 Windows 桌面端财务系统中，同时生成日报文档。\n\n### 没有 Windows-MCP 时\n- **人工操作繁琐易错**：分析师必须手动打开十几个 Excel 文件，复制粘贴数据到财务软件，重复性高且极易因疲劳导致录入错误。\n- **跨应用协作断裂**：AI 助手只能提供代码建议或文本分析，无法直接操控鼠标点击财务软件的特定输入框或菜单，形成“能想不能做”的断层。\n- **自动化门槛极高**：若要编写传统 RPA 脚本，需针对特定分辨率和 UI 控件编写大量脆弱代码，一旦软件更新或窗口位置微调，脚本即刻失效。\n- **视觉依赖重**：现有的智能自动化工具往往依赖复杂的计算机视觉模型来识别屏幕元素，配置环境复杂且运行速度缓慢。\n\n### 使用 Windows-MCP 后\n- **端到端自动执行**：Windows-MCP 让 AI 代理直接接管鼠标和键盘，自动遍历文件夹打开 Excel，读取数据后精准点击财务软件界面完成录入，全程无需人工干预。\n- **原生系统级集成**：借助其原生 Windows UI 交互能力，AI 能像真实用户一样识别窗口状态、切换应用并处理弹窗，完美打通数据源与业务系统。\n- **灵活适配无需重训**：不依赖特定的视觉模型或微调，Windows-MCP 利用 LLM 的理解能力动态适应界面变化，即使财务软件界面小幅调整也能稳定运行。\n- **毫秒级实时响应**：凭借 0.2 至 0.9 秒的低延迟操作特性，整个汇总流程从过去的 2 小时缩短至 15 分钟，且支持在后台虚拟机中高效并发处理。\n\nWindows-MCP 通过将大语言模型的决策能力转化为对 Windows 系统的实际操控力，彻底消除了数字任务中“最后一公里”的人工操作瓶颈。","https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002FCursorTouch_Windows-MCP_a0e247e7.png","CursorTouch","https:\u002F\u002Foss.gittoolsai.com\u002Favatars\u002FCursorTouch_cc4a9db3.png","Let AI do it for you.",null,"https:\u002F\u002Fgithub.com\u002FCursorTouch",[81],{"name":82,"color":83,"percentage":84},"Python","#3572A5",100,5009,634,"2026-04-05T12:30:49","MIT","Windows","未说明",{"notes":92,"python":93,"dependencies":94},"1. 仅支持 Windows 7 至 Windows 11 操作系统。\n2. 必须安装 UV 包管理器（可通过 pip 或脚本安装）。\n3. 强烈建议将 Windows 系统默认语言设置为英语；若使用其他语言，需在 MCP 服务器配置中禁用 'App-Tool'。\n4. 若在 Claude Desktop MSIX (Windows Store) 版本中使用，需配置 uv.exe 的绝对路径，且配置文件需保存为无 BOM 的 UTF-8 格式。\n5. 首次安装依赖可能需要 1-2 分钟，初次运行若超时可忽略并重启服务器。","3.13+",[95],"uv (Package Manager)",[14,13,15],[98,99,100,101,102,103],"desktop","mcp","tools","windows","ai","windows-automation","2026-03-27T02:49:30.150509","2026-04-06T06:52:13.948850",[107,112,117,122,127,132],{"id":108,"question_zh":109,"answer_zh":110,"source_url":111},17647,"State-Tool 报错 'Taskbar' 错误或鼠标点击位置偏移怎么办？","这是一个已知问题，通常与系统任务栏语言或坐标计算有关。维护者已提交修复代码，通过识别类名来避免干扰任务栏和程序管理器。请尝试拉取最新代码或更新到 v0.2.0 及以上版本，该版本已解决此问题并修复了多显示器下的坐标偏移。","https:\u002F\u002Fgithub.com\u002FCursorTouch\u002FWindows-MCP\u002Fissues\u002F7",{"id":113,"question_zh":114,"answer_zh":115,"source_url":116},17648,"在 Windows 11 上 State-Tool 无法工作且遇到各种工具错误，如何排查和解决？","如果您遇到 State-Tool 持续报错、启动错误程序或服务器不稳定等问题，请首先检查您的版本。维护者确认 v0.2.0 版本已修复了包括 'Taskbar' 错误、启动错误程序（如 calculator 启动为 autoruns）在内的多个关键 Bug。请升级到 v0.2.0 或从 @latest 分支构建最新版本进行测试。","https:\u002F\u002Fgithub.com\u002FCursorTouch\u002FWindows-MCP\u002Fissues\u002F24",{"id":118,"question_zh":119,"answer_zh":120,"source_url":121},17649,"如何在中文 Windows 系统环境下正确使用该工具？","目前工具主要支持英文环境。在中文系统中使用时，有两种解决方案：\n1. 在给 AI 的提示词（Prompt）中明确说明“系统运行在中文环境下”，以便模型调整行为。\n2. 暂时禁用 Launch Tool 和 Resize Tool，仅使用基础功能（如通过开始菜单打开应用）。\n此外，确保在运行其他操作前先运行 `State-Tool`，因为它会检测系统语言信息并反馈给模型。","https:\u002F\u002Fgithub.com\u002FCursorTouch\u002FWindows-MCP\u002Fissues\u002F18",{"id":123,"question_zh":124,"answer_zh":125,"source_url":126},17650,"use_vision 功能在多显示器设置下只能识别主屏幕怎么办？","早期版本确实只支持主显示器。维护者已开发并合并了多屏幕支持功能（Multi-Screen Support），现在可以检测所有连接的显示器并处理负坐标问题。此外，最新代码已设置为 DPI 感知（DPI aware），以解决高分辨率屏幕下的显示问题。请确保您使用的是包含多屏支持的最新仓库代码。","https:\u002F\u002Fgithub.com\u002FCursorTouch\u002FWindows-MCP\u002Fissues\u002F11",{"id":128,"question_zh":129,"answer_zh":130,"source_url":131},17651,"运行最新代码时出现 'ModuleNotFoundError: No module named fuzzywuzzy' 错误如何解决？","这是因为缺少必要的依赖库。请在您的虚拟环境中安装 `fuzzywuzzy` 模块。如果您使用 `uv` 或 `pip` 运行项目，确保在安装项目依赖时包含了该模块，或者手动执行安装命令：`pip install fuzzywuzzy`（可能还需要安装 `python-Levenshtein` 以提高性能）。维护者已在最新提交中添加了此依赖声明。","https:\u002F\u002Fgithub.com\u002FCursorTouch\u002FWindows-MCP\u002Fissues\u002F77",{"id":133,"question_zh":134,"answer_zh":135,"source_url":126},17652,"为什么按钮点击不准确，经常点不到或点在错误位置？","这通常是由两个原因造成的：\n1. 按钮像素范围小或对比度低，导致视觉模型识别困难。\n2. 高 DPI 屏幕（如 4K 屏）导致的坐标缩放问题。\n解决方案：确保使用最新的代码版本，因为维护者已将程序设置为 DPI 感知（DPI aware），这能显著改善高分屏下的坐标准确性。如果问题依旧，尝试调整截图质量或在 Prompt 中强调屏幕分辨率信息。",[137,142,147,152,157,162,167,172,177,182],{"id":138,"version":139,"summary_zh":140,"released_at":141},107969,"v0.7.1","## 新增\n* 将 PowerShell 执行逻辑提取到一个整洁、静态的 `PowerShellExecutor` 类中，以提升代码组织性和稳定性 (#158)\n* 增加了 MSIX 应用路径解析功能，支持原生启动 MSIX \u002F UWP Windows 应用程序，用于 AI 代理 (#126)\n* 添加了 Dependabot 配置，实现每周分组更新，以简化包管理流程 (#145, #125)\n* 在文档中新增了 `WINDOWS_MCP_SCREENSHOT_SCALE` 环境变量，并显式处理多显示器间的坐标不匹配问题 (#116)\n* 将 `.idea\u002F` 添加到 `.gitignore` 文件中，以原生方式排除 JetBrains IDE 的配置文件 (#120)\n* 为 `cryptography\u003C=46.0.6` 添加了依赖锁定映射，以确保 `win_arm64` ARM 架构下的 PyPI 安装稳定性 (#149)\n\n## 修复\n* 修复了在与受保护或高权限进程交互时，进程附加 `AttachThreadInput` 出现“拒绝访问”错误的问题 (#123)\n* 修复了 Windows 进程树的优雅两阶段子进程超时机制，以防止出现孤立任务 (#151)\n* 通过将 `screenshot_size` 替换为 `screenshot_original_size` 来精确绘制桌面图像，从而修复鼠标坐标不匹配问题 (#116)\n* 修复了由于 `comtypes` 在非 ASCII 应用程序 UI 布局中进行 VARIANT 封送处理而导致的 Snapshot 崩溃问题 (#148)\n* 通过移除工具输出中的 Unicode 私用区字符，修复了 UI 渲染中断的问题 (#120)\n* 修复了通知工具无法静默显示 Toast 消息的问题 (#121)\n* 修复了抓取工具中缺失滚动属性的问题 (#119)\n* 通过确保原生传递 `stdin=DEVNULL` 给 Shell 加载器，避免了子进程卡死的情况。","2026-03-29T14:04:19",{"id":143,"version":144,"summary_zh":145,"released_at":146},107970,"v0.7.0","## 变更内容\n* 修复：在切换前台窗口时，键盘焦点未正确转移，由 @JezaChen 在 https:\u002F\u002Fgithub.com\u002FCursorTouch\u002FWindows-MCP\u002Fpull\u002F106 中修复。\n* 修复：从枚举中导入 _INPUTUnion 以修复 NameError，由 @JezaChen 在 https:\u002F\u002Fgithub.com\u002FCursorTouch\u002FWindows-MCP\u002Fpull\u002F108 中修复。\n* 修复：在启动应用之前解析已知文件夹的 GUID 路径，由 @JezaChen 在 https:\u002F\u002Fgithub.com\u002FCursorTouch\u002FWindows-MCP\u002Fpull\u002F110 中修复。\n* 新特性：带有 DXCam 后端的截图工具，并修复了 UIAutomation 卡死问题，由 @yasuhirofujii-medley 在 https:\u002F\u002Fgithub.com\u002FCursorTouch\u002FWindows-MCP\u002Fpull\u002F104 中实现。\n* 重构：将工具定义提取到 tools\u002F 子包中，由 @yasuhirofujii-medley 在 https:\u002F\u002Fgithub.com\u002FCursorTouch\u002FWindows-MCP\u002Fpull\u002F111 中完成。\n* 修复：通过 shell:AppsFolder 验证应用 ID，而非仅进行字符串检查，由 @JezaChen 在 https:\u002F\u002Fgithub.com\u002FCursorTouch\u002FWindows-MCP\u002Fpull\u002F112 中修复。\n\n\n**完整变更日志**：https:\u002F\u002Fgithub.com\u002FCursorTouch\u002FWindows-MCP\u002Fcompare\u002Fv0.6.9...v0.7.0","2026-03-17T17:24:25",{"id":148,"version":149,"summary_zh":150,"released_at":151},107971,"v0.6.9","## v0.6.9\n\n### 改进\n- **工具可发现性** — 为 App、PowerShell、Snapshot、Scrape、Clipboard、Process 和 Registry 的描述添加了关键词同义词，以便 AI 客户端在首次搜索时就能正确地推荐相应工具。\n- **Scrape 抽样** — Scrape 现在使用 MCP 抽样在服务器端对网页内容进行摘要，从而避免调用方上下文中出现 Markdown 冗余。新增 `query` 参数用于聚焦提取内容；设置 `use_sampling=False` 可获取原始内容。\n\n### 错误修复与新功能\n- **#98** `Snapshot` 提供仅截屏的快速路径，通过 `use_ui_tree=False` 跳过昂贵的无障碍树遍历，适用于仅依赖视觉的工作流（感谢 @yasuhirofujii-medley）。\n- **#97** `App` 的调整大小模式现在接受 `name` 参数，可以直接定位到特定窗口，而无需先切换焦点（感谢 @JezaChen）。\n- **#96** 切换到最小化窗口时，现在只需一次调用即可将其恢复并聚焦——（感谢 @JezaChen）。\n- **#95** `Snapshot` 暴露了 `use_annotation=False` 参数，用于返回不带边界框叠加的干净截图（感谢 @yasuhirofujii-medley）。\n- **#94** `Snapshot` 接受 `display=[0]` 或 `display=[0,1]`，以在多显示器环境下将输出限制到指定的显示器上（感谢 @xqdd）。\n\n## 安装\n```bash\nuvx windows-mcp==0.6.9\n```","2026-03-13T04:46:07",{"id":153,"version":154,"summary_zh":155,"released_at":156},107972,"v0.6.2","### v0.6.2 版本更新\n- 将布尔参数兼容性扩展至 `desktop` 模块。\n- 改进了对来自大语言模型的工具参数的处理。\n- 更新了 `manifest.json`，以支持 Claude Desktop 中的 `mcpb`（感谢 @bryan-anthropic）。\n\n### v0.6.1 版本更新\n- 修复了 `Shell` 工具的输出问题（感谢 @yakub268）。\n- 改进了主工具定义中的布尔参数兼容性。","2026-02-04T12:55:09",{"id":158,"version":159,"summary_zh":160,"released_at":161},107973,"v0.6.0","## 变更内容\n- **性能优化**：修复了因 PostHog 分析干扰导致的工具执行延迟问题。分析现以异步批处理方式运行，使工具完成时间提升约 6 倍。\n- **初始化改进**：修复了 MCP 服务器初始化耗时过长的问题。\n- **缺陷修复**：解决了在应用间切换时出现的“线程分离错误”。\n\n## 核心性能提升\n- 移除了工具中的阻塞式网络调用。\n- 缩短了服务器启动时间。\n- 应用生命周期管理更加稳定。","2026-01-30T03:32:08",{"id":163,"version":164,"summary_zh":165,"released_at":166},107974,"v0.5.8","### 修复\n- 移除了对 `live-inspect` 的依赖\n\n### 重构\n- 从 `uiautomation` 库迁移，以更全面地使用无障碍 API。","2026-01-17T02:04:46",{"id":168,"version":169,"summary_zh":170,"released_at":171},107975,"v0.5.4","### 功能\n- 为 `State-Tool` 新增了仅在浏览器内部检查 DOM 内容的支持\n- 使用了 `Scrape-Tool` 中所用树结构中的 DOM 内容\n\n### 重构\n- 重构了代码库，以支持通过 PYPI 作为 `uvx` 进行安装。","2025-12-12T08:48:58",{"id":173,"version":174,"summary_zh":175,"released_at":176},107976,"v0.3","## 修复\n- 修复了中文语言环境下窗口显示的问题（感谢 @tangflash）。\n- 修复了使用工具时 VSCode 的问题（感谢 @Klauxs）。\n- 修复了 `Switch-Tool` 中的一些小问题。","2025-08-25T03:46:21",{"id":178,"version":179,"summary_zh":180,"released_at":181},107977,"v0.2","## 功能\n- 新增 `Resize-Tool`，用于调整应用大小或将其移动到指定位置。\n- 新增 `Switch-Tool`，方便在不同应用之间快速切换。\n- `Type-Tool` 增加了 `press_enter` 参数，以避免使用 `Key-Tool`。\n- 在 `State-Tool` 中添加了默认语言和浏览器设置，以便更好地理解系统状态。\n- 更新了 DXT 的 `manifest.json` 文件（感谢 @felixrieseberg）。\n\n## 修复\n- 修复了点击桌面应用时出现的问题。\n- 避免将上下文窗口视为应用。\n- 由于 DPI 相关问题，移除了 `human_cursor`。（感谢 @Kikk79）\n\n## 性能\n- 添加了必要的剪枝逻辑，以加快遍历速度（对浏览器等较长的应用列表特别有帮助）。","2025-08-03T03:51:13",{"id":183,"version":184,"summary_zh":185,"released_at":186},107978,"v0.1","## 特性\n- 包含用于 GUI 交互的工具，如 `Click Tool` 等\n- 包含用于非 GUI 交互的工具，如 `Shell Tool`、`Scrape Tool`\n- 新增 `State Tool`，用于检查桌面状态","2025-06-04T08:22:14"]