[{"data":1,"prerenderedAt":-1},["ShallowReactive",2],{"similar-web-infra-dev--midscene":3,"tool-web-infra-dev--midscene":62},[4,18,28,37,45,53],{"id":5,"name":6,"github_repo":7,"description_zh":8,"stars":9,"difficulty_score":10,"last_commit_at":11,"category_tags":12,"status":17},4358,"openclaw","openclaw\u002Fopenclaw","OpenClaw 是一款专为个人打造的本地化 AI 助手，旨在让你在自己的设备上拥有完全可控的智能伙伴。它打破了传统 AI 助手局限于特定网页或应用的束缚，能够直接接入你日常使用的各类通讯渠道，包括微信、WhatsApp、Telegram、Discord、iMessage 等数十种平台。无论你在哪个聊天软件中发送消息，OpenClaw 都能即时响应，甚至支持在 macOS、iOS 和 Android 设备上进行语音交互，并提供实时的画布渲染功能供你操控。\n\n这款工具主要解决了用户对数据隐私、响应速度以及“始终在线”体验的需求。通过将 AI 部署在本地，用户无需依赖云端服务即可享受快速、私密的智能辅助，真正实现了“你的数据，你做主”。其独特的技术亮点在于强大的网关架构，将控制平面与核心助手分离，确保跨平台通信的流畅性与扩展性。\n\nOpenClaw 非常适合希望构建个性化工作流的技术爱好者、开发者，以及注重隐私保护且不愿被单一生态绑定的普通用户。只要具备基础的终端操作能力（支持 macOS、Linux 及 Windows WSL2），即可通过简单的命令行引导完成部署。如果你渴望拥有一个懂你",349277,3,"2026-04-06T06:32:30",[13,14,15,16],"Agent","开发框架","图像","数据工具","ready",{"id":19,"name":20,"github_repo":21,"description_zh":22,"stars":23,"difficulty_score":24,"last_commit_at":25,"category_tags":26,"status":17},9989,"n8n","n8n-io\u002Fn8n","n8n 是一款面向技术团队的公平代码（fair-code）工作流自动化平台，旨在让用户在享受低代码快速构建便利的同时，保留编写自定义代码的灵活性。它主要解决了传统自动化工具要么过于封闭难以扩展、要么完全依赖手写代码效率低下的痛点，帮助用户轻松连接 400 多种应用与服务，实现复杂业务流程的自动化。\n\nn8n 特别适合开发者、工程师以及具备一定技术背景的业务人员使用。其核心亮点在于“按需编码”：既可以通过直观的可视化界面拖拽节点搭建流程，也能随时插入 JavaScript 或 Python 代码、调用 npm 包来处理复杂逻辑。此外，n8n 原生集成了基于 LangChain 的 AI 能力，支持用户利用自有数据和模型构建智能体工作流。在部署方面，n8n 提供极高的自由度，支持完全自托管以保障数据隐私和控制权，也提供云端服务选项。凭借活跃的社区生态和数百个现成模板，n8n 让构建强大且可控的自动化系统变得简单高效。",184740,2,"2026-04-19T23:22:26",[16,14,13,15,27],"插件",{"id":29,"name":30,"github_repo":31,"description_zh":32,"stars":33,"difficulty_score":10,"last_commit_at":34,"category_tags":35,"status":17},10095,"AutoGPT","Significant-Gravitas\u002FAutoGPT","AutoGPT 是一个旨在让每个人都能轻松使用和构建 AI 的强大平台，核心功能是帮助用户创建、部署和管理能够自动执行复杂任务的连续型 AI 智能体。它解决了传统 AI 应用中需要频繁人工干预、难以自动化长流程工作的痛点，让用户只需设定目标，AI 即可自主规划步骤、调用工具并持续运行直至完成任务。\n\n无论是开发者、研究人员，还是希望提升工作效率的普通用户，都能从 AutoGPT 中受益。开发者可利用其低代码界面快速定制专属智能体；研究人员能基于开源架构探索多智能体协作机制；而非技术背景用户也可直接选用预置的智能体模板，立即投入实际工作场景。\n\nAutoGPT 的技术亮点在于其模块化“积木式”工作流设计——用户通过连接功能块即可构建复杂逻辑，每个块负责单一动作，灵活且易于调试。同时，平台支持本地自托管与云端部署两种模式，兼顾数据隐私与使用便捷性。配合完善的文档和一键安装脚本，即使是初次接触的用户也能在几分钟内启动自己的第一个 AI 智能体。AutoGPT 正致力于降低 AI 应用门槛，让人人都能成为 AI 的创造者与受益者。",183572,"2026-04-20T04:47:55",[13,36,27,14,15],"语言模型",{"id":38,"name":39,"github_repo":40,"description_zh":41,"stars":42,"difficulty_score":10,"last_commit_at":43,"category_tags":44,"status":17},3808,"stable-diffusion-webui","AUTOMATIC1111\u002Fstable-diffusion-webui","stable-diffusion-webui 是一个基于 Gradio 构建的网页版操作界面，旨在让用户能够轻松地在本地运行和使用强大的 Stable Diffusion 图像生成模型。它解决了原始模型依赖命令行、操作门槛高且功能分散的痛点，将复杂的 AI 绘图流程整合进一个直观易用的图形化平台。\n\n无论是希望快速上手的普通创作者、需要精细控制画面细节的设计师，还是想要深入探索模型潜力的开发者与研究人员，都能从中获益。其核心亮点在于极高的功能丰富度：不仅支持文生图、图生图、局部重绘（Inpainting）和外绘（Outpainting）等基础模式，还独创了注意力机制调整、提示词矩阵、负向提示词以及“高清修复”等高级功能。此外，它内置了 GFPGAN 和 CodeFormer 等人脸修复工具，支持多种神经网络放大算法，并允许用户通过插件系统无限扩展能力。即使是显存有限的设备，stable-diffusion-webui 也提供了相应的优化选项，让高质量的 AI 艺术创作变得触手可及。",162132,"2026-04-05T11:01:52",[14,15,13],{"id":46,"name":47,"github_repo":48,"description_zh":49,"stars":50,"difficulty_score":24,"last_commit_at":51,"category_tags":52,"status":17},1381,"everything-claude-code","affaan-m\u002Feverything-claude-code","everything-claude-code 是一套专为 AI 编程助手（如 Claude Code、Codex、Cursor 等）打造的高性能优化系统。它不仅仅是一组配置文件，而是一个经过长期实战打磨的完整框架，旨在解决 AI 代理在实际开发中面临的效率低下、记忆丢失、安全隐患及缺乏持续学习能力等核心痛点。\n\n通过引入技能模块化、直觉增强、记忆持久化机制以及内置的安全扫描功能，everything-claude-code 能显著提升 AI 在复杂任务中的表现，帮助开发者构建更稳定、更智能的生产级 AI 代理。其独特的“研究优先”开发理念和针对 Token 消耗的优化策略，使得模型响应更快、成本更低，同时有效防御潜在的攻击向量。\n\n这套工具特别适合软件开发者、AI 研究人员以及希望深度定制 AI 工作流的技术团队使用。无论您是在构建大型代码库，还是需要 AI 协助进行安全审计与自动化测试，everything-claude-code 都能提供强大的底层支持。作为一个曾荣获 Anthropic 黑客大奖的开源项目，它融合了多语言支持与丰富的实战钩子（hooks），让 AI 真正成长为懂上",161692,"2026-04-20T11:33:57",[14,13,36],{"id":54,"name":55,"github_repo":56,"description_zh":57,"stars":58,"difficulty_score":59,"last_commit_at":60,"category_tags":61,"status":17},8272,"opencode","anomalyco\u002Fopencode","OpenCode 是一款开源的 AI 编程助手（Coding Agent），旨在像一位智能搭档一样融入您的开发流程。它不仅仅是一个代码补全插件，而是一个能够理解项目上下文、自主规划任务并执行复杂编码操作的智能体。无论是生成全新功能、重构现有代码，还是排查难以定位的 Bug，OpenCode 都能通过自然语言交互高效完成，显著减少开发者在重复性劳动和上下文切换上的时间消耗。\n\n这款工具专为软件开发者、工程师及技术研究人员设计，特别适合希望利用大模型能力来提升编码效率、加速原型开发或处理遗留代码维护的专业人群。其核心亮点在于完全开源的架构，这意味着用户可以审查代码逻辑、自定义行为策略，甚至私有化部署以保障数据安全，彻底打破了传统闭源 AI 助手的“黑盒”限制。\n\n在技术体验上，OpenCode 提供了灵活的终端界面（Terminal UI）和正在测试中的桌面应用程序，支持 macOS、Windows 及 Linux 全平台。它兼容多种包管理工具，安装便捷，并能无缝集成到现有的开发环境中。无论您是追求极致控制权的资深极客，还是渴望提升产出的独立开发者，OpenCode 都提供了一个透明、可信",144296,1,"2026-04-16T14:50:03",[13,27],{"id":63,"github_repo":64,"name":65,"description_en":66,"description_zh":67,"ai_summary_zh":68,"readme_en":69,"readme_zh":70,"quickstart_zh":71,"use_case_zh":72,"hero_image_url":73,"owner_login":74,"owner_name":75,"owner_avatar_url":76,"owner_bio":77,"owner_company":78,"owner_location":78,"owner_email":78,"owner_twitter":79,"owner_website":80,"owner_url":81,"languages":82,"stars":114,"forks":115,"last_commit_at":116,"license":117,"difficulty_score":10,"env_os":118,"env_gpu":119,"env_ram":120,"env_deps":121,"category_tags":132,"github_topics":133,"view_count":24,"oss_zip_url":78,"oss_zip_packed_at":78,"status":17,"created_at":142,"updated_at":143,"faqs":144,"releases":179},10175,"web-infra-dev\u002Fmidscene","midscene","AI-powered, vision-driven UI automation for every platform.","Midscene 是一款基于人工智能和视觉驱动的 UI 自动化工具，旨在让跨平台的界面操作变得像自然语言对话一样简单。传统自动化测试往往依赖复杂的元素定位代码，一旦界面微调就容易失效，而 Midscene 通过“看”懂屏幕内容来理解用户意图，直接根据自然语言描述规划并执行操作步骤，从而解决了维护成本高、适配难度大等痛点。\n\n这款工具非常适合开发者、测试工程师以及希望提升工作效率的技术研究人员使用。无论是 Web 网页、Android 手机还是 iOS 设备，甚至自定义接口，Midscene 都能通过 JavaScript SDK 或 YAML 脚本轻松掌控。它支持集成 Puppeteer 和 Playwright 等主流框架，也能通过 Bridge 模式控制桌面浏览器。\n\n其核心技术亮点在于融合了先进的视觉模型（如 UI-TARS），无需预先编写繁琐的选择器，只需告诉它“做什么”，它就能自主完成如填写表单、下单购物或点赞互动等复杂任务。此外，Midscene 还具备数据提取能力，并能与机械臂等硬件结合进行车载测试等前沿探索。如果你正在寻找一种更智能、更灵活的自动化方案，Midscene","Midscene 是一款基于人工智能和视觉驱动的 UI 自动化工具，旨在让跨平台的界面操作变得像自然语言对话一样简单。传统自动化测试往往依赖复杂的元素定位代码，一旦界面微调就容易失效，而 Midscene 通过“看”懂屏幕内容来理解用户意图，直接根据自然语言描述规划并执行操作步骤，从而解决了维护成本高、适配难度大等痛点。\n\n这款工具非常适合开发者、测试工程师以及希望提升工作效率的技术研究人员使用。无论是 Web 网页、Android 手机还是 iOS 设备，甚至自定义接口，Midscene 都能通过 JavaScript SDK 或 YAML 脚本轻松掌控。它支持集成 Puppeteer 和 Playwright 等主流框架，也能通过 Bridge 模式控制桌面浏览器。\n\n其核心技术亮点在于融合了先进的视觉模型（如 UI-TARS），无需预先编写繁琐的选择器，只需告诉它“做什么”，它就能自主完成如填写表单、下单购物或点赞互动等复杂任务。此外，Midscene 还具备数据提取能力，并能与机械臂等硬件结合进行车载测试等前沿探索。如果你正在寻找一种更智能、更灵活的自动化方案，Midscene 值得尝试。","\u003Cp align=\"center\">\n  \u003Cimg alt=\"Midscene.js\"  width=\"260\" src=\"https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002Fweb-infra-dev_midscene_readme_00e2e05cecd7.png\">\n\u003C\u002Fp>\n\n\u003Ch1 align=\"center\">Midscene.js\u003C\u002Fh1>\n\u003Cdiv align=\"center\">\n\nEnglish | [简体中文](.\u002FREADME.zh.md)\n\n\u003Cstrong>Official Website\u003C\u002Fstrong>: \u003Ca href=\"https:\u002F\u002Fmidscenejs.com\u002F\">https:\u002F\u002Fmidscenejs.com\u002F\u003C\u002Fa>\n\n\u003Ca href=\"https:\u002F\u002Ftrendshift.io\u002Frepositories\u002F12524\" target=\"_blank\">\u003Cimg src=\"https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002Fweb-infra-dev_midscene_readme_4cc089988f35.png\" alt=\"web-infra-dev%2Fmidscene | Trendshift\" style=\"width: 250px; height: 55px;\" width=\"250\" height=\"55\"\u002F>\u003C\u002Fa>\n\n\u003C\u002Fdiv>\n\n\u003Cp align=\"center\">\n  AI-powered, vision-driven UI automation for every platform.\n\u003C\u002Fp>\n\n\u003Cp align=\"center\">\n  \u003Ca href=\"https:\u002F\u002Fwww.npmjs.com\u002Fpackage\u002F@midscene\u002Fweb\">\u003Cimg src=\"https:\u002F\u002Fimg.shields.io\u002Fnpm\u002Fv\u002F@midscene\u002Fweb?style=flat-square&color=00a8f0\" alt=\"npm version\" \u002F>\u003C\u002Fa>\n  \u003Ca href=\"https:\u002F\u002Fhuggingface.co\u002FByteDance-Seed\u002FUI-TARS-1.5-7B\">\u003Cimg src=\"https:\u002F\u002Fimg.shields.io\u002Fbadge\u002FUI%20TARS%20Models-yellow\" alt=\"hugging face model\" \u002F>\u003C\u002Fa>\n  \u003Ca href=\"https:\u002F\u002Fnpm-compare.com\u002F@midscene\u002Fweb\u002F#timeRange=THREE_YEARS\">\u003Cimg src=\"https:\u002F\u002Fimg.shields.io\u002Fnpm\u002Fdm\u002F@midscene\u002Fweb.svg?style=flat-square&color=00a8f0\" alt=\"downloads\" \u002F>\u003C\u002Fa>\n  \u003Ca href=\"https:\u002F\u002Fgithub.com\u002Fweb-infra-dev\u002Fmidscene\u002Fblob\u002Fmain\u002FLICENSE\">\u003Cimg src=\"https:\u002F\u002Fimg.shields.io\u002Fbadge\u002FLicense-MIT-blue.svg?style=flat-square&color=00a8f0\" alt=\"License\" \u002F>\n  \u003Ca href=\"https:\u002F\u002Fdiscord.gg\u002F2JyBHxszE4\">\u003Cimg src=\"https:\u002F\u002Fimg.shields.io\u002Fdiscord\u002F1328277792730779648?style=flat-square&color=7289DA&label=Discord&logo=discord&logoColor=white\" alt=\"discord\" \u002F>\u003C\u002Fa>\n  \u003Ca href=\"https:\u002F\u002Fx.com\u002Fmidscene_ai\">\u003Cimg src=\"https:\u002F\u002Fimg.shields.io\u002Ftwitter\u002Ffollow\u002Fmidscene_ai?style=flat-square\" alt=\"twitter\" \u002F>\u003C\u002Fa>\n  \u003Ca href=\"https:\u002F\u002Fdeepwiki.com\u002Fweb-infra-dev\u002Fmidscene\">\n    \u003Cimg alt=\"Ask DeepWiki.com\" src=\"https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002Fweb-infra-dev_midscene_readme_1a081b2fa577.png\" style=\"height: 18px; vertical-align: middle;\" \u002F>\n  \u003C\u002Fa>\n\u003C\u002Fp>\n\n## 📣 Midscene Skills is here!\n\nUse [Midscene Skills](https:\u002F\u002Fgithub.com\u002Fweb-infra-dev\u002Fmidscene-skills) to control any platform with [OpenClaw](https:\u002F\u002Fgithub.com\u002FOpenClaw\u002FOpenClaw) \n\n## Showcases\n\n* [Web Automation - Automatically register the GitHub form in a web browser and pass all field validations](https:\u002F\u002Fmidscenejs.com\u002Fshowcases#web)\n* [iOS Automation - Meituan coffee order](https:\u002F\u002Fmidscenejs.com\u002Fshowcases#ios)\n* [iOS Automation - Auto-like the first @midscene_ai tweet](https:\u002F\u002Fmidscenejs.com\u002Fshowcases#ios)\n* [Android Automation - DCar: Xiaomi SU7 specs](https:\u002F\u002Fmidscenejs.com\u002Fshowcases#android)\n* [Android Automation - Booking a hotel for Christmas](https:\u002F\u002Fmidscenejs.com\u002Fshowcases#android)\n* [MCP Integration - Midscene MCP UI prepatch release](https:\u002F\u002Fmidscenejs.com\u002Fshowcases#mcp)\n* [robotic arm + vision + voice for in-vehicle testing](https:\u002F\u002Fmidscenejs.com\u002Fshowcases#community-showcases)\n\n## 💡 Features\n\n### Write Automation with Natural Language\n- Describe your goals and steps, and Midscene will plan and operate the user interface for you.\n- Use Javascript SDK or YAML to write your automation script.\n\n### Web & Mobile App & Any Interface\n- **Web Automation**: Either integrate with [Puppeteer](https:\u002F\u002Fmidscenejs.com\u002Fintegrate-with-puppeteer), [Playwright](https:\u002F\u002Fmidscenejs.com\u002Fintegrate-with-playwright) or use [Bridge Mode](https:\u002F\u002Fmidscenejs.com\u002Fbridge-mode) to control your desktop browser.\n- **Android Automation**: Use [Javascript SDK](https:\u002F\u002Fmidscenejs.com\u002Fandroid-getting-started) with adb to control your local Android device.\n- **iOS Automation**: Use [Javascript SDK](https:\u002F\u002Fmidscenejs.com\u002Fios-getting-started) with WebDriverAgent to control your local iOS devices and simulators.\n- **Any Interface Automation**: Use [Javascript SDK](https:\u002F\u002Fmidscenejs.com\u002Fintegrate-with-any-interface) to control your own interface.\n\n### For Developers\n- **Three kinds of APIs**:\n  - [Interaction API](https:\u002F\u002Fmidscenejs.com\u002Fapi#interaction-methods): interact with the user interface.\n  - [Data Extraction API](https:\u002F\u002Fmidscenejs.com\u002Fapi#data-extraction): extract data from the user interface and dom.\n  - [Utility API](https:\u002F\u002Fmidscenejs.com\u002Fapi#more-apis): utility functions like `aiAssert()`, `aiLocate()`, `aiWaitFor()`.\n- **MCP**: Midscene provides MCP services that expose atomic Midscene Agent actions as MCP tools so upper-layer agents can inspect and operate UIs with natural language. [Docs](https:\u002F\u002Fmidscenejs.com\u002Fmcp)\n- [**Caching for Efficiency**](https:\u002F\u002Fmidscenejs.com\u002Fcaching): Replay your script with cache and get the result faster.\n- **Debugging Experience**: Midscene.js offers a visualized replay back report file, a built-in playground, and a Chrome Extension to simplify the debugging process. These are the tools most developers truly need.\n\n\n## 👉 Zero-code Quick Experience\n\n- **[Chrome Extension](https:\u002F\u002Fmidscenejs.com\u002Fquick-experience)**: Start in-browser experience immediately through [the Chrome Extension](https:\u002F\u002Fmidscenejs.com\u002Fquick-experience), without writing any code.\n- **[Android Playground](https:\u002F\u002Fmidscenejs.com\u002Fandroid-getting-started)**: There is also a built-in Android playground to control your local Android device.\n- **[iOS Playground](https:\u002F\u002Fmidscenejs.com\u002Fios-getting-started)**: There is also a built-in iOS playground to control your local iOS device.\n\n## ✨ Driven by Visual Language Model\n\nMidscene.js is all-in on the pure-vision route for UI actions: element localization and interactions are based on screenshots only. It supports visual-language models like `Qwen3-VL`, `Doubao-1.6-vision`, `gemini-3-pro`, and `UI-TARS`. For data extraction and page understanding, you can still opt in to include DOM when needed.\n\n* Pure-vision localization for UI actions; the DOM extraction mode is removed.\n* Works across web, mobile, desktop, and even `\u003Ccanvas>` surfaces.\n* Far fewer tokens by skipping DOM for actions, which cuts cost and speeds up runs.\n* DOM can still be included for data extraction and page understanding when needed.\n* Strong open-source options for self-hosting.\n\nRead more about [Model Strategy](https:\u002F\u002Fmidscenejs.com\u002Fmodel-strategy)\n\n\n\n## 📄 Resources \n\n* Official Website: [https:\u002F\u002Fmidscenejs.com](https:\u002F\u002Fmidscenejs.com\u002F)\n* Documentation: [https:\u002F\u002Fmidscenejs.com](https:\u002F\u002Fmidscenejs.com\u002F)\n* Sample Projects: [https:\u002F\u002Fgithub.com\u002Fweb-infra-dev\u002Fmidscene-example](https:\u002F\u002Fgithub.com\u002Fweb-infra-dev\u002Fmidscene-example)\n* API Reference: [https:\u002F\u002Fmidscenejs.com\u002Fapi](https:\u002F\u002Fmidscenejs.com\u002Fapi)\n* GitHub: [https:\u002F\u002Fgithub.com\u002Fweb-infra-dev\u002Fmidscene](https:\u002F\u002Fgithub.com\u002Fweb-infra-dev\u002Fmidscene)\n\n## 🤝 Community\n\n* [Discord](https:\u002F\u002Fdiscord.gg\u002F2JyBHxszE4)\n* [Follow us on X](https:\u002F\u002Fx.com\u002Fmidscene_ai)\n* [Lark Group(飞书交流群)](https:\u002F\u002Fapplink.larkoffice.com\u002Fclient\u002Fchat\u002Fchatter\u002Fadd_by_link?link_token=693v0991-a6bb-4b44-b2e1-365ca0d199ba)\n\n## 🌟 Awesome Midscene\n\nCommunity projects that extend Midscene.js capabilities:\n\n* [midscene-ios](https:\u002F\u002Fgithub.com\u002Flhuanyu\u002Fmidscene-ios) - iOS Mirror automation support for Midscene\n* [midscene-pc](https:\u002F\u002Fgithub.com\u002FMofangbao\u002Fmidscene-pc) - PC operation device for Windows, macOS, and Linux\n* [midscene-pc-docker](https:\u002F\u002Fgithub.com\u002FMofangbao\u002Fmidscene-pc-docker) - Docker image with Midscene-PC server pre-installed\n* [Midscene-Python](https:\u002F\u002Fgithub.com\u002FPython51888\u002FMidscene-Python) - Python SDK for Midscene automation\n* [midscene-java](https:\u002F\u002Fgithub.com\u002FMaster-Frank\u002Fmidscene-java) by @Master-Frank - Java SDK for Midscene automation\n* [midscene-java](https:\u002F\u002Fgithub.com\u002Falstafeev\u002Fmidscene-java) by @alstafeev - Java SDK for Midscene automation\n\n\n## 📝 Credits\n\nWe would like to thank the following projects:\n\n- [Rsbuild](https:\u002F\u002Fgithub.com\u002Fweb-infra-dev\u002Frsbuild) and [Rslib](https:\u002F\u002Fgithub.com\u002Fweb-infra-dev\u002Frslib) for the build tool.\n- [UI-TARS](https:\u002F\u002Fgithub.com\u002Fbytedance\u002Fui-tars) for the open-source agent model UI-TARS.\n- [Qwen-VL](https:\u002F\u002Fgithub.com\u002FQwenLM\u002FQwen-VL) for the open-source VL model Qwen-VL.\n- [scrcpy](https:\u002F\u002Fgithub.com\u002FGenymobile\u002Fscrcpy) and [yume-chan](https:\u002F\u002Fgithub.com\u002Fyume-chan) allow us to control Android devices with browser.\n- [appium-adb](https:\u002F\u002Fgithub.com\u002Fappium\u002Fappium-adb) for the javascript bridge of adb.\n- [appium-webdriveragent](https:\u002F\u002Fgithub.com\u002Fappium\u002FWebDriverAgent) for the javascript operate XCTest。\n- [YADB](https:\u002F\u002Fgithub.com\u002Fysbing\u002FYADB) for the yadb tool which improves the performance of text input.\n- [libnut-core](https:\u002F\u002Fgithub.com\u002Fnut-tree\u002Flibnut-core) for the cross-platform native keyboard and mouse control.\n- [Puppeteer](https:\u002F\u002Fgithub.com\u002Fpuppeteer\u002Fpuppeteer) for browser automation and control.\n- [Playwright](https:\u002F\u002Fgithub.com\u002Fmicrosoft\u002Fplaywright) for browser automation and control and testing.\n\n## 📖 Citation\n\nIf you use Midscene.js in your research or project, please cite:\n\n```bibtex\n@software{Midscene.js,\n  author = {Xiao Zhou, Tao Yu, YiBing Lin},\n  title = {Midscene.js: Your AI Operator for Web, Android, iOS, Automation & Testing.},\n  year = {2025},\n  publisher = {GitHub},\n  url = {https:\u002F\u002Fgithub.com\u002Fweb-infra-dev\u002Fmidscene}\n}\n```\n\n## ✨ Star History\n\n[![Star History Chart](https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002Fweb-infra-dev_midscene_readme_7602a7609a43.png)](https:\u002F\u002Fwww.star-history.com\u002F#web-infra-dev\u002Fmidscene&Date)\n\n\n## 📝 License\n\nMidscene.js is [MIT licensed](https:\u002F\u002Fgithub.com\u002Fweb-infra-dev\u002Fmidscene\u002Fblob\u002Fmain\u002FLICENSE).\n\n---\n\n\u003Cdiv align=\"center\">\n  If this project helps you or inspires you, please give us a star\n\u003C\u002Fdiv>\n","\u003Cp align=\"center\">\n  \u003Cimg alt=\"Midscene.js\"  width=\"260\" src=\"https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002Fweb-infra-dev_midscene_readme_00e2e05cecd7.png\">\n\u003C\u002Fp>\n\n\u003Ch1 align=\"center\">Midscene.js\u003C\u002Fh1>\n\u003Cdiv align=\"center\">\n\n英语 | [简体中文](.\u002FREADME.zh.md)\n\n\u003Cstrong>官方网站\u003C\u002Fstrong>: \u003Ca href=\"https:\u002F\u002Fmidscenejs.com\u002F\">https:\u002F\u002Fmidscenejs.com\u002F\u003C\u002Fa>\n\n\u003Ca href=\"https:\u002F\u002Ftrendshift.io\u002Frepositories\u002F12524\" target=\"_blank\">\u003Cimg src=\"https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002Fweb-infra-dev_midscene_readme_4cc089988f35.png\" alt=\"web-infra-dev%2Fmidscene | Trendshift\" style=\"width: 250px; height: 55px;\" width=\"250\" height=\"55\"\u002F>\u003C\u002Fa>\n\n\u003C\u002Fdiv>\n\n\u003Cp align=\"center\">\n  基于人工智能与视觉驱动的跨平台UI自动化工具。\n\u003C\u002Fp>\n\n\u003Cp align=\"center\">\n  \u003Ca href=\"https:\u002F\u002Fwww.npmjs.com\u002Fpackage\u002F@midscene\u002Fweb\">\u003Cimg src=\"https:\u002F\u002Fimg.shields.io\u002Fnpm\u002Fv\u002F@midscene\u002Fweb?style=flat-square&color=00a8f0\" alt=\"npm版本\" \u002F>\u003C\u002Fa>\n  \u003Ca href=\"https:\u002F\u002Fhuggingface.co\u002FByteDance-Seed\u002FUI-TARS-1.5-7B\">\u003Cimg src=\"https:\u002F\u002Fimg.shields.io\u002Fbadge\u002FUI%20TARS%20Models-yellow\" alt=\"Hugging Face模型\" \u002F>\u003C\u002Fa>\n  \u003Ca href=\"https:\u002F\u002Fnpm-compare.com\u002F@midscene.web\u002F#timeRange=THREE_YEARS\">\u003Cimg src=\"https:\u002F\u002Fimg.shields.io\u002Fnpm\u002Fdm\u002F@midscene.web.svg?style=flat-square&color=00a8f0\" alt=\"下载量\" \u002F>\u003C\u002Fa>\n  \u003Ca href=\"https:\u002F\u002Fgithub.com\u002Fweb-infra-dev\u002Fmidscene\u002Fblob\u002Fmain\u002FLICENSE\">\u003Cimg src=\"https:\u002F\u002Fimg.shields.io\u002Fbadge\u002FLicense-MIT-blue.svg?style=flat-square&color=00a8f0\" alt=\"许可证\" \u002F>\n  \u003Ca href=\"https:\u002F\u002Fdiscord.gg\u002F2JyBHxszE4\">\u003Cimg src=\"https:\u002F\u002Fimg.shields.io\u002Fdiscord\u002F1328277792730779648?style=flat-square&color=7289DA&label=Discord&logo=discord&logoColor=white\" alt=\"Discord\" \u002F>\u003C\u002Fa>\n  \u003Ca href=\"https:\u002F\u002Fx.com\u002Fmidscene_ai\">\u003Cimg src=\"https:\u002F\u002Fimg.shields.io\u002Ftwitter\u002Ffollow\u002Fmidscene_ai?style=flat-square\" alt=\"Twitter\" \u002F>\u003C\u002Fa>\n  \u003Ca href=\"https:\u002F\u002Fdeepwiki.com\u002Fweb-infra-dev\u002Fmidscene\">\n    \u003Cimg alt=\"Ask DeepWiki.com\" src=\"https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002Fweb-infra-dev_midscene_readme_1a081b2fa577.png\" style=\"height: 18px; vertical-align: middle;\" \u002F>\n  \u003C\u002Fa>\n\u003C\u002Fp>\n\n## 📣 Midscene Skills来了！\n\n使用[Midscene Skills](https:\u002F\u002Fgithub.com\u002Fweb-infra-dev\u002Fmidscene-skills)，结合[OpenClaw](https:\u002F\u002Fgithub.com\u002FOpenClaw\u002FOpenClaw)即可控制任意平台。\n\n## 展示案例\n\n* [Web自动化 - 自动在浏览器中填写GitHub注册表单并完成所有字段验证](https:\u002F\u002Fmidscenejs.com\u002Fshowcases#web)\n* [iOS自动化 - 美团咖啡下单](https:\u002F\u002Fmidscenejs.com\u002Fshowcases#ios)\n* [iOS自动化 - 自动为第一条@midscene_ai推文点赞](https:\u002F\u002Fmidscenejs.com\u002Fshowcases#ios)\n* [Android自动化 - DCar：小米SU7规格查询](https:\u002F\u002Fmidscenejs.com\u002Fshowcases#android)\n* [Android自动化 - 预订圣诞节酒店](https:\u002F\u002Fmidscenejs.com\u002Fshowcases#android)\n* [MCP集成 - Midscene MCP UI预发布](https:\u002F\u002Fmidscenejs.com\u002Fshowcases#mcp)\n* [机械臂+视觉+语音用于车载测试](https:\u002F\u002Fmidscenejs.com\u002Fshowcases#community-showcases)\n\n## 💡 核心功能\n\n### 使用自然语言编写自动化脚本\n- 描述你的目标和步骤，Midscene将为你规划并操作用户界面。\n- 支持通过JavaScript SDK或YAML编写自动化脚本。\n\n### 适用于Web、移动端及任何界面\n- **Web自动化**：可与[Puppeteer](https:\u002F\u002Fmidscenejs.com\u002Fintegrate-with-puppeteer)、[Playwright](https:\u002F\u002Fmidscenejs.com\u002Fintegrate-with-playwright)集成，或使用[桥接模式](https:\u002F\u002Fmidscenejs.com\u002Fbridge-mode)控制桌面浏览器。\n- **Android自动化**：通过[JavaScript SDK](https:\u002F\u002Fmidscenejs.com\u002Fandroid-getting-started)配合adb控制本地Android设备。\n- **iOS自动化**：通过[JavaScript SDK](https:\u002F\u002Fmidscenejs.com\u002Fios-getting-started)配合WebDriverAgent控制本地iOS设备及模拟器。\n- **任意界面自动化**：使用[JavaScript SDK](https:\u002F\u002Fmidscenejs.com\u002Fintegrate-with-any-interface)控制自定义界面。\n\n### 面向开发者\n- **三种API**：\n  - [交互API](https:\u002F\u002Fmidscenejs.com\u002Fapi#interaction-methods)：用于与用户界面交互。\n  - [数据提取API](https:\u002F\u002Fmidscenejs.com\u002Fapi#data-extraction)：从用户界面和DOM中提取数据。\n  - [工具API](https:\u002F\u002Fmidscenejs.com\u002Fapi#more-apis)：提供`aiAssert()`、`aiLocate()`、`aiWaitFor()`等实用函数。\n- **MCP**：Midscene提供MCP服务，将原子级的Midscene Agent动作封装为MCP工具，使上层智能体能够以自然语言检查和操作UI。[文档](https:\u002F\u002Fmidscenejs.com\u002Fmcp)\n- **[高效缓存机制](https:\u002F\u002Fmidscenejs.com\u002Fcaching)**：利用缓存重放脚本，大幅提升执行速度。\n- **调试体验**：Midscene.js提供可视化回放报告文件、内置游乐场以及Chrome扩展程序，简化调试流程。这些都是开发者真正需要的工具。\n\n\n## 👉 无需代码的快速体验\n\n- **[Chrome扩展](https:\u002F\u002Fmidscenejs.com\u002Fquick-experience)**：无需编写任何代码，直接通过[Chrome扩展](https:\u002F\u002Fmidscenejs.com\u002Fquick-experience)开始浏览器内的体验。\n- **[Android游乐场](https:\u002F\u002Fmidscenejs.com\u002Fandroid-getting-started)**：内置Android游乐场，可直接控制本地Android设备。\n- **[iOS游乐场](https:\u002F\u002Fmidscenejs.com\u002Fios-getting-started)**：内置iOS游乐场，可直接控制本地iOS设备。\n\n## ✨ 由视觉语言模型驱动\n\nMidscene.js完全采用纯视觉路线进行UI操作：元素定位和交互仅基于截图。它支持诸如`Qwen3-VL`、`Doubao-1.6-vision`、`gemini-3-pro`和`UI-TARS`等视觉语言模型。在数据提取和页面理解方面，您仍可根据需要选择是否包含DOM。\n\n* UI操作完全基于纯视觉定位；已移除DOM提取模式。\n* 可跨Web、移动、桌面甚至`\u003Ccanvas>`表面运行。\n* 由于操作时不再使用DOM，大幅减少Token消耗，从而降低成本并加快运行速度。\n* 在需要进行数据提取和页面理解时，仍可选择包含DOM。\n* 提供强大的开源选项，方便自行部署。\n\n更多关于[模型策略](https:\u002F\u002Fmidscenejs.com\u002Fmodel-strategy)的信息请参阅。\n\n\n## 📄 资源\n\n* 官方网站：[https:\u002F\u002Fmidscenejs.com](https:\u002F\u002Fmidscenejs.com\u002F)\n* 文档：[https:\u002F\u002Fmidscenejs.com](https:\u002F\u002Fmidscenejs.com\u002F)\n* 示例项目：[https:\u002F\u002Fgithub.com\u002Fweb-infra-dev\u002Fmidscene-example](https:\u002F\u002Fgithub.com\u002Fweb-infra-dev\u002Fmidscene-example)\n* API参考：[https:\u002F\u002Fmidscenejs.com\u002Fapi](https:\u002F\u002Fmidscenejs.com\u002Fapi)\n* GitHub：[https:\u002F\u002Fgithub.com\u002Fweb-infra-dev\u002Fmidscene](https:\u002F\u002Fgithub.com\u002Fweb-infra-dev\u002Fmidscene)\n\n## 🤝 社区\n\n* [Discord](https:\u002F\u002Fdiscord.gg\u002F2JyBHxszE4)\n* [关注我们在X上](https:\u002F\u002Fx.com\u002Fmidscene_ai)\n* [飞书交流群](https:\u002F\u002Fapplink.larkoffice.com\u002Fclient\u002Fchat\u002Fchatter\u002Fadd_by_link?link_token=693v0991-a6bb-4b44-b2e1-365ca0d199ba)\n\n## 🌟 令人惊叹的 Midscene\n\n扩展 Midscene.js 功能的社区项目：\n\n* [midscene-ios](https:\u002F\u002Fgithub.com\u002Flhuanyu\u002Fmidscene-ios) - 为 Midscene 提供 iOS 镜像自动化支持\n* [midscene-pc](https:\u002F\u002Fgithub.com\u002FMofangbao\u002Fmidscene-pc) - 适用于 Windows、macOS 和 Linux 的 PC 操作设备\n* [midscene-pc-docker](https:\u002F\u002Fgithub.com\u002FMofangbao\u002Fmidscene-pc-docker) - 预装 Midscene-PC 服务器的 Docker 镜像\n* [Midscene-Python](https:\u002F\u002Fgithub.com\u002FPython51888\u002FMidscene-Python) - 用于 Midscene 自动化的 Python SDK\n* [midscene-java](https:\u002F\u002Fgithub.com\u002FMaster-Frank\u002Fmidscene-java) 由 @Master-Frank 开发 - 用于 Midscene 自动化的 Java SDK\n* [midscene-java](https:\u002F\u002Fgithub.com\u002Falstafeev\u002Fmidscene-java) 由 @alstafeev 开发 - 用于 Midscene 自动化的 Java SDK\n\n\n## 📝 致谢\n\n我们衷心感谢以下项目：\n\n- [Rsbuild](https:\u002F\u002Fgithub.com\u002Fweb-infra-dev\u002Frsbuild) 和 [Rslib](https:\u002F\u002Fgithub.com\u002Fweb-infra-dev\u002Frslib)，为我们提供了构建工具。\n- [UI-TARS](https:\u002F\u002Fgithub.com\u002Fbytedance\u002Fui-tars)，开源代理模型 UI-TARS。\n- [Qwen-VL](https:\u002F\u002Fgithub.com\u002FQwenLM\u002FQwen-VL)，开源 VL 模型 Qwen-VL。\n- [scrcpy](https:\u002F\u002Fgithub.com\u002FGenymobile\u002Fscrcpy) 和 [yume-chan](https:\u002F\u002Fgithub.com\u002Fyume-chan)，使我们能够通过浏览器控制 Android 设备。\n- [appium-adb](https:\u002F\u002Fgithub.com\u002Fappium\u002Fappium-adb)，提供 adb 的 JavaScript 桥接。\n- [appium-webdriveragent](https:\u002F\u002Fgithub.com\u002Fappium\u002FWebDriverAgent)，用于通过 JavaScript 操作 XCTest。\n- [YADB](https:\u002F\u002Fgithub.com\u002Fysbing\u002FYADB)，一款提升文本输入性能的 yadb 工具。\n- [libnut-core](https:\u002F\u002Fgithub.com\u002Fnut-tree\u002Flibnut-core)，提供跨平台的原生键盘和鼠标控制。\n- [Puppeteer](https:\u002F\u002Fgithub.com\u002Fpuppeteer\u002Fpuppeteer)，用于浏览器自动化与控制。\n- [Playwright](https:\u002F\u002Fgithub.com\u002Fmicrosoft\u002Fplaywright)，用于浏览器自动化、控制及测试。\n\n## 📖 引用\n\n如果您在研究或项目中使用了 Midscene.js，请引用如下：\n\n```bibtex\n@software{Midscene.js,\n  author = {Xiao Zhou, Tao Yu, YiBing Lin},\n  title = {Midscene.js：您的 Web、Android、iOS 自动化与测试 AI 操作员。},\n  year = {2025},\n  publisher = {GitHub},\n  url = {https:\u002F\u002Fgithub.com\u002Fweb-infra-dev\u002Fmidscene}\n}\n```\n\n## ✨ 星标历史\n\n[![星标历史图表](https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002Fweb-infra-dev_midscene_readme_7602a7609a43.png)](https:\u002F\u002Fwww.star-history.com\u002F#web-infra-dev\u002Fmidscene&Date)\n\n\n## 📝 许可证\n\nMidscene.js 采用 [MIT 许可证](https:\u002F\u002Fgithub.com\u002Fweb-infra-dev\u002Fmidscene\u002Fblob\u002Fmain\u002FLICENSE)。\n\n---\n\n\u003Cdiv align=\"center\">\n  如果本项目对您有所帮助或启发，请为我们点亮一颗星吧！\n\u003C\u002Fdiv>","# Midscene.js 快速上手指南\n\nMidscene.js 是一个由视觉语言模型（VLM）驱动的 UI 自动化工具。它支持通过自然语言描述来控制 Web、Android、iOS 及任意界面，无需依赖传统的 DOM 定位，仅凭截图即可实现元素识别与交互。\n\n## 环境准备\n\n### 系统要求\n- **操作系统**: Windows, macOS, 或 Linux\n- **Node.js**: 版本 >= 18.0.0\n- **包管理器**: npm, yarn, 或 pnpm\n\n### 前置依赖\n根据你要自动化的平台，需准备以下环境：\n- **Web 自动化**: 安装 Chrome 浏览器。\n- **Android 自动化**: \n  - 安装 Android SDK (包含 `adb` 工具)。\n  - 开启手机的“开发者选项”和\"USB 调试”。\n  - (可选) 安装 [scrcpy](https:\u002F\u002Fgithub.com\u002FGenymobile\u002Fscrcpy) 以获得更好的屏幕投射体验。\n- **iOS 自动化**: \n  - 安装 Xcode (macOS only)。\n  - 配置 WebDriverAgent (WDA)。\n\n### 模型配置\nMidscene 需要调用大模型服务。你可以选择：\n- **云端服务**: 配置 OpenAI, Azure, 或国内的大模型服务商（如阿里云百炼、火山引擎等）的 API Key。\n- **本地部署**: 自行部署开源模型（如 Qwen-VL, UI-TARS）。\n\n> **提示**：国内开发者建议在环境变量中配置国内大模型接口以降低延迟。\n\n## 安装步骤\n\n### 1. 初始化项目\n在终端中创建新项目并安装核心依赖：\n\n```bash\nmkdir midscene-demo && cd midscene-demo\nnpm init -y\nnpm install @midscene\u002Fweb\n```\n\n### 2. 配置环境变量\n在项目根目录创建 `.env` 文件，配置你的模型服务凭证。以下以兼容 OpenAI 格式的接口为例（国内用户可替换为相应国内服务商地址）：\n\n```bash\n# .env\nMIDSCENE_MODEL_NAME=Qwen3-VL-Max\nOPENAI_API_KEY=your_api_key_here\nOPENAI_BASE_URL=https:\u002F\u002Fdashscope.aliyuncs.com\u002Fcompatible-mode\u002Fv1\n```\n\n## 基本使用\n\n### 方式一：零代码体验 (Chrome 插件)\n如果你只想快速体验而不写代码，推荐直接使用官方 Chrome 扩展程序：\n1. 访问 [Midscene Chrome Extension](https:\u002F\u002Fmidscenejs.com\u002Fquick-experience) 安装插件。\n2. 在浏览器中打开任意网页，点击插件图标。\n3. 在输入框中输入自然语言指令（例如：“点击登录按钮”或“提取所有商品的价格”），插件将自动执行。\n\n### 方式二：编写自动化脚本 (JavaScript\u002FTypeScript)\n\n以下是一个控制浏览器自动操作的简单示例。该脚本将打开一个网页，并使用自然语言指令进行搜索。\n\n创建一个 `demo.js` 文件：\n\n```javascript\nconst { launchBrowser, ai, aiQuery } = require('@midscene\u002Fweb');\n\n(async () => {\n  \u002F\u002F 1. 启动浏览器\n  const browser = await launchBrowser({\n    headless: false, \u002F\u002F 设置为 true 可在后台运行\n  });\n  \n  \u002F\u002F 2. 打开目标页面\n  const page = await browser.newPage();\n  await page.goto('https:\u002F\u002Fwww.bing.com');\n\n  \u002F\u002F 3. 使用自然语言进行交互\n  \u002F\u002F 指令：在搜索框输入 \"Midscene JS\" 并回车\n  await ai(page).action('type \"Midscene JS\" in the search box and press Enter');\n\n  \u002F\u002F 等待结果加载\n  await page.waitForTimeout(3000);\n\n  \u002F\u002F 4. 提取数据\n  \u002F\u002F 指令：提取搜索结果中标题和链接\n  const data = await aiQuery(page, 'extract the title and link of each search result');\n  \n  console.log('提取到的数据:', data);\n\n  \u002F\u002F 5. 关闭浏览器\n  await browser.close();\n})();\n```\n\n运行脚本：\n\n```bash\nnode demo.js\n```\n\n### 关键 API 说明\n- **`ai(page).action(instruction)`**: 执行操作。传入自然语言描述，如 \"点击提交按钮\"、\"滚动到页面底部\"。\n- **`aiQuery(page, instruction)`**: 数据提取。传入描述，如 \"获取当前页面的所有用户名\"，返回结构化 JSON 数据。\n- **`aiAssert(page, instruction)`**: 断言检查。用于测试验证，如 \"确认页面上存在欢迎文字\"。\n\n### 进阶：移动端自动化\n对于 Android 设备，确保 `adb` 已连接设备，然后使用类似的 API：\n\n```javascript\nconst { connectToDevice, ai } = require('@midscene\u002Fweb\u002Fandroid');\n\n(async () => {\n  const device = await connectToDevice();\n  \u002F\u002F 对手机屏幕执行操作\n  await ai(device).action('Open the settings app');\n})();\n```\n\n现在你已经掌握了 Midscene.js 的基础用法，可以开始尝试用自然语言构建复杂的跨平台自动化流程了。","某电商测试团队需要在每周版本更新后，快速验证官网、iOS 及 Android 三端的核心购物流程（如搜索、加购、结算）是否正常。\n\n### 没有 midscene 时\n- **脚本维护成本极高**：传统自动化依赖固定的 CSS 选择器或 XPath，一旦前端重构或按钮 ID 变更，所有脚本立即报错，需人工逐行修复。\n- **多端适配困难**：Web、iOS 和 Android 需要分别编写和维护三套完全不同的测试代码栈，人力投入重复且分散。\n- **非标准元素识别弱**：面对动态加载的弹窗、Canvas 绘图或复杂的自定义组件，传统工具往往无法定位，只能被迫插入大量强制等待或跳过测试。\n- **需求响应滞后**：产品经理临时调整交互逻辑后，测试脚本的修改周期长达数天，严重拖慢发布节奏。\n\n### 使用 midscene 后\n- **自然语言驱动执行**：测试人员只需用中文描述“点击加入购物车按钮”或“验证订单总价”，midscene 基于视觉理解自动规划操作，不再依赖易变的代码特征。\n- **一套逻辑通吃多端**：相同的自然语言指令可直接复用于 Web、iOS 和 Android 环境，midscene 自动适配不同平台的底层驱动，大幅减少重复工作。\n- **视觉感知精准操作**：凭借 AI 视觉能力，midscene 能像人眼一样识别屏幕上的任意元素（包括动态弹窗和非标准控件），显著降低误报率。\n- **敏捷应对变更**：当界面布局调整时，只需微调自然语言描述甚至无需修改，midscene 能自适应新界面，将脚本维护时间从几天缩短至几分钟。\n\nmidscene 通过“所见即所得”的 AI 视觉自动化，将跨端 UI 测试从繁琐的代码维护中解放出来，实现了真正的敏捷质量保障。","https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002Fweb-infra-dev_midscene_00e2e05c.png","web-infra-dev","Web Infra","https:\u002F\u002Foss.gittoolsai.com\u002Favatars\u002Fweb-infra-dev_91551d2f.png","We are a ByteDance team focused on building an open ecosystem that advances web development.",null,"rspack_dev","https:\u002F\u002Fwebinfra.org\u002F","https:\u002F\u002Fgithub.com\u002Fweb-infra-dev",[83,87,91,95,99,102,106,110],{"name":84,"color":85,"percentage":86},"TypeScript","#3178c6",81.1,{"name":88,"color":89,"percentage":90},"MDX","#fcb32c",13.6,{"name":92,"color":93,"percentage":94},"Less","#1d365d",2.2,{"name":96,"color":97,"percentage":98},"HTML","#e34c26",1.6,{"name":100,"color":101,"percentage":59},"JavaScript","#f1e05a",{"name":103,"color":104,"percentage":105},"CSS","#663399",0.3,{"name":107,"color":108,"percentage":109},"Shell","#89e051",0.1,{"name":111,"color":112,"percentage":113},"Objective-C","#438eff",0,12722,946,"2026-04-20T05:57:52","MIT","Windows, macOS, Linux","未说明（支持本地部署开源视觉模型如 UI-TARS、Qwen-VL，具体显存需求取决于所选模型；也可调用云端 API 如 Gemini、Doubao）","未说明",{"notes":122,"python":123,"dependencies":124},"该工具核心为 JavaScript\u002FNode.js 环境。Web 端需安装 Puppeteer 或 Playwright；Android 自动化需配置 ADB 环境；iOS 自动化需配置 WebDriverAgent。若选择本地运行视觉大模型（如 UI-TARS），需自行搭建对应的 AI 推理环境（通常涉及 Python、PyTorch 及 GPU 支持）。","未说明（主要提供 JavaScript\u002FTypeScript SDK，社区有非官方 Python SDK）",[125,126,127,128,129,130,131],"@midscene\u002Fweb","Puppeteer (可选)","Playwright (可选)","adb (Android 自动化必需)","WebDriverAgent (iOS 自动化必需)","scrcpy (可选，用于 Android 控制)","libnut-core (跨平台键鼠控制)",[36,15,14,13],[134,135,136,137,138,139,140,141],"ai","testing","ai-test","browser-use","computer-use","gpt-operator","javascript","phone-use","2026-03-27T02:49:30.150509","2026-04-20T20:23:03.023250",[145,150,155,160,165,170,174],{"id":146,"question_zh":147,"answer_zh":148,"source_url":149},45678,"如何配置 Azure OpenAI 服务以解决 401 认证错误？","配置 Azure OpenAI 需要设置特定的环境变量，不能直接使用标准的 OPENAI_API_KEY。请按照以下步骤配置：\n1. 设置 `MIDSCENE_USE_AZURE_OPENAI=1`\n2. 设置 `MIDSCENE_AZURE_OPENAI_SCOPE`，通常为 \"https:\u002F\u002Fcognitiveservices.azure.com\u002F.default\"（根据具体公司接口可能需调整）\n3. 设置 `MIDSCENE_AZURE_OPENAI_INIT_CONFIG_JSON`，包含 apiVersion、endpoint 和 deployment 信息，例如：'{\"apiVersion\": \"2024-11-01-preview\", \"endpoint\": \"你的 endpoint\", \"deployment\": \"你的 deployment\"}'\n注意：不要将 Azure 的 Key 直接赋值给 OPENAI_API_KEY，否则会导致 401 错误。","https:\u002F\u002Fgithub.com\u002Fweb-infra-dev\u002Fmidscene\u002Fissues\u002F221",{"id":151,"question_zh":152,"answer_zh":153,"source_url":154},45679,"部署 Ollama + UI-TARS 模型时遇到 403 错误如何解决？","遇到 403 错误通常是因为跨域限制。解决方法是启动 Ollama 时启用跨域配置：\n运行命令：`OLLAMA_HOST=\"0.0.0.0\" OLLAMA_ORIGINS=\"*\" ollama serve`\n此外，目前不建议使用 UI-TARS 的 Ollama 版本，推荐参考官方说明直接使用 vllm 部署模型以获得更稳定的体验。","https:\u002F\u002Fgithub.com\u002Fweb-infra-dev\u002Fmidscene\u002Fissues\u002F309",{"id":156,"question_zh":157,"answer_zh":158,"source_url":159},45680,"Chrome 插件报错 'Cannot access a chrome-extension:\u002F\u002F URL of different extension' 是什么原因？","该错误通常是因为配置的模型不支持图片内容理解（Vision Capabilities）。Midscene 浏览器插件需要模型能够处理图像输入（如截图分析）。请检查你配置的模型（如豆包或其他模型）是否支持 `image_url` 类型的输入。如果模型仅基于文本或 DOM 分析而不支持视觉理解，会导致此错误。请更换为支持多模态（图文理解）的模型并确认参数配置正确。","https:\u002F\u002Fgithub.com\u002Fweb-infra-dev\u002Fmidscene\u002Fissues\u002F207",{"id":161,"question_zh":162,"answer_zh":163,"source_url":164},45681,"如何在 Windows 上运行 midscene CLI 避免路径错误？","在 Windows 系统上使用 midscene CLI 运行测试时，如果遇到路径找不到或 require 错误，请注意路径分隔符的使用。\n1. 尝试将命令中的反斜杠 `\\` 替换为正斜杠 `\u002F`。\n2. 或者直接使用 `npx playwright test` 而不指定具体文件路径，让工具自动发现测试文件。\n3. 确保已全局安装 `@midscene\u002Fcli` 并且本地项目依赖已正确安装。","https:\u002F\u002Fgithub.com\u002Fweb-infra-dev\u002Fmidscene\u002Fissues\u002F202",{"id":166,"question_zh":167,"answer_zh":168,"source_url":169},45682,"如何实现 Chrome 插件桥接模式的自动连接，无需每次手动确认？","为了实现全自动化，避免每次执行脚本时手动打开侧边栏点击允许连接：\n1. 在插件设置中寻找类似 \"Automatically allow connections when the side panel is open\"（打开侧边栏时自动允许连接）的选项并勾选。\n2. 结合 \"remember the last opened tabs\"（记住最后打开的标签页）功能，可以在代码执行时自动建立桥接连接。\n虽然完全无干预（如不打开侧边栏）可能受限于浏览器安全策略，但通过上述设置可以大幅减少手动操作步骤。","https:\u002F\u002Fgithub.com\u002Fweb-infra-dev\u002Fmidscene\u002Fissues\u002F1141",{"id":171,"question_zh":172,"answer_zh":173,"source_url":154},45683,"如何在 Android 设备上使用 Midscene 进行自动化测试？","Android 界面的自动化目前是通过 Appium 实现的。虽然相关文档可能尚未完善，但大部分功能已可用。\n你可以参考以下路径尝试运行测试：\n`https:\u002F\u002Fgithub.com\u002Fweb-infra-dev\u002Fmidscene\u002Ftree\u002Fmain\u002Fpackages\u002Fweb-integration\u002Ftests\u002Fai\u002Fnative\u002Fappium`\n确保环境中已正确安装和配置 Appium，并参考源码中的测试用例进行集成。",{"id":175,"question_zh":176,"answer_zh":177,"source_url":178},45684,"使用豆包（Doubao）等第三方模型时报 401 错误怎么办？","如果使用豆包等第三方模型遇到 401 错误，首先检查 `.env` 文件中的 API Key 配置是否正确。\n关键点：确保所选模型支持图片内容理解（Vision），因为 Midscene 依赖模型处理屏幕截图。如果模型不支持视觉输入，即使 Key 正确也可能报错或无法工作。请参考官方文档 `https:\u002F\u002Fmidscenejs.com\u002Fzh\u002Fmodel-provider.html` 核对模型提供商的具体配置要求和支持的模型列表。","https:\u002F\u002Fgithub.com\u002Fweb-infra-dev\u002Fmidscene\u002Fissues\u002F209",[180,184,188,192,196,201,206,211,216,221,226,231,236,241,246,251,256,261,266,271],{"id":181,"version":182,"summary_zh":78,"released_at":183},360594,"v1.7.5-beta-20260420075536.0","2026-04-20T07:58:14",{"id":185,"version":186,"summary_zh":78,"released_at":187},360595,"v1.7.5-beta-20260420061332.0","2026-04-20T06:16:13",{"id":189,"version":190,"summary_zh":78,"released_at":191},360596,"v1.7.5-beta-20260420032657.0","2026-04-20T03:29:39",{"id":193,"version":194,"summary_zh":78,"released_at":195},360597,"v1.7.5-beta-20260420031652.0","2026-04-20T03:19:39",{"id":197,"version":198,"summary_zh":199,"released_at":200},360610,"v1.5.6","\u003C!-- Release notes generated using configuration in .github\u002Frelease.yml at v1.5.6 -->\r\n\r\n## What's Changed\r\n### New Features 🎉\r\n* feat(core): add codex app-server provider by @ScriptedAlchemy in https:\u002F\u002Fgithub.com\u002Fweb-infra-dev\u002Fmidscene\u002Fpull\u002F2134\r\n### Bug Fixes 🐞\r\n* fix(chrome-extension): fix recording crash from O(n²) message serialization by @quanru in https:\u002F\u002Fgithub.com\u002Fweb-infra-dev\u002Fmidscene\u002Fpull\u002F2161\r\n\r\n## New Contributors\r\n* @ScriptedAlchemy made their first contribution in https:\u002F\u002Fgithub.com\u002Fweb-infra-dev\u002Fmidscene\u002Fpull\u002F2134\r\n\r\n**Full Changelog**: https:\u002F\u002Fgithub.com\u002Fweb-infra-dev\u002Fmidscene\u002Fcompare\u002Fv1.5.5...v1.5.6","2026-03-17T01:58:24",{"id":202,"version":203,"summary_zh":204,"released_at":205},360598,"v1.7.4","\u003C!-- 使用 .github\u002Frelease.yml 中的配置在 v1.7.4 版本生成的发布说明 -->\n\n## 变更内容\n### 新功能 🎉\n* feat(midscene-studio): 由 @quanru 在 https:\u002F\u002Fgithub.com\u002Fweb-infra-dev\u002Fmidscene\u002Fpull\u002F2329 中实现，用于搭建原生 Shell 应用的脚手架\n* feat(studio): 由 @quanru 在 https:\u002F\u002Fgithub.com\u002Fweb-infra-dev\u002Fmidscene\u002Fpull\u002F2343 中实现，将 Android Playground 集成到 Shell 中\n* feat(web-integration): 由 @EAGzzyCSL 在 https:\u002F\u002Fgithub.com\u002Fweb-infra-dev\u002Fmidscene\u002Fpull\u002F2328 中实现，支持 PlaywrightAiFixture 中的 PlaywrightAgent 选项\n### 性能优化 🚀\n* perf(report): 由 @vincerevu 在 https:\u002F\u002Fgithub.com\u002Fweb-infra-dev\u002Fmidscene\u002Fpull\u002F2320 中实现，对派生的任务和时间线数据数组进行记忆化处理\n### Bug 修复 🐞\n* fix(workflow): 由 @quanru 在 https:\u002F\u002Fgithub.com\u002Fweb-infra-dev\u002Fmidscene\u002Fpull\u002F2326 中实现，在发布推送重试时仅拉取当前分支\n* fix(visualizer): 由 @quanru 在 https:\u002F\u002Fgithub.com\u002Fweb-infra-dev\u002Fmidscene\u002Fpull\u002F2327 中实现，修复 Playground 中报告下载无法正常工作的问题\n* fix(report): 由 @quanru 在 https:\u002F\u002Fgithub.com\u002Fweb-infra-dev\u002Fmidscene\u002Fpull\u002F2345 中实现，设置显式的 assetPrefix，以避免运行时 publicPath 错误\n### 其他变更\n* chore(test): 由 @EAGzzyCSL 在 https:\u002F\u002Fgithub.com\u002Fweb-infra-dev\u002Fmidscene\u002Fpull\u002F2298 中实现，为 AiJudgeOrderSensitive 中的禁用思考功能编写单元测试\n* 由 @quanru 在 https:\u002F\u002Fgithub.com\u002Fweb-infra-dev\u002Fmidscene\u002Fpull\u002F2342 中实现，自动化 Chrome 网上应用店扩展程序的发布流程\n* chore(shared): 由 @quanru 在 https:\u002F\u002Fgithub.com\u002Fweb-infra-dev\u002Fmidscene\u002Fpull\u002F2356 中实现，将版本号从 1.7.2 升级至 1.7.3\n\n\n**完整变更日志**: https:\u002F\u002Fgithub.com\u002Fweb-infra-dev\u002Fmidscene\u002Fcompare\u002Fv1.7.2...v1.7.4","2026-04-16T03:14:57",{"id":207,"version":208,"summary_zh":209,"released_at":210},360599,"v1.7.3","\u003C!-- 使用 .github\u002Frelease.yml 中的配置在 v1.7.3 版本生成的发布说明 -->\n\n## 变更内容\n### Bug 修复 🐞\n* 修复(android)：使用 `-keyboardClear` 替代 `-keyboard ~CLEAR~`，由 @quanru 在 https:\u002F\u002Fgithub.com\u002Fweb-infra-dev\u002Fmidscene\u002Fpull\u002F2322 中完成\n* 修复(workflow)：在发布过程中锁定分支，以防止推送被拒绝，由 @quanru 在 https:\u002F\u002Fgithub.com\u002Fweb-infra-dev\u002Fmidscene\u002Fpull\u002F2319 中完成\n* 修复(computer)：防止在 `sendKeyViaA…` 中发生 Shell 和 AppleScript 注入，由 @vincerevu 在 https:\u002F\u002Fgithub.com\u002Fweb-infra-dev\u002Fmidscene\u002Fpull\u002F2315 中完成\n### 文档 📖\n* 文档(site)：添加 v1.7 版本的变更日志，由 @quanru 在 https:\u002F\u002Fgithub.com\u002Fweb-infra-dev\u002Fmidscene\u002Fpull\u002F2303 中完成\n### 其他变更\n* 暴露报告解析 API（`splitReportFile`、`reportFileToMarkdown`），并添加 JS SDK 的文档和测试，由 @yuyutaotao 在 https:\u002F\u002Fgithub.com\u002Fweb-infra-dev\u002Fmidscene\u002Fpull\u002F2304 中完成\n* 杂项(android)：更新打包的 yadb 二进制文件，由 @quanru 在 https:\u002F\u002Fgithub.com\u002Fweb-infra-dev\u002Fmidscene\u002Fpull\u002F2314 中完成\n* 杂项(core)：升级 zod 版本，由 @EAGzzyCSL 在 https:\u002F\u002Fgithub.com\u002Fweb-infra-dev\u002Fmidscene\u002Fpull\u002F2321 中完成\n* 杂项(core)：将版本号提升至 1.7.2，由 @quanru 在 https:\u002F\u002Fgithub.com\u002Fweb-infra-dev\u002Fmidscene\u002Fpull\u002F2323 中完成\n* 杂项(android)：移除打包的 yadb 二进制文件，在构建时进行下载，由 @quanru 在 https:\u002F\u002Fgithub.com\u002Fweb-infra-dev\u002Fmidscene\u002Fpull\u002F2324 中完成\n\n## 新贡献者\n* @vincerevu 在 https:\u002F\u002Fgithub.com\u002Fweb-infra-dev\u002Fmidscene\u002Fpull\u002F2315 中完成了首次贡献\n\n**完整变更日志**：https:\u002F\u002Fgithub.com\u002Fweb-infra-dev\u002Fmidscene\u002Fcompare\u002Fv1.7.1...v1.7.3","2026-04-09T10:07:44",{"id":212,"version":213,"summary_zh":214,"released_at":215},360600,"v1.7.2","\u003C!-- 使用 .github\u002Frelease.yml 中的配置生成的发布说明，提交 hash 为 1dde1ae66854c93a95f3aac267fb81fdd28896f4 -->\n\n## 变更内容\n### 文档 📖\n* docs(site): 添加 v1.7 更改日志，由 @quanru 在 https:\u002F\u002Fgithub.com\u002Fweb-infra-dev\u002Fmidscene\u002Fpull\u002F2303 中完成\n### 其他变更\n* 暴露报告解析 API（`splitReportFile`、`reportFileToMarkdown`），并添加 JS SDK 文档和测试，由 @yuyutaotao 在 https:\u002F\u002Fgithub.com\u002Fweb-infra-dev\u002Fmidscene\u002Fpull\u002F2304 中完成\n\n\n**完整更改日志**: https:\u002F\u002Fgithub.com\u002Fweb-infra-dev\u002Fmidscene\u002Fcompare\u002Fv1.7.1...v1.7.2","2026-04-09T03:48:51",{"id":217,"version":218,"summary_zh":219,"released_at":220},360601,"v1.7.1","\u003C!-- 使用 .github\u002Frelease.yml 中的配置生成的发布说明，版本为 v1.7.1 -->\n\n## 变更内容\n### Bug 修复 🐞\n* 修复（core）：当 reportFileName 被重复使用时，追加报告输出，由 yuyutaotao 在 https:\u002F\u002Fgithub.com\u002Fweb-infra-dev\u002Fmidscene\u002Fpull\u002F2300 中完成\n* 修复（core）：在内联模式下将 reportFileName 视为报告文件名，由 yuyutaotao 在 https:\u002F\u002Fgithub.com\u002Fweb-infra-dev\u002Fmidscene\u002Fpull\u002F2310 中完成\n### 文档 📖\n* 文档（core）：更新关于如何消费报告文件的文档，由 ottomao 在 https:\u002F\u002Fgithub.com\u002Fweb-infra-dev\u002Fmidscene\u002Fpull\u002F2307 中完成\n* 文档（site）：为 Android\u002FHarmony 入门指南添加常见问题解答，并修复旧版重定向，由 quanru 在 https:\u002F\u002Fgithub.com\u002Fweb-infra-dev\u002Fmidscene\u002Fpull\u002F2311 中完成\n### 其他变更\n* 测试（core）：添加针对 Markdown 格式 \u003Cdata-json> 负载的回归测试，由 yuyutaotao 在 https:\u002F\u002Fgithub.com\u002Fweb-infra-dev\u002Fmidscene\u002Fpull\u002F2308 中完成\n\n\n**完整变更日志**：https:\u002F\u002Fgithub.com\u002Fweb-infra-dev\u002Fmidscene\u002Fcompare\u002Fv1.7.0...v1.7.1","2026-04-08T13:37:04",{"id":222,"version":223,"summary_zh":224,"released_at":225},360602,"v1.7.0","\u003C!-- 使用 .github\u002Frelease.yml 中的配置在 v1.7.0 版本生成的发布说明 -->\n\n## 变更内容\n### 新特性 🎉\n* feat(core): 在 report-tool 的 Markdown 报告中包含屏幕尺寸和居中位置，由 @yuyutaotao 在 https:\u002F\u002Fgithub.com\u002Fweb-infra-dev\u002Fmidscene\u002Fpull\u002F2297 中实现。\n### Bug 修复 🐞\n* fix(shared): 支持模型初始化配置中的额外头部别名，由 @quanru 在 https:\u002F\u002Fgithub.com\u002Fweb-infra-dev\u002Fmidscene\u002Fpull\u002F2287 中实现。\n* fix(core): 禁用思考功能以进行订单敏感性判断，由 @EAGzzyCSL 在 https:\u002F\u002Fgithub.com\u002Fweb-infra-dev\u002Fmidscene\u002Fpull\u002F2295 中修复。\n* fix(core): 在 report-tool 中支持将 htmlPath 路径回退到 index.html，由 @yuyutaotao 在 https:\u002F\u002Fgithub.com\u002Fweb-infra-dev\u002Fmidscene\u002Fpull\u002F2299 中实现。\n* fix(core): 在转储回调之前刷新报告更新，由 @yuyutaotao 在 https:\u002F\u002Fgithub.com\u002Fweb-infra-dev\u002Fmidscene\u002Fpull\u002F2296 中修复。\n### 文档 📖\n* docs(core): 添加报告拆分工具的相关文档，由 @ottomao 在 https:\u002F\u002Fgithub.com\u002Fweb-infra-dev\u002Fmidscene\u002Fpull\u002F2293 中添加。\n\n\n**完整变更日志**: https:\u002F\u002Fgithub.com\u002Fweb-infra-dev\u002Fmidscene\u002Fcompare\u002Fv1.6.4...v1.7.0","2026-04-08T02:51:43",{"id":227,"version":228,"summary_zh":229,"released_at":230},360603,"v1.6.4","\u003C!-- 发布说明由 .github\u002Frelease.yml 中的配置生成，提交哈希为 fc496bc11bfe3e6ccceb206b9104afaab047a990 -->\n\n## 变更内容\n### 新功能 🎉\n* feat(core): 允许在保存配置时运行连通性测试，由 @ottomao 在 https:\u002F\u002Fgithub.com\u002Fweb-infra-dev\u002Fmidscene\u002Fpull\u002F2234 中实现\n* feat(chrome-extension): 添加可配置的 YAML 输出语言，由 @quanru 在 https:\u002F\u002Fgithub.com\u002Fweb-infra-dev\u002Fmidscene\u002Fpull\u002F2288 中实现\n* feat(core): 支持 Qwen3.6，由 @EAGzzyCSL 在 https:\u002F\u002Fgithub.com\u002Fweb-infra-dev\u002Fmidscene\u002Fpull\u002F2284 中实现\n### 其他变更\n* 修复 Android 沙盒的自动连接和 scrcpy 预览竞态问题，由 @quanru 在 https:\u002F\u002Fgithub.com\u002Fweb-infra-dev\u002Fmidscene\u002Fpull\u002F2285 中实现\n\n\n**完整变更日志**: https:\u002F\u002Fgithub.com\u002Fweb-infra-dev\u002Fmidscene\u002Fcompare\u002Fv1.6.3...v1.6.4","2026-04-07T08:33:36",{"id":232,"version":233,"summary_zh":234,"released_at":235},360604,"v1.6.3","\u003C!-- 使用 .github\u002Frelease.yml 中的配置在 v1.6.3 版本生成的发布说明 -->\n\n## 变更内容\n### 新功能 🎉\n* feat(all): 支持 single report 的 reportMergingTool，由 @frank-mupt 在 https:\u002F\u002Fgithub.com\u002Fweb-infra-dev\u002Fmidscene\u002Fpull\u002F2112 中实现\n* feat(android, harmony): 添加 terminate 动作以支持强制停止应用，并更新文档，由 @zifengjiang 在 https:\u002F\u002Fgithub.com\u002Fweb-infra-dev\u002Fmidscene\u002Fpull\u002F2214 中实现\n* feat(core): 将执行日志记录到磁盘，由 @ottomao 在 https:\u002F\u002Fgithub.com\u002Fweb-infra-dev\u002Fmidscene\u002Fpull\u002F2245 中实现\n### 问题修复 🐞\n* fix(android): 修复 X\u002FTwitter 上输入框前被添加占位符文本的问题，由 @quanru 在 https:\u002F\u002Fgithub.com\u002Fweb-infra-dev\u002Fmidscene\u002Fpull\u002F2263 中修复\n* fix(web-integration): 支持页面级别的 CDP URL，并改进标签页复用，由 @quanru 在 https:\u002F\u002Fgithub.com\u002Fweb-infra-dev\u002Fmidscene\u002Fpull\u002F2274 中实现\n* fix(core): 当查询数据中缺少预期键时，回退到 result 键，由 @quanru 在 https:\u002F\u002Fgithub.com\u002Fweb-infra-dev\u002Fmidscene\u002Fpull\u002F2277 中修复\n* fix(auto-glm): 将 Launch 动作参数封装为 { uri: string } 对象，由 @dagehaoshuang-dev 在 https:\u002F\u002Fgithub.com\u002Fweb-infra-dev\u002Fmidscene\u002Fpull\u002F2239 中修复\n* fix(web-integration): 为 Playground 的枚举下拉菜单序列化 Zod 模式字段，由 @quanru 在 https:\u002F\u002Fgithub.com\u002Fweb-infra-dev\u002Fmidscene\u002Fpull\u002F2283 中修复\n\n## 新贡献者\n* @dagehaoshuang-dev 在 https:\u002F\u002Fgithub.com\u002Fweb-infra-dev\u002Fmidscene\u002Fpull\u002F2239 中完成了首次贡献\n\n**完整变更日志**: https:\u002F\u002Fgithub.com\u002Fweb-infra-dev\u002Fmidscene\u002Fcompare\u002Fv1.6.2...v1.6.3","2026-04-07T02:51:50",{"id":237,"version":238,"summary_zh":239,"released_at":240},360605,"v1.6.2","\u003C!-- 使用 .github\u002Frelease.yml 中的配置生成的发布说明，版本为 v1.6.2 -->\n\n## 变更内容\n### Bug 修复 🐞\n* 修复（core）：当响应为空时回退到推理内容，由 @ottomao 在 https:\u002F\u002Fgithub.com\u002Fweb-infra-dev\u002Fmidscene\u002Fpull\u002F2266 中完成\n### 其他变更\n* 重构（core）：弃用 testId 回退机制，并强化 reportFileName 的安全性，由 @yuyutaotao 在 https:\u002F\u002Fgithub.com\u002Fweb-infra-dev\u002Fmidscene\u002Fpull\u002F2264 中完成\n* 杂项（docs）：为 fileChooserAccept 添加 YAML 格式的文档，由 @EAGzzyCSL 在 https:\u002F\u002Fgithub.com\u002Fweb-infra-dev\u002Fmidscene\u002Fpull\u002F2273 中完成\n\n\n**完整变更日志**：https:\u002F\u002Fgithub.com\u002Fweb-infra-dev\u002Fmidscene\u002Fcompare\u002Fv1.6.1...v1.6.2","2026-04-02T04:25:13",{"id":242,"version":243,"summary_zh":244,"released_at":245},360606,"v1.6.1","\u003C!-- 使用 .github\u002Frelease.yml 中的配置在 v1.6.1 版本生成的发布说明 -->\n\n## 变更内容\n### 新功能 🎉\n* feat(report): 在报告中添加 domIncluded 标签，由 @EAGzzyCSL 在 https:\u002F\u002Fgithub.com\u002Fweb-infra-dev\u002Fmidscene\u002Fpull\u002F2230 中实现\n### Bug 修复 🐞\n* fix(harmony): 在 scrollInDirection 方法中通过 startPoint 传递默认滑动速度，由 @quanru 在 https:\u002F\u002Fgithub.com\u002Fweb-infra-dev\u002Fmidscene\u002Fpull\u002F2235 中实现\n* fix(computer): 稳定 flaky 的 playground 端到端测试，由 @quanru 在 https:\u002F\u002Fgithub.com\u002Fweb-infra-dev\u002Fmidscene\u002Fpull\u002F2231 中实现\n* fix(core): 改进文件选择器中缺失文件的错误提示，由 @EAGzzyCSL 在 https:\u002F\u002Fgithub.com\u002Fweb-infra-dev\u002Fmidscene\u002Fpull\u002F2241 中实现\n* fix(cli): 在批量运行器摘要 JSON 中收集具体的错误信息，由 @quanru 在 https:\u002F\u002Fgithub.com\u002Fweb-infra-dev\u002Fmidscene\u002Fpull\u002F2256 中实现\n* fix(shared): 改进 YAML 提示，防止 aiScroll 缩进错误，由 @quanru 在 https:\u002F\u002Fgithub.com\u002Fweb-infra-dev\u002Fmidscene\u002Fpull\u002F2257 中实现\n* fix(core): 保留空模型内容时的使用记录，由 @yuyutaotao 在 https:\u002F\u002Fgithub.com\u002Fweb-infra-dev\u002Fmidscene\u002Fpull\u002F2261 中实现\n* fix(android-playground): 为 scrcpy 和 playground 服务器启用局域网访问，由 @quanru 在 https:\u002F\u002Fgithub.com\u002Fweb-infra-dev\u002Fmidscene\u002Fpull\u002F2259 中实现\n* fix(core): aiLocate 中的 rect 字段应为元素的实际边界框，由 @EAGzzyCSL 在 https:\u002F\u002Fgithub.com\u002Fweb-infra-dev\u002Fmidscene\u002Fpull\u002F2258 中实现\n* fix(web-integration): 添加 Playwright 截图回退机制，由 @quanru 在 https:\u002F\u002Fgithub.com\u002Fweb-infra-dev\u002Fmidscene\u002Fpull\u002F2246 中实现\n### 文档 📖\n* docs(site): 添加 v1.6 版本的变更日志和 CDP 连接模式文档，由 @quanru 在 https:\u002F\u002Fgithub.com\u002Fweb-infra-dev\u002Fmidscene\u002Fpull\u002F2228 中实现\n### 其他变更\n* refactor(harmony): 弃用 screenshotResizeScale，改用 screenshotShrinkFactor，由 @quanru 在 https:\u002F\u002Fgithub.com\u002Fweb-infra-dev\u002Fmidscene\u002Fpull\u002F2227 中实现\n* chore: 移除死代码，由 @EAGzzyCSL 在 https:\u002F\u002Fgithub.com\u002Fweb-infra-dev\u002Fmidscene\u002Fpull\u002F2226 中实现\n* refactor(core): 修复 playground 组件，由 @ottomao 在 https:\u002F\u002Fgithub.com\u002Fweb-infra-dev\u002Fmidscene\u002Fpull\u002F2219 中实现\n* chore(workflow): 忽略 .rslib 文件，由 @EAGzzyCSL 在 https:\u002F\u002Fgithub.com\u002Fweb-infra-dev\u002Fmidscene\u002Fpull\u002F2233 中实现\n* refactor(workflow): 将 rsbuild 辅助工具移至仓库脚本，由 @EAGzzyCSL 在 https:\u002F\u002Fgithub.com\u002Fweb-infra-dev\u002Fmidscene\u002Fpull\u002F2232 中实现\n* 将 GroupedActionDump\u002FGroupMeta 重命名为 ReportActionDump\u002FReportMeta，并更新相关用法，由 @yuyutaotao 在 https:\u002F\u002Fgithub.com\u002Fweb-infra-dev\u002Fmidscene\u002Fpull\u002F2243 中实现\n* 在 skill CLI 中支持图像提示功能，由 @quanru 在 https:\u002F\u002Fgithub.com\u002Fweb-infra-dev\u002Fmidscene\u002Fpull\u002F2255 中实现\n\n\n**完整变更日志**: https:\u002F\u002Fgithub.com\u002Fweb-infra-dev\u002Fmidscene\u002Fcompare\u002Fv1.6.0...v1.6.1","2026-04-01T01:19:12",{"id":247,"version":248,"summary_zh":249,"released_at":250},360607,"v1.6.0","\u003C!-- 发布说明由 .github\u002Frelease.yml 中的配置在 v1.6.0 版本生成 -->\n\n## 变更内容\n### 新功能 🎉\n* feat(web,cli): 支持基于 Chrome 设置的远程调试，由 @quanru 在 https:\u002F\u002Fgithub.com\u002Fweb-infra-dev\u002Fmidscene\u002Fpull\u002F2216 中实现\n### 问题修复 🐞\n* fix(core): 保留多模态定位提示，由 @quanru 在 https:\u002F\u002Fgithub.com\u002Fweb-infra-dev\u002Fmidscene\u002Fpull\u002F2220 中修复\n* fix(report): 对齐黑板截图叠加层，由 @quanru 在 https:\u002F\u002Fgithub.com\u002Fweb-infra-dev\u002Fmidscene\u002Fpull\u002F2223 中修复\n* fix(report): 稳定不稳定的端到端断言，由 @quanru 在 https:\u002F\u002Fgithub.com\u002Fweb-infra-dev\u002Fmidscene\u002Fpull\u002F2225 中修复\n### 文档 📖\n* docs(site): 添加自定义模型请求头常见问题解答，由 @EAGzzyCSL 在 https:\u002F\u002Fgithub.com\u002Fweb-infra-dev\u002Fmidscene\u002Fpull\u002F2224 中添加\n### 其他变更\n* refactor(core): 每次执行时为报告生成追加模型，由 @yuyutaotao 在 https:\u002F\u002Fgithub.com\u002Fweb-infra-dev\u002Fmidscene\u002Fpull\u002F2153 中重构\n\n\n**完整变更日志**: https:\u002F\u002Fgithub.com\u002Fweb-infra-dev\u002Fmidscene\u002Fcompare\u002Fv1.5.8...v1.6.0","2026-03-26T03:04:53",{"id":252,"version":253,"summary_zh":254,"released_at":255},360608,"v1.5.8","\u003C!-- Release notes generated using configuration in .github\u002Frelease.yml at v1.5.8 -->\r\n\r\n## What's Changed\r\n### New Features 🎉\r\n* feat(web,cli): add CDP browser connection mode by @quanru in https:\u002F\u002Fgithub.com\u002Fweb-infra-dev\u002Fmidscene\u002Fpull\u002F2180\r\n### Bug Fixes 🐞\r\n* fix(core): aiNumber extraction issue by @ottomao in https:\u002F\u002Fgithub.com\u002Fweb-infra-dev\u002Fmidscene\u002Fpull\u002F2193\r\n* fix(report): correct sidebar-navigation test assertion column names by @quanru in https:\u002F\u002Fgithub.com\u002Fweb-infra-dev\u002Fmidscene\u002Fpull\u002F2208\r\n### Document 📖\r\n* docs(caching): clarify AI planning vs DOM element caching in English and Chinese docs by @yuyutaotao in https:\u002F\u002Fgithub.com\u002Fweb-infra-dev\u002Fmidscene\u002Fpull\u002F2217\r\n### Other Changes\r\n* refactor(core): refact playground components by @ottomao in https:\u002F\u002Fgithub.com\u002Fweb-infra-dev\u002Fmidscene\u002Fpull\u002F2211\r\n* chore(docs): add FAQ guidance for Playwright font loading screenshot timeout by @EAGzzyCSL in https:\u002F\u002Fgithub.com\u002Fweb-infra-dev\u002Fmidscene\u002Fpull\u002F2218\r\n\r\n\r\n**Full Changelog**: https:\u002F\u002Fgithub.com\u002Fweb-infra-dev\u002Fmidscene\u002Fcompare\u002Fv1.5.7...v1.5.8","2026-03-25T03:28:31",{"id":257,"version":258,"summary_zh":259,"released_at":260},360609,"v1.5.7","\u003C!-- Release notes generated using configuration in .github\u002Frelease.yml at v1.5.7 -->\r\n\r\n## What's Changed\r\n### New Features 🎉\r\n* feat(core): add extraBody support for model API request customization by @ottomao in https:\u002F\u002Fgithub.com\u002Fweb-infra-dev\u002Fmidscene\u002Fpull\u002F2173\r\n* feat(core): add cross-platform pinch\u002Fzoom gesture support by @quanru in https:\u002F\u002Fgithub.com\u002Fweb-infra-dev\u002Fmidscene\u002Fpull\u002F2165\r\n* feat(core): Only configure the \"original\" parameter for gpt-5 during positioning. by @EAGzzyCSL in https:\u002F\u002Fgithub.com\u002Fweb-infra-dev\u002Fmidscene\u002Fpull\u002F2168\r\n* feat(report): add e2e tests for report player and sidebar by @quanru in https:\u002F\u002Fgithub.com\u002Fweb-infra-dev\u002Fmidscene\u002Fpull\u002F2183\r\n* feat(report): add advanced e2e tests with merged report and error cases by @quanru in https:\u002F\u002Fgithub.com\u002Fweb-infra-dev\u002Fmidscene\u002Fpull\u002F2191\r\n* feat(core): optimize deepLocate locate flow using planLocatedElement by @EAGzzyCSL in https:\u002F\u002Fgithub.com\u002Fweb-infra-dev\u002Fmidscene\u002Fpull\u002F2064\r\n### Bug Fixes 🐞\r\n* fix(chrome-extension): fix crash when generating script after stop recording by @quanru in https:\u002F\u002Fgithub.com\u002Fweb-infra-dev\u002Fmidscene\u002Fpull\u002F2172\r\n* fix(shared): set explicit publicPath in MCP packages to prevent Node.js crash by @quanru in https:\u002F\u002Fgithub.com\u002Fweb-infra-dev\u002Fmidscene\u002Fpull\u002F2167\r\n* fix(core): retry screenshot on navigation-related errors by @quanru in https:\u002F\u002Fgithub.com\u002Fweb-infra-dev\u002Fmidscene\u002Fpull\u002F2162\r\n* fix cache flow is empty && runAdbShell not available by @e790a8 in https:\u002F\u002Fgithub.com\u002Fweb-infra-dev\u002Fmidscene\u002Fpull\u002F2121\r\n* fix(visualizer): reset player to first frame after autoplay completes by @quanru in https:\u002F\u002Fgithub.com\u002Fweb-infra-dev\u002Fmidscene\u002Fpull\u002F2181\r\n* fix(visualizer): make Deep Think a tri-state control so env reasoningEnabled is respected by @quanru in https:\u002F\u002Fgithub.com\u002Fweb-infra-dev\u002Fmidscene\u002Fpull\u002F2182\r\n* fix(chrome-extension): add start\u002Fstop controls for bridge mode by @quanru in https:\u002F\u002Fgithub.com\u002Fweb-infra-dev\u002Fmidscene\u002Fpull\u002F2177\r\n* fix(visualizer): clear lingering insight markers before final frame by @quanru in https:\u002F\u002Fgithub.com\u002Fweb-infra-dev\u002Fmidscene\u002Fpull\u002F2196\r\n* fix(report): reduce autoplay test sleep to prevent false failure by @quanru in https:\u002F\u002Fgithub.com\u002Fweb-infra-dev\u002Fmidscene\u002Fpull\u002F2194\r\n* fix(llm): map AutoGLM Back\u002FHome actions to platform-specific names by @quanru in https:\u002F\u002Fgithub.com\u002Fweb-infra-dev\u002Fmidscene\u002Fpull\u002F2201\r\n* fix(report): compatible with models whose names contain slashes when display model info in the top right corner by @EAGzzyCSL in https:\u002F\u002Fgithub.com\u002Fweb-infra-dev\u002Fmidscene\u002Fpull\u002F2122\r\n* fix(web-integration): fix bridge mode connection lost on confirmation by @quanru in https:\u002F\u002Fgithub.com\u002Fweb-infra-dev\u002Fmidscene\u002Fpull\u002F2197\r\n* fix(core): resolve aiScroll overload misclassification for empty options by @EAGzzyCSL in https:\u002F\u002Fgithub.com\u002Fweb-infra-dev\u002Fmidscene\u002Fpull\u002F2073\r\n### Document 📖\r\n* docs(site): clean up outdated README files by @quanru in https:\u002F\u002Fgithub.com\u002Fweb-infra-dev\u002Fmidscene\u002Fpull\u002F2178\r\n* docs(faq): clarify element positioning guidance, replace `deepThink` with `deepLocate`, add DPR note by @yuyutaotao in https:\u002F\u002Fgithub.com\u002Fweb-infra-dev\u002Fmidscene\u002Fpull\u002F2186\r\n* docs(site): clarify image detail limits by @EAGzzyCSL in https:\u002F\u002Fgithub.com\u002Fweb-infra-dev\u002Fmidscene\u002Fpull\u002F2199\r\n* docs(site): add FAQ for Android text input failure in WebView\u002FH5 by @quanru in https:\u002F\u002Fgithub.com\u002Fweb-infra-dev\u002Fmidscene\u002Fpull\u002F2203\r\n### Other Changes\r\n* Fix aiAct execution\u002Freport misalignment in recorder flows by @quanru in https:\u002F\u002Fgithub.com\u002Fweb-infra-dev\u002Fmidscene\u002Fpull\u002F2204\r\n* test(computer,report): add e2e tests for extension playground and recorder by @quanru in https:\u002F\u002Fgithub.com\u002Fweb-infra-dev\u002Fmidscene\u002Fpull\u002F2195\r\n\r\n\r\n**Full Changelog**: https:\u002F\u002Fgithub.com\u002Fweb-infra-dev\u002Fmidscene\u002Fcompare\u002Fv1.5.6...v1.5.7","2026-03-23T12:23:41",{"id":262,"version":263,"summary_zh":264,"released_at":265},360611,"v1.5.5","\u003C!-- Release notes generated using configuration in .github\u002Frelease.yml at v1.5.5 -->\r\n\r\n## What's Changed\r\n### New Features 🎉\r\n* feat(core): add Skill CLI support for custom interfaces by @quanru in https:\u002F\u002Fgithub.com\u002Fweb-infra-dev\u002Fmidscene\u002Fpull\u002F2095\r\n* feat(core): support gpt-5.4 model by @ottomao in https:\u002F\u002Fgithub.com\u002Fweb-infra-dev\u002Fmidscene\u002Fpull\u002F2087\r\n* feat(core): add monitor detection to device health check by @yuyutaotao in https:\u002F\u002Fgithub.com\u002Fweb-infra-dev\u002Fmidscene\u002Fpull\u002F2125\r\n* feat(playground): extract reusable app shell and launcher by @quanru in https:\u002F\u002Fgithub.com\u002Fweb-infra-dev\u002Fmidscene\u002Fpull\u002F2126\r\n### Bug Fixes 🐞\r\n* fix: correct playground player orientation by @quanru in https:\u002F\u002Fgithub.com\u002Fweb-infra-dev\u002Fmidscene\u002Fpull\u002F2110\r\n* fix(android): bump scrcpy-server to v3.3.4 by @quanru in https:\u002F\u002Fgithub.com\u002Fweb-infra-dev\u002Fmidscene\u002Fpull\u002F2117\r\n* fix(android): upgrade scrcpy support to 3.3.3 by @quanru in https:\u002F\u002Fgithub.com\u002Fweb-infra-dev\u002Fmidscene\u002Fpull\u002F2132\r\n* fix(harmony): support render resolution screen info parsing by @quanru in https:\u002F\u002Fgithub.com\u002Fweb-infra-dev\u002Fmidscene\u002Fpull\u002F2139\r\n* fix(shared): prevent MCP stdio server from becoming orphan with 100% CPU by @quanru in https:\u002F\u002Fgithub.com\u002Fweb-infra-dev\u002Fmidscene\u002Fpull\u002F2157\r\n### Document 📖\r\n* docs: update demo links from Puppeteer+Vitest to Playwright+Vitest (EN\u002FZH) by @yuyutaotao in https:\u002F\u002Fgithub.com\u002Fweb-infra-dev\u002Fmidscene\u002Fpull\u002F2118\r\n* docs(core): update GitHub stars count from 11k to 12k in banner by @yuyutaotao in https:\u002F\u002Fgithub.com\u002Fweb-infra-dev\u002Fmidscene\u002Fpull\u002F2129\r\n* docs(core): refine tagline and description messaging across documentation by @ottomao in https:\u002F\u002Fgithub.com\u002Fweb-infra-dev\u002Fmidscene\u002Fpull\u002F2131\r\n### Other Changes\r\n* Fix report replay-all autoplay and cover it with Playwright e2e by @quanru in https:\u002F\u002Fgithub.com\u002Fweb-infra-dev\u002Fmidscene\u002Fpull\u002F2137\r\n\r\n\r\n**Full Changelog**: https:\u002F\u002Fgithub.com\u002Fweb-infra-dev\u002Fmidscene\u002Fcompare\u002Fv1.5.4...v1.5.5","2026-03-16T02:04:37",{"id":267,"version":268,"summary_zh":269,"released_at":270},360612,"v1.5.4","\u003C!-- Release notes generated using configuration in .github\u002Frelease.yml at v1.5.4 -->\r\n\r\n## What's Changed\r\n### New Features 🎉\r\n* feat(ios): add terminate app by bundleId by @zifengjiang in https:\u002F\u002Fgithub.com\u002Fweb-infra-dev\u002Fmidscene\u002Fpull\u002F2096\r\n* feat(mcp): export MidsceneTools from all platform packages by @quanru in https:\u002F\u002Fgithub.com\u002Fweb-infra-dev\u002Fmidscene\u002Fpull\u002F2104\r\n* feat(cli): add CLI version support and show @midscene\u002Fcomputer version in health check by @yuyutaotao in https:\u002F\u002Fgithub.com\u002Fweb-infra-dev\u002Fmidscene\u002Fpull\u002F2057\r\n* feat(core): add sample parameters to device action definitions by @ottomao in https:\u002F\u002Fgithub.com\u002Fweb-infra-dev\u002Fmidscene\u002Fpull\u002F2101\r\n### Bug Fixes 🐞\r\n* fix(core): aiTap format declared in the documentation by @e790a8 in https:\u002F\u002Fgithub.com\u002Fweb-infra-dev\u002Fmidscene\u002Fpull\u002F2081\r\n* fix(workflow): remove husky to fix pre-commit hook not running by @quanru in https:\u002F\u002Fgithub.com\u002Fweb-infra-dev\u002Fmidscene\u002Fpull\u002F2105\r\n* fix(shared): iframe-aware xpath and node cache for locator by @perfect-cloud in https:\u002F\u002Fgithub.com\u002Fweb-infra-dev\u002Fmidscene\u002Fpull\u002F2085\r\n* fix(core): preserve screenshot capturedAt in inline dump serialization by @EAGzzyCSL in https:\u002F\u002Fgithub.com\u002Fweb-infra-dev\u002Fmidscene\u002Fpull\u002F2103\r\n* fix(playground): recreate agent after cancel and fix orientation mismatch by @quanru in https:\u002F\u002Fgithub.com\u002Fweb-infra-dev\u002Fmidscene\u002Fpull\u002F2108\r\n### Document 📖\r\n* docs(workflow): add canonical AGENTS.md instructions by @quanru in https:\u002F\u002Fgithub.com\u002Fweb-infra-dev\u002Fmidscene\u002Fpull\u002F2093\r\n* docs(site): remove stray quote in aiAssert tip examples by @yuyutaotao in https:\u002F\u002Fgithub.com\u002Fweb-infra-dev\u002Fmidscene\u002Fpull\u002F2114\r\n\r\n## New Contributors\r\n* @zifengjiang made their first contribution in https:\u002F\u002Fgithub.com\u002Fweb-infra-dev\u002Fmidscene\u002Fpull\u002F2096\r\n* @perfect-cloud made their first contribution in https:\u002F\u002Fgithub.com\u002Fweb-infra-dev\u002Fmidscene\u002Fpull\u002F2085\r\n\r\n**Full Changelog**: https:\u002F\u002Fgithub.com\u002Fweb-infra-dev\u002Fmidscene\u002Fcompare\u002Fv1.5.3...v1.5.4","2026-03-11T00:58:48",{"id":272,"version":273,"summary_zh":274,"released_at":275},360613,"v1.5.3","\u003C!-- Release notes generated using configuration in .github\u002Frelease.yml at v1.5.3 -->\r\n\r\n## What's Changed\r\n### New Features 🎉\r\n* feat(visualizer): device-aware shell rendering with Remotion Player by @quanru in https:\u002F\u002Fgithub.com\u002Fweb-infra-dev\u002Fmidscene\u002Fpull\u002F2023\r\n* feat(core): add timing for callAi and fix timing of before\u002Fafter invoke action by @EAGzzyCSL in https:\u002F\u002Fgithub.com\u002Fweb-infra-dev\u002Fmidscene\u002Fpull\u002F2079\r\n* feat(report): lazy-load images for large reports by @quanru in https:\u002F\u002Fgithub.com\u002Fweb-infra-dev\u002Fmidscene\u002Fpull\u002F2076\r\n* feat(core): add AbortSignal support to aiAct for task cancellation by @ottomao in https:\u002F\u002Fgithub.com\u002Fweb-infra-dev\u002Fmidscene\u002Fpull\u002F2091\r\n### Bug Fixes 🐞\r\n* fix(visualizer): full-width seek bar and spacebar play\u002Fpause by @quanru in https:\u002F\u002Fgithub.com\u002Fweb-infra-dev\u002Fmidscene\u002Fpull\u002F2075\r\n* fix(shared): fix Chrome launch on Linux and deduplicate Chrome path resolution by @quanru in https:\u002F\u002Fgithub.com\u002Fweb-infra-dev\u002Fmidscene\u002Fpull\u002F2082\r\n* fix(visualizer): scale cursor size for high-resolution screenshots by @quanru in https:\u002F\u002Fgithub.com\u002Fweb-infra-dev\u002Fmidscene\u002Fpull\u002F2084\r\n* fix(core): always crop in describe deepLocate mode by @quanru in https:\u002F\u002Fgithub.com\u002Fweb-infra-dev\u002Fmidscene\u002Fpull\u002F2088\r\n* fix(mcp): exit process when stdio stdin closes to prevent zombie processes by @quanru in https:\u002F\u002Fgithub.com\u002Fweb-infra-dev\u002Fmidscene\u002Fpull\u002F2083\r\n* fix(playground): optimize Android playground performance and ADB stability by @quanru in https:\u002F\u002Fgithub.com\u002Fweb-infra-dev\u002Fmidscene\u002Fpull\u002F2077\r\n* fix(Android):fix Android Character Input Loss by @zeildtronic in https:\u002F\u002Fgithub.com\u002Fweb-infra-dev\u002Fmidscene\u002Fpull\u002F2066\r\n### Document 📖\r\n* docs(site): add agent self-verification example and use cases to skills page by @quanru in https:\u002F\u002Fgithub.com\u002Fweb-infra-dev\u002Fmidscene\u002Fpull\u002F2080\r\n* docs(core): update API documentation examples for deepThink parameter by @ottomao in https:\u002F\u002Fgithub.com\u002Fweb-infra-dev\u002Fmidscene\u002Fpull\u002F2094\r\n### Other Changes\r\n* chore(core): add langsmith in devDeps by @EAGzzyCSL in https:\u002F\u002Fgithub.com\u002Fweb-infra-dev\u002Fmidscene\u002Fpull\u002F2070\r\n* Update Agent Skills link in skills.mdx by @CrazyMrYan in https:\u002F\u002Fgithub.com\u002Fweb-infra-dev\u002Fmidscene\u002Fpull\u002F2074\r\n* fix(playwright): wrap evaluate args in object for Playwright compatibility by @Copilot in https:\u002F\u002Fgithub.com\u002Fweb-infra-dev\u002Fmidscene\u002Fpull\u002F1921\r\n* chore(core): add debug logging to CLI runner for better diagnostics by @ottomao in https:\u002F\u002Fgithub.com\u002Fweb-infra-dev\u002Fmidscene\u002Fpull\u002F2060\r\n* chore(reporter): display context screenshot even if no highlightElements by @EAGzzyCSL in https:\u002F\u002Fgithub.com\u002Fweb-infra-dev\u002Fmidscene\u002Fpull\u002F2069\r\n* chore(core): add sample action parameters to LLM prompts for better guidance by @ottomao in https:\u002F\u002Fgithub.com\u002Fweb-infra-dev\u002Fmidscene\u002Fpull\u002F2099\r\n\r\n## New Contributors\r\n* @CrazyMrYan made their first contribution in https:\u002F\u002Fgithub.com\u002Fweb-infra-dev\u002Fmidscene\u002Fpull\u002F2074\r\n* @zeildtronic made their first contribution in https:\u002F\u002Fgithub.com\u002Fweb-infra-dev\u002Fmidscene\u002Fpull\u002F2066\r\n\r\n**Full Changelog**: https:\u002F\u002Fgithub.com\u002Fweb-infra-dev\u002Fmidscene\u002Fcompare\u002Fv1.5.2...v1.5.3","2026-03-09T12:12:19"]