playwright-skill

GitHub
2.4k 156 简单 1 次阅读 今天MIT插件Agent
AI 解读 由 AI 自动生成,仅供参考

playwright-skill 是一款专为 Claude Code 设计的浏览器自动化技能,它能让 AI 自主编写并执行基于 Playwright 的测试脚本。无论是简单的页面验证还是复杂的多步骤业务流程,用户只需提出需求,Claude 即可动态生成定制代码并实时运行,无需依赖预设脚本。

这一工具主要解决了传统自动化测试中脚本编写门槛高、维护成本大以及灵活性不足的痛点。它将自然语言指令直接转化为可执行的浏览器操作,大幅提升了测试与验证的效率。

playwright-skill 特别适合开发者、测试工程师以及需要频繁进行网页交互验证的技术人员使用。对于希望利用 AI 辅助自动化工作流的研究人员而言,它也是一个强大的助力。

其技术亮点在于“按需加载”机制:Claude 会根据任务自动判断何时调用该技能,仅加载必要的信息以保持上下文简洁。默认开启可见浏览器模式,让用户能直观看到自动化操作过程。此外,内置的智能临时文件管理和通用执行器有效避免了模块解析错误和竞争条件,确保了运行的稳定性与安全性。作为 Claude Code 插件,它还支持便捷的团队分发与自动更新,让协作更加顺畅。

使用场景

某电商团队的前端工程师需要在每次发布前,快速验证新上线的“限时秒杀”活动页在复杂交互下的稳定性,包括倒计时同步、库存实时扣减及多步骤下单流程。

没有 playwright-skill 时

  • 脚本维护成本高:必须手动编写和维护固定的 Playwright 测试脚本,一旦页面元素微调或活动规则变更,就需要人工重构代码。
  • 反馈周期长:从发现需求到写出可执行的自动化脚本通常需要数小时,无法在代码提交后的几分钟内立即获得验证结果。
  • 调试过程黑盒:默认无头模式运行难以直观定位失败原因,复现偶发的时序问题(如库存竞争)需要额外配置截图或视频录制。
  • 场景覆盖受限:受限于预写脚本的固定逻辑,难以临时发起针对特定边缘案例(如特定用户状态下的异常流)的即时探索性测试。

使用 playwright-skill 后

  • 动态生成代码:只需向 Claude 描述“验证秒杀倒计时结束后的按钮状态”,playwright-skill 即可自主编写并执行量身定制的自动化代码,无需人工介入编码。
  • 即时验证反馈:在对话中直接触发测试,几分钟内即可完成从代码生成、执行到结果返回的全流程,大幅缩短发布前的验证窗口。
  • 可视化实时调试:默认以有头模式(headless: false)运行,工程师可亲眼看到浏览器自动操作的全过程,快速定位交互卡顿或逻辑错误。
  • 灵活应对变化:面对临时的验证需求,可直接用自然语言指令让 playwright-skill 构建复杂的多步流程(如模拟高并发下的库存扣减),无需预先准备脚本库。

playwright-skill 将繁琐的浏览器自动化编码工作转化为自然的语言交互,让前端验证从“耗时的人工脚本工程”变成了“即问即得的智能服务”。

运行环境要求

操作系统
  • 未说明
GPU

未说明

内存

未说明

依赖
notes该工具基于 Node.js 运行,非 Python 项目。安装后需执行 'npm run setup' 以自动安装 Playwright 及其依赖的浏览器(默认为 Chromium)。默认配置为有头模式(可见浏览器),若需无头模式需显式指定。
python不适用
Node.js
Playwright
Chromium
playwright-skill hero image

快速开始

Playwright 技能,适用于 Claude Code

作为 Claude 技能的通用浏览器自动化

这是一个 Claude 技能,使 Claude 能够即时编写并执行任何 Playwright 自动化任务——从简单的页面测试到复杂的多步骤流程。该技能以 Claude Code 插件 的形式打包,便于安装和分发。

Claude 会根据您的浏览器自动化需求自主决定何时使用此技能,仅加载完成特定任务所需的最少信息。

由 Claude Code 构建。

功能特性

  • 任意自动化任务:Claude 会根据您的具体请求编写自定义代码,不限于预构建的脚本。
  • 默认可见浏览器:通过 headless: false 实时查看自动化过程。
  • 零模块解析错误:通用执行器确保正确访问所有模块。
  • 渐进式披露:简洁的 SKILL.md 文件包含完整的 API 参考文档,仅在需要时加载。
  • 安全清理:智能临时文件管理,避免竞态条件。
  • 全面辅助工具:可选的常用任务实用函数。

安装

本仓库采用 Claude Code 插件 结构,包含一个技能。您可以将其作为 插件(推荐)安装,或提取为 独立技能

结构说明

本仓库使用插件格式,具有嵌套结构:

playwright-skill/              # 插件根目录
├── .claude-plugin/           # 插件元数据
└── skills/
    └── playwright-skill/     # 实际技能
        └── SKILL.md

Claude Code 要求技能直接位于 .claude/skills/ 目录下,因此手动安装时需提取嵌套的技能文件夹。


选项 1:插件安装(推荐)

通过 Claude Code 的插件系统安装,可实现自动更新和团队分发:

# 将本仓库添加到市场
/plugin marketplace add lackeyjb/playwright-skill

# 安装插件
/plugin install playwright-skill@playwright-skill

# 进入技能目录并运行设置
cd ~/.claude/plugins/marketplaces/playwright-skill/skills/playwright-skill
npm run setup

运行 /help 验证安装,确认技能已可用。


选项 2:独立技能安装

若要作为独立技能安装(不使用插件系统),只需提取技能文件夹:

全局安装(随处可用):

# 克隆到临时位置
git clone https://github.com/lackeyjb/playwright-skill.git /tmp/playwright-skill-temp

# 仅将技能文件夹复制到全局技能目录
mkdir -p ~/.claude/skills
cp -r /tmp/playwright-skill-temp/skills/playwright-skill ~/.claude/skills/

# 进入技能目录并运行设置
cd ~/.claude/skills/playwright-skill
npm run setup

# 清理临时文件
rm -rf /tmp/playwright-skill-temp

项目专用安装:

# 克隆到临时位置
git clone https://github.com/lackeyjb/playwright-skill.git /tmp/playwright-skill-temp

# 仅将技能文件夹复制到项目目录
mkdir -p .claude/skills
cp -r /tmp/playwright-skill-temp/skills/playwright-skill .claude/skills/

# 进入技能目录并运行设置
cd .claude/skills/playwright-skill
npm run setup

# 清理临时文件
rm -rf /tmp/playwright-skill-temp

为何采用这种结构? 插件格式要求使用 skills/ 目录来组织插件内的多个技能。当作为独立技能安装时,您只需内层的 skills/playwright-skill/ 文件夹内容即可。


选项 3:下载发布版本

  1. GitHub Releases 下载并解压最新发布版本。
  2. 仅复制 skills/playwright-skill/ 文件夹至:
    • 全局:~/.claude/skills/playwright-skill
    • 项目:/path/to/your/project/.claude/skills/playwright-skill
  3. 进入技能目录并运行设置:
    cd ~/.claude/skills/playwright-skill  # 或项目路径
    npm run setup
    

验证安装

运行 /help 确认技能已加载,然后让 Claude 执行一个简单的浏览器任务,例如“测试 google.com 是否加载”。

快速入门

安装完成后,只需让 Claude 测试或自动化任何浏览器任务。Claude 会编写自定义 Playwright 代码,执行并返回结果,附带截图和控制台输出。

使用示例

测试任意页面

“测试首页”
“检查联系表单是否正常工作”
“验证注册流程”

视觉测试

“分别截取移动端和桌面端的仪表盘截图”
“测试不同视口下的响应式设计”

交互测试

“填写注册表单并提交”
“点击浏览主导航”
“测试搜索功能”

验证测试

“检查是否有损坏的链接”
“验证所有图片是否加载”
“测试表单验证”

工作原理

  1. 描述您想要测试或自动化的内容。
  2. Claude 为该任务编写自定义 Playwright 代码。
  3. 通用执行器(run.js)负责运行代码,并确保正确解析所有模块。
  4. 浏览器打开(默认可见),自动化任务开始执行。
  5. 最终结果显示控制台输出和截图。

配置

默认设置:

  • 无头模式false(浏览器默认可见,除非明确指定)
  • 慢动作100ms 以提高可见性。
  • 超时时间30秒
  • 截图:保存至 /tmp/

项目结构

playwright-skill/
├── .claude-plugin/
│   ├── plugin.json          # 插件元数据,用于分发
│   └── marketplace.json     # 市场配置
├── skills/
│   └── playwright-skill/    # 实际技能(Claude 会发现它)
│       ├── SKILL.md         # Claude 读取的内容
│       ├── run.js           # 通用执行器(确保模块正确解析)
│       ├── package.json     # 依赖项及设置脚本
│       └── lib/
│           └── helpers.js   # 可选的实用函数
│       └── API_REFERENCE.md # 完整的 Playwright API 参考
├── README.md                # 当前文件——用户文档
├── CONTRIBUTING.md          # 贡献指南
└── LICENSE                  # MIT 许可证

高级用法

Claude 会在需要时自动加载 API_REFERENCE.md,提供关于选择器、网络拦截、身份验证、视觉回归测试、移动设备模拟、性能测试和调试等方面的全面文档。

依赖项

  • Node.js
  • Playwright(通过 npm run setup 安装)
  • Chromium(通过 npm run setup 安装)

故障排除

Playwright 未安装? 导航到技能目录并运行 npm run setup

出现“模块未找到”错误? 确保自动化通过 run.js 运行,该文件负责处理模块解析。

浏览器未打开? 请确认已设置 headless: false。默认情况下,技能会以可见模式运行浏览器,除非明确请求无头模式。

安装所有浏览器? 在技能目录下运行 npm run install-all-browsers

什么是技能?

Agent Skills 是包含指令、脚本和资源的文件夹,智能体可以发现并使用它们来更准确、更高效地完成任务。当您让 Claude 测试网页或自动化浏览器交互时,Claude 会发现此技能,加载必要的指令,执行自定义的 Playwright 代码,并返回带有截图和控制台输出的结果。

此 Playwright 技能实现了 开放的 Agent Skills 规范,使其能够在不同的智能体平台上兼容。

贡献

我们欢迎您的贡献。请 fork 仓库,创建功能分支,进行更改,并提交 pull request。详情请参阅 CONTRIBUTING.md

了解更多

许可证

MIT 许可证 - 详情请参阅 LICENSE 文件。

版本历史

v4.1.02025/12/02
v4.0.22025/10/21
v4.0.12025/10/20
v4.0.02025/10/19
v3.2.02025/10/19
v3.1.02025/10/19
v3.0.12025/10/19
v3.0.02025/10/19

常见问题

相似工具推荐

openclaw

OpenClaw 是一款专为个人打造的本地化 AI 助手,旨在让你在自己的设备上拥有完全可控的智能伙伴。它打破了传统 AI 助手局限于特定网页或应用的束缚,能够直接接入你日常使用的各类通讯渠道,包括微信、WhatsApp、Telegram、Discord、iMessage 等数十种平台。无论你在哪个聊天软件中发送消息,OpenClaw 都能即时响应,甚至支持在 macOS、iOS 和 Android 设备上进行语音交互,并提供实时的画布渲染功能供你操控。 这款工具主要解决了用户对数据隐私、响应速度以及“始终在线”体验的需求。通过将 AI 部署在本地,用户无需依赖云端服务即可享受快速、私密的智能辅助,真正实现了“你的数据,你做主”。其独特的技术亮点在于强大的网关架构,将控制平面与核心助手分离,确保跨平台通信的流畅性与扩展性。 OpenClaw 非常适合希望构建个性化工作流的技术爱好者、开发者,以及注重隐私保护且不愿被单一生态绑定的普通用户。只要具备基础的终端操作能力(支持 macOS、Linux 及 Windows WSL2),即可通过简单的命令行引导完成部署。如果你渴望拥有一个懂你

349.3k|★★★☆☆|3天前
Agent开发框架图像

stable-diffusion-webui

stable-diffusion-webui 是一个基于 Gradio 构建的网页版操作界面,旨在让用户能够轻松地在本地运行和使用强大的 Stable Diffusion 图像生成模型。它解决了原始模型依赖命令行、操作门槛高且功能分散的痛点,将复杂的 AI 绘图流程整合进一个直观易用的图形化平台。 无论是希望快速上手的普通创作者、需要精细控制画面细节的设计师,还是想要深入探索模型潜力的开发者与研究人员,都能从中获益。其核心亮点在于极高的功能丰富度:不仅支持文生图、图生图、局部重绘(Inpainting)和外绘(Outpainting)等基础模式,还独创了注意力机制调整、提示词矩阵、负向提示词以及“高清修复”等高级功能。此外,它内置了 GFPGAN 和 CodeFormer 等人脸修复工具,支持多种神经网络放大算法,并允许用户通过插件系统无限扩展能力。即使是显存有限的设备,stable-diffusion-webui 也提供了相应的优化选项,让高质量的 AI 艺术创作变得触手可及。

162.1k|★★★☆☆|4天前
开发框架图像Agent

everything-claude-code

everything-claude-code 是一套专为 AI 编程助手(如 Claude Code、Codex、Cursor 等)打造的高性能优化系统。它不仅仅是一组配置文件,而是一个经过长期实战打磨的完整框架,旨在解决 AI 代理在实际开发中面临的效率低下、记忆丢失、安全隐患及缺乏持续学习能力等核心痛点。 通过引入技能模块化、直觉增强、记忆持久化机制以及内置的安全扫描功能,everything-claude-code 能显著提升 AI 在复杂任务中的表现,帮助开发者构建更稳定、更智能的生产级 AI 代理。其独特的“研究优先”开发理念和针对 Token 消耗的优化策略,使得模型响应更快、成本更低,同时有效防御潜在的攻击向量。 这套工具特别适合软件开发者、AI 研究人员以及希望深度定制 AI 工作流的技术团队使用。无论您是在构建大型代码库,还是需要 AI 协助进行安全审计与自动化测试,everything-claude-code 都能提供强大的底层支持。作为一个曾荣获 Anthropic 黑客大奖的开源项目,它融合了多语言支持与丰富的实战钩子(hooks),让 AI 真正成长为懂上

147.9k|★★☆☆☆|今天
开发框架Agent语言模型

ComfyUI

ComfyUI 是一款功能强大且高度模块化的视觉 AI 引擎,专为设计和执行复杂的 Stable Diffusion 图像生成流程而打造。它摒弃了传统的代码编写模式,采用直观的节点式流程图界面,让用户通过连接不同的功能模块即可构建个性化的生成管线。 这一设计巧妙解决了高级 AI 绘图工作流配置复杂、灵活性不足的痛点。用户无需具备编程背景,也能自由组合模型、调整参数并实时预览效果,轻松实现从基础文生图到多步骤高清修复等各类复杂任务。ComfyUI 拥有极佳的兼容性,不仅支持 Windows、macOS 和 Linux 全平台,还广泛适配 NVIDIA、AMD、Intel 及苹果 Silicon 等多种硬件架构,并率先支持 SDXL、Flux、SD3 等前沿模型。 无论是希望深入探索算法潜力的研究人员和开发者,还是追求极致创作自由度的设计师与资深 AI 绘画爱好者,ComfyUI 都能提供强大的支持。其独特的模块化架构允许社区不断扩展新功能,使其成为当前最灵活、生态最丰富的开源扩散模型工具之一,帮助用户将创意高效转化为现实。

108.1k|★★☆☆☆|昨天
开发框架图像Agent

markitdown

MarkItDown 是一款由微软 AutoGen 团队打造的轻量级 Python 工具,专为将各类文件高效转换为 Markdown 格式而设计。它支持 PDF、Word、Excel、PPT、图片(含 OCR)、音频(含语音转录)、HTML 乃至 YouTube 链接等多种格式的解析,能够精准提取文档中的标题、列表、表格和链接等关键结构信息。 在人工智能应用日益普及的今天,大语言模型(LLM)虽擅长处理文本,却难以直接读取复杂的二进制办公文档。MarkItDown 恰好解决了这一痛点,它将非结构化或半结构化的文件转化为模型“原生理解”且 Token 效率极高的 Markdown 格式,成为连接本地文件与 AI 分析 pipeline 的理想桥梁。此外,它还提供了 MCP(模型上下文协议)服务器,可无缝集成到 Claude Desktop 等 LLM 应用中。 这款工具特别适合开发者、数据科学家及 AI 研究人员使用,尤其是那些需要构建文档检索增强生成(RAG)系统、进行批量文本分析或希望让 AI 助手直接“阅读”本地文件的用户。虽然生成的内容也具备一定可读性,但其核心优势在于为机器

93.4k|★★☆☆☆|3天前
插件开发框架

LLMs-from-scratch

LLMs-from-scratch 是一个基于 PyTorch 的开源教育项目,旨在引导用户从零开始一步步构建一个类似 ChatGPT 的大型语言模型(LLM)。它不仅是同名技术著作的官方代码库,更提供了一套完整的实践方案,涵盖模型开发、预训练及微调的全过程。 该项目主要解决了大模型领域“黑盒化”的学习痛点。许多开发者虽能调用现成模型,却难以深入理解其内部架构与训练机制。通过亲手编写每一行核心代码,用户能够透彻掌握 Transformer 架构、注意力机制等关键原理,从而真正理解大模型是如何“思考”的。此外,项目还包含了加载大型预训练权重进行微调的代码,帮助用户将理论知识延伸至实际应用。 LLMs-from-scratch 特别适合希望深入底层原理的 AI 开发者、研究人员以及计算机专业的学生。对于不满足于仅使用 API,而是渴望探究模型构建细节的技术人员而言,这是极佳的学习资源。其独特的技术亮点在于“循序渐进”的教学设计:将复杂的系统工程拆解为清晰的步骤,配合详细的图表与示例,让构建一个虽小但功能完备的大模型变得触手可及。无论你是想夯实理论基础,还是为未来研发更大规模的模型做准备

90.1k|★★★☆☆|3天前
语言模型图像Agent