[{"data":1,"prerenderedAt":-1},["ShallowReactive",2],{"similar-browserwing--browserwing":3,"tool-browserwing--browserwing":64},[4,17,27,35,43,56],{"id":5,"name":6,"github_repo":7,"description_zh":8,"stars":9,"difficulty_score":10,"last_commit_at":11,"category_tags":12,"status":16},3808,"stable-diffusion-webui","AUTOMATIC1111\u002Fstable-diffusion-webui","stable-diffusion-webui 是一个基于 Gradio 构建的网页版操作界面，旨在让用户能够轻松地在本地运行和使用强大的 Stable Diffusion 图像生成模型。它解决了原始模型依赖命令行、操作门槛高且功能分散的痛点，将复杂的 AI 绘图流程整合进一个直观易用的图形化平台。\n\n无论是希望快速上手的普通创作者、需要精细控制画面细节的设计师，还是想要深入探索模型潜力的开发者与研究人员，都能从中获益。其核心亮点在于极高的功能丰富度：不仅支持文生图、图生图、局部重绘（Inpainting）和外绘（Outpainting）等基础模式，还独创了注意力机制调整、提示词矩阵、负向提示词以及“高清修复”等高级功能。此外，它内置了 GFPGAN 和 CodeFormer 等人脸修复工具，支持多种神经网络放大算法，并允许用户通过插件系统无限扩展能力。即使是显存有限的设备，stable-diffusion-webui 也提供了相应的优化选项，让高质量的 AI 艺术创作变得触手可及。",162132,3,"2026-04-05T11:01:52",[13,14,15],"开发框架","图像","Agent","ready",{"id":18,"name":19,"github_repo":20,"description_zh":21,"stars":22,"difficulty_score":23,"last_commit_at":24,"category_tags":25,"status":16},1381,"everything-claude-code","affaan-m\u002Feverything-claude-code","everything-claude-code 是一套专为 AI 编程助手（如 Claude Code、Codex、Cursor 等）打造的高性能优化系统。它不仅仅是一组配置文件，而是一个经过长期实战打磨的完整框架，旨在解决 AI 代理在实际开发中面临的效率低下、记忆丢失、安全隐患及缺乏持续学习能力等核心痛点。\n\n通过引入技能模块化、直觉增强、记忆持久化机制以及内置的安全扫描功能，everything-claude-code 能显著提升 AI 在复杂任务中的表现，帮助开发者构建更稳定、更智能的生产级 AI 代理。其独特的“研究优先”开发理念和针对 Token 消耗的优化策略，使得模型响应更快、成本更低，同时有效防御潜在的攻击向量。\n\n这套工具特别适合软件开发者、AI 研究人员以及希望深度定制 AI 工作流的技术团队使用。无论您是在构建大型代码库，还是需要 AI 协助进行安全审计与自动化测试，everything-claude-code 都能提供强大的底层支持。作为一个曾荣获 Anthropic 黑客大奖的开源项目，它融合了多语言支持与丰富的实战钩子（hooks），让 AI 真正成长为懂上",138956,2,"2026-04-05T11:33:21",[13,15,26],"语言模型",{"id":28,"name":29,"github_repo":30,"description_zh":31,"stars":32,"difficulty_score":23,"last_commit_at":33,"category_tags":34,"status":16},2271,"ComfyUI","Comfy-Org\u002FComfyUI","ComfyUI 是一款功能强大且高度模块化的视觉 AI 引擎，专为设计和执行复杂的 Stable Diffusion 图像生成流程而打造。它摒弃了传统的代码编写模式，采用直观的节点式流程图界面，让用户通过连接不同的功能模块即可构建个性化的生成管线。\n\n这一设计巧妙解决了高级 AI 绘图工作流配置复杂、灵活性不足的痛点。用户无需具备编程背景，也能自由组合模型、调整参数并实时预览效果，轻松实现从基础文生图到多步骤高清修复等各类复杂任务。ComfyUI 拥有极佳的兼容性，不仅支持 Windows、macOS 和 Linux 全平台，还广泛适配 NVIDIA、AMD、Intel 及苹果 Silicon 等多种硬件架构，并率先支持 SDXL、Flux、SD3 等前沿模型。\n\n无论是希望深入探索算法潜力的研究人员和开发者，还是追求极致创作自由度的设计师与资深 AI 绘画爱好者，ComfyUI 都能提供强大的支持。其独特的模块化架构允许社区不断扩展新功能，使其成为当前最灵活、生态最丰富的开源扩散模型工具之一，帮助用户将创意高效转化为现实。",107662,"2026-04-03T11:11:01",[13,14,15],{"id":36,"name":37,"github_repo":38,"description_zh":39,"stars":40,"difficulty_score":23,"last_commit_at":41,"category_tags":42,"status":16},3704,"NextChat","ChatGPTNextWeb\u002FNextChat","NextChat 是一款轻量且极速的 AI 助手，旨在为用户提供流畅、跨平台的大模型交互体验。它完美解决了用户在多设备间切换时难以保持对话连续性，以及面对众多 AI 模型不知如何统一管理的痛点。无论是日常办公、学习辅助还是创意激发，NextChat 都能让用户随时随地通过网页、iOS、Android、Windows、MacOS 或 Linux 端无缝接入智能服务。\n\n这款工具非常适合普通用户、学生、职场人士以及需要私有化部署的企业团队使用。对于开发者而言，它也提供了便捷的自托管方案，支持一键部署到 Vercel 或 Zeabur 等平台。\n\nNextChat 的核心亮点在于其广泛的模型兼容性，原生支持 Claude、DeepSeek、GPT-4 及 Gemini Pro 等主流大模型，让用户在一个界面即可自由切换不同 AI 能力。此外，它还率先支持 MCP（Model Context Protocol）协议，增强了上下文处理能力。针对企业用户，NextChat 提供专业版解决方案，具备品牌定制、细粒度权限控制、内部知识库整合及安全审计等功能，满足公司对数据隐私和个性化管理的高标准要求。",87618,"2026-04-05T07:20:52",[13,26],{"id":44,"name":45,"github_repo":46,"description_zh":47,"stars":48,"difficulty_score":23,"last_commit_at":49,"category_tags":50,"status":16},2268,"ML-For-Beginners","microsoft\u002FML-For-Beginners","ML-For-Beginners 是由微软推出的一套系统化机器学习入门课程，旨在帮助零基础用户轻松掌握经典机器学习知识。这套课程将学习路径规划为 12 周，包含 26 节精炼课程和 52 道配套测验，内容涵盖从基础概念到实际应用的完整流程，有效解决了初学者面对庞大知识体系时无从下手、缺乏结构化指导的痛点。\n\n无论是希望转型的开发者、需要补充算法背景的研究人员，还是对人工智能充满好奇的普通爱好者，都能从中受益。课程不仅提供了清晰的理论讲解，还强调动手实践，让用户在循序渐进中建立扎实的技能基础。其独特的亮点在于强大的多语言支持，通过自动化机制提供了包括简体中文在内的 50 多种语言版本，极大地降低了全球不同背景用户的学习门槛。此外，项目采用开源协作模式，社区活跃且内容持续更新，确保学习者能获取前沿且准确的技术资讯。如果你正寻找一条清晰、友好且专业的机器学习入门之路，ML-For-Beginners 将是理想的起点。",84991,"2026-04-05T10:45:23",[14,51,52,53,15,54,26,13,55],"数据工具","视频","插件","其他","音频",{"id":57,"name":58,"github_repo":59,"description_zh":60,"stars":61,"difficulty_score":10,"last_commit_at":62,"category_tags":63,"status":16},3128,"ragflow","infiniflow\u002Fragflow","RAGFlow 是一款领先的开源检索增强生成（RAG）引擎，旨在为大语言模型构建更精准、可靠的上下文层。它巧妙地将前沿的 RAG 技术与智能体（Agent）能力相结合，不仅支持从各类文档中高效提取知识，还能让模型基于这些知识进行逻辑推理和任务执行。\n\n在大模型应用中，幻觉问题和知识滞后是常见痛点。RAGFlow 通过深度解析复杂文档结构（如表格、图表及混合排版），显著提升了信息检索的准确度，从而有效减少模型“胡编乱造”的现象，确保回答既有据可依又具备时效性。其内置的智能体机制更进一步，使系统不仅能回答问题，还能自主规划步骤解决复杂问题。\n\n这款工具特别适合开发者、企业技术团队以及 AI 研究人员使用。无论是希望快速搭建私有知识库问答系统，还是致力于探索大模型在垂直领域落地的创新者，都能从中受益。RAGFlow 提供了可视化的工作流编排界面和灵活的 API 接口，既降低了非算法背景用户的上手门槛，也满足了专业开发者对系统深度定制的需求。作为基于 Apache 2.0 协议开源的项目，它正成为连接通用大模型与行业专有知识之间的重要桥梁。",77062,"2026-04-04T04:44:48",[15,14,13,26,54],{"id":65,"github_repo":66,"name":67,"description_en":68,"description_zh":69,"ai_summary_zh":70,"readme_en":71,"readme_zh":72,"quickstart_zh":73,"use_case_zh":74,"hero_image_url":75,"owner_login":67,"owner_name":67,"owner_avatar_url":76,"owner_bio":77,"owner_company":77,"owner_location":77,"owner_email":77,"owner_twitter":77,"owner_website":77,"owner_url":78,"languages":79,"stars":116,"forks":117,"last_commit_at":118,"license":119,"difficulty_score":23,"env_os":120,"env_gpu":121,"env_ram":121,"env_deps":122,"category_tags":130,"github_topics":131,"view_count":23,"oss_zip_url":77,"oss_zip_packed_at":77,"status":16,"created_at":136,"updated_at":137,"faqs":138,"releases":139},3865,"browserwing\u002Fbrowserwing","browserwing","BrowserWing turns your browser actions into MCP commands Or Claude Skill, allowing AI agents to control browsers efficiently and reliably. Say goodbye to slow, token-heavy LLM interactions — let agents call commands directly for faster automation. Perfect for AI-driven tasks, browser automation, and boosting productivity.","BrowserWing 是一款将浏览器操作转化为 AI 可直接调用指令的自动化工具。它通过支持 MCP（模型上下文协议）和 Claude Skills 标准，让 AI 智能体能够高效、稳定地控制浏览器，无需再依赖缓慢且消耗大量 Token 的大语言模型交互方式。\n\n过去，让 AI 操作浏览器往往响应迟缓且成本高昂。BrowserWing 解决了这一痛点，它提供了一套包含 26+ 接口的原生自动化平台，支持可视化录制脚本、智能数据提取以及稳定的会话管理（如 Cookie 处理）。用户可以将录制的操作流程直接导出为 AI 可识别的命令或技能文件，实现“一次录制，AI 随时调用”。\n\n这款工具特别适合开发者、AI 工程师以及希望提升工作效率的技术型用户。无论是构建复杂的 AI 驱动任务流，还是进行大规模网页数据采集，BrowserWing 都能提供精准的控制能力。其独特的技术亮点在于“可视化脚本录制”与\"LLM 语义提取”的结合，既降低了编写自动化脚本的门槛，又利用大模型增强了数据处理的灵活性。只需简单安装并启动服务，你的 AI 助手便能立刻获得操控浏览器的强大能力，让自动化任务变得更快、更","BrowserWing 是一款将浏览器操作转化为 AI 可直接调用指令的自动化工具。它通过支持 MCP（模型上下文协议）和 Claude Skills 标准，让 AI 智能体能够高效、稳定地控制浏览器，无需再依赖缓慢且消耗大量 Token 的大语言模型交互方式。\n\n过去，让 AI 操作浏览器往往响应迟缓且成本高昂。BrowserWing 解决了这一痛点，它提供了一套包含 26+ 接口的原生自动化平台，支持可视化录制脚本、智能数据提取以及稳定的会话管理（如 Cookie 处理）。用户可以将录制的操作流程直接导出为 AI 可识别的命令或技能文件，实现“一次录制，AI 随时调用”。\n\n这款工具特别适合开发者、AI 工程师以及希望提升工作效率的技术型用户。无论是构建复杂的 AI 驱动任务流，还是进行大规模网页数据采集，BrowserWing 都能提供精准的控制能力。其独特的技术亮点在于“可视化脚本录制”与\"LLM 语义提取”的结合，既降低了编写自动化脚本的门槛，又利用大模型增强了数据处理的灵活性。只需简单安装并启动服务，你的 AI 助手便能立刻获得操控浏览器的强大能力，让自动化任务变得更快、更可靠。","\u003Cp align=\"center\">\n  \u003Cimg width=\"600\" alt=\"BrowserWing\" src=\"https:\u002F\u002Fraw.githubusercontent.com\u002Fbrowserwing\u002Fbrowserwing\u002Fmain\u002Fdocs\u002Fassets\u002Fbanner.svg\">\n\u003C\u002Fp>\n\n\u003Cp align=\"center\">\n  \u003Cimg alt=\"Go\" src=\"https:\u002F\u002Fimg.shields.io\u002Fbadge\u002FGo-1.21%2B-00ADD8?logo=go&logoColor=white\" \u002F>\n  \u003Cimg alt=\"React\" src=\"https:\u002F\u002Fimg.shields.io\u002Fbadge\u002FReact-18-61DAFB?logo=react&logoColor=white\" \u002F>\n  \u003Cimg alt=\"TypeScript\" src=\"https:\u002F\u002Fimg.shields.io\u002Fbadge\u002FTypeScript-5-3178C6?logo=typescript&logoColor=white\" \u002F>\n  \u003Cimg alt=\"Vite\" src=\"https:\u002F\u002Fimg.shields.io\u002Fbadge\u002FVite-5-646CFF?logo=vite&logoColor=white\" \u002F>\n  \u003Cimg alt=\"pnpm\" src=\"https:\u002F\u002Fimg.shields.io\u002Fbadge\u002Fpnpm-9-F69220?logo=pnpm&logoColor=white\" \u002F>\n  \u003Cimg alt=\"MCP\" src=\"https:\u002F\u002Fimg.shields.io\u002Fbadge\u002FMCP-Model%20Context%20Protocol-7B61FF\" \u002F>\n\u003C\u002Fp>\n\n\u003Cp align=\"center\">\n  English · \u003Ca href=\".\u002FREADME.zh-CN.md\">简体中文\u003C\u002Fa> · \u003Ca href=\".\u002FREADME.ja.md\">日本語\u003C\u002Fa> · \u003Ca href=\".\u002FREADME.es.md\">Español\u003C\u002Fa> · \u003Ca href=\".\u002FREADME.pt.md\">Português\u003C\u002Fa>\n\u003C\u002Fp>\n\n\u003Cp align=\"center\">\u003Ca href=\"https:\u002F\u002Fbrowserwing.com\">browserwing.com\u003C\u002Fa>\u003C\u002Fp>\n\n\nhttps:\u002F\u002Fgithub.com\u002Fuser-attachments\u002Fassets\u002Fe5377892-4b88-433a-8620-43b38a2fb28f\n\n\n## Highlights\n\n**Native Browser Automation Platform with AI Integration**\n\n- **Complete Browser Control**: 26+ HTTP API endpoints for full-featured browser automation\n- **Built-in AI Agent**: Direct conversational interface for browser automation tasks\n- **Universal AI Tool Integration**: Native MCP & Skills protocol support - compatible with any AI tool that supports these standards\n- **Visual Script Recording**: Record browser actions, edit visually, and replay with precision\n- **Flexible Export Options**: Convert recorded scripts to MCP commands or Skills files for AI tool integration\n- **Intelligent Data Extraction**: LLM-powered semantic extraction supporting OpenAI, Claude, DeepSeek, and more\n- **Session Management**: Robust cookie and storage handling for stable, authenticated browsing sessions\n\n## Requirements\n\n- Google Chrome or Chromium installed and accessible in your environment.\n\n## Screenshots\n\n\u003Cimg width=\"600\" alt=\"BrowserWing Homepage\" src=\"https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002Fbrowserwing_browserwing_readme_9140b754d8fa.png\">\n\n### Turn Scripts Into Claude Skill\n\nYou can now combine any scripts into a SKILL.md.\n\n\u003Cimg width=\"600\" alt=\"BrowserWing Skill\" src=\"https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002Fbrowserwing_browserwing_readme_6a583cad5fcb.png\">\n\n## Quick Start\n\n### Let Your AI Agent Install It For You\n\nSimply send the following message to your AI agent (OpenClaw, Cursor, Claude Code, etc.):\n\n> **\"Help me install BrowserWing following https:\u002F\u002Fraw.githubusercontent.com\u002Fbrowserwing\u002Fbrowserwing\u002Fmain\u002FINSTALL.md\"**\n\nThe agent will read the guide and handle the installation, configuration, Chrome setup, and Skill integration automatically.\n\n---\n\n### Option A — Install via Package Manager (recommended)\n\n**Using npm:**\n```bash\nnpm install -g browserwing\nbrowserwing --port 8080\n```\n\n**Using pnpm:**\n```bash\npnpm add -g browserwing\nbrowserwing --port 8080\n```\n\nThe npm package automatically tests GitHub and Gitee mirrors during installation and selects the fastest one.\n\n**⚠️ macOS Users:**  \nIf you encounter a \"killed\" error when running, fix it with:\n```bash\nxattr -d com.apple.quarantine $(which browserwing)\n```\nSee the [macOS Installation Fix Guide](docs\u002FMACOS_INSTALLATION_FIX.md) for details.\n\n**Using Homebrew (macOS\u002FLinux):**\n```bash\n# Coming soon\nbrew install browserwing\n```\n\n### Option B — One-Line Install Script\n\n**Linux \u002F macOS:**\n```bash\ncurl -fsSL https:\u002F\u002Fraw.githubusercontent.com\u002Fbrowserwing\u002Fbrowserwing\u002Fmain\u002Finstall.sh | bash\n```\n\n**Windows (PowerShell):**\n```powershell\niwr -useb https:\u002F\u002Fraw.githubusercontent.com\u002Fbrowserwing\u002Fbrowserwing\u002Fmain\u002Finstall.ps1 | iex\n```\n\nThe script automatically:\n- Detects your OS\u002Farchitecture\n- Tests GitHub and Gitee mirrors, selects the fastest one\n- Downloads and extracts the binary\n- Adds to PATH\n\n**Then start BrowserWing:**\n```bash\nbrowserwing --port 8080\n# Open http:\u002F\u002Flocalhost:8080 in your browser\n```\n\n**Note for users in China:** The installation script automatically uses Gitee mirror if GitHub is slow.\n\n### Option C — Manual Download\n\nDownload the prebuilt binary for your OS from [Releases](https:\u002F\u002Fgithub.com\u002Fbrowserwing\u002Fbrowserwing\u002Freleases):\n\n```bash\n# Linux\u002FmacOS\nchmod +x .\u002Fbrowserwing\n.\u002Fbrowserwing --port 8080\n\n# Windows (PowerShell)\n.\u002Fbrowserwing.exe --port 8080\n```\n\n### Option D — Build from Source\n\n```bash\n# Install deps (Go + pnpm required)\nmake install\n\n# Build integrated binary (frontend embedded)\nmake build-embedded\n.\u002Fbuild\u002Fbrowserwing --port 8080\n\n# Or build all targets and packages\nmake build-all\nmake package\n```\n\n## Quick Integration with AI Tools\n\n**Three Ways to Use BrowserWing:**\n\n### 1. MCP Server Integration\n\nConfigure BrowserWing as an MCP server in any MCP-compatible AI tool:\n\n```json\n{\n  \"mcpServers\": {\n    \"browserwing\": {\n      \"type\": \"http\",\n      \"url\": \"http:\u002F\u002Flocalhost:8080\u002Fapi\u002Fv1\u002Fmcp\u002Fmessage\"\n    }\n  }\n}\n```\n\nPaste this configuration into your AI tool's MCP settings to enable browser automation capabilities.\n\n### 2. Skills File Integration\n\nDownload and import the Skills file into any AI tool that supports the Skills protocol:\n\n1. Start BrowserWing\n2. Download [SKILL.md](https:\u002F\u002Fraw.githubusercontent.com\u002Fbrowserwing\u002Fbrowserwing\u002Frefs\u002Fheads\u002Fmain\u002FSKILL.md) from the repository\n3. Import into your AI tool's Skills settings\n4. Start automating with natural language commands\n\n**Example:**\n```\n\"Navigate to example.com, search for 'AI tools', and extract the top 5 results\"\n```\n\n### 3. Direct AI Agent Interface\n\nUse BrowserWing's built-in AI Agent for immediate browser automation:\n\n1. Open BrowserWing web interface at `http:\u002F\u002Flocalhost:8080`\n2. Navigate to \"AI Agent\" section\n3. Configure your LLM (OpenAI, Claude, DeepSeek, etc.)\n4. Start conversational browser automation\n\n**Export Custom Scripts:**\n```bash\n# Export your recorded scripts as Skills or MCP commands\ncurl -X POST 'http:\u002F\u002Flocalhost:8080\u002Fapi\u002Fv1\u002Fscripts\u002Fexport\u002Fskill' \\\n  -H 'Content-Type: application\u002Fjson' \\\n  -d '{\"script_ids\": []}' \\\n  -o MY_CUSTOM_SCRIPTS.md\n```\n\n## Why BrowserWing\n\n**Professional Browser Automation with AI Integration**\n\n- **Universal Protocol Support**: Native MCP & Skills implementation works with any compatible AI tool\n- **Complete Automation API**: 26+ HTTP endpoints providing comprehensive browser control capabilities\n- **Flexible Integration Options**: Use as MCP server, Skills file, or standalone AI Agent\n- **Visual Workflow Builder**: Record, edit, and replay browser actions without writing code\n- **Token-Efficient Design**: Optimized for LLM usage with fast performance and minimal token consumption\n- **Production-Ready**: Stable session management, cookie handling, and error recovery\n- **Extensible Architecture**: Convert recorded scripts to reusable MCP commands or Skills files\n- **Multi-LLM Support**: Works with OpenAI, Anthropic, DeepSeek, and other providers\n- **Enterprise Use Cases**: Data extraction, RPA, testing, monitoring, and agent-driven automation\n\n## Usage Guide\n\n### Getting Started in Three Steps\n\n1. **Choose Integration Method**\n   - Copy MCP server configuration for AI tool integration\n   - Download Skills file for Skills-compatible AI tools\n   - Or use built-in AI Agent for immediate access\n\n2. **Configure Your AI Tool**\n   - Import MCP configuration or Skills file into your preferred AI tool\n   - Configure LLM settings (API keys, model selection)\n   - Verify connection to BrowserWing\n\n3. **Start Automating**\n   - Control browser through natural language commands\n   - Record custom scripts for repeated tasks\n   - Export scripts as MCP commands or Skills for reuse\n\n### Advanced Workflows\n\n**For Browser Automation:**\n- Launch and manage multiple browser instances\n- Configure profiles, proxies, and browser settings\n- Handle cookies and authentication sessions\n- Execute complex interaction sequences\n\n**For Script Recording:**\n- Capture clicks, inputs, navigation, and waits\n- Edit actions visually in the script editor\n- Test and debug with step-by-step replay\n- Add variables and conditional logic\n\n**For AI Integration:**\n- Convert scripts to MCP commands or Skills files\n- Integrate with multiple LLM providers\n- Use semantic extraction for data parsing\n- Build agent-driven automation workflows\n\n### HTTP API Reference\n\nBrowserWing exposes 26+ RESTful endpoints for programmatic browser control:\n\n**Navigation & Control**\n- Navigate to URLs, go back\u002Fforward, refresh pages\n- Manage browser windows and tabs\n- Handle page loading and timeouts\n\n**Element Interaction**\n- Click, type, select, and hover actions\n- File uploads and form submissions\n- Keyboard shortcuts and key presses\n\n**Data Extraction**\n- Extract text, HTML, and attributes\n- Semantic content analysis with LLM\n- Screenshot capture (full page or element)\n\n**Advanced Operations**\n- Execute custom JavaScript\n- Manage cookies and local storage\n- Batch operations for efficiency\n- Wait conditions and element visibility\n\n**Complete Documentation**: See `docs\u002FEXECUTOR_HTTP_API.md` for detailed endpoint specifications\n\n## Contributing\n\n- Issues and PRs are welcome. Please include clear steps to reproduce or a concise rationale.\n- For feature ideas, open a discussion with use cases and expected outcomes.\n\n## Community\n\nDiscord: [https:\u002F\u002Fdiscord.gg\u002FBkqcApRj](https:\u002F\u002Fdiscord.gg\u002FBkqcApRj)\ntwitter: [https:\u002F\u002Fx.com\u002Fchg80333](https:\u002F\u002Fx.com\u002Fchg80333)\n\n## Acknowledgements\n\n- Inspired by modern browser automation, agentic workflows, and MCP.\n\n## License\n\n- MIT License. See `LICENSE`.\n\n## Disclaimer\n\n- Do not use for illegal purposes or to violate site terms.\n- Intended for personal learning and legitimate automation only.\n","\u003Cp align=\"center\">\n  \u003Cimg width=\"600\" alt=\"BrowserWing\" src=\"https:\u002F\u002Fraw.githubusercontent.com\u002Fbrowserwing\u002Fbrowserwing\u002Fmain\u002Fdocs\u002Fassets\u002Fbanner.svg\">\n\u003C\u002Fp>\n\n\u003Cp align=\"center\">\n  \u003Cimg alt=\"Go\" src=\"https:\u002F\u002Fimg.shields.io\u002Fbadge\u002FGo-1.21%2B-00ADD8?logo=go&logoColor=white\" \u002F>\n  \u003Cimg alt=\"React\" src=\"https:\u002F\u002Fimg.shields.io\u002Fbadge\u002FReact-18-61DAFB?logo=react&logoColor=white\" \u002F>\n  \u003Cimg alt=\"TypeScript\" src=\"https:\u002F\u002Fimg.shields.io\u002Fbadge\u002FTypeScript-5-3178C6?logo=typescript&logoColor=white\" \u002F>\n  \u003Cimg alt=\"Vite\" src=\"https:\u002F\u002Fimg.shields.io\u002Fbadge\u002FVite-5-646CFF?logo=vite&logoColor=white\" \u002F>\n  \u003Cimg alt=\"pnpm\" src=\"https:\u002F\u002Fimg.shields.io\u002Fbadge\u002Fpnpm-9-F69220?logo=pnpm&logoColor=white\" \u002F>\n  \u003Cimg alt=\"MCP\" src=\"https:\u002F\u002Fimg.shields.io\u002Fbadge\u002FMCP-Model%20Context%20Protocol-7B61FF\" \u002F>\n\u003C\u002Fp>\n\n\u003Cp align=\"center\">\n  英文 · \u003Ca href=\".\u002FREADME.zh-CN.md\">简体中文\u003C\u002Fa> · \u003Ca href=\".\u002FREADME.ja.md\">日本語\u003C\u002Fa> · \u003Ca href=\".\u002FREADME.es.md\">Español\u003C\u002Fa> · \u003Ca href=\".\u002FREADME.pt.md\">Português\u003C\u002Fa>\n\u003C\u002Fp>\n\n\u003Cp align=\"center\">\u003Ca href=\"https:\u002F\u002Fbrowserwing.com\">browserwing.com\u003C\u002Fa>\u003C\u002Fp>\n\n\nhttps:\u002F\u002Fgithub.com\u002Fuser-attachments\u002Fassets\u002Fe5377892-4b88-433a-8620-43b38a2fb28f\n\n\n## 亮点\n\n**集成AI的原生浏览器自动化平台**\n\n- **全面的浏览器控制**：26+个HTTP API端点，提供功能齐全的浏览器自动化能力\n- **内置AI助手**：直接通过对话式界面执行浏览器自动化任务\n- **通用AI工具集成**：原生支持MCP和Skills协议——兼容任何支持这些标准的AI工具\n- **可视化脚本录制**：录制浏览器操作、可视化编辑，并精确回放\n- **灵活的导出选项**：将录制的脚本转换为MCP命令或Skills文件，便于与AI工具集成\n- **智能数据提取**：基于LLM的语义提取功能，支持OpenAI、Claude、DeepSeek等模型\n- **会话管理**：强大的Cookie和存储管理，确保稳定且已认证的浏览会话\n\n## 系统要求\n\n- 您的环境中需安装并可访问Google Chrome或Chromium。\n\n## 截图\n\n\u003Cimg width=\"600\" alt=\"BrowserWing首页\" src=\"https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002Fbrowserwing_browserwing_readme_9140b754d8fa.png\">\n\n### 将脚本转化为Claude技能\n\n现在您可以将任意脚本整合为SKILL.md文件。\n\n\u003Cimg width=\"600\" alt=\"BrowserWing技能\" src=\"https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002Fbrowserwing_browserwing_readme_6a583cad5fcb.png\">\n\n## 快速入门\n\n### 让您的AI助手为您安装\n\n只需向您的AI助手（OpenClaw、Cursor、Claude Code等）发送以下消息：\n\n> **“请按照https:\u002F\u002Fraw.githubusercontent.com\u002Fbrowserwing\u002Fbrowserwing\u002Fmain\u002FINSTALL.md帮我安装BrowserWing。”**\n\n助手将自动阅读指南并完成安装、配置、Chrome设置以及技能集成。\n\n---\n\n### 选项A — 通过包管理器安装（推荐）\n\n**使用npm：**\n```bash\nnpm install -g browserwing\nbrowserwing --port 8080\n```\n\n**使用pnpm：**\n```bash\npnpm add -g browserwing\nbrowserwing --port 8080\n```\n\nnpm包在安装过程中会自动测试GitHub和Gitee镜像源，并选择速度最快的镜像。\n\n**⚠️ macOS用户：**  \n如果运行时出现“killed”错误，请使用以下命令修复：\n```bash\nxattr -d com.apple.quarantine $(which browserwing)\n```\n详情请参阅[macOS安装修复指南](docs\u002FMACOS_INSTALLATION_FIX.md)。\n\n**使用Homebrew（macOS\u002FLinux）：**\n```bash\n# 即将推出\nbrew install browserwing\n```\n\n### 选项B — 一行安装脚本\n\n**Linux \u002F macOS：**\n```bash\ncurl -fsSL https:\u002F\u002Fraw.githubusercontent.com\u002Fbrowserwing\u002Fbrowserwing\u002Fmain\u002Finstall.sh | bash\n```\n\n**Windows（PowerShell）：**\n```powershell\niwr -useb https:\u002F\u002Fraw.githubusercontent.com\u002Fbrowserwing\u002Fbrowserwing\u002Fmain\u002Finstall.ps1 | iex\n```\n\n该脚本会自动：\n- 检测您的操作系统和架构\n- 测试GitHub和Gitee镜像源，选择最快的一个\n- 下载并解压二进制文件\n- 将其添加到PATH中\n\n**然后启动BrowserWing：**\n```bash\nbrowserwing --port 8080\n# 在浏览器中打开 http:\u002F\u002Flocalhost:8080\n```\n\n**中国用户请注意：** 如果GitHub访问较慢，安装脚本会自动切换至Gitee镜像源。\n\n### 选项C — 手动下载\n\n从[Releases](https:\u002F\u002Fgithub.com\u002Fbrowserwing\u002Fbrowserwing\u002Freleases)页面下载适用于您操作系统的预编译二进制文件：\n\n```bash\n# Linux\u002FmacOS\nchmod +x .\u002Fbrowserwing\n.\u002Fbrowserwing --port 8080\n\n# Windows（PowerShell）\n.\u002Fbrowserwing.exe --port 8080\n```\n\n### 选项D — 从源码构建\n\n```bash\n# 安装依赖（需要Go和pnpm）\nmake install\n\n# 构建集成前端的二进制文件\nmake build-embedded\n.\u002Fbuild\u002Fbrowserwing --port 8080\n\n# 或者构建所有目标和软件包\nmake build-all\nmake package\n```\n\n## 与AI工具的快速集成\n\n**使用BrowserWing的三种方式：**\n\n### 1. MCP服务器集成\n\n在任何兼容MCP的AI工具中将BrowserWing配置为MCP服务器：\n\n```json\n{\n  \"mcpServers\": {\n    \"browserwing\": {\n      \"type\": \"http\",\n      \"url\": \"http:\u002F\u002Flocalhost:8080\u002Fapi\u002Fv1\u002Fmcp\u002Fmessage\"\n    }\n  }\n}\n```\n\n将此配置粘贴到您的AI工具的MCP设置中，即可启用浏览器自动化功能。\n\n### 2. Skills文件集成\n\n下载并导入Skills文件到任何支持Skills协议的AI工具中：\n\n1. 启动BrowserWing\n2. 从仓库下载[SKILL.md](https:\u002F\u002Fraw.githubusercontent.com\u002Fbrowserwing\u002Fbrowserwing\u002Frefs\u002Fheads\u002Fmain\u002FSKILL.md)\n3. 导入到您的AI工具的Skills设置中\n4. 开始使用自然语言命令进行自动化操作\n\n**示例：**\n```\n“导航到example.com，搜索‘AI工具’，提取前5条结果”\n```\n\n### 3. 直接使用AI助手界面\n\n利用BrowserWing内置的AI助手实现即时浏览器自动化：\n\n1. 打开BrowserWing的Web界面，地址为`http:\u002F\u002Flocalhost:8080`\n2. 进入“AI助手”部分\n3. 配置您的LLM（OpenAI、Claude、DeepSeek等）\n4. 开始通过对话方式进行浏览器自动化操作\n\n**导出自定义脚本：**\n```bash\n# 将您录制的脚本导出为Skills或MCP命令\ncurl -X POST 'http:\u002F\u002Flocalhost:8080\u002Fapi\u002Fv1\u002Fscripts\u002Fexport\u002Fskill' \\\n  -H 'Content-Type: application\u002Fjson' \\\n  -d '{\"script_ids\": []}' \\\n  -o MY_CUSTOM_SCRIPTS.md\n```\n\n## 为什么选择 BrowserWing\n\n**融合 AI 的专业浏览器自动化**\n\n- **通用协议支持**：原生 MCP 和 Skills 实现可与任何兼容的 AI 工具无缝对接\n- **完整的自动化 API**：提供 26+ 个 HTTP 端点，覆盖全面的浏览器控制功能\n- **灵活的集成方式**：可作为 MCP 服务器、Skills 文件或独立的 AI 代理使用\n- **可视化工作流构建器**：无需编写代码即可录制、编辑和回放浏览器操作\n- **高效令牌设计**：针对大模型使用进行优化，性能快速且令牌消耗极低\n- **生产就绪**：稳定的会话管理、Cookie 处理和错误恢复机制\n- **可扩展架构**：将录制的脚本转换为可重用的 MCP 命令或 Skills 文件\n- **多大模型支持**：兼容 OpenAI、Anthropic、DeepSeek 等多家提供商\n- **企业级应用场景**：数据提取、RPA、测试、监控以及基于代理的自动化\n\n## 使用指南\n\n### 三步快速入门\n\n1. **选择集成方式**\n   - 复制 MCP 服务器配置以集成到 AI 工具中\n   - 下载 Skills 文件用于支持 Skills 的 AI 工具\n   - 或直接使用内置的 AI 代理，即刻开始使用\n\n2. **配置您的 AI 工具**\n   - 将 MCP 配置或 Skills 文件导入您偏好的 AI 工具\n   - 设置大模型相关参数（API 密钥、模型选择等）\n   - 验证与 BrowserWing 的连接状态\n\n3. **开始自动化**\n   - 通过自然语言指令控制浏览器\n   - 录制自定义脚本以执行重复性任务\n   - 将脚本导出为 MCP 命令或 Skills，便于复用\n\n### 高级工作流\n\n**用于浏览器自动化：**\n- 启动并管理多个浏览器实例\n- 配置用户配置文件、代理及浏览器设置\n- 处理 Cookie 和认证会话\n- 执行复杂的交互序列\n\n**用于脚本录制：**\n- 捕捉点击、输入、导航和等待操作\n- 在脚本编辑器中直观地编辑操作步骤\n- 通过逐步回放进行测试和调试\n- 添加变量和条件逻辑\n\n**用于 AI 集成：**\n- 将脚本转换为 MCP 命令或 Skills 文件\n- 与多家大模型提供商集成\n- 利用语义提取技术解析数据\n- 构建基于代理的自动化工作流\n\n### HTTP API 参考\n\nBrowserWing 提供 26+ 个 RESTful 端点，用于程序化控制浏览器：\n\n**导航与控制**\n- 跳转至指定 URL、后退\u002F前进、刷新页面\n- 管理浏览器窗口和标签页\n- 处理页面加载和超时问题\n\n**元素交互**\n- 点击、输入、选择和悬停操作\n- 文件上传和表单提交\n- 快捷键和按键操作\n\n**数据提取**\n- 提取文本、HTML 和属性信息\n- 结合大模型进行语义内容分析\n- 截图功能（全页或特定元素）\n\n**高级操作**\n- 执行自定义 JavaScript\n- 管理 Cookie 和本地存储\n- 批量操作提升效率\n- 等待条件与元素可见性检查\n\n**完整文档**：请参阅 `docs\u002FEXECUTOR_HTTP_API.md` 获取详细的端点说明。\n\n## 贡献\n\n- 欢迎提交问题和 Pull Request。请附上清晰的复现步骤或简明的理由。\n- 如有功能建议，请发起讨论，并说明使用场景和预期效果。\n\n## 社区\n\nDiscord：[https:\u002F\u002Fdiscord.gg\u002FBkqcApRj](https:\u002F\u002Fdiscord.gg\u002FBkqcApRj)  \nTwitter：[https:\u002F\u002Fx.com\u002Fchg80333](https:\u002F\u002Fx.com\u002Fchg80333)\n\n## 致谢\n\n- 灵感来源于现代浏览器自动化、代理式工作流以及 MCP 技术。\n\n## 许可证\n\n- MIT 许可证。详情请参阅 `LICENSE` 文件。\n\n## 免责声明\n\n- 请勿用于非法目的或违反网站条款的行为。\n- 本工具仅适用于个人学习和合法的自动化用途。","# BrowserWing 快速上手指南\n\nBrowserWing 是一个原生浏览器自动化平台，集成了 AI 代理功能。它支持通过自然语言控制浏览器、录制可视化脚本，并兼容 MCP (Model Context Protocol) 和 Skills 协议，可无缝对接各类 AI 工具。\n\n## 环境准备\n\n在开始之前，请确保您的开发环境满足以下要求：\n\n*   **操作系统**：Linux, macOS, 或 Windows\n*   **浏览器内核**：必须安装 **Google Chrome** 或 **Chromium**，并确保其可在系统环境中被访问到。\n*   **网络环境**：安装脚本会自动检测网络速度，优先使用 Gitee 镜像（针对中国大陆用户优化）。\n\n## 安装步骤\n\n您可以选择以下任意一种方式进行安装。**推荐中国开发者使用“一键安装脚本”**，它会自动选择最快的下载源。\n\n### 方式一：一键安装脚本（推荐）\n\n该脚本会自动检测操作系统架构，测试 GitHub 和 Gitee 镜像速度，并自动配置环境变量。\n\n**Linux \u002F macOS:**\n```bash\ncurl -fsSL https:\u002F\u002Fraw.githubusercontent.com\u002Fbrowserwing\u002Fbrowserwing\u002Fmain\u002Finstall.sh | bash\n```\n\n**Windows (PowerShell):**\n```powershell\niwr -useb https:\u002F\u002Fraw.githubusercontent.com\u002Fbrowserwing\u002Fbrowserwing\u002Fmain\u002Finstall.ps1 | iex\n```\n\n### 方式二：包管理器安装\n\n**使用 npm:**\n```bash\nnpm install -g browserwing\n```\n\n**使用 pnpm:**\n```bash\npnpm add -g browserwing\n```\n> **注意**：npm\u002Fpnpm 包在安装时也会自动测试并选择最快的镜像源。\n\n**⚠️ macOS 用户特别提示：**\n如果在运行时报错 `killed`，请执行以下命令移除隔离属性：\n```bash\nxattr -d com.apple.quarantine $(which browserwing)\n```\n\n### 方式三：手动下载\n\n前往 [Releases 页面](https:\u002F\u002Fgithub.com\u002Fbrowserwing\u002Fbrowserwing\u002Freleases) 下载对应系统的二进制文件，解压后赋予执行权限即可。\n\n## 基本使用\n\n安装完成后，只需一条命令即可启动服务。\n\n### 1. 启动服务\n\n在终端运行以下命令（默认端口为 8080）：\n\n```bash\nbrowserwing --port 8080\n```\n\n启动成功后，在浏览器中访问：\n`http:\u002F\u002Flocalhost:8080`\n\n### 2. 快速体验自动化\n\n您有三种方式立即开始使用 BrowserWing：\n\n#### 方案 A：使用内置 AI 代理（最简单）\n1. 打开 Web 界面 `http:\u002F\u002Flocalhost:8080`。\n2. 进入 **\"AI Agent\"** 板块。\n3. 配置您的 LLM API Key（支持 OpenAI, Claude, DeepSeek 等）。\n4. 直接在对话框输入自然语言指令，例如：\n   > \"Navigate to example.com, search for 'AI tools', and extract the top 5 results\"\n\n#### 方案 B：集成到现有 AI 工具 (MCP 协议)\n如果您使用 Cursor、Claude Code 或其他支持 MCP 的工具，请在配置文件中添加：\n\n```json\n{\n  \"mcpServers\": {\n    \"browserwing\": {\n      \"type\": \"http\",\n      \"url\": \"http:\u002F\u002Flocalhost:8080\u002Fapi\u002Fv1\u002Fmcp\u002Fmessage\"\n    }\n  }\n}\n```\n配置完成后，即可在 AI 编辑器中直接调用浏览器自动化能力。\n\n#### 方案 C：导入 Skills 文件\n1. 下载 [SKILL.md](https:\u002F\u002Fraw.githubusercontent.com\u002Fbrowserwing\u002Fbrowserwing\u002Frefs\u002Fheads\u002Fmain\u002FSKILL.md) 文件。\n2. 将其导入到支持 Skills 协议的 AI 工具设置中。\n3. 通过自然语言对话控制浏览器。\n\n### 3. 录制与回放\n在 Web 界面中，您可以点击\"Record\"按钮录制浏览器操作，编辑后可直接回放，或导出为 MCP 命令\u002FSkills 文件供 AI 重复使用。","某电商数据分析师需要每日从多个竞品网站抓取实时价格、库存状态及促销信息，并整理成结构化报表供团队决策。\n\n### 没有 browserwing 时\n- **交互效率低下**：依赖大语言模型（LLM）逐步推理浏览器操作步骤，生成大量 Token，导致每次抓取任务耗时极长且响应缓慢。\n- **执行稳定性差**：基于自然语言指令的自动化容易因网页微小变动或模型幻觉而中断，难以维持稳定的登录会话和 Cookie 状态。\n- **数据提取困难**：非结构化的网页内容需要编写复杂的正则或 XPath，且每次网站改版都需人工重新调整脚本，维护成本高昂。\n- **技能复用性低**：针对不同网站的抓取逻辑散落在各种提示词中，无法沉淀为可重复调用的标准化工具或技能文件。\n\n### 使用 browserwing 后\n- **指令直连加速**：browserwing 将浏览器操作转化为直接的 MCP 命令或 Claude Skill，AI 代理直接调用接口而非通过文本推理，任务执行速度提升数倍。\n- **会话稳定可靠**：内置的会话管理机制自动处理 Cookie 和存储，确保在需要登录的竞品网站上也能长时间稳定运行，不再频繁掉线。\n- **智能语义提取**：利用 browserwing 集成的 LLM 语义提取能力，直接指定“获取价格和库存”即可输出结构化 JSON，无需手动编写解析规则。\n- **可视化脚本复用**：通过录制一次人工操作流程，即可在 browserwing 中可视化为脚本并导出为 Skill 文件，让 AI 在未来无限次精准复现该抓取任务。\n\nbrowserwing 通过将浏览器控制标准化为底层命令，彻底消除了 AI 代理操作浏览器的延迟与不确定性，让复杂的数据采集任务变得像调用本地函数一样高效可靠。","https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002Fbrowserwing_browserwing_9140b754.png","https:\u002F\u002Foss.gittoolsai.com\u002Favatars\u002Fbrowserwing_13e44f5d.png",null,"https:\u002F\u002Fgithub.com\u002Fbrowserwing",[80,84,88,92,96,100,104,108,112],{"name":81,"color":82,"percentage":83},"TypeScript","#3178c6",44.6,{"name":85,"color":86,"percentage":87},"Go","#00ADD8",42.5,{"name":89,"color":90,"percentage":91},"JavaScript","#f1e05a",10.1,{"name":93,"color":94,"percentage":95},"Shell","#89e051",1.1,{"name":97,"color":98,"percentage":99},"CSS","#663399",0.8,{"name":101,"color":102,"percentage":103},"Makefile","#427819",0.4,{"name":105,"color":106,"percentage":107},"PowerShell","#012456",0.3,{"name":109,"color":110,"percentage":111},"Dockerfile","#384d54",0.1,{"name":113,"color":114,"percentage":115},"HTML","#e34c26",0,1189,106,"2026-04-05T09:40:36","MIT","Linux, macOS, Windows","未说明",{"notes":123,"python":124,"dependencies":125},"该工具基于 Go 和 React 开发，不依赖 Python 环境。必须安装 Google Chrome 或 Chromium 浏览器。macOS 用户若遇到 'killed' 错误，需执行命令移除隔离属性（xattr -d com.apple.quarantine）。支持通过 MCP 协议或 Skills 文件与各类 AI 工具集成。","不需要",[126,127,128,129],"Go 1.21+","Google Chrome 或 Chromium","Node.js (隐含，用于 React\u002FVite\u002Fpnpm)","pnpm 9+",[26,13],[132,133,134,135],"aibrowser","golang","llm","react","2026-03-27T02:49:30.150509","2026-04-06T05:15:56.683509",[],[140,145,150,155],{"id":141,"version":142,"summary_zh":143,"released_at":144},108009,"v1.0.1-beta.2","## v1.0.1-beta.2\n\n### 新特性\n- **LLM BaseURL 支持**：LLM 客户端现支持自定义 BaseURL，以便与兼容 OpenAI 的服务集成。\n- **版本端点**：新增 \u002Fversion 端点，用于查看当前版本信息。\n- **NoSandbox 配置**：浏览器支持 NoSandbox 模式，适用于容器化部署。\n- **立即执行任务**：调度器支持立即执行任务，并保存执行结果。\n\n### 优化\n- **恐慌恢复**：为 iframe 脚本注入和导航操作添加了恐慌恢复机制。\n\n### 安装\n```bash\nnpm install -g browserwing@beta\n```","2026-03-06T02:21:13",{"id":146,"version":147,"summary_zh":148,"released_at":149},108010,"v1.0.1-beta.1","## 新增功能\n\n- **AI 控制模式**: 新增 AI 驱动的浏览器控制，支持临时会话和适配器接口\n- **多浏览器实例管理**: 支持创建、管理多个独立的浏览器实例\n- **定时任务系统**: 支持脚本的定时执行和任务管理\n- **XHR\u002FFetch 捕获**: 录制和回放时捕获网络请求\n- **Cookie 管理**: 新增 Cookie 的查看、单个删除和批量删除功能\n- **国际化 (i18n)**: 支持中英文界面切换\n- **MCP 服务管理**: 支持外部 MCP 服务的 CRUD 和工具发现\n- **脚本变量系统**: 支持脚本参数化和外部变量覆盖\n- **条件执行**: 基于变量的条件判断执行\n- **键盘动作**: 支持键盘输入录制和回放\n- **滚动动作**: 支持页面滚动录制和回放\n- **截图动作**: 支持视口\u002F全页\u002F区域截图\n- **AI Explorer**: AI 驱动的浏览器探索和脚本生成\n- **自定义 AI 提示词**: 可自定义 AI 操作的提示词系统\n- **RefID 系统**: 语义化元素选择，提升自动化稳定性\n- **代理支持**: 浏览器配置支持 HTTP\u002FSOCKS 代理\n- **认证系统**: 支持 JWT 和 API Key 认证\n\n详见 CHANGELOG.md","2026-03-03T01:16:02",{"id":151,"version":152,"summary_zh":153,"released_at":154},108011,"v1.0.0","# BrowserWing 1.0.0 发行说明 🎉\n\n\u003Cp align=\"center\">\n  \u003Cimg width=\"600\" alt=\"BrowserWing\" src=\"https:\u002F\u002Fraw.githubusercontent.com\u002Fbrowserwing\u002Fbrowserwing\u002Fmain\u002Fdocs\u002Fassets\u002Fbanner.svg\">\n\u003C\u002Fp>\n\n**发布日期:** 2026-01-25  \n**版本:** 1.0.0  \n**许可证:** MIT\n\n## 🌟 概述\n\nBrowserWing 1.0.0 是首个正式版本，提供了一个深度融合 AI 的完整浏览器自动化平台。它是一款功能强大的工具，专为开发者、QA 工程师、数据分析师以及 AI 应用开发者打造，让浏览器自动化变得简单、智能且高效。\n\n## ✨ 核心特性\n\n### 1. 🤖 内置 AI 助手\n\n**对话式浏览器控制**\n\n- **多大模型支持**: 兼容 OpenAI、Claude、DeepSeek、Gemini 等多种模型\n- **自然语言控制**: 用日常语言描述任务，AI 自动完成浏览器操作\n- **智能任务规划**: 自动评估任务复杂度并选择最优执行策略\n- **实时流式反馈**: 实时查看执行进度\n- **会话管理**: 支持多并发会话，每个会话可独立配置模型\n- **性能优化**:\n  - 启动时间缩短 89%（4.5 秒 → 0.5 秒）\n  - 内存占用降低 97%（800MB → 24MB）\n  - 简单查询响应速度提升 56%（4.5 秒 → 2 秒）\n\n**示例任务:**\n``` \n“打开 GitHub，搜索‘browser automation’，提取前 10 个项目的名称和星数”\n“登录 Twitter，发布一条推文：‘来自 BrowserWing 的问候！’”\n“监控亚马逊上的商品价格，当价格低于 50 美元时通知我”\n``` \n\n### 2. 🔌 通用 AI 工具集成\n\n**三种方式适配所有 AI 工具**\n\n#### 方法 1: MCP 服务器（推荐）\n\n- **标准协议**: 完整实现模型上下文协议 (MCP)\n- **零配置**: 一行 JSON 配置即可与任何兼容 MCP 的 AI 工具对接\n- **丰富工具集**: 包含导航、交互、数据提取、截图等 26+ 种浏览器控制工具\n\n```json\n{\n  \"mcpServers\": {\n    \"browserwing\": {\n      \"url\": \"http:\u002F\u002Flocalhost:8080\u002Fapi\u002Fv1\u002Fmcp\u002Fmessage\"\n    }\n  }\n}\n``` \n\n#### 方法 2: Skills 文件\n\n- **即插即用**: 下载 SKILL.md，导入到 Cursor、Windsurf 等支持 Skills 的工具中\n- **自动发现**: AI 工具会自动识别可用的浏览器控制能力\n- **自定义导出**: 可将录制的脚本导出为自定义 Skills 文件\n\n#### 方法 3: HTTP API\n\n- **26+ 个 RESTful 接口**: 提供完整的程序化浏览器控制能力\n- **OpenAPI 文档**: 标准化的 API 规范，便于集成\n- **批量操作**: 支持多步骤原子性执行\n\n### 3. 🎬 可视化脚本录制与回放\n\n**所见即所得的自动化流程**\n\n#### 录制功能\n- **一键录制**: 自动捕获点击、输入、选择、导航等操作\n- **语义化录制**: 基于 ARIA 角色和无障碍树稳定定位元素\n- **智能等待**: 自动检测页面加载、元素…","2026-01-25T15:07:45",{"id":156,"version":157,"summary_zh":158,"released_at":159},108012,"v0.0.1","# 概述\n\nBrowserWing 使 AI 代理能够通过 **MCP 命令** 控制浏览器，而非采用缓慢且消耗大量令牌的逐步交互方式。\n\n通过将浏览器执行置于命令边界之后，代理可以以更快的速度运行，并显著减少对大语言模型的调用次数。\n\n# 特性\n\n* 将浏览器自动化定义为可重用的 **MCP 命令**\n* 以最少的大语言模型交互执行浏览器操作\n* 本地浏览器控制，支持代理驱动的工作流\n* 简单的演示展示了基于命令的自动化\n\n# 动机\n\n当前的浏览器代理依赖频繁的大语言模型交互来进行 DOM 检查和推理，这导致了较高的延迟和令牌消耗。\n\nBrowserWing 通过让大语言模型专注于 **意图**，而由预定义的命令负责执行，从而降低了这种开销。\n\n# 注意事项\n\n* 处于早期发布阶段；API 可能会发生变化\n* 当前版本的命令集有限\n* 专注于本地实验\n\n# 后续计划\n\n* 命令组合与链式调用\n* 改进的编写工具\n* 更多真实场景的自动化示例\n\n# 反馈\n\n我们非常欢迎问题、讨论以及早期反馈。","2025-12-16T14:53:27"]