[{"data":1,"prerenderedAt":-1},["ShallowReactive",2],{"similar-browserbase--mcp-server-browserbase":3,"tool-browserbase--mcp-server-browserbase":62},[4,18,26,36,46,54],{"id":5,"name":6,"github_repo":7,"description_zh":8,"stars":9,"difficulty_score":10,"last_commit_at":11,"category_tags":12,"status":17},4358,"openclaw","openclaw\u002Fopenclaw","OpenClaw 是一款专为个人打造的本地化 AI 助手，旨在让你在自己的设备上拥有完全可控的智能伙伴。它打破了传统 AI 助手局限于特定网页或应用的束缚，能够直接接入你日常使用的各类通讯渠道，包括微信、WhatsApp、Telegram、Discord、iMessage 等数十种平台。无论你在哪个聊天软件中发送消息，OpenClaw 都能即时响应，甚至支持在 macOS、iOS 和 Android 设备上进行语音交互，并提供实时的画布渲染功能供你操控。\n\n这款工具主要解决了用户对数据隐私、响应速度以及“始终在线”体验的需求。通过将 AI 部署在本地，用户无需依赖云端服务即可享受快速、私密的智能辅助，真正实现了“你的数据，你做主”。其独特的技术亮点在于强大的网关架构，将控制平面与核心助手分离，确保跨平台通信的流畅性与扩展性。\n\nOpenClaw 非常适合希望构建个性化工作流的技术爱好者、开发者，以及注重隐私保护且不愿被单一生态绑定的普通用户。只要具备基础的终端操作能力（支持 macOS、Linux 及 Windows WSL2），即可通过简单的命令行引导完成部署。如果你渴望拥有一个懂你",349277,3,"2026-04-06T06:32:30",[13,14,15,16],"Agent","开发框架","图像","数据工具","ready",{"id":19,"name":20,"github_repo":21,"description_zh":22,"stars":23,"difficulty_score":10,"last_commit_at":24,"category_tags":25,"status":17},3808,"stable-diffusion-webui","AUTOMATIC1111\u002Fstable-diffusion-webui","stable-diffusion-webui 是一个基于 Gradio 构建的网页版操作界面，旨在让用户能够轻松地在本地运行和使用强大的 Stable Diffusion 图像生成模型。它解决了原始模型依赖命令行、操作门槛高且功能分散的痛点，将复杂的 AI 绘图流程整合进一个直观易用的图形化平台。\n\n无论是希望快速上手的普通创作者、需要精细控制画面细节的设计师，还是想要深入探索模型潜力的开发者与研究人员，都能从中获益。其核心亮点在于极高的功能丰富度：不仅支持文生图、图生图、局部重绘（Inpainting）和外绘（Outpainting）等基础模式，还独创了注意力机制调整、提示词矩阵、负向提示词以及“高清修复”等高级功能。此外，它内置了 GFPGAN 和 CodeFormer 等人脸修复工具，支持多种神经网络放大算法，并允许用户通过插件系统无限扩展能力。即使是显存有限的设备，stable-diffusion-webui 也提供了相应的优化选项，让高质量的 AI 艺术创作变得触手可及。",162132,"2026-04-05T11:01:52",[14,15,13],{"id":27,"name":28,"github_repo":29,"description_zh":30,"stars":31,"difficulty_score":32,"last_commit_at":33,"category_tags":34,"status":17},1381,"everything-claude-code","affaan-m\u002Feverything-claude-code","everything-claude-code 是一套专为 AI 编程助手（如 Claude Code、Codex、Cursor 等）打造的高性能优化系统。它不仅仅是一组配置文件，而是一个经过长期实战打磨的完整框架，旨在解决 AI 代理在实际开发中面临的效率低下、记忆丢失、安全隐患及缺乏持续学习能力等核心痛点。\n\n通过引入技能模块化、直觉增强、记忆持久化机制以及内置的安全扫描功能，everything-claude-code 能显著提升 AI 在复杂任务中的表现，帮助开发者构建更稳定、更智能的生产级 AI 代理。其独特的“研究优先”开发理念和针对 Token 消耗的优化策略，使得模型响应更快、成本更低，同时有效防御潜在的攻击向量。\n\n这套工具特别适合软件开发者、AI 研究人员以及希望深度定制 AI 工作流的技术团队使用。无论您是在构建大型代码库，还是需要 AI 协助进行安全审计与自动化测试，everything-claude-code 都能提供强大的底层支持。作为一个曾荣获 Anthropic 黑客大奖的开源项目，它融合了多语言支持与丰富的实战钩子（hooks），让 AI 真正成长为懂上",159267,2,"2026-04-17T11:29:14",[14,13,35],"语言模型",{"id":37,"name":38,"github_repo":39,"description_zh":40,"stars":41,"difficulty_score":42,"last_commit_at":43,"category_tags":44,"status":17},8272,"opencode","anomalyco\u002Fopencode","OpenCode 是一款开源的 AI 编程助手（Coding Agent），旨在像一位智能搭档一样融入您的开发流程。它不仅仅是一个代码补全插件，而是一个能够理解项目上下文、自主规划任务并执行复杂编码操作的智能体。无论是生成全新功能、重构现有代码，还是排查难以定位的 Bug，OpenCode 都能通过自然语言交互高效完成，显著减少开发者在重复性劳动和上下文切换上的时间消耗。\n\n这款工具专为软件开发者、工程师及技术研究人员设计，特别适合希望利用大模型能力来提升编码效率、加速原型开发或处理遗留代码维护的专业人群。其核心亮点在于完全开源的架构，这意味着用户可以审查代码逻辑、自定义行为策略，甚至私有化部署以保障数据安全，彻底打破了传统闭源 AI 助手的“黑盒”限制。\n\n在技术体验上，OpenCode 提供了灵活的终端界面（Terminal UI）和正在测试中的桌面应用程序，支持 macOS、Windows 及 Linux 全平台。它兼容多种包管理工具，安装便捷，并能无缝集成到现有的开发环境中。无论您是追求极致控制权的资深极客，还是渴望提升产出的独立开发者，OpenCode 都提供了一个透明、可信",144296,1,"2026-04-16T14:50:03",[13,45],"插件",{"id":47,"name":48,"github_repo":49,"description_zh":50,"stars":51,"difficulty_score":32,"last_commit_at":52,"category_tags":53,"status":17},2271,"ComfyUI","Comfy-Org\u002FComfyUI","ComfyUI 是一款功能强大且高度模块化的视觉 AI 引擎，专为设计和执行复杂的 Stable Diffusion 图像生成流程而打造。它摒弃了传统的代码编写模式，采用直观的节点式流程图界面，让用户通过连接不同的功能模块即可构建个性化的生成管线。\n\n这一设计巧妙解决了高级 AI 绘图工作流配置复杂、灵活性不足的痛点。用户无需具备编程背景，也能自由组合模型、调整参数并实时预览效果，轻松实现从基础文生图到多步骤高清修复等各类复杂任务。ComfyUI 拥有极佳的兼容性，不仅支持 Windows、macOS 和 Linux 全平台，还广泛适配 NVIDIA、AMD、Intel 及苹果 Silicon 等多种硬件架构，并率先支持 SDXL、Flux、SD3 等前沿模型。\n\n无论是希望深入探索算法潜力的研究人员和开发者，还是追求极致创作自由度的设计师与资深 AI 绘画爱好者，ComfyUI 都能提供强大的支持。其独特的模块化架构允许社区不断扩展新功能，使其成为当前最灵活、生态最丰富的开源扩散模型工具之一，帮助用户将创意高效转化为现实。",108322,"2026-04-10T11:39:34",[14,15,13],{"id":55,"name":56,"github_repo":57,"description_zh":58,"stars":59,"difficulty_score":32,"last_commit_at":60,"category_tags":61,"status":17},6121,"gemini-cli","google-gemini\u002Fgemini-cli","gemini-cli 是一款由谷歌推出的开源 AI 命令行工具，它将强大的 Gemini 大模型能力直接集成到用户的终端环境中。对于习惯在命令行工作的开发者而言，它提供了一条从输入提示词到获取模型响应的最短路径，无需切换窗口即可享受智能辅助。\n\n这款工具主要解决了开发过程中频繁上下文切换的痛点，让用户能在熟悉的终端界面内直接完成代码理解、生成、调试以及自动化运维任务。无论是查询大型代码库、根据草图生成应用，还是执行复杂的 Git 操作，gemini-cli 都能通过自然语言指令高效处理。\n\n它特别适合广大软件工程师、DevOps 人员及技术研究人员使用。其核心亮点包括支持高达 100 万 token 的超长上下文窗口，具备出色的逻辑推理能力；内置 Google 搜索、文件操作及 Shell 命令执行等实用工具；更独特的是，它支持 MCP（模型上下文协议），允许用户灵活扩展自定义集成，连接如图像生成等外部能力。此外，个人谷歌账号即可享受免费的额度支持，且项目基于 Apache 2.0 协议完全开源，是提升终端工作效率的理想助手。",100752,"2026-04-10T01:20:03",[45,13,15,14],{"id":63,"github_repo":64,"name":65,"description_en":66,"description_zh":67,"ai_summary_zh":68,"readme_en":69,"readme_zh":70,"quickstart_zh":71,"use_case_zh":72,"hero_image_url":73,"owner_login":74,"owner_name":74,"owner_avatar_url":75,"owner_bio":76,"owner_company":77,"owner_location":77,"owner_email":77,"owner_twitter":74,"owner_website":78,"owner_url":79,"languages":80,"stars":96,"forks":97,"last_commit_at":98,"license":99,"difficulty_score":32,"env_os":100,"env_gpu":101,"env_ram":101,"env_deps":102,"category_tags":109,"github_topics":110,"view_count":32,"oss_zip_url":77,"oss_zip_packed_at":77,"status":17,"created_at":118,"updated_at":119,"faqs":120,"releases":151},8616,"browserbase\u002Fmcp-server-browserbase","mcp-server-browserbase","Allow LLMs to control a browser with Browserbase and Stagehand","mcp-server-browserbase 是一款基于模型上下文协议（MCP）的开源工具，旨在让大语言模型（LLM）直接掌控云端浏览器。它通过集成 Browserbase 和 Stagehand 技术，赋予 AI“眼睛”和“双手”，使其能够自主执行网页导航、元素观察、指令操作及数据提取等复杂任务，将原本静态的对话式 AI 升级为能主动交互的智能代理。\n\n该工具主要解决了大模型无法直接访问实时网络内容或执行网页操作的痛点。以往开发者需要编写大量繁琐的代码来模拟用户行为，而现在只需通过自然语言指令，模型即可在隔离的云端环境中完成自动化流程，极大降低了网页自动化开发的门槛。\n\n它特别适合 AI 应用开发者、研究人员以及希望构建自定义智能工作流的技术人员使用。无论是打造具备联网能力的 AI IDE，还是开发能自动抓取信息的聊天机器人，mcp-server-browserbase 都能提供标准化的连接方案。\n\n其技术亮点在于提供了灵活的部署选项：既支持零配置托管服务以快速上手，也允许开发者通过 Docker 或本地源码完全私有化部署，确保数据安全与定制化需求。此外，它内置了针对网页交互优化的最","mcp-server-browserbase 是一款基于模型上下文协议（MCP）的开源工具，旨在让大语言模型（LLM）直接掌控云端浏览器。它通过集成 Browserbase 和 Stagehand 技术，赋予 AI“眼睛”和“双手”，使其能够自主执行网页导航、元素观察、指令操作及数据提取等复杂任务，将原本静态的对话式 AI 升级为能主动交互的智能代理。\n\n该工具主要解决了大模型无法直接访问实时网络内容或执行网页操作的痛点。以往开发者需要编写大量繁琐的代码来模拟用户行为，而现在只需通过自然语言指令，模型即可在隔离的云端环境中完成自动化流程，极大降低了网页自动化开发的门槛。\n\n它特别适合 AI 应用开发者、研究人员以及希望构建自定义智能工作流的技术人员使用。无论是打造具备联网能力的 AI IDE，还是开发能自动抓取信息的聊天机器人，mcp-server-browserbase 都能提供标准化的连接方案。\n\n其技术亮点在于提供了灵活的部署选项：既支持零配置托管服务以快速上手，也允许开发者通过 Docker 或本地源码完全私有化部署，确保数据安全与定制化需求。此外，它内置了针对网页交互优化的最佳实践模型，显著提升了自动化任务的准确率与稳定性。","# Browserbase MCP Server\n\n![cover](https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002Fbrowserbase_mcp-server-browserbase_readme_52cf80858559.png)\n\n[The Model Context Protocol (MCP)](https:\u002F\u002Fmodelcontextprotocol.io\u002Fintroduction) is an open protocol that enables seamless integration between LLM applications and external data sources and tools. Whether you're building an AI-powered IDE, enhancing a chat interface, or creating custom AI workflows, MCP provides a standardized way to connect LLMs with the context they need.\n\nThis server provides cloud browser automation capabilities using [Browserbase](https:\u002F\u002Fwww.browserbase.com\u002F) and [Stagehand](https:\u002F\u002Fgithub.com\u002Fbrowserbase\u002Fstagehand). It enables LLMs to interact with web pages, extract information, and perform automated actions.\n\nThis is a self-hostable version of the [Browserbase hosted MCP server](https:\u002F\u002Fmcp.browserbase.com\u002Fmcp) with the same tools and functionality. **We recommend using the hosted version for the easiest setup.**\n\n## Tools\n\nThis server exposes 6 tools that match the [hosted Browserbase MCP server](https:\u002F\u002Fdocs.browserbase.com\u002Fintegrations\u002Fmcp\u002Fintroduction):\n\n| Tool       | Description                             | Input                      |\n| ---------- | --------------------------------------- | -------------------------- |\n| `start`    | Create or reuse a Browserbase session   | _(none)_                   |\n| `end`      | Close the current Browserbase session   | _(none)_                   |\n| `navigate` | Navigate to a URL                       | `{ url: string }`          |\n| `act`      | Perform an action on the page           | `{ action: string }`       |\n| `observe`  | Observe actionable elements on the page | `{ instruction: string }`  |\n| `extract`  | Extract data from the page              | `{ instruction?: string }` |\n\n## How to Setup\n\nWe currently support 2 transports for our MCP server, STDIO and SHTTP. We recommend you use SHTTP with our hosted MCP server to take advantage of the server at full capacity.\n\n## SHTTP (Hosted MCP):\n\nUse the Browserbase hosted MCP server at `https:\u002F\u002Fmcp.browserbase.com\u002Fmcp`. This is the easiest way to get started -- we host the server and provide the LLM costs for Gemini, the [best performing model](https:\u002F\u002Fwww.stagehand.dev\u002Fevals) in [Stagehand](https:\u002F\u002Fwww.stagehand.dev).\n\nFor full setup instructions, see the [Browserbase MCP documentation](https:\u002F\u002Fdocs.browserbase.com\u002Fintegrations\u002Fmcp\u002Fintroduction).\n\nIf your client supports SHTTP:\n\n```json\n{\n  \"mcpServers\": {\n    \"browserbase\": {\n      \"type\": \"http\",\n      \"url\": \"https:\u002F\u002Fmcp.browserbase.com\u002Fmcp\"\n    }\n  }\n}\n```\n\nIf your client doesn't support SHTTP:\n\n```json\n{\n  \"mcpServers\": {\n    \"browserbase\": {\n      \"command\": \"npx\",\n      \"args\": [\"mcp-remote\", \"https:\u002F\u002Fmcp.browserbase.com\u002Fmcp\"]\n    }\n  }\n}\n```\n\n## STDIO (Self-Hosted):\n\nYou can either use our server hosted on NPM or run it completely locally by cloning this repo.\n\n> **Note:** If you want to use a different model you have to add --modelName to the args and provide that respective key as an arg. More info below.\n\n### To run via NPM (Recommended)\n\nGo into your MCP Config JSON and add the Browserbase Server:\n\n```json\n{\n  \"mcpServers\": {\n    \"browserbase\": {\n      \"command\": \"npx\",\n      \"args\": [\"@browserbasehq\u002Fmcp\"],\n      \"env\": {\n        \"BROWSERBASE_API_KEY\": \"\",\n        \"BROWSERBASE_PROJECT_ID\": \"\",\n        \"GEMINI_API_KEY\": \"\"\n      }\n    }\n  }\n}\n```\n\nThat's it! Reload your MCP client and you're ready to go.\n\n### To run 100% local:\n\n#### Option 1: Direct installation\n\n```bash\ngit clone https:\u002F\u002Fgithub.com\u002Fbrowserbase\u002Fmcp-server-browserbase.git\ncd mcp-server-browserbase\nnpm install && npm run build\n```\n\n#### Option 2: Docker\n\n```bash\ngit clone https:\u002F\u002Fgithub.com\u002Fbrowserbase\u002Fmcp-server-browserbase.git\ncd mcp-server-browserbase\ndocker build -t mcp-browserbase .\n```\n\nThen in your MCP Config JSON run the server:\n\n#### Using Direct Installation\n\n```json\n{\n  \"mcpServers\": {\n    \"browserbase\": {\n      \"command\": \"node\",\n      \"args\": [\"\u002Fpath\u002Fto\u002Fmcp-server-browserbase\u002Fcli.js\"],\n      \"env\": {\n        \"BROWSERBASE_API_KEY\": \"\",\n        \"BROWSERBASE_PROJECT_ID\": \"\",\n        \"GEMINI_API_KEY\": \"\"\n      }\n    }\n  }\n}\n```\n\n#### Using Docker\n\n```json\n{\n  \"mcpServers\": {\n    \"browserbase\": {\n      \"command\": \"docker\",\n      \"args\": [\n        \"run\",\n        \"--rm\",\n        \"-i\",\n        \"-e\",\n        \"BROWSERBASE_API_KEY\",\n        \"-e\",\n        \"BROWSERBASE_PROJECT_ID\",\n        \"-e\",\n        \"GEMINI_API_KEY\",\n        \"mcp-browserbase\"\n      ],\n      \"env\": {\n        \"BROWSERBASE_API_KEY\": \"\",\n        \"BROWSERBASE_PROJECT_ID\": \"\",\n        \"GEMINI_API_KEY\": \"\"\n      }\n    }\n  }\n}\n```\n\n## Configuration\n\nThe Browserbase MCP server accepts the following command-line flags:\n\n| Flag                       | Description                                                                 |\n| -------------------------- | --------------------------------------------------------------------------- |\n| `--proxies`                | Enable Browserbase proxies for the session                                  |\n| `--advancedStealth`        | Enable Browserbase Advanced Stealth (Only for Scale Plan Users)             |\n| `--keepAlive`              | Enable Browserbase Keep Alive Session                                       |\n| `--contextId \u003CcontextId>`  | Specify a Browserbase Context ID to use                                     |\n| `--persist`                | Whether to persist the Browserbase context (default: true)                  |\n| `--port \u003Cport>`            | Port to listen on for HTTP\u002FSHTTP transport                                  |\n| `--host \u003Chost>`            | Host to bind server to (default: localhost, use 0.0.0.0 for all interfaces) |\n| `--browserWidth \u003Cwidth>`   | Browser viewport width (default: 1024)                                      |\n| `--browserHeight \u003Cheight>` | Browser viewport height (default: 768)                                      |\n| `--modelName \u003Cmodel>`      | The model to use for Stagehand (default: google\u002Fgemini-2.5-flash-lite)      |\n| `--modelApiKey \u003Ckey>`      | API key for the custom model provider (required when using custom models)   |\n| `--experimental`           | Enable experimental features (default: false)                               |\n\nThese flags can be passed directly to the CLI or configured in your MCP configuration file.\n\n> **Note:** These flags can only be used with the self-hosted server (npx @browserbasehq\u002Fmcp or Docker).\n\n### Model Configuration\n\nStagehand defaults to using Google's Gemini 2.5 Flash Lite model, but you can configure it to use other models like GPT-4o, Claude, or other providers.\n\n**Important**: When using any custom model (non-default), you must provide your own API key for that model provider using the `--modelApiKey` flag.\n\n```json\n{\n  \"mcpServers\": {\n    \"browserbase\": {\n      \"command\": \"npx\",\n      \"args\": [\n        \"@browserbasehq\u002Fmcp\",\n        \"--modelName\",\n        \"anthropic\u002Fclaude-sonnet-4.5\",\n        \"--modelApiKey\",\n        \"your-anthropic-api-key\"\n      ],\n      \"env\": {\n        \"BROWSERBASE_API_KEY\": \"\",\n        \"BROWSERBASE_PROJECT_ID\": \"\"\n      }\n    }\n  }\n}\n```\n\n_Note: The model must be supported in Stagehand. Check out the docs [here](https:\u002F\u002Fdocs.stagehand.dev\u002Fexamples\u002Fcustom_llms#supported-llms)._\n\n## Links\n\n- [Browserbase MCP Documentation](https:\u002F\u002Fdocs.browserbase.com\u002Fintegrations\u002Fmcp\u002Fintroduction)\n- [MCP Documentation](https:\u002F\u002Fmodelcontextprotocol.io\u002Fdocs)\n- [MCP Specification](https:\u002F\u002Fspec.modelcontextprotocol.io\u002F)\n- [Stagehand Documentation](https:\u002F\u002Fdocs.stagehand.dev\u002F)\n\n## License\n\nLicensed under the Apache 2.0 License.\n\nCopyright 2025 Browserbase, Inc.\n","# Browserbase MCP 服务器\n\n![封面](https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002Fbrowserbase_mcp-server-browserbase_readme_52cf80858559.png)\n\n[模型上下文协议 (MCP)](https:\u002F\u002Fmodelcontextprotocol.io\u002Fintroduction) 是一种开放协议，能够实现 LLM 应用与外部数据源和工具之间的无缝集成。无论您是在构建一个 AI 驱动的 IDE、增强聊天界面，还是创建自定义的 AI 工作流，MCP 都提供了一种标准化的方式来连接 LLM 和它们所需的上下文。\n\n该服务器使用 [Browserbase](https:\u002F\u002Fwww.browserbase.com\u002F) 和 [Stagehand](https:\u002F\u002Fgithub.com\u002Fbrowserbase\u002Fstagehand) 提供云端浏览器自动化功能。它使 LLM 能够与网页交互、提取信息并执行自动化操作。\n\n这是 [Browserbase 托管 MCP 服务器](https:\u002F\u002Fmcp.browserbase.com\u002Fmcp) 的自托管版本，具备相同的工具和功能。**我们建议使用托管版本以获得最简单的部署方式。**\n\n## 工具\n\n该服务器公开了 6 种工具，与 [Browserbase 托管 MCP 服务器](https:\u002F\u002Fdocs.browserbase.com\u002Fintegrations\u002Fmcp\u002Fintroduction) 相匹配：\n\n| 工具       | 描述                             | 输入                      |\n| ---------- | --------------------------------------- | -------------------------- |\n| `start`    | 创建或重用一个 Browserbase 会话   | _(无)_                   |\n| `end`      | 关闭当前的 Browserbase 会话   | _(无)_                   |\n| `navigate` | 导航到一个 URL                       | `{ url: string }`          |\n| `act`      | 在页面上执行一个操作           | `{ action: string }`       |\n| `observe`  | 观察页面上的可操作元素         | `{ instruction: string }`  |\n| `extract`  | 从页面中提取数据              | `{ instruction?: string }` |\n\n## 如何部署\n\n我们目前支持两种传输方式：STDIO 和 SHTTP。我们建议您使用 SHTTP 搭配我们的托管 MCP 服务器，以便充分利用服务器的所有功能。\n\n## SHTTP（托管 MCP）：\n\n请使用 Browserbase 托管的 MCP 服务器 `https:\u002F\u002Fmcp.browserbase.com\u002Fmcp`。这是最简单的入门方式——我们负责托管服务器，并承担 Gemini 模型的费用，Gemini 是 [Stagehand](https:\u002F\u002Fwww.stagehand.dev) 中表现最佳的模型。\n\n有关完整的部署说明，请参阅 [Browserbase MCP 文档](https:\u002F\u002Fdocs.browserbase.com\u002Fintegrations\u002Fmcp\u002Fintroduction)。\n\n如果您的客户端支持 SHTTP：\n\n```json\n{\n  \"mcpServers\": {\n    \"browserbase\": {\n      \"type\": \"http\",\n      \"url\": \"https:\u002F\u002Fmcp.browserbase.com\u002Fmcp\"\n    }\n  }\n}\n```\n\n如果您的客户端不支持 SHTTP：\n\n```json\n{\n  \"mcpServers\": {\n    \"browserbase\": {\n      \"command\": \"npx\",\n      \"args\": [\"mcp-remote\", \"https:\u002F\u002Fmcp.browserbase.com\u002Fmcp\"]\n    }\n  }\n}\n```\n\n## STDIO（自托管）：\n\n您可以选择使用我们在 NPM 上托管的服务器，也可以通过克隆此仓库完全在本地运行。\n\n> **注意：** 如果您想使用不同的模型，必须在参数中添加 `--modelName`，并将相应的密钥作为参数传入。更多信息见下文。\n\n### 通过 NPM 运行（推荐）\n\n进入您的 MCP 配置 JSON 文件，添加 Browserbase 服务器：\n\n```json\n{\n  \"mcpServers\": {\n    \"browserbase\": {\n      \"command\": \"npx\",\n      \"args\": [\"@browserbasehq\u002Fmcp\"],\n      \"env\": {\n        \"BROWSERBASE_API_KEY\": \"\",\n        \"BROWSERBASE_PROJECT_ID\": \"\",\n        \"GEMINI_API_KEY\": \"\"\n      }\n    }\n  }\n}\n```\n\n仅此而已！重新加载您的 MCP 客户端，您就可以开始使用了。\n\n### 完全本地运行：\n\n#### 选项 1：直接安装\n\n```bash\ngit clone https:\u002F\u002Fgithub.com\u002Fbrowserbase\u002Fmcp-server-browserbase.git\ncd mcp-server-browserbase\nnpm install && npm run build\n```\n\n#### 选项 2：Docker\n\n```bash\ngit clone https:\u002F\u002Fgithub.com\u002Fbrowserbase\u002Fmcp-server-browserbase.git\ncd mcp-server-browserbase\ndocker build -t mcp-browserbase .\n```\n\n然后在您的 MCP 配置 JSON 文件中运行服务器：\n\n#### 使用直接安装\n\n```json\n{\n  \"mcpServers\": {\n    \"browserbase\": {\n      \"command\": \"node\",\n      \"args\": [\"\u002Fpath\u002Fto\u002Fmcp-server-browserbase\u002Fcli.js\"],\n      \"env\": {\n        \"BROWSERBASE_API_KEY\": \"\",\n        \"BROWSERBASE_PROJECT_ID\": \"\",\n        \"GEMINI_API_KEY\": \"\"\n      }\n    }\n  }\n}\n```\n\n#### 使用 Docker\n\n```json\n{\n  \"mcpServers\": {\n    \"browserbase\": {\n      \"command\": \"docker\",\n      \"args\": [\n        \"run\",\n        \"--rm\",\n        \"-i\",\n        \"-e\",\n        \"BROWSERBASE_API_KEY\",\n        \"-e\",\n        \"BROWSERBASE_PROJECT_ID\",\n        \"-e\",\n        \"GEMINI_API_KEY\",\n        \"mcp-browserbase\"\n      ],\n      \"env\": {\n        \"BROWSERBASE_API_KEY\": \"\",\n        \"BROWSERBASE_PROJECT_ID\": \"\",\n        \"GEMINI_API_KEY\": \"\"\n      }\n    }\n  }\n}\n```\n\n## 配置\n\nBrowserbase MCP 服务器接受以下命令行参数：\n\n| 参数                       | 描述                                                                 |\n| -------------------------- | --------------------------------------------------------------------------- |\n| `--proxies`                | 为会话启用 Browserbase 代理                                  |\n| `--advancedStealth`        | 启用 Browserbase 高级隐身模式（仅适用于 Scale 计划用户）             |\n| `--keepAlive`              | 启用 Browserbase 保持会话活跃                                       |\n| `--contextId \u003CcontextId>`  | 指定要使用的 Browserbase 上下文 ID                                     |\n| `--persist`                | 是否持久化 Browserbase 上下文（默认：是）                  |\n| `--port \u003Cport>`            | 用于 HTTP\u002FSHTTP 传输的监听端口                                  |\n| `--host \u003Chost>`            | 绑定服务器的主机地址（默认：localhost，使用 0.0.0.0 可监听所有接口） |\n| `--browserWidth \u003Cwidth>`   | 浏览器视口宽度（默认：1024）                                      |\n| `--browserHeight \u003Cheight>` | 浏览器视口高度（默认：768）                                      |\n| `--modelName \u003Cmodel>`      | 用于 Stagehand 的模型（默认：google\u002Fgemini-2.5-flash-lite）      |\n| `--modelApiKey \u003Ckey>`      | 自定义模型提供商的 API 密钥（使用自定义模型时必填）           |\n| `--experimental`           | 启用实验性功能（默认：否）                               |\n\n这些参数可以直接传递给 CLI，也可以在您的 MCP 配置文件中进行设置。\n\n> **注意：** 这些参数仅适用于自托管服务器（npx @browserbasehq\u002Fmcp 或 Docker）。\n\n### 模型配置\n\nStagehand 默认使用 Google 的 Gemini 2.5 Flash Lite 模型，但你也可以将其配置为使用其他模型，例如 GPT-4o、Claude 或其他提供商的模型。\n\n**重要提示**：当使用任何自定义模型（非默认模型）时，必须通过 `--modelApiKey` 标志提供该模型提供商的 API 密钥。\n\n```json\n{\n  \"mcpServers\": {\n    \"browserbase\": {\n      \"command\": \"npx\",\n      \"args\": [\n        \"@browserbasehq\u002Fmcp\",\n        \"--modelName\",\n        \"anthropic\u002Fclaude-sonnet-4.5\",\n        \"--modelApiKey\",\n        \"your-anthropic-api-key\"\n      ],\n      \"env\": {\n        \"BROWSERBASE_API_KEY\": \"\",\n        \"BROWSERBASE_PROJECT_ID\": \"\"\n      }\n    }\n  }\n}\n```\n\n_注意：所选模型必须受 Stagehand 支持。请参阅文档 [此处](https:\u002F\u002Fdocs.stagehand.dev\u002Fexamples\u002Fcustom_llms#supported-llms)。_\n\n## 链接\n\n- [Browserbase MCP 文档](https:\u002F\u002Fdocs.browserbase.com\u002Fintegrations\u002Fmcp\u002Fintroduction)\n- [MCP 文档](https:\u002F\u002Fmodelcontextprotocol.io\u002Fdocs)\n- [MCP 规范](https:\u002F\u002Fspec.modelcontextprotocol.io\u002F)\n- [Stagehand 文档](https:\u002F\u002Fdocs.stagehand.dev\u002F)\n\n## 许可证\n\n根据 Apache 2.0 许可证授权。\n\n版权所有 © 2025 Browserbase, Inc.","# mcp-server-browserbase 快速上手指南\n\n`mcp-server-browserbase` 是一个基于 Model Context Protocol (MCP) 的服务器，它利用 Browserbase 和 Stagehand 为大语言模型（LLM）提供云端浏览器自动化能力。通过该工具，LLM 可以自动浏览网页、提取信息并执行操作。\n\n## 环境准备\n\n在开始之前，请确保满足以下要求：\n\n*   **操作系统**：Linux, macOS 或 Windows (需安装 WSL 或 Git Bash)。\n*   **Node.js**：版本 18 或更高 (推荐最新 LTS 版本)。\n*   **MCP 客户端**：已安装支持 MCP 协议的 AI 编辑器或客户端 (如 Cursor, Windsurf, Cline 等)。\n*   **API 密钥**：\n    *   `BROWSERBASE_API_KEY`: 来自 [Browserbase](https:\u002F\u002Fwww.browserbase.com\u002F) 的 API Key。\n    *   `BROWSERBASE_PROJECT_ID`: 你的 Browserbase 项目 ID。\n    *   `GEMINI_API_KEY`: Google Gemini API Key (默认模型所需，若更换模型需提供对应 Key)。\n\n## 安装步骤\n\n推荐使用 **NPM** 方式运行，这是最简便的自托管方案。你也可以选择完全本地源码编译或 Docker 运行。\n\n### 方案一：通过 NPM 运行（推荐）\n\n无需克隆代码，直接在 MCP 配置中调用。\n\n1.  打开你的 MCP 配置文件 (通常为 `config.json` 或在客户端设置中)。\n2.  添加以下配置项，并填入你的环境变量：\n\n```json\n{\n  \"mcpServers\": {\n    \"browserbase\": {\n      \"command\": \"npx\",\n      \"args\": [\"@browserbasehq\u002Fmcp\"],\n      \"env\": {\n        \"BROWSERBASE_API_KEY\": \"你的_BROWSERBASE_API_KEY\",\n        \"BROWSERBASE_PROJECT_ID\": \"你的_BROWSERBASE_PROJECT_ID\",\n        \"GEMINI_API_KEY\": \"你的_GEMINI_API_KEY\"\n      }\n    }\n  }\n}\n```\n\n3.  保存文件并重启 MCP 客户端。\n\n### 方案二：100% 本地运行 (源码或 Docker)\n\n如果你需要完全控制运行环境：\n\n#### 选项 A：直接安装源码\n\n```bash\ngit clone https:\u002F\u002Fgithub.com\u002Fbrowserbase\u002Fmcp-server-browserbase.git\ncd mcp-server-browserbase\nnpm install && npm run build\n```\n\n配置 MCP (`config.json`)：\n\n```json\n{\n  \"mcpServers\": {\n    \"browserbase\": {\n      \"command\": \"node\",\n      \"args\": [\"\u002F绝对路径\u002Fto\u002Fmcp-server-browserbase\u002Fcli.js\"],\n      \"env\": {\n        \"BROWSERBASE_API_KEY\": \"你的_BROWSERBASE_API_KEY\",\n        \"BROWSERBASE_PROJECT_ID\": \"你的_BROWSERBASE_PROJECT_ID\",\n        \"GEMINI_API_KEY\": \"你的_GEMINI_API_KEY\"\n      }\n    }\n  }\n}\n```\n\n#### 选项 B：使用 Docker\n\n```bash\ngit clone https:\u002F\u002Fgithub.com\u002Fbrowserbase\u002Fmcp-server-browserbase.git\ncd mcp-server-browserbase\ndocker build -t mcp-browserbase .\n```\n\n配置 MCP (`config.json`)：\n\n```json\n{\n  \"mcpServers\": {\n    \"browserbase\": {\n      \"command\": \"docker\",\n      \"args\": [\n        \"run\",\n        \"--rm\",\n        \"-i\",\n        \"-e\",\n        \"BROWSERBASE_API_KEY\",\n        \"-e\",\n        \"BROWSERBASE_PROJECT_ID\",\n        \"-e\",\n        \"GEMINI_API_KEY\",\n        \"mcp-browserbase\"\n      ],\n      \"env\": {\n        \"BROWSERBASE_API_KEY\": \"你的_BROWSERBASE_API_KEY\",\n        \"BROWSERBASE_PROJECT_ID\": \"你的_BROWSERBASE_PROJECT_ID\",\n        \"GEMINI_API_KEY\": \"你的_GEMINI_API_KEY\"\n      }\n    }\n  }\n}\n```\n\n> **提示**：如果希望使用最简单的设置且无需自托管，可直接使用 Browserbase 提供的托管服务 (`https:\u002F\u002Fmcp.browserbase.com\u002Fmcp`)，配置方式见原文 \"SHTTP (Hosted MCP)\" 部分。\n\n## 基本使用\n\n配置完成后，重启你的 AI 助手。该服务器会自动暴露以下 6 个工具供 LLM 调用：\n\n| 工具名称 | 功能描述 | 输入参数示例 |\n| :--- | :--- | :--- |\n| `start` | 创建或复用浏览器会话 | 无 |\n| `end` | 关闭当前浏览器会话 | 无 |\n| `navigate` | 跳转到指定 URL | `{ \"url\": \"https:\u002F\u002Fexample.com\" }` |\n| `act` | 在页面上执行操作 (点击、输入等) | `{ \"action\": \"click the login button\" }` |\n| `observe` | 观察页面上可操作的元素 | `{ \"instruction\": \"find the search box\" }` |\n| `extract` | 从页面提取数据 | `{ \"instruction\": \"extract all product prices\" }` |\n\n### 使用示例\n\n你可以在对话框中直接使用自然语言指令，例如：\n\n> \"帮我访问 https:\u002F\u002Fnews.ycombinator.com，观察页面上的头条新闻标题，并将它们提取出来列给我。\"\n\nLLM 将自动按顺序调用 `start` -> `navigate` -> `observe` -> `extract` -> `end` 来完成任务。\n\n### 自定义模型配置\n\n默认使用 `google\u002Fgemini-2.5-flash-lite`。若需切换模型（如 Claude 3.5 Sonnet），需在 `args` 中添加 `--modelName` 和 `--modelApiKey`：\n\n```json\n{\n  \"mcpServers\": {\n    \"browserbase\": {\n      \"command\": \"npx\",\n      \"args\": [\n        \"@browserbasehq\u002Fmcp\",\n        \"--modelName\",\n        \"anthropic\u002Fclaude-sonnet-4.5\",\n        \"--modelApiKey\",\n        \"你的_Anthropic_API_Key\"\n      ],\n      \"env\": {\n        \"BROWSERBASE_API_KEY\": \"你的_BROWSERBASE_API_KEY\",\n        \"BROWSERBASE_PROJECT_ID\": \"你的_BROWSERBASE_PROJECT_ID\"\n      }\n    }\n  }\n}\n```\n\n*注意：自定义模型必须在 Stagehand 支持列表中。*","某电商数据分析师需要每日从多个竞争对手网站抓取实时价格、库存状态及促销活动信息，以生成动态定价报告。\n\n### 没有 mcp-server-browserbase 时\n- 必须手动编写和维护复杂的 Selenium 或 Puppeteer 脚本，一旦目标网站调整 DOM 结构，脚本立即失效且排查困难。\n- 难以处理现代网页的动态加载内容（如无限滚动、AJAX 请求），经常抓取到空白页面或不完整数据。\n- 每次新增一个监控网站都需要数小时的开发调试时间，无法快速响应临时的竞品调研需求。\n- 缺乏智能交互能力，无法让 AI 理解“点击‘查看更多’按钮”或“提取打折商品列表”这类自然语言指令。\n- 本地运行浏览器消耗大量系统资源，且难以在云端大规模并发执行任务。\n\n### 使用 mcp-server-browserbase 后\n- 分析师只需通过自然语言指示 LLM，mcp-server-browserbase 即可自动调用 `navigate` 和 `act` 工具完成页面跳转与交互，无需编写底层代码。\n- 利用 Stagehand 的智能感知能力，`observe` 和 `extract` 工具能精准识别动态渲染的元素，即使网页布局变更也能自适应提取数据。\n- 新增监控源仅需几秒钟配置，LLM 结合 mcp-server-browserbase 可立即理解新网站结构并开始工作，极大缩短响应时间。\n- 支持高阶语义操作，如直接命令“找出所有降价超过 20% 的商品”，工具会自动执行搜索、筛选和数据提取全流程。\n- 基于 Browserbase 的云浏览器环境，任务可在云端稳定运行，轻松实现多站点并发采集而不占用本地资源。\n\nmcp-server-browserbase 将繁琐的网页自动化转化为简单的自然语言交互，让非技术人员也能轻松构建强大的全网数据采集工作流。","https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002Fbrowserbase_mcp-server-browserbase_390b3b10.png","browserbase","https:\u002F\u002Foss.gittoolsai.com\u002Favatars\u002Fbrowserbase_a7fd3d85.png","",null,"https:\u002F\u002Fwww.browserbase.com","https:\u002F\u002Fgithub.com\u002Fbrowserbase",[81,85,89,92],{"name":82,"color":83,"percentage":84},"TypeScript","#3178c6",97.5,{"name":86,"color":87,"percentage":88},"JavaScript","#f1e05a",1.4,{"name":90,"color":91,"percentage":42},"Dockerfile","#384d54",{"name":93,"color":94,"percentage":95},"Shell","#89e051",0.1,3263,349,"2026-04-16T22:18:06","Apache-2.0","Linux, macOS, Windows","未说明",{"notes":103,"python":104,"dependencies":105},"该工具是基于 Node.js 的 MCP 服务器，而非 Python 应用。运行需要安装 Node.js 和 npm。核心功能依赖 Browserbase 云服务和本地 Stagehand 库。必须配置 BROWSERBASE_API_KEY、BROWSERBASE_PROJECT_ID 环境变量；若使用非默认模型（默认为 Google Gemini），还需提供对应模型的 API Key。支持通过 npx 直接运行、源码编译运行或 Docker 容器化部署。","未说明 (基于 Node.js 环境)",[106,107,108],"Node.js","npm","Docker (可选)",[14,15,45,13],[111,112,113,114,115,116,117],"ai","browser","chrome","chromium","mcp","playwright","puppeteer","2026-03-27T02:49:30.150509","2026-04-18T02:20:26.766713",[121,126,131,136,141,146],{"id":122,"question_zh":123,"answer_zh":124,"source_url":125},38592,"在本地运行 Stagehand 时遇到 'Cannot create proxy with a non-object' 或 'ENOENT: no such file or directory, mkdir '\u002Fdownloads'' 错误怎么办？","这通常是因为 macOS 本地运行时权限或路径问题，或者是 Chrome 调试端口的行为变更导致的。解决方案包括：\n1. 使用 `Google Chrome for Testing` 代替普通 Chrome，因为近期 Chrome 改变了 `--remote-debugging-port` 的行为。\n2. 确保传递了正确的本地 CDP (Chrome DevTools Protocol) URL 以在本地浏览器上运行 MCP，而不是尝试创建 Browserbase 会话。\n3. 检查代码中是否硬编码了 `\u002Fdownloads` 等 Linux 风格路径，macOS 用户可能需要手动创建该目录或修改配置。","https:\u002F\u002Fgithub.com\u002Fbrowserbase\u002Fmcp-server-browserbase\u002Fissues\u002F34",{"id":127,"question_zh":128,"answer_zh":129,"source_url":130},38593,"调用 `browserbase_close_session` 时报错 '429 You've exceeded your max concurrent sessions limit' 是怎么回事？","这是一个已知的 Bug。目前 `browserbase_close_session` 函数可能无法正确关闭会话，导致会话计数未释放。暂时的解决方法是：\n1. 不要依赖该函数自动关闭会话。\n2. 必须手动前往 Browserbase 仪表板（Dashboard）的 Sessions 视图来关闭挂起的会话。\n3. 关注后续版本更新，维护者正在修复与会话关闭相关的 Bug。","https:\u002F\u002Fgithub.com\u002Fbrowserbase\u002Fmcp-server-browserbase\u002Fissues\u002F40",{"id":132,"question_zh":133,"answer_zh":134,"source_url":135},38594,"遇到错误 'Failed to initialize Stagehand: You seem to be calling `page` on a page in an uninitialized `Stagehand` object' 如何解决？","这个错误通常由两个原因引起：\n1. **代码逻辑问题**：确保在引用 `page` 对象之前，已经对 Stagehand 对象执行了 `await stagehand.init()`。\n2. **Chrome 版本兼容性问题**（常见于 Chrome 136+）：Chrome 更新了远程调试端口的行为。如果是在本地运行，启动 Chrome 时必须指定自定义的用户数据目录。请在启动命令中添加 `--user-data-dir` 参数，例如：`chrome --remote-debugging-port=9222 --user-data-dir=\u002Ftmp\u002Fchrome-debug-profile`。","https:\u002F\u002Fgithub.com\u002Fbrowserbase\u002Fmcp-server-browserbase\u002Fissues\u002F44",{"id":137,"question_zh":138,"answer_zh":139,"source_url":140},38595,"mcp-server-browserbase 支持 Docker 部署吗？","官方认为在此场景下使用 Docker 没有太大必要。因为所有的浏览器操作都是在 Browserbase 的云会话中完成的，或者完全在本地机器上运行。如果你只是为了安装方便而考虑 Docker，通常直接通过 npm 安装或在本地配置环境变量即可满足需求，无需容器化。","https:\u002F\u002Fgithub.com\u002Fbrowserbase\u002Fmcp-server-browserbase\u002Fissues\u002F12",{"id":142,"question_zh":143,"answer_zh":144,"source_url":145},38596,"npm audit 报告 `langsmith` 依赖存在 SSRF 漏洞（Server-Side Request Forgery），该如何处理？","该漏洞源于 `@browserbasehq\u002Fstagehand` 依赖的旧版 `langsmith`。处理方法如下：\n1. 运行 `npm audit fix` 将 `langsmith` 升级到修补后的版本。\n2. **风险评估**：该漏洞需要启用 LangSmith 追踪且攻击者能控制追踪头才会被利用。在典型的 MCP 服务器部署中，如果不对外暴露追踪输入，实际风险较低。但为了安全起见，建议仍升级到最新版本。","https:\u002F\u002Fgithub.com\u002Fbrowserbase\u002Fmcp-server-browserbase\u002Fissues\u002F164",{"id":147,"question_zh":148,"answer_zh":149,"source_url":150},38597,"在 Node 18 环境下构建成功后，运行生成的 `dist` 文件报错 'SyntaxError: Unexpected token 'with'' 怎么办？","这是因为项目使用了 `import ... with { type: \"json\" }` 语法，该语法仅在 Node.js 20.6 及以上版本支持，而 Node 18 不支持。\n解决方案有两种：\n1. **升级 Node 版本**（推荐）：将运行环境升级到 Node.js 20.6 或更高版本。\n2. **修改构建配置**：如果必须使用 Node 18，需要修改 `tsconfig.json` 将模块系统改为 `CommonJS`，或者手动修改代码使用 `fs.readFileSync` 读取 JSON 文件，避免使用 import assertion 语法。","https:\u002F\u002Fgithub.com\u002Fbrowserbase\u002Fmcp-server-browserbase\u002Fissues\u002F77",[152],{"id":153,"version":154,"summary_zh":155,"released_at":156},314497,"v3.0.0","### 重大变更\n\n-   8f0b070：将工具名称和模式与托管的 Browserbase MCP 服务器（mcp.browserbase.com）保持一致。\n\n    **破坏性变更：**\n\n    -   工具 `browserbase_session_create` 重命名为 `start`\n    -   工具 `browserbase_session_close` 重命名为 `end`\n    -   工具 `browserbase_stagehand_navigate` 重命名为 `navigate`\n    -   工具 `browserbase_stagehand_act` 重命名为 `act`\n    -   工具 `browserbase_stagehand_observe` 重命名为 `observe`\n    -   工具 `browserbase_stagehand_extract` 重命名为 `extract`\n    -   工具 `browserbase_screenshot`、`browserbase_stagehand_get_url` 和 `browserbase_stagehand_agent` 已移除\n    -   `act` 工具不再接受 `variables` 参数\n    -   `start` 工具不再接受 `sessionId` 参数\n    -   `extract` 工具的 `instruction` 现在为可选参数（与托管版本一致）\n    -   默认模型由 `gemini-2.0-flash` 更改为 `google\u002Fgemini-2.5-flash-lite`\n    -   移除了 Smithery 的引用和依赖项","2026-03-31T01:51:54"]