wa-automate-nodejs
wa-automate-nodejs 是一款基于 Node.js 开发的高级库,旨在为开发者提供控制 WhatsApp Web 的强大能力。它通过封装底层细节,暴露出简洁易用的 API 接口,让用户能够轻松构建功能丰富的聊天机器人、自动化消息回复系统以及批量消息管理工具。
这款工具主要解决了在 WhatsApp 平台上实现程序化交互的技术门槛问题。以往开发者需要逆向工程或手动模拟浏览器操作,过程繁琐且不稳定;而 wa-automate-nodejs 提供了可靠的连接机制和完整的功能集,支持发送文本、媒体文件、位置信息,甚至能监听群聊动态和管理联系人,极大地提升了开发效率。
它非常适合具备 JavaScript 基础的软件开发者、技术团队或希望将 WhatsApp 集成到现有业务系统中的企业用户。对于研究人员而言,它也可用于合规的社交网络行为分析场景。普通用户若无编程经验,则可能需要借助基于此库构建的成品应用。
其独特亮点包括对“多设备模式”的原生支持,允许在不依赖手机实时联网的情况下运行;内置 CLI 命令行工具,可一键将账号转换为 API 服务;同时提供灵活的配置选项,如无头模式运行、自定义会话管理及详细的日志控制,确保在生产环境中的稳定性与安全性。
使用场景
某中小型电商运营团队希望利用 WhatsApp 为数千名老客户提供订单状态自动查询与促销通知服务,以提升复购率并减轻客服压力。
没有 wa-automate-nodejs 时
- 客服人员需手动复制粘贴回复大量重复的“订单发货了吗”咨询,响应延迟高达数小时,导致客户投诉激增。
- 发送节日促销信息时,员工必须逐个打开聊天窗口操作,不仅效率极低,还极易因疲劳发生误发或漏发。
- 缺乏统一的技术接口,无法将内部的 ERP 订单系统与 WhatsApp 打通,实时物流状态只能靠人工核对后告知。
- 尝试使用非官方脚本模拟点击时,频繁触发 WhatsApp 的风控机制导致账号被封禁,业务被迫中断。
使用 wa-automate-nodejs 后
- 部署自动回复机器人后,系统能即时识别“订单”、“发货”等关键词并返回真实物流进度,客户满意度显著提升。
- 通过调用批量发送接口,团队可在几秒钟内向特定标签用户群精准推送促销海报,且支持动态变量插入用户昵称。
- 借助其高级 API 直接对接内部数据库,当订单状态变更时,系统自动触发消息推送,实现了业务流程的完全自动化。
- 依托其稳定的多设备支持(multiDevice)和防崩溃日志功能,机器人可 7x24 小时稳定运行,彻底规避了封号风险。
wa-automate-nodejs 将原本繁琐的人工客服流程转化为高效的自动化闭环,让中小团队也能以低成本拥有企业级的即时通讯服务能力。
运行环境要求
- Linux
- macOS
- Windows
未说明
未说明

快速开始
[!WARNING]
通过访问此页面,您即明确同意服务条款(请在此处阅读)
安装与更新
使用以下命令首次安装库,并保持库为最新版本。
> npm i --save @open-wa/wa-automate@latest
使用方法
CLI
想立即将您的 WhatsApp 账号转换为 API 吗?现在可以通过 CLI 实现。更多详情请参阅 简易 API
> npx @open-wa/wa-automate --help
自定义设置
在此处了解所有可能的配置选项:ConfigObject
const wa = require('@open-wa/wa-automate');
wa.create({
sessionId: "COVID_HELPER",
multiDevice: true, // 必须启用多设备支持
authTimeout: 60, // 只等待 60 秒即可与主机账号设备建立连接
blockCrashLogs: true,
disableSpins: true,
headless: true,
hostNotificationLang: 'PT_BR',
logConsole: false,
popup: true,
qrTimeout: 0, // 0 表示将无限期等待您扫描二维码
}).then(client => start(client));
function start(client) {
client.onMessage(async message => {
if (message.body === 'Hi') {
await client.sendText(message.from, '👋 Hello!');
}
});
}
执行 create() 函数后,@open-wa/wa-automate 将创建一个 WhatsApp Web 实例。如果您尚未登录,它将在 终端 中显示一个二维码。用手机扫描该二维码,您就可以开始使用了!
@open-wa/wa-automate 会记住会话,因此无需每次都重新认证
多设备支持
目前我们正处于一个特殊的过渡期,有些人被迫采用多设备功能(MD)。一旦过渡完成,库的默认设置将是开启多设备支持。在此之前,您需要通过使用 --multi-device 标志(配合 CLI)或在配置中设置 multiDevice: true(通过自定义代码),来显式地启用多设备功能。
最新变更
由于 WhatsApp 不断更新,建议始终使用最新版本的 @open-wa/wa-automate。
函数列表
| 函数 | 参考文档 |
|---|---|
| 接收消息 | onMessage |
| 自动刷新二维码 | autoRefresh |
| 发送文本 | sendText |
| 获取联系人 | getContact |
| 获取聊天记录 | getAllChats |
| 获取群组 | getAllGroups |
| 获取群组成员 | getGroupMembersId |
| 发送联系人 | sendContact |
| 发送图片(image) | sendImage |
| 发送媒体(音频、文档) | sendFile |
| 发送媒体(视频) | Send Videos |
| 发送贴纸 | sendStickerfromUrl |
| 解密媒体(图片、音频、文档) | Decrypt Media |
| 捕获二维码 | Capturing QR Code |
| 多会话 | Multiple Sessions |
| 最后上线时间 | getLastSeen |
| 是否在线 | isChatOnline |
| 📍 发送位置 | sendLocation |
| 模拟“正在输入” | simulateTyping |
| 发送 GIF! | sendVideoAsGif |
| 发送 Giphy! | sendGiphy |
| 转发消息 | forwardMessages |
| 监听已读回执 | onAck |
| 监听实时位置 | onLiveLocation |
| 群组成员变更 | onParticipantsChanged |
| 创建群组 | Create Group |
| 添加、移除、提升、降级成员 | Manage Participants |
运行演示
您可以克隆此仓库并运行演示,但需要使用 TypeScript 和 ts-node:
> git clone https://github.com/open-wa/wa-automate-nodejs.git
> cd wa-automate-nodejs
> npm i
> npm i -g ts-node typescript
> cd demo
> ts-node index.ts
贡献
欢迎提交 Pull Request。对于重大更改,请先打开一个议题讨论您希望进行的修改。
支持
如果您需要付费支持、咨询,或只是想支持/赞助本项目的持续开发,可以通过以下方式:
| 描述 | 链接 |
|- |:-:|
| 获取许可证密钥 | 获取许可证密钥
| 捐款或预订1小时咨询 |
| 按分钟计费的咨询服务 |
| 雇佣我! |
许可证
Hippocratic + Do Not Harm Version 1.0
法律声明
本代码与 WhatsApp 或其任何关联公司、子公司均无任何隶属关系,也未获得其授权、维护、赞助或认可。这是一款独立且非官方的软件。请自行承担使用风险。
加密通知
本发行版包含加密软件。您目前居住的国家或地区可能对加密软件的进口、持有、使用和/或再出口到其他国家/地区有限制。在使用任何加密软件之前,请务必查阅您所在国家或地区的相关法律、法规和政策,了解是否允许进口、持有、使用及再出口此类软件。更多信息请参阅 http://www.wassenaar.org/。
美国商务部工业与安全局(BIS)已将该软件归类为出口商品控制编号(ECCN)5D002.C.1,该编号涵盖使用或执行基于非对称算法的加密功能的信息安全软件。根据本发行版的形式和分发方式,其出口可适用许可证豁免 ENC 技术软件无限制(TSU)条款(参见 BIS 出口管理条例第 740.13 节),适用于目标代码和源代码。
版本历史
4.76.02025/02/194.75.02024/12/224.74.22024/11/214.74.12024/11/184.74.02024/10/174.72.52024/09/194.72.42024/09/174.72.32024/09/174.72.22024/08/294.72.12024/08/214.72.02024/08/074.71.152024/07/204.71.142024/06/264.71.132024/06/114.71.122024/06/064.71.112024/05/164.71.102024/04/214.71.92024/04/144.71.82024/04/124.71.62024/04/11常见问题
相似工具推荐
openclaw
OpenClaw 是一款专为个人打造的本地化 AI 助手,旨在让你在自己的设备上拥有完全可控的智能伙伴。它打破了传统 AI 助手局限于特定网页或应用的束缚,能够直接接入你日常使用的各类通讯渠道,包括微信、WhatsApp、Telegram、Discord、iMessage 等数十种平台。无论你在哪个聊天软件中发送消息,OpenClaw 都能即时响应,甚至支持在 macOS、iOS 和 Android 设备上进行语音交互,并提供实时的画布渲染功能供你操控。 这款工具主要解决了用户对数据隐私、响应速度以及“始终在线”体验的需求。通过将 AI 部署在本地,用户无需依赖云端服务即可享受快速、私密的智能辅助,真正实现了“你的数据,你做主”。其独特的技术亮点在于强大的网关架构,将控制平面与核心助手分离,确保跨平台通信的流畅性与扩展性。 OpenClaw 非常适合希望构建个性化工作流的技术爱好者、开发者,以及注重隐私保护且不愿被单一生态绑定的普通用户。只要具备基础的终端操作能力(支持 macOS、Linux 及 Windows WSL2),即可通过简单的命令行引导完成部署。如果你渴望拥有一个懂你
stable-diffusion-webui
stable-diffusion-webui 是一个基于 Gradio 构建的网页版操作界面,旨在让用户能够轻松地在本地运行和使用强大的 Stable Diffusion 图像生成模型。它解决了原始模型依赖命令行、操作门槛高且功能分散的痛点,将复杂的 AI 绘图流程整合进一个直观易用的图形化平台。 无论是希望快速上手的普通创作者、需要精细控制画面细节的设计师,还是想要深入探索模型潜力的开发者与研究人员,都能从中获益。其核心亮点在于极高的功能丰富度:不仅支持文生图、图生图、局部重绘(Inpainting)和外绘(Outpainting)等基础模式,还独创了注意力机制调整、提示词矩阵、负向提示词以及“高清修复”等高级功能。此外,它内置了 GFPGAN 和 CodeFormer 等人脸修复工具,支持多种神经网络放大算法,并允许用户通过插件系统无限扩展能力。即使是显存有限的设备,stable-diffusion-webui 也提供了相应的优化选项,让高质量的 AI 艺术创作变得触手可及。
everything-claude-code
everything-claude-code 是一套专为 AI 编程助手(如 Claude Code、Codex、Cursor 等)打造的高性能优化系统。它不仅仅是一组配置文件,而是一个经过长期实战打磨的完整框架,旨在解决 AI 代理在实际开发中面临的效率低下、记忆丢失、安全隐患及缺乏持续学习能力等核心痛点。 通过引入技能模块化、直觉增强、记忆持久化机制以及内置的安全扫描功能,everything-claude-code 能显著提升 AI 在复杂任务中的表现,帮助开发者构建更稳定、更智能的生产级 AI 代理。其独特的“研究优先”开发理念和针对 Token 消耗的优化策略,使得模型响应更快、成本更低,同时有效防御潜在的攻击向量。 这套工具特别适合软件开发者、AI 研究人员以及希望深度定制 AI 工作流的技术团队使用。无论您是在构建大型代码库,还是需要 AI 协助进行安全审计与自动化测试,everything-claude-code 都能提供强大的底层支持。作为一个曾荣获 Anthropic 黑客大奖的开源项目,它融合了多语言支持与丰富的实战钩子(hooks),让 AI 真正成长为懂上
opencode
OpenCode 是一款开源的 AI 编程助手(Coding Agent),旨在像一位智能搭档一样融入您的开发流程。它不仅仅是一个代码补全插件,而是一个能够理解项目上下文、自主规划任务并执行复杂编码操作的智能体。无论是生成全新功能、重构现有代码,还是排查难以定位的 Bug,OpenCode 都能通过自然语言交互高效完成,显著减少开发者在重复性劳动和上下文切换上的时间消耗。 这款工具专为软件开发者、工程师及技术研究人员设计,特别适合希望利用大模型能力来提升编码效率、加速原型开发或处理遗留代码维护的专业人群。其核心亮点在于完全开源的架构,这意味着用户可以审查代码逻辑、自定义行为策略,甚至私有化部署以保障数据安全,彻底打破了传统闭源 AI 助手的“黑盒”限制。 在技术体验上,OpenCode 提供了灵活的终端界面(Terminal UI)和正在测试中的桌面应用程序,支持 macOS、Windows 及 Linux 全平台。它兼容多种包管理工具,安装便捷,并能无缝集成到现有的开发环境中。无论您是追求极致控制权的资深极客,还是渴望提升产出的独立开发者,OpenCode 都提供了一个透明、可信
ComfyUI
ComfyUI 是一款功能强大且高度模块化的视觉 AI 引擎,专为设计和执行复杂的 Stable Diffusion 图像生成流程而打造。它摒弃了传统的代码编写模式,采用直观的节点式流程图界面,让用户通过连接不同的功能模块即可构建个性化的生成管线。 这一设计巧妙解决了高级 AI 绘图工作流配置复杂、灵活性不足的痛点。用户无需具备编程背景,也能自由组合模型、调整参数并实时预览效果,轻松实现从基础文生图到多步骤高清修复等各类复杂任务。ComfyUI 拥有极佳的兼容性,不仅支持 Windows、macOS 和 Linux 全平台,还广泛适配 NVIDIA、AMD、Intel 及苹果 Silicon 等多种硬件架构,并率先支持 SDXL、Flux、SD3 等前沿模型。 无论是希望深入探索算法潜力的研究人员和开发者,还是追求极致创作自由度的设计师与资深 AI 绘画爱好者,ComfyUI 都能提供强大的支持。其独特的模块化架构允许社区不断扩展新功能,使其成为当前最灵活、生态最丰富的开源扩散模型工具之一,帮助用户将创意高效转化为现实。
gemini-cli
gemini-cli 是一款由谷歌推出的开源 AI 命令行工具,它将强大的 Gemini 大模型能力直接集成到用户的终端环境中。对于习惯在命令行工作的开发者而言,它提供了一条从输入提示词到获取模型响应的最短路径,无需切换窗口即可享受智能辅助。 这款工具主要解决了开发过程中频繁上下文切换的痛点,让用户能在熟悉的终端界面内直接完成代码理解、生成、调试以及自动化运维任务。无论是查询大型代码库、根据草图生成应用,还是执行复杂的 Git 操作,gemini-cli 都能通过自然语言指令高效处理。 它特别适合广大软件工程师、DevOps 人员及技术研究人员使用。其核心亮点包括支持高达 100 万 token 的超长上下文窗口,具备出色的逻辑推理能力;内置 Google 搜索、文件操作及 Shell 命令执行等实用工具;更独特的是,它支持 MCP(模型上下文协议),允许用户灵活扩展自定义集成,连接如图像生成等外部能力。此外,个人谷歌账号即可享受免费的额度支持,且项目基于 Apache 2.0 协议完全开源,是提升终端工作效率的理想助手。
