ChatGPT-weBot

GitHub
656 120 较难 1 次阅读 1周前其他语言模型插件图像
AI 解读 由 AI 自动生成,仅供参考

ChatGPT-weBot 是一款基于微信官方钩子接口开发的开源机器人工具,旨在让用户在微信环境中直接体验 ChatGPT(支持 gpt-3.5 及更新模型)的对话能力与 Stable Diffusion 的 AI 绘画功能。它有效解决了用户无法在常用社交软件中便捷访问大模型服务、以及传统外挂方案容易导致账号被封禁的痛点。通过模拟官方客户端执行逻辑,ChatGPT-weBot 实现了高安全性的消息监听与自动回复,大幅降低了封号风险。

这款工具特别适合具备一定技术基础的开发者、运维人员或极客用户部署使用,用于搭建私有的智能客服、社群助手或个人效率工具。其核心技术亮点包括:支持多线程并发处理,确保单账号下多用户对话互不干扰;具备上下文记忆、角色设定及关键词唤醒机制,可灵活定制机器人在私聊或群聊中的行为模式;同时集成了 AI 绘画功能,支持英文提示词生成图像。此外,项目还设计了异常自动恢复机制,无需人工重启服务即可应对运行错误,并提供了对话回滚、总结等高级功能以优化 Token 消耗。只需在 Windows 环境下配置简单的 JSON 文件并注入指定版本的微信客户端,即可快速启动属于自己的微信 AI 助手。

使用场景

某电商运营团队需要在微信社群中实时响应数百名用户的咨询,并快速生成产品宣传图以应对突发营销活动。

没有 ChatGPT-weBot 时

  • 客服人员需频繁切换电脑与手机,手动复制用户问题到网页版 AI 查询后再回复,响应延迟高达数分钟,极易引发用户不满。
  • 面对群内高频并发提问,单人无法同时处理多路对话,导致大量消息积压,关键售后问题被遗漏。
  • 制作营销海报需依赖设计部门排期或使用复杂的绘图软件,从需求提出到出图往往耗时数小时,错失促销黄金窗口。
  • 机器人若采用非官方协议挂载,常因触发风控导致微信号被封禁,造成客户资源永久丢失。
  • 缺乏上下文记忆能力,每次回答都是“断片”状态,无法理解用户连续追问的意图,体验极差。

使用 ChatGPT-weBot 后

  • 基于官方微信 Hook 接口无缝集成,用户在群内@机器人即可秒级获得精准回复,实现 7x24 小时自动化客服。
  • 支持多线程并发处理,单个账号可同时流畅回应数十个用户的不同咨询,彻底消除消息积压现象。
  • 内置 Stable Diffusion 绘图功能,运营人员只需发送英文提示词,机器人即刻在群内生成高质量产品海报,将出图时间缩短至秒级。
  • 采用官方执行环境运行,从根本上杜绝了封号风险,保障私域流量池的安全稳定。
  • 具备强大的上下文感知与角色设定功能,能像真人一样记住前序对话内容,提供连贯、个性化的购物建议。

ChatGPT-weBot 将原本割裂的人工操作转化为微信内的智能自动化闭环,显著提升了社群运营效率与用户满意度。

运行环境要求

操作系统
  • Windows
GPU

未说明 (支持 Stable Diffusion 绘图,但未明确指定 GPU 型号或显存要求)

内存

未说明

依赖
notes必须安装特定版本的微信客户端 (WeChat-3.9.5.81.exe),若版本过高需降级或安装在其他目录;必须以管理员身份运行微信;通过 inject 方式挂钩微信进程;Stable Diffusion 功能仅支持英文提示词。
python3.7+
requirements.txt 中列出的包 (具体列表未在 README 中展示)
ChatGPT-weBot hero image

快速开始

ChatGPT-weBot

[TOC]

GitHub tag (latest by date)

使用基于 ChatGPT(API 密钥调用)、Stable Diffusion AI 绘图以及官方微信 Hook 接口的 ChatGPT-weBot。中文文档 | 英文

作者

Snapdragon Lee (github.com)

封面由 DALL·E3 (openai.com) 创作

支持与功能

  • 支持对话
  • 支持上下文感知问答
  • 支持多线程 Stable Diffusion AI 绘图(仅英文,支持(负面)提示词)
  • 通过使用官方微信执行方式,绝不会被封禁
  • 支持 gpt-3.5-turbo 及更新模型的 API 调用
  • 支持 WebChatGPT 功能
  • 支持机器人角色设定
  • 设置在私人聊天中唤醒微信机器人的关键词
  • 设置在群聊中唤醒微信机器人的关键词
  • 支持在群聊中提及你的机器人时进行@回复
  • 内置帮助文档
  • 重新生成对话
  • 回滚对话
  • 总结 (节省 token 消耗)
  • 重置整个对话
  • 支持单账号下的多线程对话
  • 出现错误后无需手动重启服务
  • 其他

默认配置(启动服务器前请按照步骤操作)

---> 可配置选项 详细指南

启动步骤

  1. 环境:Windows 7+,Python 3.7+

  2. 安装 requirements.txt 中列出的所有包,使用如下命令:

    pip install -r ./requirements.txt
    

    请注意,v1.2 需要安装和升级更多包,因此升级后请再次执行此命令。

  3. 从 Github Releases 下载软件包。(可在后续提到时逐步下载)

  4. 在您的电脑上安装 WeChat-3.9.5.81.exe如果您的版本高于 3.9.5.81,可以立即降级,或在其他目录单独安装。之后,请以管理员身份运行并登录。如果您想双开微信,需要安装两个不同版本,并根据注释修改 ./dual-start.bat,后续步骤略有不同,请继续阅读 [这里](. /doc/Dual_Start.md)。

  5. 通过运行服务器来监控微信消息。自 V1.20 版本后,已简化为一种解决方案:

    >  cd .\wxinject\bin\
    >  .\injector.exe -n WeChat.exe -i .\wxinject.dll
    
  6. 最后一步是填写 .config/ 目录下的 JSON 文件。

    • api_config.json 中,您需要填写自己的 API 调用参数设置。如果您不清楚具体参数,只需填写“api_key”和可选的“proxy”项即可。

    • server_config.json 中,您可以自定义监听地址和端口。如果不了解具体设置,可保持默认不变。

    • config.json 中,您需要根据个人喜好配置自定义选项。

    • sys_character.json 中,您可以自定义机器人扮演的角色,并在聊天时使用特定指令激活该角色。

  7. 使用以下命令运行 main.py

    python main.py
    

    一切准备就绪,您可以随时上线您的 ChatGPT-weBot!

    无任何限制,但自从切换到 OpenAI API 后,存在使用次数和付费要求。

问答

  1. 如何获取所有回复?您可以用自己的语言说“继续”。

  2. 遇到问题?欢迎创建问题。

  3. 如何追踪多线程程序中的问题?打印日志或使用带有线程栈信息的调试工具。

  4. 是否有关于功能的预览图片?是的,请前往 -> 预览

  5. 想请我喝杯咖啡吗?谢谢,二维码如下所示。

    image-20230321150123666

星标用户

@SnapdragonLee/ChatGPT-weBot 的星标用户列表

星标数量随时间变化

星标数量随时间变化

日志

  • 2023.10.23 发布 v1.20.2 版本,修复了一些内存泄漏并更换了 XML 解析器。
  • 2023.10.18 发布 v1.2 版本,采用新 SDK 和新微信版本。
  • 2023.10.17 完成 Python ws 客户端开发,更新源代码以支持新 SDK,并为整体架构升级做准备。
  • 2023.10.15 添加大量 API 并进行类型测试。
  • 2023.10.10 构建和完善 SDK,并支持 ws 客户端。
  • 2023.3.24 更新异常处理程序,以及其他来自 rogue-shadowdancerwbbeyourself 的 Pull 请求。
  • 2023.3.23 修复 Stable Diffusion 等问题,发布 v1.01 版本。
  • 2023.3.21 增加大量新功能,修复 bug,发布 v1.00 版本。
  • 2023.3.4 将 Stable Diffusion 功能加入其中(仅英文)。
  • 2023.3.3 引入多线程并重写整个程序结构。
  • 2023.2.27 添加微信的 zip 版本和 dual-start.bat,修复了当响应关键词为空时阻止其他操作的 bug。
  • 2023.2.25 在 config.json 中添加回答前引用原始问题的选项。
  • 2023.2.25 完成所有功能相关的 API 函数及错误调试。
  • 2023.2.23 实现部分功能中列出的 API。
  • 2023.2.23 修复连接反向服务器时的流式传输问题。
  • 2023.2.21 报告 ChatGPT API 的问题。
  • 2023.2.20 发布 v0.90-dev 版本,用于在微信上进行基本的 ChatGPT API 使用。
  • 2023.2.17 开始开发整个流程。
参考资料

版本历史

v1.20.22023/10/23
v1.20.12023/10/18
v1.202023/10/17
v1.022023/03/23
v1.012023/03/23
v1.002023/03/21
v0.99-dev2023/03/04
v0.98-dev2023/02/27
v0.95-dev2023/02/20

常见问题

相似工具推荐

openclaw

OpenClaw 是一款专为个人打造的本地化 AI 助手,旨在让你在自己的设备上拥有完全可控的智能伙伴。它打破了传统 AI 助手局限于特定网页或应用的束缚,能够直接接入你日常使用的各类通讯渠道,包括微信、WhatsApp、Telegram、Discord、iMessage 等数十种平台。无论你在哪个聊天软件中发送消息,OpenClaw 都能即时响应,甚至支持在 macOS、iOS 和 Android 设备上进行语音交互,并提供实时的画布渲染功能供你操控。 这款工具主要解决了用户对数据隐私、响应速度以及“始终在线”体验的需求。通过将 AI 部署在本地,用户无需依赖云端服务即可享受快速、私密的智能辅助,真正实现了“你的数据,你做主”。其独特的技术亮点在于强大的网关架构,将控制平面与核心助手分离,确保跨平台通信的流畅性与扩展性。 OpenClaw 非常适合希望构建个性化工作流的技术爱好者、开发者,以及注重隐私保护且不愿被单一生态绑定的普通用户。只要具备基础的终端操作能力(支持 macOS、Linux 及 Windows WSL2),即可通过简单的命令行引导完成部署。如果你渴望拥有一个懂你

349.3k|★★★☆☆|1周前
Agent开发框架图像

stable-diffusion-webui

stable-diffusion-webui 是一个基于 Gradio 构建的网页版操作界面,旨在让用户能够轻松地在本地运行和使用强大的 Stable Diffusion 图像生成模型。它解决了原始模型依赖命令行、操作门槛高且功能分散的痛点,将复杂的 AI 绘图流程整合进一个直观易用的图形化平台。 无论是希望快速上手的普通创作者、需要精细控制画面细节的设计师,还是想要深入探索模型潜力的开发者与研究人员,都能从中获益。其核心亮点在于极高的功能丰富度:不仅支持文生图、图生图、局部重绘(Inpainting)和外绘(Outpainting)等基础模式,还独创了注意力机制调整、提示词矩阵、负向提示词以及“高清修复”等高级功能。此外,它内置了 GFPGAN 和 CodeFormer 等人脸修复工具,支持多种神经网络放大算法,并允许用户通过插件系统无限扩展能力。即使是显存有限的设备,stable-diffusion-webui 也提供了相应的优化选项,让高质量的 AI 艺术创作变得触手可及。

162.1k|★★★☆☆|1周前
开发框架图像Agent

everything-claude-code

everything-claude-code 是一套专为 AI 编程助手(如 Claude Code、Codex、Cursor 等)打造的高性能优化系统。它不仅仅是一组配置文件,而是一个经过长期实战打磨的完整框架,旨在解决 AI 代理在实际开发中面临的效率低下、记忆丢失、安全隐患及缺乏持续学习能力等核心痛点。 通过引入技能模块化、直觉增强、记忆持久化机制以及内置的安全扫描功能,everything-claude-code 能显著提升 AI 在复杂任务中的表现,帮助开发者构建更稳定、更智能的生产级 AI 代理。其独特的“研究优先”开发理念和针对 Token 消耗的优化策略,使得模型响应更快、成本更低,同时有效防御潜在的攻击向量。 这套工具特别适合软件开发者、AI 研究人员以及希望深度定制 AI 工作流的技术团队使用。无论您是在构建大型代码库,还是需要 AI 协助进行安全审计与自动化测试,everything-claude-code 都能提供强大的底层支持。作为一个曾荣获 Anthropic 黑客大奖的开源项目,它融合了多语言支持与丰富的实战钩子(hooks),让 AI 真正成长为懂上

159.6k|★★☆☆☆|今天
开发框架Agent语言模型

opencode

OpenCode 是一款开源的 AI 编程助手(Coding Agent),旨在像一位智能搭档一样融入您的开发流程。它不仅仅是一个代码补全插件,而是一个能够理解项目上下文、自主规划任务并执行复杂编码操作的智能体。无论是生成全新功能、重构现有代码,还是排查难以定位的 Bug,OpenCode 都能通过自然语言交互高效完成,显著减少开发者在重复性劳动和上下文切换上的时间消耗。 这款工具专为软件开发者、工程师及技术研究人员设计,特别适合希望利用大模型能力来提升编码效率、加速原型开发或处理遗留代码维护的专业人群。其核心亮点在于完全开源的架构,这意味着用户可以审查代码逻辑、自定义行为策略,甚至私有化部署以保障数据安全,彻底打破了传统闭源 AI 助手的“黑盒”限制。 在技术体验上,OpenCode 提供了灵活的终端界面(Terminal UI)和正在测试中的桌面应用程序,支持 macOS、Windows 及 Linux 全平台。它兼容多种包管理工具,安装便捷,并能无缝集成到现有的开发环境中。无论您是追求极致控制权的资深极客,还是渴望提升产出的独立开发者,OpenCode 都提供了一个透明、可信

144.3k|★☆☆☆☆|昨天
Agent插件

ComfyUI

ComfyUI 是一款功能强大且高度模块化的视觉 AI 引擎,专为设计和执行复杂的 Stable Diffusion 图像生成流程而打造。它摒弃了传统的代码编写模式,采用直观的节点式流程图界面,让用户通过连接不同的功能模块即可构建个性化的生成管线。 这一设计巧妙解决了高级 AI 绘图工作流配置复杂、灵活性不足的痛点。用户无需具备编程背景,也能自由组合模型、调整参数并实时预览效果,轻松实现从基础文生图到多步骤高清修复等各类复杂任务。ComfyUI 拥有极佳的兼容性,不仅支持 Windows、macOS 和 Linux 全平台,还广泛适配 NVIDIA、AMD、Intel 及苹果 Silicon 等多种硬件架构,并率先支持 SDXL、Flux、SD3 等前沿模型。 无论是希望深入探索算法潜力的研究人员和开发者,还是追求极致创作自由度的设计师与资深 AI 绘画爱好者,ComfyUI 都能提供强大的支持。其独特的模块化架构允许社区不断扩展新功能,使其成为当前最灵活、生态最丰富的开源扩散模型工具之一,帮助用户将创意高效转化为现实。

108.3k|★★☆☆☆|1周前
开发框架图像Agent

gemini-cli

gemini-cli 是一款由谷歌推出的开源 AI 命令行工具,它将强大的 Gemini 大模型能力直接集成到用户的终端环境中。对于习惯在命令行工作的开发者而言,它提供了一条从输入提示词到获取模型响应的最短路径,无需切换窗口即可享受智能辅助。 这款工具主要解决了开发过程中频繁上下文切换的痛点,让用户能在熟悉的终端界面内直接完成代码理解、生成、调试以及自动化运维任务。无论是查询大型代码库、根据草图生成应用,还是执行复杂的 Git 操作,gemini-cli 都能通过自然语言指令高效处理。 它特别适合广大软件工程师、DevOps 人员及技术研究人员使用。其核心亮点包括支持高达 100 万 token 的超长上下文窗口,具备出色的逻辑推理能力;内置 Google 搜索、文件操作及 Shell 命令执行等实用工具;更独特的是,它支持 MCP(模型上下文协议),允许用户灵活扩展自定义集成,连接如图像生成等外部能力。此外,个人谷歌账号即可享受免费的额度支持,且项目基于 Apache 2.0 协议完全开源,是提升终端工作效率的理想助手。

100.8k|★★☆☆☆|1周前
插件Agent图像