chatdev

GitHub
584 99 非常简单 1 次阅读 今天GPL-3.0开发框架语言模型Agent
AI 解读 由 AI 自动生成,仅供参考

ChatDev 是一款专为构建智能体(AI Agent)设计的集成开发环境。无论是打造游戏中的沉浸式 NPC,还是开发高效的自动化助手,用户都能在此平台上自由定制所需功能。它主要解决了传统提示词工程难以实现复杂逻辑、多模型适配困难以及缺乏可视化调试手段等痛点,让智能体的创建过程更加直观和高效。

这款工具特别适合开发者、游戏设计师及 AI 研究人员使用。其核心亮点在于强大的 PromptIDE,支持 JavaScript/TypeScript 编程,允许用户通过代码实现复杂的提示策略,并提供自动补全、双屏显示及提示流可视化功能。此外,ChatDev 打破了单一模型的限制,不仅兼容 ChatGPT,还广泛支持新 Bing、Claude、通义千问、讯飞星火等十余种主流大模型及开源模型。独特的“游戏模式”更让用户能在模拟社交场景中直接定义 NPC 行为与地点标记,为交互式应用开发提供了全新思路。通过灵活的架构设计,ChatDev 致力于降低智能体开发门槛,激发更多创新应用的可能。

使用场景

某独立游戏开发者正在构建一款开放世界 RPG,需要为数百个 NPC 设计具备不同性格、记忆和动态反应能力的智能对话系统。

没有 chatdev 时

  • 开发效率低下:开发者需在 Python 代码与纯文本提示词之间反复切换,手动拼接复杂的逻辑链,调试一个 NPC 的行为往往耗时数天。
  • 模型选择受限:仅能依赖单一的 OpenAI 接口,无法根据成本或性能需求灵活切换 Bing Chat、Claude 或本地开源模型进行对比测试。
  • 流程不可视:多轮对话的逻辑跳转如同“黑盒”,难以直观看到提示词(Prompt)是如何在各个环节流转和变形的,排查错误极其困难。
  • 交互体验割裂:缺乏实时预览环境,必须重新编译部署游戏才能看到 NPC 的实际表现,严重拖慢了迭代节奏。

使用 chatdev 后

  • 可视化编程加速:利用 PromptIDE 的双屏显示和可视化 PromptFlow 功能,开发者通过 TypeScript 直接编排逻辑,自动补全让复杂提示工程效率提升数倍。
  • 多模型自由切换:内置支持超过 10 种大模型,可一键在 QianWen、iFlytek Spark 等模型间切换,快速找到最适合特定 NPC 性格的“大脑”。
  • 逻辑透明可控:通过可视化的数据流图,清晰追踪每一轮对话的生成路径,迅速定位并修复逻辑断层,确保 NPC 行为符合预期。
  • 沉浸式实时调试:直接在 GameWindow 中运行"AI 城镇”模拟,实时观察 NPC 之间的社交互动与位置标记效果,无需重启游戏即可验证修改。

chatdev 将原本晦涩的代码开发转化为直观的可视化创作,让开发者能专注于赋予 AI 角色真正的“灵魂”而非陷入底层调试泥潭。

运行环境要求

操作系统
  • Windows
  • macOS
  • Linux
GPU

未说明

内存

未说明

依赖
notes该工具主要作为浏览器扩展(支持 Chrome 和 Microsoft Edge)运行,而非传统的本地 Python 深度学习环境。安装方式包括从应用商店安装、手动加载解压后的文件夹或从源码构建(需运行 yarn install 和 yarn build)。它支持连接多种大模型(如 ChatGPT, Bing, Claude, 本地开源模型等),但具体的模型运行环境取决于用户选择的后端服务,工具本身未强制要求特定的 GPU 或 Python 版本。
python未说明
Node.js
Yarn
Chrome/Edge Browser
chatdev hero image

快速开始

ChatDev IDE:构建你的AI智能体

作者 许可证 发布版本 最近提交 Discord Chrome扩展 Chrome用户数

在Chromium浏览器中获取ChatDev 在Microsoft Edge浏览器中获取ChatDev

截图   |   游戏窗口   |   聊天窗口   |   PromptIDE   |   智能体   |   安装   

ChatDev IDE是一款用于构建AI智能体的工具。无论是游戏中的NPC,还是强大的智能工具,你都可以在这个平台上设计出自己想要的内容。

它通过JavaScript支持加速提示工程,允许实现复杂的提示技术。

https://youtu.be/O0gC2Sxm0EQ?feature=shared

📢 简要说明

  • 游戏模式:在AI小镇社交模拟中,你可以自定义这些NPC和地点标记。
  • 智能体支持:可以从智能体社区导入,也可以自行定义。
  • PromptIDE:自动补全、双屏显示、可视化提示流程、JavaScript支持。
  • 不仅支持ChatGPT,还支持新版Bing Chat、Google Bard、Claude、通义千问、讯飞星火等,以及超过10种开源模型。

功能对比

功能 ChatDev IDE ChatDev(OpenBMB)
编程方式 TypeScript Python代码
工作流 promptflowx ChatChainConfig.json
支持的LLM 种类丰富 仅限OpenAI
PromptIDE
RPG游戏
可扩展性
一键部署

✨ 游戏窗口

Generative_agents_dev是最令人兴奋的部分。所有角色都可以自定义,你可以设计一位数学家、心理分析专家来帮你解决各种问题。你只需要定义一个合理的提示角色描述,地图的丰富程度将完全由你掌控。如果你对自己的设计满意,也可以与我们分享,我们会推荐给其他用户。

在游戏窗口中,你可以在左侧选择自己喜欢的大模型,在地图上通过方向键或鼠标控制NPC的行为。当你靠近NPC或到达标记的位置时,NPC会主动触发冷启动响应,或者主动将你的聊天内容输入到下方的输入框中。

这款游戏基于一个模拟的AI小镇社交环境,你可以接近NPC或走到特定位置,通过输入与NPC交流,或者在特定地点与自己进行对话。

✨ 聊天窗口

选择聊天窗口,并点击右上角的“切换到聊天模式...”,在左侧选择你喜欢的大模型。聊天窗口将是一个常规的LLM聊天界面,所有的输入都将通过正常的LLM接口进行,输出大模型的回复。

chat_mode.png

✨ Prompt IDE

Promptflowx是一套开发工具,旨在简化基于LLM的AI应用从构思、原型设计、测试到评估的端到端开发周期。它使提示工程变得更加容易,让你能够以生产级质量构建LLM应用。

prompt_ide.png

  • 提示流程编辑器:用于编辑Prompt Flow的YAML文件,以及节点的提示内容和JavaScript脚本。
  • 提示流程可视化:通过可视化提示流程节点的执行过程,当执行到某个节点时,节点的颜色会发生变化。
  • JavaScript支持:通过JavaScript脚本,你可以发挥创意,实现不同NPC之间的协作,从而达成你的智能体目标。
  • 导出与导入:你可以导入其他优秀的智能体,也可以分享自己的智能体。

PromptFow 编辑器

  • YAML 语法高亮
  • 自动补全 NPC 名称及提示库内容
  • 双屏显示

使用 PromptFow 编辑器创建并迭代开发流程:

  • 创建可执行的流程,将大语言模型、提示词、JavaScript 代码及其他工具串联起来。
  • 轻松调试和迭代您的流程,尤其是与大语言模型的交互部分。

左侧编辑器显示的是 PromptFlow 的 YAML 文件,其中 pathfunc 被高亮,表明引用了自定义的提示词。您可以将鼠标悬停并点击 pathfunc 上的节点,右侧会显示该节点对应的自定义提示词。最右侧折叠的界面是可视化 Prompt Flow。您也可以通过双击节点来编辑该节点的提示词内容。 当您在左侧修改 YAML 文件时,右侧的可视化 Prompt Flow 会实时更新。

PromptFow 可视化

尽管许多开发者对大语言模型的工作原理难以捉摸,但 LLM 应用的工作方式却并不复杂——它们本质上是由一系列对外部服务(如大语言模型、数据库、搜索引擎)的调用,以及中间的数据处理步骤组合而成的。因此,LLM 应用实际上就是函数调用的有向无环图(DAG)。而在 PromptFlow 中,这些 DAG 就被称为“流程”。通过对大量内部用例的观察,我们发现深入了解执行细节至关重要。建立一套系统化的外部系统交互追踪方法,是我们设计的首要任务之一。因此,我们采用了一种非传统的方案:PromptFlow 使用一个 YAML 文件来描述函数调用(我们称之为“工具”)如何被执行,并以有向无环图(DAG)的形式连接起来。

导出与导入

您可以将您的 PromptFlow 导出为 JSON 文件,并将其导入到其他设备中。导出的文件包含了关于您的 PromptFlow 的所有信息,包括提示词、JavaScript 函数以及 YAML 文件内容。

🤖 机器人

ChatGPT、Bing、Bard、Claude、LLaMA 2、Vicuna、Falcon、通义千问、科大讯飞星火

🔨 安装

1. 从 Web 商店安装

  1. Chrome 网上应用店 中搜索 ChatDev,然后点击“添加至 Chrome”。
  2. Microsoft Edge 扩展商店 中搜索 ChatDev,然后点击“获取”。

2. 手动安装

  1. 从 Releases 页面下载 chatdev1.5.0.zip
  2. 解压文件。
  3. 在 Chrome/Edge 浏览器中打开扩展程序页面(chrome://extensionsedge://extensions)。
  4. 启用开发者模式。
  5. 将解压后的文件夹拖放到页面中进行导入(导入后请勿删除该文件夹)。

3. 从源代码构建

  • 克隆源代码。
  • 运行 yarn install 安装依赖项。
  • 运行 yarn build 构建插件。
  • 按照“手动安装”中的步骤,将 dist 文件夹加载到您的浏览器中。

版本历史

chatdev1.5.22024/05/07
chatdev1.5.02024/04/26
chatdev1.4.02024/01/15
chatdev1.3.22023/12/24
chatdev1.3.02023/11/30
chatdev1.2.42023/11/22
chatdev1.2.32023/11/19
chatdev1.2.22023/11/14
chatdev1.2.12023/11/02
chatdev1.1.32023/10/23
chatdev1.1.12023/10/13
chatdev1.1.02023/09/25
chatdev1.0.12023/08/23
chatdev1.0.02023/08/16

常见问题

相似工具推荐

openclaw

OpenClaw 是一款专为个人打造的本地化 AI 助手,旨在让你在自己的设备上拥有完全可控的智能伙伴。它打破了传统 AI 助手局限于特定网页或应用的束缚,能够直接接入你日常使用的各类通讯渠道,包括微信、WhatsApp、Telegram、Discord、iMessage 等数十种平台。无论你在哪个聊天软件中发送消息,OpenClaw 都能即时响应,甚至支持在 macOS、iOS 和 Android 设备上进行语音交互,并提供实时的画布渲染功能供你操控。 这款工具主要解决了用户对数据隐私、响应速度以及“始终在线”体验的需求。通过将 AI 部署在本地,用户无需依赖云端服务即可享受快速、私密的智能辅助,真正实现了“你的数据,你做主”。其独特的技术亮点在于强大的网关架构,将控制平面与核心助手分离,确保跨平台通信的流畅性与扩展性。 OpenClaw 非常适合希望构建个性化工作流的技术爱好者、开发者,以及注重隐私保护且不愿被单一生态绑定的普通用户。只要具备基础的终端操作能力(支持 macOS、Linux 及 Windows WSL2),即可通过简单的命令行引导完成部署。如果你渴望拥有一个懂你

349.3k|★★★☆☆|4天前
Agent开发框架图像

stable-diffusion-webui

stable-diffusion-webui 是一个基于 Gradio 构建的网页版操作界面,旨在让用户能够轻松地在本地运行和使用强大的 Stable Diffusion 图像生成模型。它解决了原始模型依赖命令行、操作门槛高且功能分散的痛点,将复杂的 AI 绘图流程整合进一个直观易用的图形化平台。 无论是希望快速上手的普通创作者、需要精细控制画面细节的设计师,还是想要深入探索模型潜力的开发者与研究人员,都能从中获益。其核心亮点在于极高的功能丰富度:不仅支持文生图、图生图、局部重绘(Inpainting)和外绘(Outpainting)等基础模式,还独创了注意力机制调整、提示词矩阵、负向提示词以及“高清修复”等高级功能。此外,它内置了 GFPGAN 和 CodeFormer 等人脸修复工具,支持多种神经网络放大算法,并允许用户通过插件系统无限扩展能力。即使是显存有限的设备,stable-diffusion-webui 也提供了相应的优化选项,让高质量的 AI 艺术创作变得触手可及。

162.1k|★★★☆☆|4天前
开发框架图像Agent

everything-claude-code

everything-claude-code 是一套专为 AI 编程助手(如 Claude Code、Codex、Cursor 等)打造的高性能优化系统。它不仅仅是一组配置文件,而是一个经过长期实战打磨的完整框架,旨在解决 AI 代理在实际开发中面临的效率低下、记忆丢失、安全隐患及缺乏持续学习能力等核心痛点。 通过引入技能模块化、直觉增强、记忆持久化机制以及内置的安全扫描功能,everything-claude-code 能显著提升 AI 在复杂任务中的表现,帮助开发者构建更稳定、更智能的生产级 AI 代理。其独特的“研究优先”开发理念和针对 Token 消耗的优化策略,使得模型响应更快、成本更低,同时有效防御潜在的攻击向量。 这套工具特别适合软件开发者、AI 研究人员以及希望深度定制 AI 工作流的技术团队使用。无论您是在构建大型代码库,还是需要 AI 协助进行安全审计与自动化测试,everything-claude-code 都能提供强大的底层支持。作为一个曾荣获 Anthropic 黑客大奖的开源项目,它融合了多语言支持与丰富的实战钩子(hooks),让 AI 真正成长为懂上

148.6k|★★☆☆☆|今天
开发框架Agent语言模型

ComfyUI

ComfyUI 是一款功能强大且高度模块化的视觉 AI 引擎,专为设计和执行复杂的 Stable Diffusion 图像生成流程而打造。它摒弃了传统的代码编写模式,采用直观的节点式流程图界面,让用户通过连接不同的功能模块即可构建个性化的生成管线。 这一设计巧妙解决了高级 AI 绘图工作流配置复杂、灵活性不足的痛点。用户无需具备编程背景,也能自由组合模型、调整参数并实时预览效果,轻松实现从基础文生图到多步骤高清修复等各类复杂任务。ComfyUI 拥有极佳的兼容性,不仅支持 Windows、macOS 和 Linux 全平台,还广泛适配 NVIDIA、AMD、Intel 及苹果 Silicon 等多种硬件架构,并率先支持 SDXL、Flux、SD3 等前沿模型。 无论是希望深入探索算法潜力的研究人员和开发者,还是追求极致创作自由度的设计师与资深 AI 绘画爱好者,ComfyUI 都能提供强大的支持。其独特的模块化架构允许社区不断扩展新功能,使其成为当前最灵活、生态最丰富的开源扩散模型工具之一,帮助用户将创意高效转化为现实。

108.1k|★★☆☆☆|昨天
开发框架图像Agent

gemini-cli

gemini-cli 是一款由谷歌推出的开源 AI 命令行工具,它将强大的 Gemini 大模型能力直接集成到用户的终端环境中。对于习惯在命令行工作的开发者而言,它提供了一条从输入提示词到获取模型响应的最短路径,无需切换窗口即可享受智能辅助。 这款工具主要解决了开发过程中频繁上下文切换的痛点,让用户能在熟悉的终端界面内直接完成代码理解、生成、调试以及自动化运维任务。无论是查询大型代码库、根据草图生成应用,还是执行复杂的 Git 操作,gemini-cli 都能通过自然语言指令高效处理。 它特别适合广大软件工程师、DevOps 人员及技术研究人员使用。其核心亮点包括支持高达 100 万 token 的超长上下文窗口,具备出色的逻辑推理能力;内置 Google 搜索、文件操作及 Shell 命令执行等实用工具;更独特的是,它支持 MCP(模型上下文协议),允许用户灵活扩展自定义集成,连接如图像生成等外部能力。此外,个人谷歌账号即可享受免费的额度支持,且项目基于 Apache 2.0 协议完全开源,是提升终端工作效率的理想助手。

100.8k|★★☆☆☆|今天
插件Agent图像

markitdown

MarkItDown 是一款由微软 AutoGen 团队打造的轻量级 Python 工具,专为将各类文件高效转换为 Markdown 格式而设计。它支持 PDF、Word、Excel、PPT、图片(含 OCR)、音频(含语音转录)、HTML 乃至 YouTube 链接等多种格式的解析,能够精准提取文档中的标题、列表、表格和链接等关键结构信息。 在人工智能应用日益普及的今天,大语言模型(LLM)虽擅长处理文本,却难以直接读取复杂的二进制办公文档。MarkItDown 恰好解决了这一痛点,它将非结构化或半结构化的文件转化为模型“原生理解”且 Token 效率极高的 Markdown 格式,成为连接本地文件与 AI 分析 pipeline 的理想桥梁。此外,它还提供了 MCP(模型上下文协议)服务器,可无缝集成到 Claude Desktop 等 LLM 应用中。 这款工具特别适合开发者、数据科学家及 AI 研究人员使用,尤其是那些需要构建文档检索增强生成(RAG)系统、进行批量文本分析或希望让 AI 助手直接“阅读”本地文件的用户。虽然生成的内容也具备一定可读性,但其核心优势在于为机器

93.4k|★★☆☆☆|3天前
插件开发框架