724-office

1.1k 164 简单 1 次阅读今天MITAgent开发框架

AI 解读由 AI 自动生成，仅供参考

724-office 是一个全天候运行的自进化 AI 智能体系统，旨在为用户提供持续、自主的生产力支持。它不依赖 LangChain 等重型框架，仅用约一万行纯 Python 代码构建，解决了传统 AI 应用架构臃肿、难以长期稳定运行及缺乏自我修正能力的痛点。

该系统特别适合希望深入理解 AI 智能体底层逻辑的开发者、研究人员，以及需要定制化自动化办公解决方案的技术团队。普通用户也可通过其集成的群聊、日程管理及多媒体处理功能获得高效协助。

724-office 的核心亮点在于其独特的“自进化”机制：具备三层记忆系统（会话、压缩长时记忆、向量检索），能像人类一样积累经验；内置“轻推系统”可自动检测并纠正模型不使用工具的惰性行为；支持运行时动态创建新工具，甚至能编写代码修复自身错误。此外，其模块化架构、多租户路由管理及可视化的行为分析报告，使其成为一个既轻量又强大的生产级 AI 基础设施，真正实现了 7×24 小时的无人值守运行。

使用场景

某初创团队的技术负责人需要为多位客户部署定制化的 24 小时智能客服代理，同时要求系统能根据业务反馈自动进化并处理复杂的群聊协作。

没有 724-office 时

架构臃肿且维护难：依赖 LangChain 等重型框架，代码耦合度高，一旦某个组件升级容易导致整个服务崩溃，排查问题耗时极长。
缺乏持续记忆与自愈力：代理无法跨会话记住用户偏好，遇到工具调用失败时直接“死机”，需要人工重启服务或手动修复日志。
资源浪费严重：无论用户是否活跃，系统都全量加载所有工具和上下文，导致 Token 消耗巨大且响应延迟高。
群聊协作混乱：难以区分群组中的提及消息，无法在多人对话中精准识别发言者身份，常出现答非所问的情况。

使用 724-office 后

轻量模块化运行：基于纯 Python 标准库构建的模块化架构，将工具拆分为 7 个独立域模块，支持热插拔 MCP 插件，系统稳定性显著提升。
三层记忆与自我修复：利用会话历史、压缩长时记忆和向量检索构成的三层记忆体系，配合“断路器”和每日自检机制，自动从错误中恢复并归档黑盒记录。
智能节流与动态过滤：通过“轻推系统（Nudge）”监测工具使用情况，结合 5 种动态上下文配置文件，仅在必要时加载工具，大幅降低 Token 成本。
精准的群聊网关：独立的群聊容器支持 @提及门控和说话人识别，确保代理只在被需要时介入，并能准确理解多人协作语境。

724-office 通过零框架依赖的轻量架构和自进化机制，将原本脆弱的单次对话脚本转变为可全天候稳定运行、具备自我修复能力的生产级多租户智能体系统。

运行环境要求

操作系统

Linux
macOS

GPU

未说明 (设计用于边缘设备如 Jetson Orin Nano，主要依赖 API 调用而非本地推理)

内存

最低 2GB (推荐 8GB+ 以支持多租户 Docker 部署)

依赖

notes该工具无大型框架依赖（如 LangChain），主要通过 API 调用 LLM。支持两种运行方式：直接运行或推荐的 Docker 多租户部署。若使用 Docker 模式，需预先安装 Docker 和 Docker Compose。配置需填写各类 API Key（LLM、消息平台、ASR、视频生成等）。架构设计轻量，旨在占用内存低于 2GB 的情况下在边缘设备运行。

python3.x (具体版本未说明，需支持所列依赖库)

croniter

lancedb

websocket-client

pilk

numpy

httpx

beautifulsoup4

pydub

jieba

fpdf2

快速开始

7/24 办公室 -- 自进化 AI 代理系统

一个在生产环境中运行的 AI 代理，由 约 10,000 行纯 Python 构建而成，无任何框架依赖。不使用 LangChain、LlamaIndex 或 CrewAI——仅依靠标准库和少量小型第三方包。

36 种工具，20 个文件，模块化架构，全天候运行。

由一人借助 AI 协同开发工具独立构建，在多用户环境下实现 24/7 全天候生产运行。

v2.0 新特性

模块化工具架构——从单体的 tools.py 拆分为 7 个领域模块
群聊支持——为群组对话提供独立容器，并引入 @提及权限控制
AI 镜像——行为画像报告（soul_report）+ 未来自我对话模式（future_self）
提示系统——结构化行为纠正：自动检测 LLM 虽有工具却未使用的情况
动态工具过滤——5 种上下文配置文件（语音/日程/群组/诊断/默认），以减少 token 浪费
预算感知系统提示——在组装系统提示时跟踪 token 预算
非活跃保护——对休眠用户（超过 3 天无操作）自动跳过定时任务
熔断机制——每个会话中连续失败 3 次后禁用相关工具
交互式可视化——通过 render_page 使用 ECharts 生成 HTML 页面（折线图/柱状图/饼图/雷达图/表格/报告）
容器协调——路由器在启动时会根据路由表自动重建缺失的容器
指数退避重试——消息 API 调用将进行 3 次重试，延迟分别为 2/4/8 秒
会话自动归档——每日记录所有对话的黑盒日志

功能特性

工具使用循环——兼容 OpenAI 的函数调用功能，具备自动重试机制，每轮对话最多可尝试 20 次
三层记忆体系——会话历史 + LLM 压缩的长期记忆 + LanceDB 向量检索
MCP/插件系统——通过 JSON-RPC（stdin 或 HTTP）连接外部 MCP 服务器，支持热加载无需重启
运行时工具创建——代理可在运行时编写、保存并加载新的 Python 工具（create_tool）
自我修复——每日自检、会话健康诊断、错误日志分析，并在出现故障时自动通知
Cron 定时调度——支持一次性与周期性任务，任务状态持久化且不受重启影响，具备时区感知与非活跃保护功能
多租户路由——基于 Docker 的自动资源调配，每个用户独享一个容器，定期健康检查并进行容器协调
多模态支持——可处理图片、视频、文件、语音及链接等媒体；内置 ASR（语音转文本）功能，并可通过 base64 解析图像内容
网络搜索——集成多搜索引擎（Tavily、Bocha、GitHub、HuggingFace），具备自动路由与双引擎默认策略
视频处理——智能静音检测剪辑、添加背景音乐，以及通过 API 进行 AI 视频生成
消息集成——可插拔的消息平台，支持防抖、消息拆分及流式媒体上传
群聊功能——独立容器、@提及权限控制、上下文缓冲区（最近 20 条消息）、发言者识别

系统架构

                    +-----------------+
                    |  消息平台       |
                    +--------+--------+
                             |
                    +--------v--------+
                    |   router.py     |  多租户路由
                    |  自动调配       |  容器协调
                    |  群组路由       |  健康检查
                    +--------+--------+
                             |
                    +--------v--------+
                    | xiaowang.py     |  入口点
                    |  HTTP 服务器    |  回调处理
                    |  防抖           |  媒体下载/ASR
                    |  群聊支持       |  非活跃追踪
                    +--------+--------+
                             |
                    +--------v--------+
                    |    llm.py       |  工具使用循环（核心）
                    |  预算感知       |  会话管理
                    |  系统提示       |  提示系统集成
                    |  多模态         |  记忆注入
                    +--------+--------+
                             |
     +----------+----+------+------+----+-----------+
     |          |    |             |    |           |
+----v-----+ +-v----v--+ +-------v-+ +-v--------+ |
| tools_    | |tools_   | |tools_   | |tools_    | |
| messaging | |admin    | |search   | |video     | |
| send/file | |exec/diag| |web/mem  | |trim/bgm  | |
| schedule  | |plugin   | |recall   | |generate  | |
+-----------+ |MCP      | +---------+ +----------+ |
              +----+----+                           |
              +----v----+  +----------+  +----------v--+
              |tools_   |  |tools_    |  |  nudge.py   |
              |page     |  |mirror    |  |  5 条规则    |
              |ECharts  |  |soul rpt  |  |  自动提示    |
              |6 types  |  |future    |  +-------------+
              |self      |
              +----------+
              +--------------+--------------+
              |              |              |
       +------v------+  +---v--------+  +--v-----------+
       | memory.py   |  |scheduler.py|  | archive.py   |
       | 三层         |  | cron+once  |  | 日常黑盒记录 |
       | 压缩         |  | 非活跃保护|  | 机密存储     |
       | 去重         |  | 保护       |  +--------------+
       | 检索         |  +------------+
       +------+------+
              |
       +------v------+
       |mcp_client.py|  JSON-RPC over stdio/HTTP
       | 自动重连 + 热加载
       +-------------+

记忆系统

第一层：会话记忆（短期）
  - 每个会话保留最近 40 条消息，以 JSON 文件形式存储
  - 当超出容量时触发压缩
  - 对于超过 100KB 的会话，自动归档

第二层：压缩记忆（长期）
  - LLM 从被驱逐的消息中提取结构化事实
  - 采用余弦相似度进行去重（阈值为 0.92）
  - 存储为向量形式，存入 LanceDB 数据库

第三层：检索记忆（主动回忆）
  - 用户输入消息 -> 文本嵌入 -> 向量检索
  - 将最相关的 K 条记忆注入到系统提示中
  - 注入过程考虑 token 预算，实时跟踪用量

工具列表（36个内置）

分类	模块	工具
核心	`tools_admin`	`exec`, `message`
文件	`tools_admin`	`read_file`, `write_file`, `edit_file`, `list_files`
调度	`tools_messaging`	`schedule`, `list_schedules`, `remove_schedule`
媒体发送	`tools_messaging`	`send_image`, `send_file`, `send_video`, `send_link`, `send_location`, `send_namecard`
视频	`tools_video`	`trim_video`（自动剪掉静音部分）、`add_bgm`、`generate_video`
搜索	`tools_search`	`web_search`（Tavily+Bocha双引擎）、`search_nearby`（地理编码+POI）、`search_memory`、`recall`
可视化	`tools_page`	`render_page`（通过ECharts绘制折线图/柱状图/饼图/雷达图/表格/报告）
AI镜像	`tools_mirror`	`soul_report`（行为画像HTML）、`future_self`（对话模式）
诊断	`tools_admin`	`self_check`, `diagnose`, `task_history`, `code_audit`, `asr_check`, `daily_digest`
内存	`tools_admin`	`compact_memory`, `compact_guides`
插件	`tools_admin`	`create_tool`, `list_custom_tools`, `remove_tool`
MCP	`tools_admin`	`reload_mcp`

模块结构

文件	行数	职责
`xiaowang.py`	~1040	入口：配置、HTTP服务器、回调、防抖、ASR、群组支持
`llm.py`	~1260	LLM API + 工具使用循环 + 预算感知系统提示 + 提醒集成
`tools.py`	~37	协调层（导入各领域模块）
`tools_base.py`	~314	注册表 + @tool装饰器 + 动态过滤 + 熔断机制
`tools_messaging.py`	~550	消息/文件/日程/位置/名片相关工具
`tools_admin.py`	~860	执行/文件操作/诊断/插件/MCP管理
`tools_mirror.py`	~716	AI镜像：灵魂报告 + 未来自我
`tools_page.py`	~470	交互式HTML页面生成（ECharts）
`tools_search.py`	~293	多引擎网络搜索 + 记忆搜索
`tools_video.py`	~394	视频剪辑/添加背景音乐/视频生成
`messaging.py`	~447	消息平台API封装 + CDN上传/下载
`memory.py`	~1100	三层记忆系统（会话记忆 + 压缩记忆 + 向量记忆）
`scheduler.py`	~652	Cron定时任务 + 一次性调度 + 非活跃保护
`router.py`	~500+	多租户Docker路由器 + 自动调配 + 对账
`mcp_client.py`	~342	MCP协议客户端（JSON-RPC，无新增依赖）
`nudge.py`	~190	提醒系统：检测工具误用，自动注入提示
`archive.py`	~204	每日会话归档（黑盒记录器）
`audit.py`	~448	自动化11项代码审计

快速开始

方案一：直接运行

git clone https://github.com/wangziqi06/724-office.git
cd 724-office
cp config.example.json config.json
# 编辑config.json以填写您的API密钥

pip install croniter lancedb websocket-client pilk numpy httpx beautifulsoup4 pydub jieba fpdf2

mkdir -p workspace/memory workspace/files
python3 xiaowang.py

方案二：Docker部署（推荐）

# 将Dockerfile.example复制为Dockerfile
# 将docker-compose.example.yml复制为docker-compose.yml
# 编辑.env文件以填写您的凭证

docker compose build
docker compose up -d

该代理会在8080端口启动HTTP服务器。请将您的消息平台Webhook指向http://YOUR_SERVER:8080/。

配置

完整配置结构请参见config.example.json。关键部分包括：

models -- LLM提供商（任何兼容OpenAI的API），并设置备用链路
messaging -- 消息平台的凭证和接口地址
memory -- 三层记忆系统的设置（嵌入式API、相似度阈值）
asr -- 语音转文本API的凭证
video_api -- AI视频生成API
mcp_servers -- MCP服务器连接信息（stdin或HTTP传输）
page_base_url -- 生成可视化页面的基础URL

设计原则

零框架依赖 -- 每一行代码都清晰可见且可调试。没有魔法，没有隐藏的抽象。
模块化工具 -- 添加一项功能只需在相应领域模块中添加一个@tool装饰的函数。
边缘部署 -- 设计目标是在Jetson Orin Nano（8GB内存，ARM64架构）上运行。内存预算低于2GB。
自我进化 -- 该代理可以在运行时创建新工具、诊断自身问题，并通知所有者。
结构性行为修正 -- 不要用提示来纠正代理的错误，而是添加提醒、钩子和验证机制。
为删除而构建 -- 当模型变得更智能时，每个模块都应该能够被干净地移除。
上下文是最稀缺的资源 -- 设计的核心约束是token预算，而非计算能力。

许可证

MIT

724-office 快速上手指南

724-office 是一个基于纯 Python 构建的自进化 AI Agent 系统，无需 LangChain 等重型框架，仅依赖标准库和少量轻量包。它支持多租户路由、三层记忆系统、动态工具创建及可视化报表生成，适合在生产环境中 24/7 运行。

环境准备

系统要求

操作系统: Linux / macOS (Windows 需 WSL2)
Python 版本: Python 3.8+
硬件建议: 最低 2GB 可用内存（专为边缘设备如 Jetson Orin Nano 优化）
网络: 需访问 OpenAI 兼容 API 及外部服务（搜索、视频生成等）

前置依赖

确保已安装 git、python3 和 pip。若使用 Docker 部署，需安装 Docker 和 Docker Compose。

安装步骤

方案一：直接运行（推荐开发调试）

克隆项目

git clone https://github.com/wangziqi06/724-office.git
cd 724-office

配置密钥 复制示例配置文件并填入你的 API Keys（LLM、消息平台、ASR 等）：
```
cp config.example.json config.json
# 请使用编辑器修改 config.json
```

安装依赖 建议使用国内镜像源加速安装：

pip install -i https://pypi.tuna.tsinghua.edu.cn/simple croniter lancedb websocket-client pilk numpy httpx beautifulsoup4 pydub jieba fpdf2

初始化目录

mkdir -p workspace/memory workspace/files

启动服务
```
python3 xiaowang.py
```

方案二：Docker 部署（推荐生产环境）

准备配置文件

cp Dockerfile.example Dockerfile
cp docker-compose.example.yml docker-compose.yml
# 编辑 .env 文件填入凭证

构建并启动

docker compose build
docker compose up -d

基本使用

启动成功后，Agent 将在 8080 端口 运行 HTTP 服务器。

配置消息平台回调 将你的消息平台（如微信、飞书、钉钉等）的 Webhook 地址指向： http://YOUR_SERVER_IP:8080/
交互示例 在消息平台中直接向 Agent 发送指令，系统将自动识别意图并调用工具：
- 自然对话: "帮我总结一下今天的新闻"（自动调用 web_search）
- 文件操作: "把刚才的内容保存到 summary.txt"（自动调用 write_file）
- 数据可视化: "画一个展示本周销量的柱状图"（自动调用 render_page 生成 ECharts HTML）
- 定时任务: "每天早上 9 点提醒我查看邮件"（自动调用 schedule）
验证运行状态 查看终端日志，确认无报错且出现 Server started 相关提示。若启用诊断工具，可发送“自检”触发 self_check 工具查看系统健康度。

相似工具推荐

openclaw

OpenClaw 是一款专为个人打造的本地化 AI 助手，旨在让你在自己的设备上拥有完全可控的智能伙伴。它打破了传统 AI 助手局限于特定网页或应用的束缚，能够直接接入你日常使用的各类通讯渠道，包括微信、WhatsApp、Telegram、Discord、iMessage 等数十种平台。无论你在哪个聊天软件中发送消息，OpenClaw 都能即时响应，甚至支持在 macOS、iOS 和 Android 设备上进行语音交互，并提供实时的画布渲染功能供你操控。这款工具主要解决了用户对数据隐私、响应速度以及“始终在线”体验的需求。通过将 AI 部署在本地，用户无需依赖云端服务即可享受快速、私密的智能辅助，真正实现了“你的数据，你做主”。其独特的技术亮点在于强大的网关架构，将控制平面与核心助手分离，确保跨平台通信的流畅性与扩展性。 OpenClaw 非常适合希望构建个性化工作流的技术爱好者、开发者，以及注重隐私保护且不愿被单一生态绑定的普通用户。只要具备基础的终端操作能力（支持 macOS、Linux 及 Windows WSL2），即可通过简单的命令行引导完成部署。如果你渴望拥有一个懂你

★ 349.3k|★★★☆☆|5天前

Agent开发框架图像

stable-diffusion-webui

stable-diffusion-webui 是一个基于 Gradio 构建的网页版操作界面，旨在让用户能够轻松地在本地运行和使用强大的 Stable Diffusion 图像生成模型。它解决了原始模型依赖命令行、操作门槛高且功能分散的痛点，将复杂的 AI 绘图流程整合进一个直观易用的图形化平台。无论是希望快速上手的普通创作者、需要精细控制画面细节的设计师，还是想要深入探索模型潜力的开发者与研究人员，都能从中获益。其核心亮点在于极高的功能丰富度：不仅支持文生图、图生图、局部重绘（Inpainting）和外绘（Outpainting）等基础模式，还独创了注意力机制调整、提示词矩阵、负向提示词以及“高清修复”等高级功能。此外，它内置了 GFPGAN 和 CodeFormer 等人脸修复工具，支持多种神经网络放大算法，并允许用户通过插件系统无限扩展能力。即使是显存有限的设备，stable-diffusion-webui 也提供了相应的优化选项，让高质量的 AI 艺术创作变得触手可及。

★ 162.1k|★★★☆☆|6天前

开发框架图像Agent

everything-claude-code

everything-claude-code 是一套专为 AI 编程助手（如 Claude Code、Codex、Cursor 等）打造的高性能优化系统。它不仅仅是一组配置文件，而是一个经过长期实战打磨的完整框架，旨在解决 AI 代理在实际开发中面临的效率低下、记忆丢失、安全隐患及缺乏持续学习能力等核心痛点。通过引入技能模块化、直觉增强、记忆持久化机制以及内置的安全扫描功能，everything-claude-code 能显著提升 AI 在复杂任务中的表现，帮助开发者构建更稳定、更智能的生产级 AI 代理。其独特的“研究优先”开发理念和针对 Token 消耗的优化策略，使得模型响应更快、成本更低，同时有效防御潜在的攻击向量。这套工具特别适合软件开发者、AI 研究人员以及希望深度定制 AI 工作流的技术团队使用。无论您是在构建大型代码库，还是需要 AI 协助进行安全审计与自动化测试，everything-claude-code 都能提供强大的底层支持。作为一个曾荣获 Anthropic 黑客大奖的开源项目，它融合了多语言支持与丰富的实战钩子（hooks），让 AI 真正成长为懂上

★ 150.7k|★★☆☆☆|今天

开发框架Agent语言模型

ComfyUI

ComfyUI 是一款功能强大且高度模块化的视觉 AI 引擎，专为设计和执行复杂的 Stable Diffusion 图像生成流程而打造。它摒弃了传统的代码编写模式，采用直观的节点式流程图界面，让用户通过连接不同的功能模块即可构建个性化的生成管线。这一设计巧妙解决了高级 AI 绘图工作流配置复杂、灵活性不足的痛点。用户无需具备编程背景，也能自由组合模型、调整参数并实时预览效果，轻松实现从基础文生图到多步骤高清修复等各类复杂任务。ComfyUI 拥有极佳的兼容性，不仅支持 Windows、macOS 和 Linux 全平台，还广泛适配 NVIDIA、AMD、Intel 及苹果 Silicon 等多种硬件架构，并率先支持 SDXL、Flux、SD3 等前沿模型。无论是希望深入探索算法潜力的研究人员和开发者，还是追求极致创作自由度的设计师与资深 AI 绘画爱好者，ComfyUI 都能提供强大的支持。其独特的模块化架构允许社区不断扩展新功能，使其成为当前最灵活、生态最丰富的开源扩散模型工具之一，帮助用户将创意高效转化为现实。

★ 108.3k|★★☆☆☆|昨天

开发框架图像Agent

gemini-cli

gemini-cli 是一款由谷歌推出的开源 AI 命令行工具，它将强大的 Gemini 大模型能力直接集成到用户的终端环境中。对于习惯在命令行工作的开发者而言，它提供了一条从输入提示词到获取模型响应的最短路径，无需切换窗口即可享受智能辅助。这款工具主要解决了开发过程中频繁上下文切换的痛点，让用户能在熟悉的终端界面内直接完成代码理解、生成、调试以及自动化运维任务。无论是查询大型代码库、根据草图生成应用，还是执行复杂的 Git 操作，gemini-cli 都能通过自然语言指令高效处理。它特别适合广大软件工程师、DevOps 人员及技术研究人员使用。其核心亮点包括支持高达 100 万 token 的超长上下文窗口，具备出色的逻辑推理能力；内置 Google 搜索、文件操作及 Shell 命令执行等实用工具；更独特的是，它支持 MCP（模型上下文协议），允许用户灵活扩展自定义集成，连接如图像生成等外部能力。此外，个人谷歌账号即可享受免费的额度支持，且项目基于 Apache 2.0 协议完全开源，是提升终端工作效率的理想助手。

★ 100.8k|★★☆☆☆|昨天

插件Agent图像

markitdown

MarkItDown 是一款由微软 AutoGen 团队打造的轻量级 Python 工具，专为将各类文件高效转换为 Markdown 格式而设计。它支持 PDF、Word、Excel、PPT、图片（含 OCR）、音频（含语音转录）、HTML 乃至 YouTube 链接等多种格式的解析，能够精准提取文档中的标题、列表、表格和链接等关键结构信息。在人工智能应用日益普及的今天，大语言模型（LLM）虽擅长处理文本，却难以直接读取复杂的二进制办公文档。MarkItDown 恰好解决了这一痛点，它将非结构化或半结构化的文件转化为模型“原生理解”且 Token 效率极高的 Markdown 格式，成为连接本地文件与 AI 分析 pipeline 的理想桥梁。此外，它还提供了 MCP（模型上下文协议）服务器，可无缝集成到 Claude Desktop 等 LLM 应用中。这款工具特别适合开发者、数据科学家及 AI 研究人员使用，尤其是那些需要构建文档检索增强生成（RAG）系统、进行批量文本分析或希望让 AI 助手直接“阅读”本地文件的用户。虽然生成的内容也具备一定可读性，但其核心优势在于为机器

★ 93.4k|★★☆☆☆|5天前

插件开发框架