openakita
OpenAkita 是一款开源的多智能体 AI 助手框架,旨在突破传统 AI 仅能对话的局限,打造能真正“办事”的虚拟团队。它通过组织多个 AI 智能体协同工作,自主完成网页搜索、电脑操作、文件管理及定时任务等复杂流程,并支持在 Telegram、飞书、微信、钉钉等主流即时通讯平台上即时响应。
这一工具解决了单一 AI 模型在处理长链条、多步骤任务时能力不足的问题,让用户无需编写代码或输入复杂指令,只需通过图形界面或扫码绑定,即可在几分钟内部署属于自己的"AI 公司”。无论是希望提升办公效率的普通用户,还是想要构建复杂自动化流程的开发者与研究人员,都能从中受益。普通用户可享受零命令行门槛的便捷体验,而开发者则能通过丰富的插件系统扩展功能。
OpenAkita 的技术亮点在于其独特的“组织编排”架构与六层沙箱安全机制,既保障了多智能体协作的高效性,又确保了本地操作的安全性。此外,它兼容 30 多种大语言模型,支持跨桌面、Web 及移动端使用,让 AI 不仅能聊天,更能像专业团队一样交付成果。
使用场景
某电商运营团队需要在每周一上午快速汇总竞品价格、生成分析报告并同步至飞书群,同时自动更新本地库存表格。
没有 openakita 时
- 人工操作繁琐:运营人员需手动打开多个网页搜索竞品数据,复制粘贴到 Excel,耗时且容易出错。
- 工具割裂严重:数据分析、报告撰写和消息通知分散在不同软件中,无法形成自动化闭环,需反复切换窗口。
- 响应滞后:一旦遇到突发价格变动,无法实时监测并立即通知团队,往往错过最佳调整时机。
- 技能扩展困难:若想增加“自动截图存档”或“异常数据预警”功能,需要专门开发脚本,门槛高且维护成本大。
使用 openakita 后
- 多智能体协同作业:部署“搜索代理”自动抓取全网竞品价格,“分析代理”生成对比图表,“通知代理”直接将结果推送到飞书群,全程无人值守。
- 一站式任务编排:通过图形化界面将搜索、计算、绘图和发消息串联成工作流,无需编写代码即可在 5 分钟内搭建完成。
- 实时触发与响应:设置定时任务或关键词监听,一旦发现价格波动超过阈值,openakita 立即启动应急流程并报警。
- 插件灵活扩展:利用其丰富的插件系统,随手添加“屏幕截图”或“数据库写入”技能,像搭积木一样自定义业务逻辑。
openakita 将原本需要多人协作半天的重复劳动,转化为一个自主运行的"AI 虚拟员工”,让团队专注于策略决策而非数据处理。
运行环境要求
- Windows
- macOS
- Linux
未说明
未说明

快速开始
OpenAkita
开源多智能体AI助手 — 不只是聊天,而是一支能完成任务的AI团队
多智能体协作 · 组织编排 · 插件系统 · 沙箱安全 · 30+ LLM · 6种IM平台 · 89+工具 · 桌面端 / Web端 / 移动端
快速入门 • 组织编排 • 扫码绑定 • 插件系统 • 安全防护 • 文档
English | 中文
OpenAkita是什么?
其他AI只会聊天。OpenAkita能完成任务。
OpenAkita是一款开源的一站式AI助手——多个AI智能体协同工作,组建一个能够自主运行的“AI公司”,它可以搜索网络、操作你的电脑、管理文件、执行定时任务,并在Telegram / 飞书 / 微信企业号 / 钉钉 / QQ等平台上即时响应。只需扫描二维码,30秒即可绑定你的聊天应用。 它会记住你的偏好,自我学习新技能,且从不轻言放弃任何任务。通过插件系统可扩展功能,同时受到六层沙箱安全机制的保护。
完全基于GUI的设置,5分钟即可就绪,无需命令行操作。
🌐 网站 openakita.ai | 📥 下载桌面应用 | 📖 文档 | 💬 Discord社区
快速入门指南
🚀 对于首次使用者(3分钟)
无需安装——下载桌面应用即可开始聊天:
- 从GitHub Releases下载安装程序
- 安装并按照引导向导进行设置
- 输入你的API Key(可从Anthropic或DeepSeek获取)
- 尝试第一个任务:输入“创建一个计算器”,看看它如何运作
💻 对于开发者(5分钟)
# 安装
pip install openakita[all]
# 快速设置(交互式向导)
openakita init
# 运行第一个任务
openakita run "构建一个天气爬虫"
✨ 立即可以做的事情
| 类别 | 示例 |
|---|---|
| 💬 聊天 | 文本 + 图片 + 文件,语音消息,贴纸 |
| 🤖 多智能体 | “创建一份竞争分析” → 研究 + 分析 + 写作智能体协同工作 |
| 🏢 组织 | 构建一个AI公司——CEO、CTO、市场部、财务部——智能体自主运行 |
| 🌐 网络 | 搜索新闻、抓取网站、自动化浏览器操作 |
| 📁 文件 | 读取/写入/编辑文件、批量重命名、内容搜索 |
| 🖥️ 桌面 | 点击按钮、输入文本、截图、自动化应用程序 |
| ⏰ 定时任务 | “每星期一上午9点提醒我”——基于cron的提醒 |
➡️ 后续步骤
- 配置LLM:添加多个模型提供商以实现自动故障转移
- 设置IM渠道:扫描二维码,30秒内绑定微信/飞书/企业微信,直接在聊天应用中使用AI
- 探索技能:从市场下载或自行开发
- 尝试组织模式:构建一个AI公司并观察其运行
- 加入社区:Discord | 微信群
核心能力
🤝 多智能体协作多个具备专业技能的智能体并行工作。 你只需说一句话——编码智能体会编写代码,写作智能体会起草文档,测试智能体会进行验证——所有这些都会同时完成。 🏢 组织编排不仅仅是多智能体——还可以构建一个“AI公司”。CEO、CTO、CFO、市场总监……每个角色都独立运作。共享白板、消息路由、死锁检测。 📋 计划模式复杂任务会自动分解为步骤计划,实时跟踪进度,并在失败时自动回滚。 🧠 ReAct推理引擎思考 → 行动 → 观察。明确的三阶段推理,带有检查点和回滚功能。如果失败?则尝试不同的策略。 |
🔌 插件系统8种插件类型,三层权限模型,10个生命周期钩子。工具、渠道、RAG、记忆、LLM——一切皆可扩展。 🛡️ 六层沙箱安全路径分区 · 确认门控 · 命令拦截 · 文件快照 · 自我保护 · 操作系统级沙箱。高风险命令会自动在隔离环境中运行。 📱 IM扫码绑定微信、飞书、企业微信——扫描二维码,30秒即可绑定,在你的聊天应用中直接使用AI。 💾 双模记忆——越用越聪明碎片化记忆 + MDRM关系图(因果链 · 时间线 · 实体图 · 3D可视化),自动智能切换。 |
完整功能列表
| 功能 | 描述 | |
|---|---|---|
| 🤝 | 多智能体 | 专业化智能体、并行委派、自动交接、故障转移、实时可视化仪表盘 |
| 🏢 | 组织编排 | 层次化组织结构、CEO/CTO/CFO角色、共享黑板记忆、消息路由、死锁检测、心跳机制、自动扩缩容 |
| 📋 | 计划模式 | 自动任务分解、每步跟踪、UI中浮动进度条 |
| 🧠 | ReAct推理 | 显式三阶段循环、检查点/回滚、循环检测、策略切换 |
| 🚀 | 零门槛部署 | 全图形化配置、引导向导、从安装到聊天仅需5分钟、无需命令行 |
| 🔧 | 89+内置工具 | 16类:Shell / 文件 / 浏览器 / 桌面 / 搜索 / 计划器 / MCP … |
| 🔌 | 插件系统 | 8种类型(工具/通道/RAG/记忆/LLM/钩子/技能/MCP)、3级权限、10个生命周期钩子、故障隔离 |
| 🛡️ | 6层安全防护 | 路径分区、确认闸门、命令黑名单、文件快照、自我保护、操作系统沙盒(Linux bwrap / macOS seatbelt / Windows MIC) |
| 📱 | IM扫码绑定 | 微信/飞书/企业微信扫码绑定,30秒完成设置,无需开发者配置 |
| 🛒 | 技能市场 | 搜索与一键安装、GitHub直接安装、AI即时生成技能 |
| 🌐 | 30+ LLM提供商 | Anthropic / OpenAI / DeepSeek / Qwen / Kimi / MiniMax / Gemini … 智能故障转移 |
| 💬 | 6个IM平台 | Telegram / 飞书 / 企业微信 / 钉钉 / QQ / OneBot,语音识别、智能群聊 |
| 🔗 | MCP集成 | 标准MCP客户端,stdio / HTTP / SSE传输协议,多目录扫描,动态服务器管理 |
| 💾 | 双模记忆 | 模式1碎片化记忆(3层+7种类型+多路径召回)+模式2MDRM关系图(5维+多跳遍历+3D可视化),自动智能切换 |
| 🎭 | 8种人格 | 默认 / 技术专家 / 男友 / 女友 / Jarvis / 管家 / 商务 / 家庭 |
| 🤖 | 主动引擎 | 问候、任务跟进、空闲聊天、晚安——根据您的反馈调整频率 |
| 🧬 | 自我进化 | 每日自检与修复、故障根因分析、自动技能生成 |
| 🔍 | 深度思考 | 可控思考模式、实时思维链展示、IM流式输出 |
| 🖥️ | 多平台支持 | 桌面端(Win/Mac/Linux)· Web端(PC及移动浏览器)· 移动App(Android/iOS),11个面板,深色主题 |
| 📊 | 可观测性 | 12种追踪跨度类型,全链路Token统计面板 |
| 😄 | 贴纸 | 5700+贴纸,情绪感知、与人格匹配 |
5分钟快速部署
方案1:桌面应用(推荐)
完全图形化界面,无需命令行 — 这正是OpenAkita区别于其他开源AI助手之处:
| 步骤 | 操作内容 | 时间 |
|---|---|---|
| 1 | 下载安装程序,双击安装 | 1分钟 |
| 2 | 按照引导向导操作,输入API Key | 2分钟 |
| 3 | 开始聊天 | 立即 |
- 无需安装Python、克隆Git仓库或编辑配置文件
- 运行时环境隔离——不会干扰您现有的系统
- 中文用户可自动切换镜像源
- 模型、IM渠道、技能、计划等均在GUI中配置
下载: GitHub Releases — Windows (.exe) / macOS (.dmg) / Linux (.deb)
更多信息请访问 openakita.ai
方案2:pip安装
pip install openakita[all] # 安装所有可选功能
openakita init # 运行设置向导
openakita # 启动交互式CLI
方案3:源码安装
git clone https://github.com/openakita/openakita.git
cd openakita
python -m venv venv && source venv/bin/activate
pip install -e ".[all]"
openakita init
命令示例
openakita # 交互式聊天
openakita run "构建计算器" # 执行单个任务
openakita serve # 服务模式(IM渠道)
openakita serve --dev # 开发模式,支持热重载
openakita daemon start # 后台守护进程
openakita status # 查看状态
多平台访问
OpenAkita支持 桌面、Web和移动端——无论何时何地,任何设备都能使用:
| 平台 | 详情 |
|---|---|
| 🖥️ 桌面应用 | Windows / macOS / Linux — 使用Tauri 2.x构建的原生应用 |
| 🌐 Web访问 | PC及移动浏览器 — 支持远程访问,可在任意浏览器中打开 |
| 📱 移动应用 | Android (APK) / iOS (TestFlight) — 通过Capacitor构建的原生封装 |
桌面应用
基于 Tauri 2.x + React + TypeScript 构建的跨平台桌面应用:
| 面板 | 功能 |
|---|---|
| 聊天 | AI聊天、流式输出、思维显示、拖拽上传、图片灯箱 |
| 智能体仪表盘 | 神经网络可视化、实时多智能体状态追踪 |
| 智能体管理器 | 创建、管理和配置多个智能体 |
| IM渠道 | 一站式配置所有6大平台,扫码绑定 |
| 技能 | 市场搜索、安装、启用/禁用 |
| MCP | MCP服务器管理 |
| 记忆 | 内存管理+LLM驱动的回顾 |
| 计划器 | 定时任务管理 |
| Token统计 | Token使用情况统计 |
| 配置 | LLM接口、系统设置、高级选项 |
| 反馈 | Bug报告+功能请求 |
深色/浅色主题 · 引导向导 · 自动更新 · 双语(英/中)· 开机自启
移动应用
- 通过本地网络将手机连接到桌面后端
- 功能齐全:聊天、多智能体协作、记忆、技能、MCP——全部在移动端实现
- 支持实时流式输出和思维链展示
- 即使不连接服务器,也可使用预览模式
组织编排
▶ 点击观看:基于OpenAkita构建一家公司,且实现自主运行(哔哩哔哩)
超越多智能体协作——构建整个AI公司。OpenAkita内置完整的组织编排引擎(AgentOrg),允许你在GUI界面中以可视化方式设计公司架构,让AI智能体如同真实公司般运作:
┌───────────────────────────────────────────────┐
│ CEO / 执行层 │
│ 制定公司战略,协调全局事务 │
└───┬───────────┬───────────┬───────────┬───────┘
▼ ▼ ▼ ▼
CTO 产品部 市场部 财务部
技术架构 规划 战略 预算管理
│ │ │ │
▼ ▼ ▼ ▼
开发团队 设计 内容 分析
核心功能
| 功能 | 描述 |
|---|---|
| 可视化组织架构图 | GUI中的拖拽式组织架构构建工具——节点、边、层级关系 |
| 自主角色 | 每个节点都是独立的智能体,拥有自己的身份、技能、策略和记忆 |
| 共享黑板 | 三层黑板内存(组织/部门/节点),用于安全地跨团队信息共享 |
| 消息路由 | 带优先级的消息队列,支持边带宽控制及死锁检测 |
| 心跳检查 | 定期监测所有节点健康状态,异常时自动修复 |
| 自动扩缩容 | 在负载过高时自动招募新智能体,空闲时则释放资源 |
| 外部工具 | 节点可按需申请科研、浏览器或代码工具,经审批流程后使用 |
| 组织模板 | 预置模板(如科技公司、内容团队等),一键部署 |
| 项目与任务 | 树状任务分解、时间线跟踪及全组织范围内的协同 |
多智能体协作
OpenAkita内置多智能体编排系统——不仅仅是一个AI,而是一支AI团队:
你: “生成一份竞争分析报告”
│
▼
┌──────────────────────────────────────┐
│ AgentOrchestrator (导演) │
│ 将任务拆解 → 分配给各智能体 │
└───┬────────────┬──────────────┬──────┘
▼ ▼ ▼
搜索智能体 分析智能体 写作智能体
(网络调研) (数据处理) (报告撰写)
│ │ │
└────────────┴──────────────┘
▼
结果合并后交付给你
- 专业化分工:不同领域由不同智能体负责,自动匹配任务
- 并行处理:多个智能体同时工作
- 自动交接:若某一智能体卡壳,会转交给更合适的智能体
- 故障转移:智能体失效时自动切换至备用智能体
- 深度控制:最多5层委托,防止递归失控
- 可视化追踪:智能体仪表盘实时显示每个智能体的状态
- 实例池化:采用LRU淘汰机制的智能体实例池,高效利用资源
IM扫码绑定
▶ 点击观看:OpenAkita在微信、飞书、企业微信上的扫码绑定教程(哔哩哔哩)
无需开发者账号,无需配置回调URL,无需任何技术背景——只需扫描二维码,30秒即可完成绑定:
| 平台 | 绑定方式 | 时间 |
|---|---|---|
| 微信 | 打开IM通道 → 点击“微信” → 扫描二维码 | 30秒 |
| 飞书 | 打开IM通道 → 点击“飞书” → 扫码授权 | 30秒 |
| 企业微信 | 打开IM通道 → 点击“企业微信” → 扫码绑定 | 30秒 |
绑定完成后,只需在聊天应用中@AI——发送文字、图片、文件、语音等,AI将全部处理。
6大IM平台
直接在您常用的聊天工具中与AI对话:
| 平台 | 连接方式 | 特色 |
|---|---|---|
| 微信 | 扫码绑定(iLink) | 支持个人账号,无需官方账号,30秒快速设置 |
| 飞书 | WebSocket / Webhook | 卡片消息、事件订阅、扫码绑定 |
| 企业微信 | 智能机器人回调 / WebSocket | 流式回复、主动推送、扫码绑定 |
| 钉钉 | Stream WebSocket | 无需公网IP |
| Telegram | Webhook / Long Polling | 配对验证、Markdown支持、代理支持 |
| QQ官方 | WebSocket / Webhook | 支持群聊、私信及频道 |
| OneBot | WebSocket | 兼容NapCat / Lagrange / go-cqhttp |
- 📷 视觉能力:发送截图/照片——AI能够理解并处理
- 🎤 语音能力:发送语音消息——自动转录并处理
- 📎 文件传递:AI生成的文件可直接推送到聊天中
- 👥 群聊支持:被@时回复,未提及时不干扰
- 💭 思维链:实时推理过程可流式传输至IM
- 🔄 消息打断:可在工具调用过程中插入新指令,无需等待
插件系统
OpenAkita提供完整的插件架构,包括plugin.json清单声明、三级权限模型以确保安全性,以及10个生命周期钩子以实现深度集成:
8种插件类型
| 类型 | 描述 | 示例 |
|---|---|---|
| 🔧 工具 | 注册LLM可调用的自定义工具 | 数据库查询、API调用 |
| 💬 渠道 | 添加新的IM渠道适配器 | Slack、Discord适配器 |
| 📚 RAG | 添加外部知识检索源 | Notion、Confluence检索 |
| 🧠 内存 | 扩展内存存储后端 | Redis、PostgreSQL存储 |
| 🤖 LLM | 连接新的LLM提供商 | 私有模型部署 |
| 🪝 钩子 | 将逻辑注入生命周期 | 消息审计、内容过滤 |
| ⚡ 技能 | 将技能封装为插件 | 技能打包分发 |
| 🔗 MCP | 将MCP服务器封装为插件 | 简化MCP部署 |
三级权限模型
| 层级 | 描述 | 示例 |
|---|---|---|
| 基础 | 安装时自动授予 | 读取配置、注册工具 |
| 高级 | 安装时需用户确认 | 文件I/O、网络请求 |
| 系统 | 必须逐项手动授权 | Shell执行、系统配置 |
生命周期钩子
on_init → on_message_received → on_tool_result → on_prompt_build → on_retrieve → on_session_start → on_session_end → on_schedule → on_shutdown
插件具有自动故障隔离功能:当错误次数超过阈值时,会自动禁用该插件,从而防止单个插件导致系统崩溃。
开发者文档:插件系统概述
沙箱安全
OpenAkita 实现了6 层纵深防御的安全模型,从路径管理到操作系统级别的隔离:
L1 路径分区 工作空间 / 受控 / 受保护 / 禁止
L2 确认闸门 危险操作(删除文件、系统命令)需要用户批准
L3 命令拦截 regedit、format、rm -rf — 直接阻止
L4 文件快照 写入前自动创建检查点,可回滚
L5 自我保护 data/、src/、identity/ — 核心目录被锁定,无法修改
L6 操作系统级沙箱 Linux bwrap / macOS seatbelt / Windows MIC
沙箱执行
当策略引擎将 shell 命令分类为高风险时,它会自动在操作系统级别的沙箱中运行:
| 平台 | 沙箱后端 | 描述 |
|---|---|---|
| Linux | bubblewrap (bwrap) | 用户空间容器隔离,受限的文件系统和网络 |
| macOS | sandbox-exec (seatbelt) | 系统级沙箱策略 |
| Windows | 低完整性 (MIC) | 强制完整性控制,低权限进程隔离 |
额外的安全机制
- 策略引擎:
POLICIES.yaml用于工具权限、shell 命令黑名单、路径限制 - 资源预算: 每个任务的 token / 费用 / 持续时间 / 迭代 / 工具调用限制
- 运行时监控: 自动检测工具滥用、推理循环、token 异常
- 本地数据: 内存、配置和聊天记录仅存储在您的设备上
- 开源: Apache 2.0,完全透明的代码库
30 多家 LLM 提供商
无供应商锁定。自由组合:
| 类别 | 供应商 |
|---|---|
| 国际 | Anthropic · OpenAI · Google Gemini · xAI (Grok) · Mistral · OpenRouter · NVIDIA NIM · Groq · Together AI · Fireworks · Cohere |
| 中国 | Alibaba DashScope · Kimi (Moonshot) · Xiaomi MiMo · MiniMax · DeepSeek · SiliconFlow · Volcengine · Zhipu AI · Baidu Qianfan · Tencent Hunyuan · Yunwu · Meituan LongCat · iFlow |
| 本地 | Ollama · LM Studio (⚠️ 小模型的工具调用能力有限 — 尚不推荐,待优化) |
7 种能力维度:文本 · 视觉 · 视频 · 工具使用 · 思考 · 音频 · PDF
智能故障转移:一个模型宕机,下一个模型无缝接管。
推荐模型
国际模型(按推荐顺序):
| 模型 | 供应商 | 备注 |
|---|---|---|
claude-opus-4-6 |
Anthropic | 最佳之一 — 顶级编码与长任务处理能力,1M 上下文 |
gpt-5.4 |
OpenAI | 旗舰 — 原生计算机使用,1M 上下文,强大的推理能力 |
claude-sonnet-4-6 |
Anthropic | 性价比最高 — 全面升级的默认模型,1M 上下文 |
gpt-5.3-instant |
OpenAI | 日常聊天最佳 — 幻觉显著减少,对话自然流畅 |
claude-opus-4-5 |
Anthropic | 上一代旗舰,依然非常强大 |
claude-sonnet-4-5 |
Anthropic | 稳定可靠,适合日常使用 |
中国模型(推荐):
| 模型 | 供应商 | 备注 |
|---|---|---|
kimi-k2.5 |
Moonshot | 1T MoE,支持最多 100 个并行子代理的 Agent Swarm,256K 上下文,开源 |
qwen3.5-plus |
Alibaba | 397B MoE,1M 上下文,支持 201 种语言,性价比极高 |
mimo-v2-pro |
Xiaomi | 1T MoE,1M 上下文,全球排名前 8,价格实惠 |
deepseek-v3 |
DeepSeek | 性价比标杆,中文支持强劲 |
对于复杂推理,请启用思考模式 — 在模型名称后添加
-thinking后缀。⚠️ 不推荐使用本地小型模型(如 7B/14B 量化模型):小型模型的工具调用和代理协作能力有限,容易出现幻觉和格式错误。建议使用 API 托管的旗舰模型以获得最佳体验。
记忆系统
不仅仅是“上下文窗口”——而是真正的长期记忆。支持双模式并自动切换:
模式 1:碎片化记忆(经典)
- 三层结构:工作记忆(当前任务)+ 核心记忆(用户档案)+ 动态检索(过往经验)
- 7 种记忆类型:事实 / 喜好 / 技能 / 错误 / 规则 / 人格特质 / 经验
- 多路径回忆:语义 + 全文 + 时间 + 附件搜索
- 越用越聪明:您两个月前提到的偏好?仍然记得。
模式 2:MDRM 关系图记忆(新)
在碎片化记忆的基础上,构建因果链、时间线和实体关系图——让 AI 真正理解事件之间的联系:
| 维度 | 描述 | 示例 |
|---|---|---|
| 时间 | 事件编年史和时间线 | “上周我做了什么?” → 自动构建时间线 |
| 因果 | 因果链条 | “是什么导致了这个 bug?” → 追溯因果链 |
| 实体 | 人/项目/概念之间的关系 | “Alice 曾参与过哪些项目?” → 实体图 |
| 行动 | 依赖关系、先决条件、组合 | “完成 X 还需要什么?” → 依赖分析 |
| 上下文 | 项目/会话归属 | “所有关于这个项目的讨论” → 跨会话聚合 |
- 4 种节点类型:事件 / 事实 / 决策 / 目标
- 多跳图遍历:从种子节点开始,沿着关系边扩展,找到深层连接
- 3 层编码:快速规则编码 → 摘要补全 → 会话结束批量 LLM 编码
- 3D 可视化:前端支持记忆图的 3D 可视化
智能模式切换
将 memory_mode 设置为 auto(默认),系统会根据查询特征自动路由:因果/时间线/跨会话问题使用模式 2 图遍历,偏好/事实查询使用模式 1 语义检索。
- AI 驱动提取:每次对话后自动提炼有价值的信息,并同时写入两种模式
- 3D 记忆图:可视化记忆节点和关系,直观理解 AI 的记忆结构
MCP 集成
OpenAkita 包含一个完整的 MCP(模型上下文协议) 客户端,使 AI 能够连接任何外部服务:
| 功能 | 描述 |
|---|---|
| 3 种传输方式 | stdio(默认)、可流式 HTTP、SSE(旧版兼容) |
| 多目录扫描 | 自动发现内置 mcps/、.mcp、data/mcp/servers/ 目录中的 MCP 配置 |
| 动态管理 | 运行时可添加或移除 MCP 服务器,无需重启 |
| 工具套件 | call_mcp_tool、list_mcp_servers、add_mcp_server、connect_mcp_server 等 |
| 渐进式披露 | MCP 工具目录 + 提示模板,按需显示 |
| GUI 管理 | 桌面 MCP 面板,实现一站式配置 |
可连接 GitHub、数据库、Playwright 浏览器、文件系统或任何 MCP 服务器。
自我进化
OpenAkita 不断变得更强大:
每日 04:00 → 自检:分析错误日志 → AI 诊断 → 自动修复 → 发送报告
失败后 → 根因分析(上下文丢失 / 工具限制 / 循环 / 预算)→ 提供建议
缺少技能 → 自动在 GitHub 上搜索相关技能,或由 AI 即时生成新技能
缺少依赖 → 自动执行 pip 安装,并为国内用户自动切换镜像源
每次对话 → 提取用户偏好和经验 → 形成长期记忆
架构
桌面应用(Tauri + React)
│
身份 ─── SOUL.md · AGENT.md · POLICIES.yaml · 8 种人格预设
│
核心 ─── 理性引擎(ReAct) · 大脑(LLM) · 上下文管理器
│ 提示词组装器 · 运行时监督器 · 资源预算
│
代理 ─── 代理编排器(协调)· 代理实例池(池化)
│ 代理工厂 · 失败处理机制
│
组织 ─── 组织运行时(运行)· 组织管理者(CRUD)
│ 组织消息传递者(路由)· 共享内存板
│ 组织身份(继承)· 组织政策(策略)
│
插件 ─── 插件管理器(发现/加载)· 插件 API(宿主接口)
│ 钩子注册表(10 个钩子)· 插件沙箱(故障隔离)
│
内存 ─── 模式 1:统一存储(SQLite+向量)· 检索引擎(多路径)
│ 模式 2:关系型存储(MDRM 图)· 图引擎(多跳)
│ 内存模式切换器(自动切换)· 内存编码器(3 层)
│
工具 ─── Shell · 文件 · 浏览器 · 桌面 · Web · MCP · 技能
│ 计划 · 调度 · 贴纸 · 人格 · 代理委派
│
安全 ─── 政策引擎(6 层)· 沙箱执行器(操作系统沙箱)
│ 确认门 · 命令过滤器 · 检查点
│
进化 ── 自检 · 失败分析器 · 技能生成器 · 安装程序
│
渠道 ─── CLI · Telegram · Feishu · WeCom · WeChat · DingTalk · QQ · OneBot
│
追踪 ─── 代理追踪器(12 种跨度类型)· 决策追踪 · Token 统计
文档
| 文档 | 内容 |
|---|---|
| 配置指南 | 桌面快速设置与完整设置教程 |
| ⭐ LLM 提供商设置 | API 密钥注册 + 端点配置 + 故障转移 |
| ⭐ IM 渠道设置 | Telegram / Feishu / DingTalk / WeCom / QQ / OneBot 教程 |
| 插件系统概述 | 插件类型、权限及开发者指南 |
| 组织编排设计 | 代理组织的技术架构与设计 |
| 组织编排指南 | 组织编排用户指南 |
| 快速入门 | 安装与基础知识 |
| 架构 | 系统设计与组件 |
| 配置 | 所有配置选项 |
| 部署 | 生产环境部署 |
| MCP 集成 | 连接外部服务 |
| 技能系统 | 创建和使用技能 |
社区
![]() 微信公众号 关注获取最新动态 |
![]() 个人微信 备注“OpenAkita”加入群组 |
![]() 微信群 扫码加入(⚠️ 每周更新) |
![]() QQ 群:854429727 扫码或搜索加入 |
🌐 官网 · 💬 Discord · 🐦 X(Twitter) · 📧 邮箱
致谢
- Anthropic Claude — 默认推荐的 LLM,核心开发合作伙伴
- Tauri — 跨平台桌面框架
- ChineseBQB — 5700 多款贴纸,赋予 AI 灵魂
- browser-use — AI 浏览器自动化
- AGENTS.md / Agent Skills — 开放标准
社区贡献者
- @948324394 — Docker 部署支持
许可证
Apache License 2.0 — 参见 LICENSE
第三方许可证:THIRD_PARTY_NOTICES.md
星标历史
OpenAkita — 开源多代理 AI 助手,高效完成任务
openakita.ai
版本历史
v1.26.102026/04/03v1.26.92026/04/02v1.25.172026/04/02v1.27.72026/03/30v1.26.82026/03/30v1.25.162026/03/29v1.27.52026/03/25v1.27.22026/03/24v1.26.72026/03/22v1.25.152026/03/22v1.26.62026/03/20v1.27.12026/03/20v1.25.142026/03/20v1.26.52026/03/18v1.25.132026/03/17v1.26.32026/03/16v1.25.122026/03/15v1.26.22026/03/14v1.25.112026/03/14v1.25.102026/03/12常见问题
相似工具推荐
openclaw
OpenClaw 是一款专为个人打造的本地化 AI 助手,旨在让你在自己的设备上拥有完全可控的智能伙伴。它打破了传统 AI 助手局限于特定网页或应用的束缚,能够直接接入你日常使用的各类通讯渠道,包括微信、WhatsApp、Telegram、Discord、iMessage 等数十种平台。无论你在哪个聊天软件中发送消息,OpenClaw 都能即时响应,甚至支持在 macOS、iOS 和 Android 设备上进行语音交互,并提供实时的画布渲染功能供你操控。 这款工具主要解决了用户对数据隐私、响应速度以及“始终在线”体验的需求。通过将 AI 部署在本地,用户无需依赖云端服务即可享受快速、私密的智能辅助,真正实现了“你的数据,你做主”。其独特的技术亮点在于强大的网关架构,将控制平面与核心助手分离,确保跨平台通信的流畅性与扩展性。 OpenClaw 非常适合希望构建个性化工作流的技术爱好者、开发者,以及注重隐私保护且不愿被单一生态绑定的普通用户。只要具备基础的终端操作能力(支持 macOS、Linux 及 Windows WSL2),即可通过简单的命令行引导完成部署。如果你渴望拥有一个懂你
stable-diffusion-webui
stable-diffusion-webui 是一个基于 Gradio 构建的网页版操作界面,旨在让用户能够轻松地在本地运行和使用强大的 Stable Diffusion 图像生成模型。它解决了原始模型依赖命令行、操作门槛高且功能分散的痛点,将复杂的 AI 绘图流程整合进一个直观易用的图形化平台。 无论是希望快速上手的普通创作者、需要精细控制画面细节的设计师,还是想要深入探索模型潜力的开发者与研究人员,都能从中获益。其核心亮点在于极高的功能丰富度:不仅支持文生图、图生图、局部重绘(Inpainting)和外绘(Outpainting)等基础模式,还独创了注意力机制调整、提示词矩阵、负向提示词以及“高清修复”等高级功能。此外,它内置了 GFPGAN 和 CodeFormer 等人脸修复工具,支持多种神经网络放大算法,并允许用户通过插件系统无限扩展能力。即使是显存有限的设备,stable-diffusion-webui 也提供了相应的优化选项,让高质量的 AI 艺术创作变得触手可及。
everything-claude-code
everything-claude-code 是一套专为 AI 编程助手(如 Claude Code、Codex、Cursor 等)打造的高性能优化系统。它不仅仅是一组配置文件,而是一个经过长期实战打磨的完整框架,旨在解决 AI 代理在实际开发中面临的效率低下、记忆丢失、安全隐患及缺乏持续学习能力等核心痛点。 通过引入技能模块化、直觉增强、记忆持久化机制以及内置的安全扫描功能,everything-claude-code 能显著提升 AI 在复杂任务中的表现,帮助开发者构建更稳定、更智能的生产级 AI 代理。其独特的“研究优先”开发理念和针对 Token 消耗的优化策略,使得模型响应更快、成本更低,同时有效防御潜在的攻击向量。 这套工具特别适合软件开发者、AI 研究人员以及希望深度定制 AI 工作流的技术团队使用。无论您是在构建大型代码库,还是需要 AI 协助进行安全审计与自动化测试,everything-claude-code 都能提供强大的底层支持。作为一个曾荣获 Anthropic 黑客大奖的开源项目,它融合了多语言支持与丰富的实战钩子(hooks),让 AI 真正成长为懂上
ComfyUI
ComfyUI 是一款功能强大且高度模块化的视觉 AI 引擎,专为设计和执行复杂的 Stable Diffusion 图像生成流程而打造。它摒弃了传统的代码编写模式,采用直观的节点式流程图界面,让用户通过连接不同的功能模块即可构建个性化的生成管线。 这一设计巧妙解决了高级 AI 绘图工作流配置复杂、灵活性不足的痛点。用户无需具备编程背景,也能自由组合模型、调整参数并实时预览效果,轻松实现从基础文生图到多步骤高清修复等各类复杂任务。ComfyUI 拥有极佳的兼容性,不仅支持 Windows、macOS 和 Linux 全平台,还广泛适配 NVIDIA、AMD、Intel 及苹果 Silicon 等多种硬件架构,并率先支持 SDXL、Flux、SD3 等前沿模型。 无论是希望深入探索算法潜力的研究人员和开发者,还是追求极致创作自由度的设计师与资深 AI 绘画爱好者,ComfyUI 都能提供强大的支持。其独特的模块化架构允许社区不断扩展新功能,使其成为当前最灵活、生态最丰富的开源扩散模型工具之一,帮助用户将创意高效转化为现实。
markitdown
MarkItDown 是一款由微软 AutoGen 团队打造的轻量级 Python 工具,专为将各类文件高效转换为 Markdown 格式而设计。它支持 PDF、Word、Excel、PPT、图片(含 OCR)、音频(含语音转录)、HTML 乃至 YouTube 链接等多种格式的解析,能够精准提取文档中的标题、列表、表格和链接等关键结构信息。 在人工智能应用日益普及的今天,大语言模型(LLM)虽擅长处理文本,却难以直接读取复杂的二进制办公文档。MarkItDown 恰好解决了这一痛点,它将非结构化或半结构化的文件转化为模型“原生理解”且 Token 效率极高的 Markdown 格式,成为连接本地文件与 AI 分析 pipeline 的理想桥梁。此外,它还提供了 MCP(模型上下文协议)服务器,可无缝集成到 Claude Desktop 等 LLM 应用中。 这款工具特别适合开发者、数据科学家及 AI 研究人员使用,尤其是那些需要构建文档检索增强生成(RAG)系统、进行批量文本分析或希望让 AI 助手直接“阅读”本地文件的用户。虽然生成的内容也具备一定可读性,但其核心优势在于为机器
LLMs-from-scratch
LLMs-from-scratch 是一个基于 PyTorch 的开源教育项目,旨在引导用户从零开始一步步构建一个类似 ChatGPT 的大型语言模型(LLM)。它不仅是同名技术著作的官方代码库,更提供了一套完整的实践方案,涵盖模型开发、预训练及微调的全过程。 该项目主要解决了大模型领域“黑盒化”的学习痛点。许多开发者虽能调用现成模型,却难以深入理解其内部架构与训练机制。通过亲手编写每一行核心代码,用户能够透彻掌握 Transformer 架构、注意力机制等关键原理,从而真正理解大模型是如何“思考”的。此外,项目还包含了加载大型预训练权重进行微调的代码,帮助用户将理论知识延伸至实际应用。 LLMs-from-scratch 特别适合希望深入底层原理的 AI 开发者、研究人员以及计算机专业的学生。对于不满足于仅使用 API,而是渴望探究模型构建细节的技术人员而言,这是极佳的学习资源。其独特的技术亮点在于“循序渐进”的教学设计:将复杂的系统工程拆解为清晰的步骤,配合详细的图表与示例,让构建一个虽小但功能完备的大模型变得触手可及。无论你是想夯实理论基础,还是为未来研发更大规模的模型做准备



