openakita

GitHub
1.6k 203 非常简单 1 次阅读 今天Apache-2.0Agent开发框架图像
AI 解读 由 AI 自动生成,仅供参考

OpenAkita 是一款开源的多智能体 AI 助手框架,旨在突破传统 AI 仅能对话的局限,打造能真正“办事”的虚拟团队。它通过组织多个 AI 智能体协同工作,自主完成网页搜索、电脑操作、文件管理及定时任务等复杂流程,并支持在 Telegram、飞书、微信、钉钉等主流即时通讯平台上即时响应。

这一工具解决了单一 AI 模型在处理长链条、多步骤任务时能力不足的问题,让用户无需编写代码或输入复杂指令,只需通过图形界面或扫码绑定,即可在几分钟内部署属于自己的"AI 公司”。无论是希望提升办公效率的普通用户,还是想要构建复杂自动化流程的开发者与研究人员,都能从中受益。普通用户可享受零命令行门槛的便捷体验,而开发者则能通过丰富的插件系统扩展功能。

OpenAkita 的技术亮点在于其独特的“组织编排”架构与六层沙箱安全机制,既保障了多智能体协作的高效性,又确保了本地操作的安全性。此外,它兼容 30 多种大语言模型,支持跨桌面、Web 及移动端使用,让 AI 不仅能聊天,更能像专业团队一样交付成果。

使用场景

某电商运营团队需要在每周一上午快速汇总竞品价格、生成分析报告并同步至飞书群,同时自动更新本地库存表格。

没有 openakita 时

  • 人工操作繁琐:运营人员需手动打开多个网页搜索竞品数据,复制粘贴到 Excel,耗时且容易出错。
  • 工具割裂严重:数据分析、报告撰写和消息通知分散在不同软件中,无法形成自动化闭环,需反复切换窗口。
  • 响应滞后:一旦遇到突发价格变动,无法实时监测并立即通知团队,往往错过最佳调整时机。
  • 技能扩展困难:若想增加“自动截图存档”或“异常数据预警”功能,需要专门开发脚本,门槛高且维护成本大。

使用 openakita 后

  • 多智能体协同作业:部署“搜索代理”自动抓取全网竞品价格,“分析代理”生成对比图表,“通知代理”直接将结果推送到飞书群,全程无人值守。
  • 一站式任务编排:通过图形化界面将搜索、计算、绘图和发消息串联成工作流,无需编写代码即可在 5 分钟内搭建完成。
  • 实时触发与响应:设置定时任务或关键词监听,一旦发现价格波动超过阈值,openakita 立即启动应急流程并报警。
  • 插件灵活扩展:利用其丰富的插件系统,随手添加“屏幕截图”或“数据库写入”技能,像搭积木一样自定义业务逻辑。

openakita 将原本需要多人协作半天的重复劳动,转化为一个自主运行的"AI 虚拟员工”,让团队专注于策略决策而非数据处理。

运行环境要求

操作系统
  • Windows
  • macOS
  • Linux
GPU

未说明

内存

未说明

依赖
notes该工具主要作为多智能体协作框架运行,依赖外部 LLM API(如 Anthropic, DeepSeek 等),README 中未提及本地运行大模型所需的 GPU 或显存需求。提供桌面端应用(基于 Tauri 2.x)、Web 端和移动端,支持通过 pip 安装或源码安装。内置 89+ 工具,支持 6 种即时通讯平台绑定。
python3.11+
openakita[all]
openakita hero image

快速开始

OpenAkita Logo

OpenAkita

开源多智能体AI助手 — 不只是聊天,而是一支能完成任务的AI团队

官方网站   下载   Discord

许可证 Python版本 版本 PyPI 构建状态 星标数

多智能体协作 · 组织编排 · 插件系统 · 沙箱安全 · 30+ LLM · 6种IM平台 · 89+工具 · 桌面端 / Web端 / 移动端

快速入门组织编排扫码绑定插件系统安全防护文档

English | 中文


OpenAkita是什么?

其他AI只会聊天。OpenAkita能完成任务。

OpenAkita是一款开源的一站式AI助手——多个AI智能体协同工作,组建一个能够自主运行的“AI公司”,它可以搜索网络、操作你的电脑、管理文件、执行定时任务,并在Telegram / 飞书 / 微信企业号 / 钉钉 / QQ等平台上即时响应。只需扫描二维码,30秒即可绑定你的聊天应用。 它会记住你的偏好,自我学习新技能,且从不轻言放弃任何任务。通过插件系统可扩展功能,同时受到六层沙箱安全机制的保护。

完全基于GUI的设置,5分钟即可就绪,无需命令行操作。

🌐 网站 openakita.ai  |  📥 下载桌面应用  |  📖 文档  |  💬 Discord社区


快速入门指南

🚀 对于首次使用者(3分钟)

无需安装——下载桌面应用即可开始聊天:

  1. GitHub Releases下载安装程序
  2. 安装并按照引导向导进行设置
  3. 输入你的API Key(可从AnthropicDeepSeek获取)
  4. 尝试第一个任务:输入“创建一个计算器”,看看它如何运作

💻 对于开发者(5分钟)

# 安装
pip install openakita[all]

# 快速设置(交互式向导)
openakita init

# 运行第一个任务
openakita run "构建一个天气爬虫"

✨ 立即可以做的事情

类别 示例
💬 聊天 文本 + 图片 + 文件,语音消息,贴纸
🤖 多智能体 “创建一份竞争分析” → 研究 + 分析 + 写作智能体协同工作
🏢 组织 构建一个AI公司——CEO、CTO、市场部、财务部——智能体自主运行
🌐 网络 搜索新闻、抓取网站、自动化浏览器操作
📁 文件 读取/写入/编辑文件、批量重命名、内容搜索
🖥️ 桌面 点击按钮、输入文本、截图、自动化应用程序
⏰ 定时任务 “每星期一上午9点提醒我”——基于cron的提醒

➡️ 后续步骤

  • 配置LLM:添加多个模型提供商以实现自动故障转移
  • 设置IM渠道:扫描二维码,30秒内绑定微信/飞书/企业微信,直接在聊天应用中使用AI
  • 探索技能:从市场下载或自行开发
  • 尝试组织模式:构建一个AI公司并观察其运行
  • 加入社区Discord | 微信群

核心能力

🤝 多智能体协作

多个具备专业技能的智能体并行工作。 你只需说一句话——编码智能体会编写代码,写作智能体会起草文档,测试智能体会进行验证——所有这些都会同时完成。

🏢 组织编排

不仅仅是多智能体——还可以构建一个“AI公司”。CEO、CTO、CFO、市场总监……每个角色都独立运作。共享白板、消息路由、死锁检测。

📋 计划模式

复杂任务会自动分解为步骤计划,实时跟踪进度,并在失败时自动回滚。

🧠 ReAct推理引擎

思考 → 行动 → 观察。明确的三阶段推理,带有检查点和回滚功能。如果失败?则尝试不同的策略。

🔌 插件系统

8种插件类型,三层权限模型,10个生命周期钩子。工具、渠道、RAG、记忆、LLM——一切皆可扩展。

🛡️ 六层沙箱安全

路径分区 · 确认门控 · 命令拦截 · 文件快照 · 自我保护 · 操作系统级沙箱。高风险命令会自动在隔离环境中运行。

📱 IM扫码绑定

微信、飞书、企业微信——扫描二维码,30秒即可绑定,在你的聊天应用中直接使用AI。

💾 双模记忆——越用越聪明

碎片化记忆 + MDRM关系图(因果链 · 时间线 · 实体图 · 3D可视化),自动智能切换。


完整功能列表

功能 描述
🤝 多智能体 专业化智能体、并行委派、自动交接、故障转移、实时可视化仪表盘
🏢 组织编排 层次化组织结构、CEO/CTO/CFO角色、共享黑板记忆、消息路由、死锁检测、心跳机制、自动扩缩容
📋 计划模式 自动任务分解、每步跟踪、UI中浮动进度条
🧠 ReAct推理 显式三阶段循环、检查点/回滚、循环检测、策略切换
🚀 零门槛部署 全图形化配置、引导向导、从安装到聊天仅需5分钟、无需命令行
🔧 89+内置工具 16类:Shell / 文件 / 浏览器 / 桌面 / 搜索 / 计划器 / MCP …
🔌 插件系统 8种类型(工具/通道/RAG/记忆/LLM/钩子/技能/MCP)、3级权限、10个生命周期钩子、故障隔离
🛡️ 6层安全防护 路径分区、确认闸门、命令黑名单、文件快照、自我保护、操作系统沙盒(Linux bwrap / macOS seatbelt / Windows MIC)
📱 IM扫码绑定 微信/飞书/企业微信扫码绑定,30秒完成设置,无需开发者配置
🛒 技能市场 搜索与一键安装、GitHub直接安装、AI即时生成技能
🌐 30+ LLM提供商 Anthropic / OpenAI / DeepSeek / Qwen / Kimi / MiniMax / Gemini … 智能故障转移
💬 6个IM平台 Telegram / 飞书 / 企业微信 / 钉钉 / QQ / OneBot,语音识别、智能群聊
🔗 MCP集成 标准MCP客户端,stdio / HTTP / SSE传输协议,多目录扫描,动态服务器管理
💾 双模记忆 模式1碎片化记忆(3层+7种类型+多路径召回)+模式2MDRM关系图(5维+多跳遍历+3D可视化),自动智能切换
🎭 8种人格 默认 / 技术专家 / 男友 / 女友 / Jarvis / 管家 / 商务 / 家庭
🤖 主动引擎 问候、任务跟进、空闲聊天、晚安——根据您的反馈调整频率
🧬 自我进化 每日自检与修复、故障根因分析、自动技能生成
🔍 深度思考 可控思考模式、实时思维链展示、IM流式输出
🖥️ 多平台支持 桌面端(Win/Mac/Linux)· Web端(PC及移动浏览器)· 移动App(Android/iOS),11个面板,深色主题
📊 可观测性 12种追踪跨度类型,全链路Token统计面板
😄 贴纸 5700+贴纸,情绪感知、与人格匹配

5分钟快速部署

方案1:桌面应用(推荐)

完全图形化界面,无需命令行 — 这正是OpenAkita区别于其他开源AI助手之处:

OpenAkita快速配置

步骤 操作内容 时间
1 下载安装程序,双击安装 1分钟
2 按照引导向导操作,输入API Key 2分钟
3 开始聊天 立即
  • 无需安装Python、克隆Git仓库或编辑配置文件
  • 运行时环境隔离——不会干扰您现有的系统
  • 中文用户可自动切换镜像源
  • 模型、IM渠道、技能、计划等均在GUI中配置

下载: GitHub Releases — Windows (.exe) / macOS (.dmg) / Linux (.deb)

更多信息请访问 openakita.ai

方案2:pip安装

pip install openakita[all]    # 安装所有可选功能
openakita init                # 运行设置向导
openakita                     # 启动交互式CLI

方案3:源码安装

git clone https://github.com/openakita/openakita.git
cd openakita
python -m venv venv && source venv/bin/activate
pip install -e ".[all]"
openakita init

命令示例

openakita                              # 交互式聊天
openakita run "构建计算器"     # 执行单个任务
openakita serve                        # 服务模式(IM渠道)
openakita serve --dev                  # 开发模式,支持热重载
openakita daemon start                 # 后台守护进程
openakita status                       # 查看状态

多平台访问

OpenAkita支持 桌面、Web和移动端——无论何时何地,任何设备都能使用:

平台 详情
🖥️ 桌面应用 Windows / macOS / Linux — 使用Tauri 2.x构建的原生应用
🌐 Web访问 PC及移动浏览器 — 支持远程访问,可在任意浏览器中打开
📱 移动应用 Android (APK) / iOS (TestFlight) — 通过Capacitor构建的原生封装

桌面应用

OpenAkita桌面应用

基于 Tauri 2.x + React + TypeScript 构建的跨平台桌面应用:

面板 功能
聊天 AI聊天、流式输出、思维显示、拖拽上传、图片灯箱
智能体仪表盘 神经网络可视化、实时多智能体状态追踪
智能体管理器 创建、管理和配置多个智能体
IM渠道 一站式配置所有6大平台,扫码绑定
技能 市场搜索、安装、启用/禁用
MCP MCP服务器管理
记忆 内存管理+LLM驱动的回顾
计划器 定时任务管理
Token统计 Token使用情况统计
配置 LLM接口、系统设置、高级选项
反馈 Bug报告+功能请求

深色/浅色主题 · 引导向导 · 自动更新 · 双语(英/中)· 开机自启

移动应用

▶ 观看移动应用演示
▶ 点击观看Bilibili上的移动应用演示

  • 通过本地网络将手机连接到桌面后端
  • 功能齐全:聊天、多智能体协作、记忆、技能、MCP——全部在移动端实现
  • 支持实时流式输出和思维链展示
  • 即使不连接服务器,也可使用预览模式

组织编排

▶ 观看组织编排演示
▶ 点击观看:基于OpenAkita构建一家公司,且实现自主运行(哔哩哔哩)

超越多智能体协作——构建整个AI公司。OpenAkita内置完整的组织编排引擎(AgentOrg),允许你在GUI界面中以可视化方式设计公司架构,让AI智能体如同真实公司般运作:

┌───────────────────────────────────────────────┐
│                CEO / 执行层                 │
│       制定公司战略,协调全局事务           │
└───┬───────────┬───────────┬───────────┬───────┘
    ▼           ▼           ▼           ▼
  CTO        产品部     市场部     财务部
 技术架构   规划      战略      预算管理
    │           │           │           │
    ▼           ▼           ▼           ▼
 开发团队    设计      内容      分析

核心功能

功能 描述
可视化组织架构图 GUI中的拖拽式组织架构构建工具——节点、边、层级关系
自主角色 每个节点都是独立的智能体,拥有自己的身份、技能、策略和记忆
共享黑板 三层黑板内存(组织/部门/节点),用于安全地跨团队信息共享
消息路由 带优先级的消息队列,支持边带宽控制及死锁检测
心跳检查 定期监测所有节点健康状态,异常时自动修复
自动扩缩容 在负载过高时自动招募新智能体,空闲时则释放资源
外部工具 节点可按需申请科研、浏览器或代码工具,经审批流程后使用
组织模板 预置模板(如科技公司、内容团队等),一键部署
项目与任务 树状任务分解、时间线跟踪及全组织范围内的协同

多智能体协作

▶ 观看多智能体协作演示
▶ 点击观看哔哩哔哩上的多智能体协作演示

OpenAkita内置多智能体编排系统——不仅仅是一个AI,而是一支AI团队

你: “生成一份竞争分析报告”
    │
    ▼
┌──────────────────────────────────────┐
│      AgentOrchestrator (导演)     │
│   将任务拆解 → 分配给各智能体 │
└───┬────────────┬──────────────┬──────┘
    ▼            ▼              ▼
 搜索智能体  分析智能体  写作智能体
 (网络调研) (数据处理) (报告撰写)
    │            │              │
    └────────────┴──────────────┘
                 ▼
         结果合并后交付给你
  • 专业化分工:不同领域由不同智能体负责,自动匹配任务
  • 并行处理:多个智能体同时工作
  • 自动交接:若某一智能体卡壳,会转交给更合适的智能体
  • 故障转移:智能体失效时自动切换至备用智能体
  • 深度控制:最多5层委托,防止递归失控
  • 可视化追踪:智能体仪表盘实时显示每个智能体的状态
  • 实例池化:采用LRU淘汰机制的智能体实例池,高效利用资源

IM扫码绑定

▶ 观看扫码绑定教程
▶ 点击观看:OpenAkita在微信、飞书、企业微信上的扫码绑定教程(哔哩哔哩)

无需开发者账号,无需配置回调URL,无需任何技术背景——只需扫描二维码,30秒即可完成绑定:

平台 绑定方式 时间
微信 打开IM通道 → 点击“微信” → 扫描二维码 30秒
飞书 打开IM通道 → 点击“飞书” → 扫码授权 30秒
企业微信 打开IM通道 → 点击“企业微信” → 扫码绑定 30秒

绑定完成后,只需在聊天应用中@AI——发送文字、图片、文件、语音等,AI将全部处理。


6大IM平台

直接在您常用的聊天工具中与AI对话:

平台 连接方式 特色
微信 扫码绑定(iLink) 支持个人账号,无需官方账号,30秒快速设置
飞书 WebSocket / Webhook 卡片消息、事件订阅、扫码绑定
企业微信 智能机器人回调 / WebSocket 流式回复、主动推送、扫码绑定
钉钉 Stream WebSocket 无需公网IP
Telegram Webhook / Long Polling 配对验证、Markdown支持、代理支持
QQ官方 WebSocket / Webhook 支持群聊、私信及频道
OneBot WebSocket 兼容NapCat / Lagrange / go-cqhttp
  • 📷 视觉能力:发送截图/照片——AI能够理解并处理
  • 🎤 语音能力:发送语音消息——自动转录并处理
  • 📎 文件传递:AI生成的文件可直接推送到聊天中
  • 👥 群聊支持:被@时回复,未提及时不干扰
  • 💭 思维链:实时推理过程可流式传输至IM
  • 🔄 消息打断:可在工具调用过程中插入新指令,无需等待

插件系统

OpenAkita提供完整的插件架构,包括plugin.json清单声明、三级权限模型以确保安全性,以及10个生命周期钩子以实现深度集成:

8种插件类型

类型 描述 示例
🔧 工具 注册LLM可调用的自定义工具 数据库查询、API调用
💬 渠道 添加新的IM渠道适配器 Slack、Discord适配器
📚 RAG 添加外部知识检索源 Notion、Confluence检索
🧠 内存 扩展内存存储后端 Redis、PostgreSQL存储
🤖 LLM 连接新的LLM提供商 私有模型部署
🪝 钩子 将逻辑注入生命周期 消息审计、内容过滤
技能 将技能封装为插件 技能打包分发
🔗 MCP 将MCP服务器封装为插件 简化MCP部署

三级权限模型

层级 描述 示例
基础 安装时自动授予 读取配置、注册工具
高级 安装时需用户确认 文件I/O、网络请求
系统 必须逐项手动授权 Shell执行、系统配置

生命周期钩子

on_initon_message_receivedon_tool_resulton_prompt_buildon_retrieveon_session_starton_session_endon_scheduleon_shutdown

插件具有自动故障隔离功能:当错误次数超过阈值时,会自动禁用该插件,从而防止单个插件导致系统崩溃。

开发者文档:插件系统概述


沙箱安全

OpenAkita 实现了6 层纵深防御的安全模型,从路径管理到操作系统级别的隔离:

L1  路径分区         工作空间 / 受控 / 受保护 / 禁止
L2  确认闸门   危险操作(删除文件、系统命令)需要用户批准
L3  命令拦截   regedit、format、rm -rf — 直接阻止
L4  文件快照      写入前自动创建检查点,可回滚
L5  自我保护     data/、src/、identity/ — 核心目录被锁定,无法修改
L6  操作系统级沙箱    Linux bwrap / macOS seatbelt / Windows MIC

沙箱执行

当策略引擎将 shell 命令分类为高风险时,它会自动在操作系统级别的沙箱中运行:

平台 沙箱后端 描述
Linux bubblewrap (bwrap) 用户空间容器隔离,受限的文件系统和网络
macOS sandbox-exec (seatbelt) 系统级沙箱策略
Windows 低完整性 (MIC) 强制完整性控制,低权限进程隔离

额外的安全机制

  • 策略引擎: POLICIES.yaml 用于工具权限、shell 命令黑名单、路径限制
  • 资源预算: 每个任务的 token / 费用 / 持续时间 / 迭代 / 工具调用限制
  • 运行时监控: 自动检测工具滥用、推理循环、token 异常
  • 本地数据: 内存、配置和聊天记录仅存储在您的设备上
  • 开源: Apache 2.0,完全透明的代码库

30 多家 LLM 提供商

无供应商锁定。自由组合:

类别 供应商
国际 Anthropic · OpenAI · Google Gemini · xAI (Grok) · Mistral · OpenRouter · NVIDIA NIM · Groq · Together AI · Fireworks · Cohere
中国 Alibaba DashScope · Kimi (Moonshot) · Xiaomi MiMo · MiniMax · DeepSeek · SiliconFlow · Volcengine · Zhipu AI · Baidu Qianfan · Tencent Hunyuan · Yunwu · Meituan LongCat · iFlow
本地 Ollama · LM Studio (⚠️ 小模型的工具调用能力有限 — 尚不推荐,待优化)

7 种能力维度:文本 · 视觉 · 视频 · 工具使用 · 思考 · 音频 · PDF

智能故障转移:一个模型宕机,下一个模型无缝接管。

推荐模型

国际模型(按推荐顺序):

模型 供应商 备注
claude-opus-4-6 Anthropic 最佳之一 — 顶级编码与长任务处理能力,1M 上下文
gpt-5.4 OpenAI 旗舰 — 原生计算机使用,1M 上下文,强大的推理能力
claude-sonnet-4-6 Anthropic 性价比最高 — 全面升级的默认模型,1M 上下文
gpt-5.3-instant OpenAI 日常聊天最佳 — 幻觉显著减少,对话自然流畅
claude-opus-4-5 Anthropic 上一代旗舰,依然非常强大
claude-sonnet-4-5 Anthropic 稳定可靠,适合日常使用

中国模型(推荐):

模型 供应商 备注
kimi-k2.5 Moonshot 1T MoE,支持最多 100 个并行子代理的 Agent Swarm,256K 上下文,开源
qwen3.5-plus Alibaba 397B MoE,1M 上下文,支持 201 种语言,性价比极高
mimo-v2-pro Xiaomi 1T MoE,1M 上下文,全球排名前 8,价格实惠
deepseek-v3 DeepSeek 性价比标杆,中文支持强劲

对于复杂推理,请启用思考模式 — 在模型名称后添加 -thinking 后缀。

⚠️ 不推荐使用本地小型模型(如 7B/14B 量化模型):小型模型的工具调用和代理协作能力有限,容易出现幻觉和格式错误。建议使用 API 托管的旗舰模型以获得最佳体验。


记忆系统

不仅仅是“上下文窗口”——而是真正的长期记忆。支持双模式并自动切换:

模式 1:碎片化记忆(经典)

  • 三层结构:工作记忆(当前任务)+ 核心记忆(用户档案)+ 动态检索(过往经验)
  • 7 种记忆类型:事实 / 喜好 / 技能 / 错误 / 规则 / 人格特质 / 经验
  • 多路径回忆:语义 + 全文 + 时间 + 附件搜索
  • 越用越聪明:您两个月前提到的偏好?仍然记得。

模式 2:MDRM 关系图记忆(新)

在碎片化记忆的基础上,构建因果链、时间线和实体关系图——让 AI 真正理解事件之间的联系:

维度 描述 示例
时间 事件编年史和时间线 “上周我做了什么?” → 自动构建时间线
因果 因果链条 “是什么导致了这个 bug?” → 追溯因果链
实体 人/项目/概念之间的关系 “Alice 曾参与过哪些项目?” → 实体图
行动 依赖关系、先决条件、组合 “完成 X 还需要什么?” → 依赖分析
上下文 项目/会话归属 “所有关于这个项目的讨论” → 跨会话聚合
  • 4 种节点类型:事件 / 事实 / 决策 / 目标
  • 多跳图遍历:从种子节点开始,沿着关系边扩展,找到深层连接
  • 3 层编码:快速规则编码 → 摘要补全 → 会话结束批量 LLM 编码
  • 3D 可视化:前端支持记忆图的 3D 可视化

智能模式切换

memory_mode 设置为 auto(默认),系统会根据查询特征自动路由:因果/时间线/跨会话问题使用模式 2 图遍历,偏好/事实查询使用模式 1 语义检索

  • AI 驱动提取:每次对话后自动提炼有价值的信息,并同时写入两种模式
  • 3D 记忆图:可视化记忆节点和关系,直观理解 AI 的记忆结构

MCP 集成

OpenAkita 包含一个完整的 MCP(模型上下文协议) 客户端,使 AI 能够连接任何外部服务:

功能 描述
3 种传输方式 stdio(默认)、可流式 HTTP、SSE(旧版兼容)
多目录扫描 自动发现内置 mcps/.mcpdata/mcp/servers/ 目录中的 MCP 配置
动态管理 运行时可添加或移除 MCP 服务器,无需重启
工具套件 call_mcp_toollist_mcp_serversadd_mcp_serverconnect_mcp_server
渐进式披露 MCP 工具目录 + 提示模板,按需显示
GUI 管理 桌面 MCP 面板,实现一站式配置

可连接 GitHub、数据库、Playwright 浏览器、文件系统或任何 MCP 服务器。


自我进化

OpenAkita 不断变得更强大:

每日 04:00   →  自检:分析错误日志 → AI 诊断 → 自动修复 → 发送报告
失败后        →  根因分析(上下文丢失 / 工具限制 / 循环 / 预算)→ 提供建议
缺少技能    →  自动在 GitHub 上搜索相关技能,或由 AI 即时生成新技能
缺少依赖    →  自动执行 pip 安装,并为国内用户自动切换镜像源
每次对话    →  提取用户偏好和经验 → 形成长期记忆

架构

桌面应用(Tauri + React)
    │
身份 ─── SOUL.md · AGENT.md · POLICIES.yaml · 8 种人格预设
    │
核心     ─── 理性引擎(ReAct) · 大脑(LLM) · 上下文管理器
    │        提示词组装器 · 运行时监督器 · 资源预算
    │
代理     ─── 代理编排器(协调)· 代理实例池(池化)
    │        代理工厂 · 失败处理机制
    │
组织     ─── 组织运行时(运行)· 组织管理者(CRUD)
    │        组织消息传递者(路由)· 共享内存板
    │        组织身份(继承)· 组织政策(策略)
    │
插件     ─── 插件管理器(发现/加载)· 插件 API(宿主接口)
    │        钩子注册表(10 个钩子)· 插件沙箱(故障隔离)
    │
内存     ─── 模式 1:统一存储(SQLite+向量)· 检索引擎(多路径)
    │        模式 2:关系型存储(MDRM 图)· 图引擎(多跳)
    │        内存模式切换器(自动切换)· 内存编码器(3 层)
    │
工具     ─── Shell · 文件 · 浏览器 · 桌面 · Web · MCP · 技能
    │        计划 · 调度 · 贴纸 · 人格 · 代理委派
    │
安全     ─── 政策引擎(6 层)· 沙箱执行器(操作系统沙箱)
    │        确认门 · 命令过滤器 · 检查点
    │
进化     ── 自检 · 失败分析器 · 技能生成器 · 安装程序
    │
渠道     ─── CLI · Telegram · Feishu · WeCom · WeChat · DingTalk · QQ · OneBot
    │
追踪     ─── 代理追踪器(12 种跨度类型)· 决策追踪 · Token 统计

文档

文档 内容
配置指南 桌面快速设置与完整设置教程
LLM 提供商设置 API 密钥注册 + 端点配置 + 故障转移
IM 渠道设置 Telegram / Feishu / DingTalk / WeCom / QQ / OneBot 教程
插件系统概述 插件类型、权限及开发者指南
组织编排设计 代理组织的技术架构与设计
组织编排指南 组织编排用户指南
快速入门 安装与基础知识
架构 系统设计与组件
配置 所有配置选项
部署 生产环境部署
MCP 集成 连接外部服务
技能系统 创建和使用技能

社区

微信公众号
微信公众号
关注获取最新动态
个人微信
个人微信
备注“OpenAkita”加入群组
微信群
微信群
扫码加入(⚠️ 每周更新)
QQ 群
QQ 群:854429727
扫码或搜索加入

🌐 官网 · 💬 Discord · 🐦 X(Twitter) · 📧 邮箱

问题反馈 · 讨论区 · ⭐ Star


致谢

社区贡献者

许可证

Apache License 2.0 — 参见 LICENSE

第三方许可证:THIRD_PARTY_NOTICES.md

星标历史

星标历史图表

OpenAkita — 开源多代理 AI 助手,高效完成任务
openakita.ai

版本历史

v1.26.102026/04/03
v1.26.92026/04/02
v1.25.172026/04/02
v1.27.72026/03/30
v1.26.82026/03/30
v1.25.162026/03/29
v1.27.52026/03/25
v1.27.22026/03/24
v1.26.72026/03/22
v1.25.152026/03/22
v1.26.62026/03/20
v1.27.12026/03/20
v1.25.142026/03/20
v1.26.52026/03/18
v1.25.132026/03/17
v1.26.32026/03/16
v1.25.122026/03/15
v1.26.22026/03/14
v1.25.112026/03/14
v1.25.102026/03/12

常见问题

相似工具推荐

openclaw

OpenClaw 是一款专为个人打造的本地化 AI 助手,旨在让你在自己的设备上拥有完全可控的智能伙伴。它打破了传统 AI 助手局限于特定网页或应用的束缚,能够直接接入你日常使用的各类通讯渠道,包括微信、WhatsApp、Telegram、Discord、iMessage 等数十种平台。无论你在哪个聊天软件中发送消息,OpenClaw 都能即时响应,甚至支持在 macOS、iOS 和 Android 设备上进行语音交互,并提供实时的画布渲染功能供你操控。 这款工具主要解决了用户对数据隐私、响应速度以及“始终在线”体验的需求。通过将 AI 部署在本地,用户无需依赖云端服务即可享受快速、私密的智能辅助,真正实现了“你的数据,你做主”。其独特的技术亮点在于强大的网关架构,将控制平面与核心助手分离,确保跨平台通信的流畅性与扩展性。 OpenClaw 非常适合希望构建个性化工作流的技术爱好者、开发者,以及注重隐私保护且不愿被单一生态绑定的普通用户。只要具备基础的终端操作能力(支持 macOS、Linux 及 Windows WSL2),即可通过简单的命令行引导完成部署。如果你渴望拥有一个懂你

349.3k|★★★☆☆|2天前
Agent开发框架图像

stable-diffusion-webui

stable-diffusion-webui 是一个基于 Gradio 构建的网页版操作界面,旨在让用户能够轻松地在本地运行和使用强大的 Stable Diffusion 图像生成模型。它解决了原始模型依赖命令行、操作门槛高且功能分散的痛点,将复杂的 AI 绘图流程整合进一个直观易用的图形化平台。 无论是希望快速上手的普通创作者、需要精细控制画面细节的设计师,还是想要深入探索模型潜力的开发者与研究人员,都能从中获益。其核心亮点在于极高的功能丰富度:不仅支持文生图、图生图、局部重绘(Inpainting)和外绘(Outpainting)等基础模式,还独创了注意力机制调整、提示词矩阵、负向提示词以及“高清修复”等高级功能。此外,它内置了 GFPGAN 和 CodeFormer 等人脸修复工具,支持多种神经网络放大算法,并允许用户通过插件系统无限扩展能力。即使是显存有限的设备,stable-diffusion-webui 也提供了相应的优化选项,让高质量的 AI 艺术创作变得触手可及。

162.1k|★★★☆☆|3天前
开发框架图像Agent

everything-claude-code

everything-claude-code 是一套专为 AI 编程助手(如 Claude Code、Codex、Cursor 等)打造的高性能优化系统。它不仅仅是一组配置文件,而是一个经过长期实战打磨的完整框架,旨在解决 AI 代理在实际开发中面临的效率低下、记忆丢失、安全隐患及缺乏持续学习能力等核心痛点。 通过引入技能模块化、直觉增强、记忆持久化机制以及内置的安全扫描功能,everything-claude-code 能显著提升 AI 在复杂任务中的表现,帮助开发者构建更稳定、更智能的生产级 AI 代理。其独特的“研究优先”开发理念和针对 Token 消耗的优化策略,使得模型响应更快、成本更低,同时有效防御潜在的攻击向量。 这套工具特别适合软件开发者、AI 研究人员以及希望深度定制 AI 工作流的技术团队使用。无论您是在构建大型代码库,还是需要 AI 协助进行安全审计与自动化测试,everything-claude-code 都能提供强大的底层支持。作为一个曾荣获 Anthropic 黑客大奖的开源项目,它融合了多语言支持与丰富的实战钩子(hooks),让 AI 真正成长为懂上

144.7k|★★☆☆☆|今天
开发框架Agent语言模型

ComfyUI

ComfyUI 是一款功能强大且高度模块化的视觉 AI 引擎,专为设计和执行复杂的 Stable Diffusion 图像生成流程而打造。它摒弃了传统的代码编写模式,采用直观的节点式流程图界面,让用户通过连接不同的功能模块即可构建个性化的生成管线。 这一设计巧妙解决了高级 AI 绘图工作流配置复杂、灵活性不足的痛点。用户无需具备编程背景,也能自由组合模型、调整参数并实时预览效果,轻松实现从基础文生图到多步骤高清修复等各类复杂任务。ComfyUI 拥有极佳的兼容性,不仅支持 Windows、macOS 和 Linux 全平台,还广泛适配 NVIDIA、AMD、Intel 及苹果 Silicon 等多种硬件架构,并率先支持 SDXL、Flux、SD3 等前沿模型。 无论是希望深入探索算法潜力的研究人员和开发者,还是追求极致创作自由度的设计师与资深 AI 绘画爱好者,ComfyUI 都能提供强大的支持。其独特的模块化架构允许社区不断扩展新功能,使其成为当前最灵活、生态最丰富的开源扩散模型工具之一,帮助用户将创意高效转化为现实。

107.9k|★★☆☆☆|2天前
开发框架图像Agent

markitdown

MarkItDown 是一款由微软 AutoGen 团队打造的轻量级 Python 工具,专为将各类文件高效转换为 Markdown 格式而设计。它支持 PDF、Word、Excel、PPT、图片(含 OCR)、音频(含语音转录)、HTML 乃至 YouTube 链接等多种格式的解析,能够精准提取文档中的标题、列表、表格和链接等关键结构信息。 在人工智能应用日益普及的今天,大语言模型(LLM)虽擅长处理文本,却难以直接读取复杂的二进制办公文档。MarkItDown 恰好解决了这一痛点,它将非结构化或半结构化的文件转化为模型“原生理解”且 Token 效率极高的 Markdown 格式,成为连接本地文件与 AI 分析 pipeline 的理想桥梁。此外,它还提供了 MCP(模型上下文协议)服务器,可无缝集成到 Claude Desktop 等 LLM 应用中。 这款工具特别适合开发者、数据科学家及 AI 研究人员使用,尤其是那些需要构建文档检索增强生成(RAG)系统、进行批量文本分析或希望让 AI 助手直接“阅读”本地文件的用户。虽然生成的内容也具备一定可读性,但其核心优势在于为机器

93.4k|★★☆☆☆|昨天
插件开发框架

LLMs-from-scratch

LLMs-from-scratch 是一个基于 PyTorch 的开源教育项目,旨在引导用户从零开始一步步构建一个类似 ChatGPT 的大型语言模型(LLM)。它不仅是同名技术著作的官方代码库,更提供了一套完整的实践方案,涵盖模型开发、预训练及微调的全过程。 该项目主要解决了大模型领域“黑盒化”的学习痛点。许多开发者虽能调用现成模型,却难以深入理解其内部架构与训练机制。通过亲手编写每一行核心代码,用户能够透彻掌握 Transformer 架构、注意力机制等关键原理,从而真正理解大模型是如何“思考”的。此外,项目还包含了加载大型预训练权重进行微调的代码,帮助用户将理论知识延伸至实际应用。 LLMs-from-scratch 特别适合希望深入底层原理的 AI 开发者、研究人员以及计算机专业的学生。对于不满足于仅使用 API,而是渴望探究模型构建细节的技术人员而言,这是极佳的学习资源。其独特的技术亮点在于“循序渐进”的教学设计:将复杂的系统工程拆解为清晰的步骤,配合详细的图表与示例,让构建一个虽小但功能完备的大模型变得触手可及。无论你是想夯实理论基础,还是为未来研发更大规模的模型做准备

90.1k|★★★☆☆|2天前
语言模型图像Agent