aiva

GitHub
845 592 较难 1 次阅读 1周前MIT语言模型其他
AI 解读 由 AI 自动生成,仅供参考

AIVA 是一款专为开发者打造的通用型人工智能虚拟助手框架。它旨在解决传统机器人开发中重复造轮子、功能单一且难以跨平台部署的痛点。以往,开发者往往需要为不同平台(如 Slack、Telegram、Facebook)分别构建机器人,且受限于单一编程语言,难以整合先进的 AI 能力。

AIVA 通过“一次构建,处处运行”的理念,让开发者能够轻松创建同时部署在多个主流通讯平台上的智能机器人。其核心亮点在于强大的多语言互操作性:借助 SocketIO 技术,你可以在 Node.js、Python、Ruby 等不同语言编写的模块间自由交互。这意味着你可以用 Python 编写复杂的自然语言处理或机器学习逻辑(如调用 TensorFlow、Scikit-learn 等库),而用 Node.js 处理业务逻辑,并将它们无缝集成到同一个机器人中。

此外,AIVA 基于成熟的 Hubot 架构扩展而来,具有极高的可定制性,允许开发者灵活添加自定义模块。无论是需要快速原型验证的工程师,还是希望将前沿 AI 模型落地到即时通讯场景的研究人员,AIVA 都能提供坚实的基础设施,让大家从繁琐的底层搭建中解放出来,专注于核心功能的创新与实现。

使用场景

某初创团队希望为内部开发组打造一个集代码查询、任务管理和智能分析于一体的助手,以便在 Slack、Telegram 和 Facebook Messenger 上统一使用。

没有 aiva 时

  • 重复造轮子:为了覆盖不同沟通平台,团队必须分别为 Slack、Telegram 等编写三套独立的机器人代码,维护成本极高。
  • 技术栈割裂:擅长 Python 的算法工程师无法直接贡献 NLP 功能,因为主机器人是用 Node.js 写的,跨语言调用需要复杂的中间件。
  • AI 集成困难:想要引入 TensorFlow 或 spaCy 进行智能分析,需要从零配置环境并处理繁琐的依赖关系,耗时数天才能跑通 Demo。
  • 功能扩展缓慢:每次新增一个简单的“待办事项”功能,都需要修改多个平台的适配逻辑,导致新特性上线周期长达数周。

使用 aiva 后

  • 一次构建,多端运行:利用 aiva 的跨平台适配器,团队只需编写一套核心逻辑,即可同时部署到 Slack、Telegram 和 Facebook,维护工作量减少 70%。
  • 无缝多语言协作:通过 SocketIO 机制,Node.js 主控程序可直接调用 Python 编写的机器学习模块,让算法工程师能直接参与机器人功能开发。
  • 开箱即用的 AI 能力:aiva 预集成了 Tensorflow、Scikit-learn 等主流工具,团队仅用几小时就成功上线了基于深度学习的代码推荐功能。
  • 敏捷的功能迭代:借助其基于 Hubot 的可黑客化架构,开发人员通过添加独立模块即可快速扩展新功能,无需改动底层平台适配代码。

aiva 通过消除平台壁垒和技术栈隔阂,让开发者从繁琐的机器人基建中解放出来,专注于创造真正的智能业务价值。

运行环境要求

操作系统
  • Linux
  • macOS
  • Windows
GPU

未说明

内存

未说明

依赖
notes该工具是一个基于 Hubot 的通用虚拟助手框架,支持跨平台(Slack, Telegram, Facebook 等)和多语言(Node.js, Python, Ruby)交互。核心运行依赖为 Node.js 6+、Python 3 和 MySQL。虽然 README 提及支持 Tensorflow、SkFlow 等 AI 库,但明确指出自 v4 版本起不再预安装这些重型 AI 依赖,需用户根据需求自行配置。提供 Docker 镜像以简化部署。
pythonPython 3
Node.js >= 6
MySQL
SocketIO
Hubot
Tensorflow (可选)
Scikit-learn (可选)
Pandas (可选)
spaCy (可选)
aiva hero image

快速开始

AIVA GitHub版本 CircleCI Codacy Badge Codacy Badge 依赖状态 MIT许可 GitHub叉数 GitHub星标数

AIVA(人工智能虚拟助手):面向开发者的通用型虚拟助手。https://kengz.github.io/aiva-doc/

本项目正在扩展中——旨在构建一个用于知识编码的【上下文图谱知识库】。更多详情请参阅【路线图】。

它是一种“机器人泛化”解决方案:您可以实现任何功能,与主流AI工具集成,在多个平台上部署,并使用多种编程语言进行开发。

AIVA 的特点 详情
通用性 可作为应用界面、AI助手,用途广泛!
跨平台 可同时部署于 Slack、Telegram、Facebook 或其他任何 hubot适配器
多语言支持 使用 SocketIO 实现 Node.jsPythonRuby 等语言之间的跨语言交互。
内置AI工具(自v4起未预装) Tensorflow、SkFlow、Scikit、Pandas、Indico.ml、spaCy、Watson、Google API等
可扩展性强 基于 Hubot 进行扩展,可添加自定义模块!
功能强大、易于使用 请查看【设置】和【功能】部分以了解更多信息。

例如,假设您为 AIVA 开发了一个待办事项列表功能,该功能用 Node.js 编写,并利用了 Python 的 NLP 和 ML 技术。如果您之前在桌面端的 Slack 上设置了待办事项列表,那么现在也可以通过手机上的 Telegram 或 Facebook 访问它。

AIVA 中的 Deepdream 示例(v3.2.1 版本),仅用了几个小时就完成了 Deepdream 模块的开发,并在几分钟内将其部署到 AIVA 中。它可以同时在 Fb 和 Telegram 上运行: AIVA中的Deepdream

我们发现许多人在构建机器人上花费了大量时间,而忽略了真正想要实现的目标。仅仅让一个机器人正常运行就需要投入大量的精力。此外,大多数机器人往往局限于单一语言、单一平台,且缺乏 AI 能力。

既然可以拥有这一切,为什么还要受限呢?既然可以打造一个能够接入所有平台、支持多种语言的机器人,为什么还要分别开发多个机器人呢?

AIVA 的诞生正是为了解决这些问题——我们承担了繁重的工作,为您构建一个开箱即用的机器人;它具有通用性、多语言支持、跨平台特性,并经过稳健的设计与测试,完全符合您的需求。

AIVA 为您提供强大的机器人工具,节省您从零开始构建的时间,让您专注于真正想做的事情。此外,借助 AIVA 的多适配器功能(Slack、Telegram、Fb),您可以实现 一次开发,处处运行

安装

1. 克隆此仓库以便日后拉取最新版本:

    GitHub叉数 GitHub星标数

2. 克隆 您自己的分支仓库

git clone https://github.com/YOURUSERNAME/aiva.git

要将 AIVA 的最新版本同步到您的分支:

git remote add upstream https://github.com/kengz/aiva.git
git fetch upstream
git merge upstream/master

设置

以下命令会执行 bin/setup && bin/copy-config && npm install

npm run setup

然后编辑 config/ 目录下的文件:default.json(开发环境)、production.json(生产环境,可选)、db.json(MySQL数据库配置)。

该命令会通过 bin/install && npm install 安装依赖项,并为 AIVA 的运行准备数据库。所需的依赖项非常少:nodejs>=6python3mysql

完整的依赖列表请参阅 bin/install 文件,您也可以根据需要进行自定义。此过程与 CircleCI 在 circle.yml 中的构建流程相同。

Docker。我们还提供 Docker 镜像 kengz/aiva。除了多一层 Docker 层之外,其运行方式与上述步骤相同。更多详情请参阅【Docker安装】部分。

运行

npm start # 以开发模式运行 'aivadev'
# 添加标志以切换不同模式
npm start --debug # 启用调试日志
npm start production # 以生产模式运行 'aiva'

更多选项请参阅【命令】部分。这将启动 AIVA,默认使用 hubot 适配器:Slack、Telegram、Facebook(仅在启用时)。如需连接其他聊天平台,请参阅【适配器】部分。

AIVA 在 Slack、Telegram 和 Facebook 上打招呼、翻译并运行深度神经网络:

AIVA在Slack、Telegram上

如需帮助,请参阅【设置提示】部分。

旧版发布

AIVA 在 v2 版本中曾被称为 Jarvis。目前该版本已弃用,但如果您需要参考 Jarvis 的相关内容,可以执行 git checkout tags/v2.0,或查看 发布页面

AIVA v3 最后一次发布是在 v3.2.1,该版本功能齐全,但体积较大。我们现已停止维护此版本,转而推出更轻量、更便于开发者使用且更具扩展性的新版本。

路线图

  • 内置图谱大脑,用于临时知识编码,采用 CGKBHTMI
  • 内置 NLP 意图解析引擎

贡献

我们非常欢迎您的贡献,共同使 AIVA 更加完善,惠及所有开发者。我们主要关注通用性和基础性工作,例如为新语言添加客户端、改进 NLP 功能、增加实用的通用模块,或添加 Skype、Twilio 等更多适配器。

版本历史

v4.2.02017/04/02

常见问题

相似工具推荐

everything-claude-code

everything-claude-code 是一套专为 AI 编程助手(如 Claude Code、Codex、Cursor 等)打造的高性能优化系统。它不仅仅是一组配置文件,而是一个经过长期实战打磨的完整框架,旨在解决 AI 代理在实际开发中面临的效率低下、记忆丢失、安全隐患及缺乏持续学习能力等核心痛点。 通过引入技能模块化、直觉增强、记忆持久化机制以及内置的安全扫描功能,everything-claude-code 能显著提升 AI 在复杂任务中的表现,帮助开发者构建更稳定、更智能的生产级 AI 代理。其独特的“研究优先”开发理念和针对 Token 消耗的优化策略,使得模型响应更快、成本更低,同时有效防御潜在的攻击向量。 这套工具特别适合软件开发者、AI 研究人员以及希望深度定制 AI 工作流的技术团队使用。无论您是在构建大型代码库,还是需要 AI 协助进行安全审计与自动化测试,everything-claude-code 都能提供强大的底层支持。作为一个曾荣获 Anthropic 黑客大奖的开源项目,它融合了多语言支持与丰富的实战钩子(hooks),让 AI 真正成长为懂上

145.9k|★★☆☆☆|今天
开发框架Agent语言模型

LLMs-from-scratch

LLMs-from-scratch 是一个基于 PyTorch 的开源教育项目,旨在引导用户从零开始一步步构建一个类似 ChatGPT 的大型语言模型(LLM)。它不仅是同名技术著作的官方代码库,更提供了一套完整的实践方案,涵盖模型开发、预训练及微调的全过程。 该项目主要解决了大模型领域“黑盒化”的学习痛点。许多开发者虽能调用现成模型,却难以深入理解其内部架构与训练机制。通过亲手编写每一行核心代码,用户能够透彻掌握 Transformer 架构、注意力机制等关键原理,从而真正理解大模型是如何“思考”的。此外,项目还包含了加载大型预训练权重进行微调的代码,帮助用户将理论知识延伸至实际应用。 LLMs-from-scratch 特别适合希望深入底层原理的 AI 开发者、研究人员以及计算机专业的学生。对于不满足于仅使用 API,而是渴望探究模型构建细节的技术人员而言,这是极佳的学习资源。其独特的技术亮点在于“循序渐进”的教学设计:将复杂的系统工程拆解为清晰的步骤,配合详细的图表与示例,让构建一个虽小但功能完备的大模型变得触手可及。无论你是想夯实理论基础,还是为未来研发更大规模的模型做准备

90.1k|★★★☆☆|2天前
语言模型图像Agent

NextChat

NextChat 是一款轻量且极速的 AI 助手,旨在为用户提供流畅、跨平台的大模型交互体验。它完美解决了用户在多设备间切换时难以保持对话连续性,以及面对众多 AI 模型不知如何统一管理的痛点。无论是日常办公、学习辅助还是创意激发,NextChat 都能让用户随时随地通过网页、iOS、Android、Windows、MacOS 或 Linux 端无缝接入智能服务。 这款工具非常适合普通用户、学生、职场人士以及需要私有化部署的企业团队使用。对于开发者而言,它也提供了便捷的自托管方案,支持一键部署到 Vercel 或 Zeabur 等平台。 NextChat 的核心亮点在于其广泛的模型兼容性,原生支持 Claude、DeepSeek、GPT-4 及 Gemini Pro 等主流大模型,让用户在一个界面即可自由切换不同 AI 能力。此外,它还率先支持 MCP(Model Context Protocol)协议,增强了上下文处理能力。针对企业用户,NextChat 提供专业版解决方案,具备品牌定制、细粒度权限控制、内部知识库整合及安全审计等功能,满足公司对数据隐私和个性化管理的高标准要求。

87.6k|★★☆☆☆|3天前
开发框架语言模型

ML-For-Beginners

ML-For-Beginners 是由微软推出的一套系统化机器学习入门课程,旨在帮助零基础用户轻松掌握经典机器学习知识。这套课程将学习路径规划为 12 周,包含 26 节精炼课程和 52 道配套测验,内容涵盖从基础概念到实际应用的完整流程,有效解决了初学者面对庞大知识体系时无从下手、缺乏结构化指导的痛点。 无论是希望转型的开发者、需要补充算法背景的研究人员,还是对人工智能充满好奇的普通爱好者,都能从中受益。课程不仅提供了清晰的理论讲解,还强调动手实践,让用户在循序渐进中建立扎实的技能基础。其独特的亮点在于强大的多语言支持,通过自动化机制提供了包括简体中文在内的 50 多种语言版本,极大地降低了全球不同背景用户的学习门槛。此外,项目采用开源协作模式,社区活跃且内容持续更新,确保学习者能获取前沿且准确的技术资讯。如果你正寻找一条清晰、友好且专业的机器学习入门之路,ML-For-Beginners 将是理想的起点。

85.1k|★★☆☆☆|今天
图像数据工具视频

ragflow

RAGFlow 是一款领先的开源检索增强生成(RAG)引擎,旨在为大语言模型构建更精准、可靠的上下文层。它巧妙地将前沿的 RAG 技术与智能体(Agent)能力相结合,不仅支持从各类文档中高效提取知识,还能让模型基于这些知识进行逻辑推理和任务执行。 在大模型应用中,幻觉问题和知识滞后是常见痛点。RAGFlow 通过深度解析复杂文档结构(如表格、图表及混合排版),显著提升了信息检索的准确度,从而有效减少模型“胡编乱造”的现象,确保回答既有据可依又具备时效性。其内置的智能体机制更进一步,使系统不仅能回答问题,还能自主规划步骤解决复杂问题。 这款工具特别适合开发者、企业技术团队以及 AI 研究人员使用。无论是希望快速搭建私有知识库问答系统,还是致力于探索大模型在垂直领域落地的创新者,都能从中受益。RAGFlow 提供了可视化的工作流编排界面和灵活的 API 接口,既降低了非算法背景用户的上手门槛,也满足了专业开发者对系统深度定制的需求。作为基于 Apache 2.0 协议开源的项目,它正成为连接通用大模型与行业专有知识之间的重要桥梁。

77.1k|★★★☆☆|4天前
Agent图像开发框架

PaddleOCR

PaddleOCR 是一款基于百度飞桨框架开发的高性能开源光学字符识别工具包。它的核心能力是将图片、PDF 等文档中的文字提取出来,转换成计算机可读取的结构化数据,让机器真正“看懂”图文内容。 面对海量纸质或电子文档,PaddleOCR 解决了人工录入效率低、数字化成本高的问题。尤其在人工智能领域,它扮演着连接图像与大型语言模型(LLM)的桥梁角色,能将视觉信息直接转化为文本输入,助力智能问答、文档分析等应用场景落地。 PaddleOCR 适合开发者、算法研究人员以及有文档自动化需求的普通用户。其技术优势十分明显:不仅支持全球 100 多种语言的识别,还能在 Windows、Linux、macOS 等多个系统上运行,并灵活适配 CPU、GPU、NPU 等各类硬件。作为一个轻量级且社区活跃的开源项目,PaddleOCR 既能满足快速集成的需求,也能支撑前沿的视觉语言研究,是处理文字识别任务的理想选择。

75.1k|★★★☆☆|今天
语言模型图像开发框架