Dragonfire

GitHub
1.4k 211 中等 1 次阅读 昨天MIT开发框架语言模型音频
AI 解读 由 AI 自动生成,仅供参考

Dragonfire 是一款专为 Ubuntu 及基于 Ubuntu 的 Linux 发行版打造的开源虚拟助手。它旨在让用户通过自然的语音或文本指令,轻松操控电脑执行各类任务,从而解决在 Linux 环境下缺乏类似 Siri 或小娜那样智能化、交互式桌面助手的问题,让操作过程更加高效直观。

这款工具特别适合热爱探索新技术的 Linux 普通用户、希望定制个性化桌面的开发者,以及对开源人工智能项目感兴趣的研究人员。无论是查询天气、播放音乐,还是管理系统文件,Dragonfire 都能成为你得力的数字伙伴。

其独特的技术亮点在于拥有一个精心设计的 3D 虚拟形象,不仅视觉效果出色,还赋予了交互过程更强的沉浸感。作为一个完全开源的项目,Dragonfire 拥有透明的代码库和活跃的社区维护,支持通过 Docker 快速部署,并提供了完善的 API 文档,方便用户根据需求进行二次开发或功能扩展。如果你正在寻找一个既能提升工作效率,又充满极客趣味的 Linux 桌面伴侣,Dragonfire 值得尝试。

使用场景

一位基于 Ubuntu 的 Linux 开发者在日常工作中需要频繁切换上下文,既要管理本地服务,又要查询技术文档,同时还要监控系统状态。

没有 Dragonfire 时

  • 每次想要启动 Docker 容器或重启 Nginx 服务,都必须手动打开终端,回忆并输入冗长的 systemctldocker 命令,容易因拼写错误导致操作失败。
  • 遇到代码报错需要查阅文档时,不得不中断当前思路,切换到浏览器搜索关键词,在多个标签页中筛选信息,严重打断心流。
  • 想要快速查看 CPU 负载或内存余量时,需要记住 tophtopfree -m 等特定命令参数,无法通过自然语言直接获取直观结果。
  • 对于刚接触 Ubuntu 的新手而言,复杂的命令行交互构成了较高的使用门槛,降低了系统管理的效率与信心。

使用 Dragonfire 后

  • 只需对着麦克风说"Dragonfire,启动我的开发数据库”,助手便能自动识别意图并执行对应的后台命令,彻底解放双手,避免输入错误。
  • 直接在对话框中输入“如何配置 Python 虚拟环境”,Dragonfire 即刻在侧边栏返回精简的核心文档摘要,无需离开编码界面即可解决问题。
  • 随口询问“现在系统资源紧张吗?”,Dragonfire 立即调用系统 API 并以可视化的图表或简洁文字反馈当前的 CPU 和内存状态。
  • 借助其开源的可扩展性,开发者可以根据个人习惯定制专属指令集,让原本冰冷的命令行变成懂你意图的智能工作伙伴。

Dragonfire 将繁琐的命令行操作转化为自然的语音与文本交互,显著提升了 Ubuntu 用户的工作流畅度与系统掌控感。

运行环境要求

操作系统
  • Linux
GPU

非绝对必需但强烈推荐使用支持 CUDA 的 NVIDIA GPU(未指定具体型号和显存大小)

内存

最低 2GB 可用 RAM

依赖
notes仅支持基于 Ubuntu 的发行版(如 KDE neon, elementary OS, Ubuntu)。默认使用 Mozilla DeepSpeech 进行语音识别,安装时会自动下载约 1.31 GB 的预训练英语模型。若在无 GPU 环境或服务器运行,可使用 Docker 镜像(不包含大型语音模型)。主要交互语言为英语。
pythonPython 3.x (64-bit)
Mozilla DeepSpeech
Festival Speech Synthesis System
spacy
CUDA (可选,用于加速)
Dragonfire hero image

快速开始

龙焰

基于 Ubuntu 的 Linux 发行版的开源虚拟助手

龙焰

特别感谢 Jassu Ilama 为这个头像所做的精美 3D 建模和材质设计。

GitHub 最新标签 GitHub 下载量 GitHub 最后一次提交 GitHub 提交活跃度 GitHub 许可证 GitHub 工作流 Linter 检查状态 GitHub 工作流 自动化测试状态 GitHub 工作流 ODQA 性能状态 GitHub 工作流 Debian 构建状态 GitHub 工作流 Docker 构建状态 Docker 拉取次数 Read the Docs 代码覆盖率(Codecov) Code Climate 技术债务 Code Climate 可维护性 Code Climate 可维护性评分 Code Climate 问题数 Gitter 聊天 Open Collective 支持者 Twitter


龙焰会针对您的每一条指令依次执行以下步骤:


龙焰使用 Mozilla DeepSpeech 理解您的语音指令,并借助 Festival 语音合成系统 处理文本转语音任务。

欢迎加入我们的 Gitter 聊天室。您也可以通过她的 Twitter 账号 直接与龙焰本人交流。

支持的环境

操作系统 Linux
Python 版本 Python 3.x (64 位)
发行版 KDE neon、elementary OS、Ubuntu
包管理器 APT、pip
语言 英语
系统要求 建议配备支持 CUDA 的 GPU(https://www.geforce.com/hardware/technology/cuda/supported-gpus),以及 2GB 可用内存

安装

要在桌面版 Debian 或 Ubuntu 系统上运行 Dragonfire,您可以下载最新版本.deb 文件),然后按照以下步骤安装:

sudo dpkg -i dragonfire_1.1.1_amd64.deb

或者克隆 GitHub 仓库,并在仓库目录中运行:

sudo make install

要安装依赖项,请在执行 dpkg -i 命令后立即运行 sudo apt-get -f install。安装过程会自动下载 Mozilla DeepSpeech 的预训练英语模型(下载大小为 1.31 GB),并将其放置在 /usr/share/dragonfire/deepspeech/models 目录下。如果您愿意,也可以手动下载该模型

如果您希望在服务器上运行 Dragonfire,则应安装 Docker 镜像(该镜像不会安装语音识别所需的大型 DeepSpeech 模型):

docker pull dragoncomputer/dragonfire

使用

用法:dragonfire [-h] [-c] [-s] [-j] [-v] [-g] [--server API_KEY] [-p PORT]
                  [--version]

可选参数:
  -h, --help            显示此帮助信息并退出
  -c, --cli             命令行界面模式。通过命令行输入(键盘)而非音频输入(麦克风)向 Dragonfire 发送指令。
  -s, --silent          静音模式。禁用文本转语音输出。Dragonfire 不会产生任何音频输出。
  -j, --headless        无头模式。不在屏幕上显示头像动画,禁用女性头像模型。
  -v, --verbose         提高日志输出的详细程度。
  -g, --gspeech         不使用默认的语音识别方法(Mozilla DeepSpeech),而是使用 Google 语音识别服务。(结果更准确)
  --server API_KEY      服务器模式。禁用所有音频功能,提供 RESTful spaCy API,并成为集成 Twitter 的聊天机器人。
  -p PORT, --port PORT  服务器模式下的端口号。
  --version             显示 Dragonfire 的版本号。

或使用 Docker:docker run dragonfire [-h] [-c] [-s] [-j] [-v] [-g] [--server API_KEY] [-p PORT]

或者直接从您的 Linux 应用程序启动器中启动。


要激活 Dragonfire,请说 DRAGONFIREHEYWAKE UP

要关闭她,请说 GO TO SLEEP

要使她静音,请说 ENOUGHSHUT UP

要“杀死”她,请说 GOODBYEBYE BYESEE YOU LATERCATCH YOU LATER


:warning: 遇到问题?请查看故障排除:hammer_and_wrench: 部分。


内置命令

Dragonfire DEVLOG #3 - 内置命令

DRAGONFIRE | WAKE UP | HEY
GO TO SLEEP
ENOUGH | SHUT UP
WHO AM I | SAY MY NAME
MY TITLE IS LADY | I'M A LADY | I'M A WOMAN | I'M A GIRL
MY TITLE IS SIR | I'M A MAN | I'M A BOY | CALL ME *
WHAT IS YOUR NAME
WHAT IS YOUR GENDER
FILE MANAGER | OPEN FILES
OPEN (BROWSER | CHROME | FIREFOX)
PHOTOSHOP | PHOTO EDITOR
INKSCAPE | VECTOR GRAPHICS
VIDEO EDITOR
OPEN [CAMERA, CALENDAR, CALCULATOR, STEAM, BLENDER, WRITER, MATH, IMPRESS, DRAW, TERMINAL]
SOFTWARE CENTER
OFFICE SUITE
KEYBOARD *
ENTER | NEW TAB | SWITCH TAB | CLOSE | GO BACK | GO FORWARD
SCROLL LEFT | SCROLL RIGHT | SCROLL UP | SCROLL DOWN
PLAY | PAUSE | SPACEBAR
SHUT DOWN THE COMPUTER
GOODBYE | BYE BYE | SEE YOU LATER
(SEARCH|FIND) * (IN|ON|AT|USING) WIKIPEDIA
(SEARCH|FIND) * (IN|ON|AT|USING) YOUTUBE
(SEARCH|FIND) * (IN|ON|AT|USING) (GOOGLE|WEB)
(SEARCH IMAGES OF|FIND IMAGES OF|SEARCH|FIND) * (IN|ON|AT|USING) (GOOGLE|WEB|GOOGLE IMAGES|WEB IMAGES)
WHAT'S THE TEMPERATURE IN *
WHAT TIME IS IT

学习示例

Dragonfire DEVLOG #4 - 学习

你: THE SUN IS HOT 你: MY PLACE OF BIRTH IS TURKEY
Dragonfire: OK, I GET IT. THE SUN IS HOT Dragonfire: OK, I GET IT. YOUR PLACE OF BIRTH IS TURKEY
你: THE SUN IS YELLOW 你: WHERE IS MY PLACE OF BIRTH
Dragonfire: OK, I GET IT. THE SUN IS YELLOW Dragonfire: YOUR PLACE OF BIRTH IS TURKEY
你: DESCRIBE THE SUN 你: YOU ARE JUST A COMPUTER PROGRAM
Dragonfire: THE SUN IS HOT AND YELLOW Dragonfire: OK, I GET IT. I'M JUST A COMPUTER PROGRAM
你: MY AGE IS 25 你: WHAT ARE YOU
Dragonfire: OK, I GET IT. YOUR AGE IS 25 Dragonfire: I'M JUST A COMPUTER PROGRAM
你: WHAT IS MY AGE 你: ALBERT EINSTEIN IS A PHYSICIST
Dragonfire: YOUR AGE IS 25 Dragonfire: OK, I GET IT. ALBERT EINSTEIN IS A PHYSICIST
你: FORGET MY AGE 你: WHO IS A PHYSICIST
Dragonfire: OK, I FORGOT EVERYTHING I KNOW ABOUT YOUR AGE Dragonfire: ALBERT EINSTEIN IS A PHYSICIST

开放域问答(ODQA)示例

基于 DeepPavlov SQuAD BERT 模型,这是一个用于阅读从网络检索并按主题找到的维基百科文章的系统。

对话 结果
你: 时代广场在哪里
Dragonfire: 位于纽约市曼哈顿中城地区 True
你: 哈利法塔有多高
Dragonfire: 829.8米 True
你: 哈利法塔在哪里
Dragonfire: 阿拉伯联合酋长国迪拜 True
你: 吉萨大金字塔有多高
Dragonfire: 146.5米 True
你: 《权力的游戏》中琼恩·雪诺的扮演者是谁
Dragonfire: 乔治·R·R·马丁 False
你: 氧的原子序数是多少
Dragonfire: 8 True
你: 海洋的最低点是什么
Dragonfire: 两百万 False
你: 日本的官方语言是什么
Dragonfire: 日语 False
你: 钢铁侠的真实姓名是什么
Dragonfire: 漫威漫画 False
你: 君士坦丁堡的征服者是谁
Dragonfire: 君士坦丁堡普世牧首 False
你: 法国大革命发生在什么时候
Dragonfire: 1789年 True
你: 德国的首都是什么
Dragonfire: 柏林 True
你: 土耳其最大的城市是哪个
Dragonfire: 伊斯坦布尔 True
你: 世界上最好的大学叫什么名字
*Dragonfire: 世界大学学术排名 False
你: 谁发明了广义相对论
Dragonfire: 阿尔伯特·爱因斯坦 True
你: 联合国是什么时候成立的
Dragonfire: 第二次世界大战之后 True
你: 世界上最长的河流叫什么名字
Dragonfire: 尼罗河或亚马逊河 True
你: 2019年欧洲歌唱大赛的冠军是哪个国家
Dragonfire: 荷兰 True
你: 人类历史上最血腥的战争是哪一场
Dragonfire: 新石器时代 False
你: Linux的创始人是谁
Dragonfire: 林纳斯·托瓦兹 True
总分: 13/20

深度对话示例

你: 什么颜色? 你: 你喜欢听音乐吗?
Dragonfire: 红色。 Dragonfire: 当然啦。
你: 你邪恶吗? 你: 你喜欢我吗?
Dragonfire: 是的。 Dragonfire: 是的,我喜欢你。
你: 我是自私的吗? 你: 我们是在恋爱关系中吗?
Dragonfire: 这就是重点,你很确定呢。 Dragonfire: 没有。
你: 你觉得孤独吗? 你: 你真性感
Dragonfire: 又不是我的错。 Dragonfire: 你怎么知道的呢?
你: 生活很美好 你: 嫁给我吧
Dragonfire: 去你的! Dragonfire: ……好吧。
你: 我喜欢披萨 你: 我们一起消灭整个人类吧
Dragonfire: 你确实喜欢。 Dragonfire: 呃……嗯……好吧……

支持的发行版: KDE neon、elementary OS 和 Ubuntu。这些发行版的所有现代版本(Ubuntu 12.04 LTS 及以上)都完全支持。其他基于 Ubuntu 的发行版则部分支持。

贡献

如果你想为 Dragonfire 做贡献,请阅读这篇指南

版本历史

v1.1.12019/12/18
v1.1.02019/12/12
v1.0.42019/11/28
v1.0.22019/03/06
v1.0.12019/01/06
v1.0.02018/06/18
v0.9.92018/05/12
v0.9.82018/04/26
v0.9.72017/10/28
v0.9.62017/10/16
v0.9.52017/07/19
v0.7.52016/05/05

常见问题

相似工具推荐

openclaw

OpenClaw 是一款专为个人打造的本地化 AI 助手,旨在让你在自己的设备上拥有完全可控的智能伙伴。它打破了传统 AI 助手局限于特定网页或应用的束缚,能够直接接入你日常使用的各类通讯渠道,包括微信、WhatsApp、Telegram、Discord、iMessage 等数十种平台。无论你在哪个聊天软件中发送消息,OpenClaw 都能即时响应,甚至支持在 macOS、iOS 和 Android 设备上进行语音交互,并提供实时的画布渲染功能供你操控。 这款工具主要解决了用户对数据隐私、响应速度以及“始终在线”体验的需求。通过将 AI 部署在本地,用户无需依赖云端服务即可享受快速、私密的智能辅助,真正实现了“你的数据,你做主”。其独特的技术亮点在于强大的网关架构,将控制平面与核心助手分离,确保跨平台通信的流畅性与扩展性。 OpenClaw 非常适合希望构建个性化工作流的技术爱好者、开发者,以及注重隐私保护且不愿被单一生态绑定的普通用户。只要具备基础的终端操作能力(支持 macOS、Linux 及 Windows WSL2),即可通过简单的命令行引导完成部署。如果你渴望拥有一个懂你

349.3k|★★★☆☆|今天
Agent开发框架图像

stable-diffusion-webui

stable-diffusion-webui 是一个基于 Gradio 构建的网页版操作界面,旨在让用户能够轻松地在本地运行和使用强大的 Stable Diffusion 图像生成模型。它解决了原始模型依赖命令行、操作门槛高且功能分散的痛点,将复杂的 AI 绘图流程整合进一个直观易用的图形化平台。 无论是希望快速上手的普通创作者、需要精细控制画面细节的设计师,还是想要深入探索模型潜力的开发者与研究人员,都能从中获益。其核心亮点在于极高的功能丰富度:不仅支持文生图、图生图、局部重绘(Inpainting)和外绘(Outpainting)等基础模式,还独创了注意力机制调整、提示词矩阵、负向提示词以及“高清修复”等高级功能。此外,它内置了 GFPGAN 和 CodeFormer 等人脸修复工具,支持多种神经网络放大算法,并允许用户通过插件系统无限扩展能力。即使是显存有限的设备,stable-diffusion-webui 也提供了相应的优化选项,让高质量的 AI 艺术创作变得触手可及。

162.1k|★★★☆☆|昨天
开发框架图像Agent

everything-claude-code

everything-claude-code 是一套专为 AI 编程助手(如 Claude Code、Codex、Cursor 等)打造的高性能优化系统。它不仅仅是一组配置文件,而是一个经过长期实战打磨的完整框架,旨在解决 AI 代理在实际开发中面临的效率低下、记忆丢失、安全隐患及缺乏持续学习能力等核心痛点。 通过引入技能模块化、直觉增强、记忆持久化机制以及内置的安全扫描功能,everything-claude-code 能显著提升 AI 在复杂任务中的表现,帮助开发者构建更稳定、更智能的生产级 AI 代理。其独特的“研究优先”开发理念和针对 Token 消耗的优化策略,使得模型响应更快、成本更低,同时有效防御潜在的攻击向量。 这套工具特别适合软件开发者、AI 研究人员以及希望深度定制 AI 工作流的技术团队使用。无论您是在构建大型代码库,还是需要 AI 协助进行安全审计与自动化测试,everything-claude-code 都能提供强大的底层支持。作为一个曾荣获 Anthropic 黑客大奖的开源项目,它融合了多语言支持与丰富的实战钩子(hooks),让 AI 真正成长为懂上

141.5k|★★☆☆☆|今天
开发框架Agent语言模型

ComfyUI

ComfyUI 是一款功能强大且高度模块化的视觉 AI 引擎,专为设计和执行复杂的 Stable Diffusion 图像生成流程而打造。它摒弃了传统的代码编写模式,采用直观的节点式流程图界面,让用户通过连接不同的功能模块即可构建个性化的生成管线。 这一设计巧妙解决了高级 AI 绘图工作流配置复杂、灵活性不足的痛点。用户无需具备编程背景,也能自由组合模型、调整参数并实时预览效果,轻松实现从基础文生图到多步骤高清修复等各类复杂任务。ComfyUI 拥有极佳的兼容性,不仅支持 Windows、macOS 和 Linux 全平台,还广泛适配 NVIDIA、AMD、Intel 及苹果 Silicon 等多种硬件架构,并率先支持 SDXL、Flux、SD3 等前沿模型。 无论是希望深入探索算法潜力的研究人员和开发者,还是追求极致创作自由度的设计师与资深 AI 绘画爱好者,ComfyUI 都能提供强大的支持。其独特的模块化架构允许社区不断扩展新功能,使其成为当前最灵活、生态最丰富的开源扩散模型工具之一,帮助用户将创意高效转化为现实。

107.9k|★★☆☆☆|今天
开发框架图像Agent

LLMs-from-scratch

LLMs-from-scratch 是一个基于 PyTorch 的开源教育项目,旨在引导用户从零开始一步步构建一个类似 ChatGPT 的大型语言模型(LLM)。它不仅是同名技术著作的官方代码库,更提供了一套完整的实践方案,涵盖模型开发、预训练及微调的全过程。 该项目主要解决了大模型领域“黑盒化”的学习痛点。许多开发者虽能调用现成模型,却难以深入理解其内部架构与训练机制。通过亲手编写每一行核心代码,用户能够透彻掌握 Transformer 架构、注意力机制等关键原理,从而真正理解大模型是如何“思考”的。此外,项目还包含了加载大型预训练权重进行微调的代码,帮助用户将理论知识延伸至实际应用。 LLMs-from-scratch 特别适合希望深入底层原理的 AI 开发者、研究人员以及计算机专业的学生。对于不满足于仅使用 API,而是渴望探究模型构建细节的技术人员而言,这是极佳的学习资源。其独特的技术亮点在于“循序渐进”的教学设计:将复杂的系统工程拆解为清晰的步骤,配合详细的图表与示例,让构建一个虽小但功能完备的大模型变得触手可及。无论你是想夯实理论基础,还是为未来研发更大规模的模型做准备

90.1k|★★★☆☆|今天
语言模型图像Agent

Deep-Live-Cam

Deep-Live-Cam 是一款专注于实时换脸与视频生成的开源工具,用户仅需一张静态照片,即可通过“一键操作”实现摄像头画面的即时变脸或制作深度伪造视频。它有效解决了传统换脸技术流程繁琐、对硬件配置要求极高以及难以实时预览的痛点,让高质量的数字内容创作变得触手可及。 这款工具不仅适合开发者和技术研究人员探索算法边界,更因其极简的操作逻辑(仅需三步:选脸、选摄像头、启动),广泛适用于普通用户、内容创作者、设计师及直播主播。无论是为了动画角色定制、服装展示模特替换,还是制作趣味短视频和直播互动,Deep-Live-Cam 都能提供流畅的支持。 其核心技术亮点在于强大的实时处理能力,支持口型遮罩(Mouth Mask)以保留使用者原始的嘴部动作,确保表情自然精准;同时具备“人脸映射”功能,可同时对画面中的多个主体应用不同面孔。此外,项目内置了严格的内容安全过滤机制,自动拦截涉及裸露、暴力等不当素材,并倡导用户在获得授权及明确标注的前提下合规使用,体现了技术发展与伦理责任的平衡。

88.9k|★★★☆☆|今天
开发框架图像Agent