dataline

GitHub
1.5k 158 简单 1 次阅读 今天GPL-3.0开发框架图像语言模型其他数据工具Agent
AI 解读 由 AI 自动生成,仅供参考

DataLine 是一款开源的 AI 驱动数据分析与可视化工具,旨在让用户通过自然语言对话轻松探索数据。无论是处理 CSV 文件,还是连接 Postgres、MySQL、Snowflake、SQLite 等多种数据库,用户只需输入日常语言指令,DataLine 即可自动生成并执行 SQL 查询,快速绘制图表或导出报告,将原本繁琐的数据分析过程简化为几秒钟的互动。

它主要解决了传统数据分析门槛高、耗时长的痛点。对于非技术人员,无需掌握复杂的 SQL 语法即可获取数据洞察;对于后端开发者,它能大幅加速查询草稿的编写和新数据库的探索效率。在数据安全方面,DataLine 坚持“隐私优先”原则,所有数据均存储在本地设备,默认情况下会对发送给大模型的数据进行脱敏处理,确保企业级应用的安全性。

这款工具非常适合希望快速挖掘数据价值的业务人员、数据分析师,以及需要高效调试查询的开发者。其独特的技术亮点在于广泛的源支持(涵盖 Excel、SAS 文件等)以及对本地化部署的完善支持,真正实现了“无云端、纯本地”的私密数据分析体验。作为一个社区驱动的开源项目,DataLine 正致力于让每个人都能以十倍的速度完成数据工作。

使用场景

某电商公司的运营经理急需分析上季度的销售数据以制定促销策略,但面对存储在 PostgreSQL 数据库中的百万级订单记录,他无法直接获取洞察。

没有 dataline 时

  • 沟通成本高昂:运营人员必须编写详细的需求文档并等待数据分析师排期,简单的取数需求往往需要耗时数天才能反馈。
  • 技术门槛阻碍探索:非技术人员不懂 SQL 语法,无法自行验证假设或进行临时的多维度的数据下钻分析。
  • 可视化流程繁琐:即使拿到了数据表格,还需手动导出至 Excel 或 BI 工具中重新配置图表,反复调整格式浪费大量时间。
  • 迭代响应迟缓:当业务方向微调需要变更查询逻辑时,整个“提需求 - 写代码 - 跑数据”的流程必须重来一遍。

使用 dataline 后

  • 自然语言即时交互:运营经理直接用中文提问“展示上季度各品类销售额趋势”,dataline 自动将其转化为 SQL 并秒级返回结果。
  • 零代码自主探索:业务人员可连续追问“只看不含退货的订单”或“按地区拆分”,无需依赖技术人员即可自由探索数据细节。
  • 一键生成可视化图表:只需指令“画成柱状图对比”,dataline 即刻渲染出专业图表,支持直接在界面调整维度并刷新视图。
  • 敏捷迭代分析路径:修改分析思路仅需在对话框补充新条件,dataline 自动修正查询逻辑并重新执行,将分析周期从几天缩短至几分钟。

dataline 通过让业务人员直接用自然语言对话数据库,彻底打破了技术与业务之间的壁垒,实现了数据洞察的实时化与民主化。

运行环境要求

操作系统
  • Windows
  • macOS
  • Linux
GPU

未说明

内存

未说明

依赖
notes该工具主要提供预编译二进制文件 (.exe, .tar.zip) 和 Docker 镜像,普通用户无需手动配置环境。支持通过 Homebrew (macOS/Linux) 安装。手动运行时需分别配置后端 (Python FastAPI) 和前端 (React)。数据存储在本地设备,默认隐藏数据以防泄露给 LLM。Docker 部署时可通过环境变量配置基本认证 (AUTH_USERNAME, AUTH_PASSWORD) 和 CORS (ALLOWED_ORIGINS)。
python未说明 (手动运行提及后端为 Python FastAPI)
FastAPI
React
dataline hero image

快速开始

💬 用自然语言与你的数据对话 📊

介绍 DataLine,最简单、最快捷的方式⚡️ 来分析和可视化你的数据!
使用 DataLine——你的 AI 驱动的数据分析与可视化工具——在几秒钟内生成并导出图表、表格和报告 🤓

⚠️ 我们正在寻找维护者!如果你感兴趣,请在 Discord 上联系我 ⚠️

🍿 观看快速演示

DataLine logo


目录

适用人群?

无论是技术人员还是非技术人员,只要想快速探索数据,都可以使用它。⚡️⚡️

对于后端开发者来说,它也能帮助他们更快地编写查询语句,并轻松探索新的数据库。😎

尤其适合企业使用,因为它以安全为先 🔒,同时采用开源 📖 模式。

是什么?

DataLine 是一款由 AI 驱动的数据分析与可视化工具。

它注重隐私保护,所有数据都存储在你的设备上。没有 ☁️,只有 ☀️!

默认情况下,它会将你的数据与所使用的大型语言模型隔离开来,但如果数据不敏感,也可以关闭此功能。

它可以连接多种数据源(Postgres、Snowflake、MySQL、Azure SQL Server、Microsoft SQL Server、Excel、SQLite、CSV、sas7bdat 等),执行查询、生成图表,并允许你复制结果以快速构建报告。

未来发展方向?

目前,我们的目标是帮助人们快速从数据中获取洞察。

这旨在让非技术人员也能轻松查询数据,同时帮助数据分析师的工作效率提升 10 倍。

不过,你仍然可以影响我们的发展方向。我们正是为你而建,所以你拥有最大的发言权。

功能支持

  • 广泛的数据库支持:Postgres、MySQL、Snowflake、Excel、CSV、SQLite 等
  • 通过自然语言生成并执行 SQL
  • 能够修改 SQL 查询结果、保存并重新执行
  • 更好地支持探索性问题
  • 查询 CSV、Excel、SQLite、sas7bdat 等数据文件(更多连接类型)
  • 通过自然语言绘制图表
  • 修改图表查询并重新渲染/刷新图表
  • 仪表盘和触发器
  • 知识库和“可训练”示例(RAG 类型)
  • 更高级的图表选项(气泡图、堆叠图等)

还有更多功能即将推出。你仍然可以影响我们的开发方向,所以如果你是用户并且愿意参与,我们非常乐意与你面谈!请在此处预约时间:

快速入门

设置 DataLine 的方式有很多,最简单的是使用二进制可执行文件。只需下载一个文件并运行即可开始使用。

更灵活的选择是使用我们托管的 Docker 镜像。这样你可以根据需要设置认证和其他功能。

Windows

前往我们的 发布页面,打开最新的版本。你应该能找到一个 windows-exe.zip 文件。下载并解压后,运行 DataLine.exe 文件。

你可能会看到一条提示:“Windows 已保护您的电脑”,这是正常的(更多信息 -> 仍要运行)。最后,在浏览器中打开 http://localhost:7377/。

Mac

Homebrew

# 安装 dataline
brew tap ramiawar/dataline
brew install dataline

# 运行 dataline
dataline

如果你不喜欢 Homebrew,最新发布的版本中也有二进制文件!

DataLine 应该会在端口 7377 上运行,你可以在浏览器中访问:http://localhost:7377。

Linux

你可以使用 Homebrew,参见 Mac 部分。

你也可以直接使用二进制文件,方法同 Windows 部分所述,只是使用 dataline-linux.tar.zip 文件即可。

Docker

你还可以使用我们的官方 Docker 镜像,只需一条命令即可启动。这种方式更适合企业使用:

docker run -p 7377:7377 -v dataline:/home/.dataline --name dataline ramiawar/dataline:latest

你可以像管理其他容器一样管理它。docker start datalinedocker stop dataline

要更新到新版本,只需删除容器并重新运行命令即可。这样卷会跨版本保持持久化。

docker rm dataline
docker run -p 7377:7377 -v dataline:/home/.dataline --name dataline ramiawar/dataline:latest

要连接到前端,你可以访问: http://localhost:7377

升级

Windows 升级

与安装步骤相同,只需用新版本的可执行文件替换旧版即可!你的数据在不同版本之间会一直保留。

Mac 升级

Homebrew(你的数据会保留,不用担心!)

brew update && brew upgrade dataline

如果你不喜欢 Homebrew,最新发布的版本中也有二进制文件!数据同样会被保留。

Linux 升级

如果使用 Homebrew,步骤同上。否则只需用新版本的二进制文件替换旧版即可!

Docker 升级

要更新到新版本,只需删除容器并重新运行命令即可。这样卷会在更新过程中保持持久化。

docker rm dataline
docker run -p 7377:7377 -v dataline:/home/.dataline --name dataline ramiawar/dataline:latest

手动运行

想要挑战一下吗?🌶️ 你需要了解几点。DataLine 分为后端和前端两部分。

后端是一个 Python FastAPI 服务器,前端是一个 React 应用程序。 前端还包括我们的登录页面,因此你需要先设置一个环境变量!

请查看 后端前端 的说明文档。

身份验证

DataLine 在自托管模式下也支持基本的身份验证 🔒 🥳,如果您正在自行托管 DataLine 并希望通过用户名/密码来保护它,就可以使用此功能。

在运行 DataLine 可执行文件时,身份验证是不支持的 ❌。

要在自托管版本中启用身份验证,请在启动服务时添加环境变量 AUTH_USERNAMEAUTH_PASSWORD。✅

使用 Docker

通过以下 docker run 命令注入环境变量:

docker run -p 7377:7377 -v dataline:/home/.dataline --name dataline -e AUTH_USERNAME=admin -e AUTH_PASSWORD=admin ramiawar/dataline:latest

我们计划在未来支持多用户身份验证,但目前默认只支持单个用户。

启动指南

请按照以下清单探索 DataLine 的各项功能!

  • 创建一个示例数据库连接
  • 创建一个新的聊天并重命名
  • 开始向 DataLine 提问关于您的数据,并获取答案
  • 刷新页面并重新运行一些 SQL 查询
  • 点击 SQL 查询中的内容,对其进行修改,并保存以便日后使用!
  • 尝试修改您的示例数据库连接,探索连接编辑器页面
  • 尝试请求生成一张图表!
  • 如果想真正挑战一下,可以提出一个会返回多个结果(图表、表格等)的问题——示例
  • 添加个人头像

支持的数据库

更多详细信息请参阅 说明文档

部署

将 DataLine 部署到自定义域名时,您必须配置的一项内容是 CORS 允许的来源。为此,请将环境变量 ALLOWED_ORIGINS(以逗号分隔的来源列表)添加到您的域名中。

默认情况下,该变量设置为 http://localhost:7377,http://0.0.0.0:7377,以便与本地 Docker 和本地二进制文件兼容。

例如,在具有 IP 地址 123.123.12.34 的远程服务器上运行 Docker 镜像:

docker run -p 7377:7377 -v dataline:/home/.dataline --name dataline -e ALLOWED_ORIGINS="http://123.123.12.34:7377,https://123.123.12.34:7377" ramiawar/dataline:latest

Excel 文件支持

我们支持 Excel 文件,但目前这些文件需要符合一定的结构。同时,我们也支持多张工作表——每一张工作表都会被导入为一个独立的表。

现阶段,我们会尝试自动检测“标题行”和第一列,这依赖于一些手动的数据处理(以确保安全性)。因此,如果您的表格顶部有多余的行、徽标或品牌元素,系统可能会误判。

为了保证最佳质量,请确保您的第一行是列名,并移除所有工作表中的空白行和空白列。如果任何一张工作表不符合要求,整个导入过程将会失败。

未来,我们将考虑让大语言模型自动识别标题行,从而进一步减少用户的操作步骤。

贡献者 ✨

感谢以下各位优秀的朋友(emoji key):

Rami Awar
Rami Awar

💻 🎨 📖 🚇 📦 📝 🐛
anthony2261
anthony2261

💻 🤔 🚇 📦 🧑‍🏫 🚧 🐛
Walusimbi Mahad
Walusimbi Mahad

💻 🤔
Péter Gyarmati
Péter Gyarmati

💻 📖
Joe Haddad
Joe Haddad

💻 📖
maryamalki
maryamalki

💻 📖
Filip Katušin
Filip Katušin

💻 🐛

本项目遵循 all-contributors 规范。欢迎任何形式的贡献!

版本历史

v1.2.02025/05/29
v1.1.52025/03/05
v1.1.42025/01/28
v1.1.32024/11/27
v1.1.22024/10/26
v1.1.02024/10/25
v1.0.142024/09/23
v1.0.132024/09/01
v1.0.122024/08/22
v1.0.112024/07/29
v1.0.102024/07/13
v1.0.82024/07/07
v1.0.72024/06/30
v1.0.62024/06/23
v1.0.52024/06/14
v1.0.42024/06/13
v1.0.32024/06/11
v1.0.2-beta2024/06/06
v1.0.0-beta2024/05/28
v0.1.3-beta2024/05/09

常见问题

相似工具推荐

openclaw

OpenClaw 是一款专为个人打造的本地化 AI 助手,旨在让你在自己的设备上拥有完全可控的智能伙伴。它打破了传统 AI 助手局限于特定网页或应用的束缚,能够直接接入你日常使用的各类通讯渠道,包括微信、WhatsApp、Telegram、Discord、iMessage 等数十种平台。无论你在哪个聊天软件中发送消息,OpenClaw 都能即时响应,甚至支持在 macOS、iOS 和 Android 设备上进行语音交互,并提供实时的画布渲染功能供你操控。 这款工具主要解决了用户对数据隐私、响应速度以及“始终在线”体验的需求。通过将 AI 部署在本地,用户无需依赖云端服务即可享受快速、私密的智能辅助,真正实现了“你的数据,你做主”。其独特的技术亮点在于强大的网关架构,将控制平面与核心助手分离,确保跨平台通信的流畅性与扩展性。 OpenClaw 非常适合希望构建个性化工作流的技术爱好者、开发者,以及注重隐私保护且不愿被单一生态绑定的普通用户。只要具备基础的终端操作能力(支持 macOS、Linux 及 Windows WSL2),即可通过简单的命令行引导完成部署。如果你渴望拥有一个懂你

349.3k|★★★☆☆|1周前
Agent开发框架图像

stable-diffusion-webui

stable-diffusion-webui 是一个基于 Gradio 构建的网页版操作界面,旨在让用户能够轻松地在本地运行和使用强大的 Stable Diffusion 图像生成模型。它解决了原始模型依赖命令行、操作门槛高且功能分散的痛点,将复杂的 AI 绘图流程整合进一个直观易用的图形化平台。 无论是希望快速上手的普通创作者、需要精细控制画面细节的设计师,还是想要深入探索模型潜力的开发者与研究人员,都能从中获益。其核心亮点在于极高的功能丰富度:不仅支持文生图、图生图、局部重绘(Inpainting)和外绘(Outpainting)等基础模式,还独创了注意力机制调整、提示词矩阵、负向提示词以及“高清修复”等高级功能。此外,它内置了 GFPGAN 和 CodeFormer 等人脸修复工具,支持多种神经网络放大算法,并允许用户通过插件系统无限扩展能力。即使是显存有限的设备,stable-diffusion-webui 也提供了相应的优化选项,让高质量的 AI 艺术创作变得触手可及。

162.1k|★★★☆☆|1周前
开发框架图像Agent

everything-claude-code

everything-claude-code 是一套专为 AI 编程助手(如 Claude Code、Codex、Cursor 等)打造的高性能优化系统。它不仅仅是一组配置文件,而是一个经过长期实战打磨的完整框架,旨在解决 AI 代理在实际开发中面临的效率低下、记忆丢失、安全隐患及缺乏持续学习能力等核心痛点。 通过引入技能模块化、直觉增强、记忆持久化机制以及内置的安全扫描功能,everything-claude-code 能显著提升 AI 在复杂任务中的表现,帮助开发者构建更稳定、更智能的生产级 AI 代理。其独特的“研究优先”开发理念和针对 Token 消耗的优化策略,使得模型响应更快、成本更低,同时有效防御潜在的攻击向量。 这套工具特别适合软件开发者、AI 研究人员以及希望深度定制 AI 工作流的技术团队使用。无论您是在构建大型代码库,还是需要 AI 协助进行安全审计与自动化测试,everything-claude-code 都能提供强大的底层支持。作为一个曾荣获 Anthropic 黑客大奖的开源项目,它融合了多语言支持与丰富的实战钩子(hooks),让 AI 真正成长为懂上

159.6k|★★☆☆☆|今天
开发框架Agent语言模型

opencode

OpenCode 是一款开源的 AI 编程助手(Coding Agent),旨在像一位智能搭档一样融入您的开发流程。它不仅仅是一个代码补全插件,而是一个能够理解项目上下文、自主规划任务并执行复杂编码操作的智能体。无论是生成全新功能、重构现有代码,还是排查难以定位的 Bug,OpenCode 都能通过自然语言交互高效完成,显著减少开发者在重复性劳动和上下文切换上的时间消耗。 这款工具专为软件开发者、工程师及技术研究人员设计,特别适合希望利用大模型能力来提升编码效率、加速原型开发或处理遗留代码维护的专业人群。其核心亮点在于完全开源的架构,这意味着用户可以审查代码逻辑、自定义行为策略,甚至私有化部署以保障数据安全,彻底打破了传统闭源 AI 助手的“黑盒”限制。 在技术体验上,OpenCode 提供了灵活的终端界面(Terminal UI)和正在测试中的桌面应用程序,支持 macOS、Windows 及 Linux 全平台。它兼容多种包管理工具,安装便捷,并能无缝集成到现有的开发环境中。无论您是追求极致控制权的资深极客,还是渴望提升产出的独立开发者,OpenCode 都提供了一个透明、可信

144.3k|★☆☆☆☆|昨天
Agent插件

ComfyUI

ComfyUI 是一款功能强大且高度模块化的视觉 AI 引擎,专为设计和执行复杂的 Stable Diffusion 图像生成流程而打造。它摒弃了传统的代码编写模式,采用直观的节点式流程图界面,让用户通过连接不同的功能模块即可构建个性化的生成管线。 这一设计巧妙解决了高级 AI 绘图工作流配置复杂、灵活性不足的痛点。用户无需具备编程背景,也能自由组合模型、调整参数并实时预览效果,轻松实现从基础文生图到多步骤高清修复等各类复杂任务。ComfyUI 拥有极佳的兼容性,不仅支持 Windows、macOS 和 Linux 全平台,还广泛适配 NVIDIA、AMD、Intel 及苹果 Silicon 等多种硬件架构,并率先支持 SDXL、Flux、SD3 等前沿模型。 无论是希望深入探索算法潜力的研究人员和开发者,还是追求极致创作自由度的设计师与资深 AI 绘画爱好者,ComfyUI 都能提供强大的支持。其独特的模块化架构允许社区不断扩展新功能,使其成为当前最灵活、生态最丰富的开源扩散模型工具之一,帮助用户将创意高效转化为现实。

108.3k|★★☆☆☆|1周前
开发框架图像Agent

gemini-cli

gemini-cli 是一款由谷歌推出的开源 AI 命令行工具,它将强大的 Gemini 大模型能力直接集成到用户的终端环境中。对于习惯在命令行工作的开发者而言,它提供了一条从输入提示词到获取模型响应的最短路径,无需切换窗口即可享受智能辅助。 这款工具主要解决了开发过程中频繁上下文切换的痛点,让用户能在熟悉的终端界面内直接完成代码理解、生成、调试以及自动化运维任务。无论是查询大型代码库、根据草图生成应用,还是执行复杂的 Git 操作,gemini-cli 都能通过自然语言指令高效处理。 它特别适合广大软件工程师、DevOps 人员及技术研究人员使用。其核心亮点包括支持高达 100 万 token 的超长上下文窗口,具备出色的逻辑推理能力;内置 Google 搜索、文件操作及 Shell 命令执行等实用工具;更独特的是,它支持 MCP(模型上下文协议),允许用户灵活扩展自定义集成,连接如图像生成等外部能力。此外,个人谷歌账号即可享受免费的额度支持,且项目基于 Apache 2.0 协议完全开源,是提升终端工作效率的理想助手。

100.8k|★★☆☆☆|1周前
插件Agent图像