glean

GitHub
800 58 中等 2 次阅读 2天前AGPL-3.0数据工具插件
AI 解读 由 AI 自动生成,仅供参考

Glean(拾灵)是一个可自行部署的 RSS 阅读器与个人知识管理工具,帮助信息密集型用户高效聚合、整理和回顾网络内容。它解决了信息过载与碎片化阅读的问题,让用户在一个统一界面中订阅、分类、标记并稍后阅读来自不同来源的文章。Glean 特别适合开发者、研究人员、内容创作者等需要持续追踪大量信息源的用户。其核心亮点包括支持多级文件夹与标签组织、自动同步更新、干净的阅读视图,以及注重隐私的自托管架构。未来还将引入 AI 功能,如智能推荐、文章摘要与自动打标(支持自带密钥)。通过 Docker 一键部署,既提供完整版(含向量数据库 Milvus),也提供轻量版,兼顾功能与易用性。目前项目仍在开发中,适合愿意尝试早期版本并关注数据自主权的技术用户。

使用场景

一位独立开发者每天需要追踪 30+ 技术博客、开源项目更新和行业资讯,信息来源分散且内容质量参差不齐。

没有 glean 时

  • 使用多个 RSS 阅读器和浏览器书签管理订阅源,内容重复且无法统一归档
  • 遇到长文或深度技术文章只能临时保存到笔记软件,缺乏上下文关联,后续难以查找
  • 无法自动过滤低质量内容(如营销软文、重复转载),浪费大量筛选时间
  • 移动端阅读体验差,不同平台同步状态混乱,经常重复阅读或遗漏重要内容
  • 所有数据托管在第三方服务,担心隐私泄露且无法灵活扩展功能

使用 glean 后

  • 通过自托管部署将所有 RSS/Atom 订阅集中管理,支持 OPML 一键迁移原有订阅列表
  • 利用“稍后读”和标签系统对技术文章分类归档,结合文件夹结构建立个人知识库
  • 开启内容过滤规则,自动屏蔽关键词匹配的低质内容,提升信息摄入效率
  • 响应式界面在手机和电脑上无缝同步阅读进度,PWA 支持离线查看已加载文章
  • 数据完全本地掌控,未来可接入 AI 功能实现自动摘要与智能推荐,无需依赖外部平台

glean 让重度信息消费者从“被动接收”转向“主动管理”,真正把碎片化阅读转化为结构化知识资产。

运行环境要求

操作系统
  • Linux
  • macOS
  • Windows
GPU

未说明

内存

未说明

依赖
notes项目支持通过 Docker 部署,包含完整版(含 Milvus 向量数据库)和精简版(不含 Milvus)。生产环境需修改默认密码和 SECRET_KEY。AI 相关功能(如摘要生成、自动打标签)尚在计划中,当前版本不依赖 GPU。
python3.11+
FastAPI
SQLAlchemy>=2.0
PostgreSQL
Redis
arq
React>=18
TypeScript
Tailwind CSS
Zustand
TanStack Query
glean hero image

快速开始

Glean 拾灵

English | 中文

[!IMPORTANT] 加入我们的 Discord 以获取最新动态并获得支持。

本项目仍在开发中,尚未准备好用于生产环境。

一个自托管的 RSS 阅读器和个人知识管理工具。

Glean(拾灵)通过智能 RSS 聚合,帮助信息密集型用户高效管理阅读内容。

Glean

功能特性

核心功能

  • 📰 RSS 订阅 - 订阅并整理 RSS/Atom 源,支持 OPML 导入/导出
  • 📚 智能阅读 - 提供干净的阅读体验,支持内容过滤
  • 🔖 稍后阅读 - 保存文章以供后续阅读,并自动清理
  • 📁 文件夹与标签 - 支持多级文件夹和标签进行内容组织
  • 书签 - 从订阅源或外部 URL 保存文章
  • 🔧 后台同步 - 每 15 分钟自动更新订阅源
  • 🔒 自托管 - 通过 Docker 部署,完全掌控数据所有权
  • 🎨 现代化 UI - 美观、响应式的暖色暗黑主题界面
  • 👨‍💼 管理员仪表盘 - 用户管理与系统监控

计划中的功能(开发中)

  • 🧠 智能推荐 - 基于 AI 的偏好学习与文章评分
  • ⚙️ 规则引擎 - 使用类 Jinja2 条件实现自动化处理
  • 🤖 AI 功能 - 自动生成摘要、自动打标签、关键词提取(自带密钥 BYOK)
  • 📄 全文抓取 - 为 RSS 摘要抓取完整文章内容
  • 🔌 Chrome 扩展 - 浏览器一键添加书签
  • 📱 移动 PWA - 面向移动设备的渐进式 Web 应用(Progressive Web App)

快速开始

一键部署

# 下载 docker-compose.yml
curl -fsSL https://raw.githubusercontent.com/LeslieLeung/glean/main/docker-compose.yml -o docker-compose.yml

# 启动 Glean(完整部署,包含 Milvus)
docker compose up -d

# 访问地址:
# - Web 应用:http://localhost
# - 管理员仪表盘:http://localhost:3001(默认账号:admin/Admin123!)

默认管理员账号:系统会自动创建一个管理员账号:

  • 用户名:admin
  • 密码:Admin123!
  • ⚠️ 在生产环境中务必修改此密码!

轻量部署(不含 Milvus,如果你不需要第三阶段的功能):

# 下载轻量版配置
curl -fsSL https://raw.githubusercontent.com/LeslieLeung/glean/main/docker-compose.lite.yml -o docker-compose.yml

# 启动 Glean
docker compose up -d

# 管理员仪表盘:http://localhost:3001(默认账号:admin/Admin123!)

自定义管理员账号(可选)

若要使用自定义管理员凭据而非默认值,请在启动前创建 .env 文件:

# 在 .env 中设置自定义管理员凭据
cat > .env << EOF
ADMIN_USERNAME=admin
ADMIN_PASSWORD=YourSecurePassword123!
SECRET_KEY=$(openssl rand -base64 32)
EOF

# 启动服务
docker compose up -d

若要禁用自动创建并手动创建管理员账号:

# 在 .env 中禁用自动创建
echo "CREATE_ADMIN=false" >> .env

# 启动服务
docker compose up -d

# 手动创建管理员账号
docker exec -it glean-backend /app/scripts/create-admin-docker.sh

配置

在生产环境中,请通过环境变量自定义部署。下载示例配置文件:

curl -fsSL https://raw.githubusercontent.com/LeslieLeung/glean/main/.env.example -o .env

需要修改的重要配置项:

变量 说明 默认值
SECRET_KEY JWT 签名密钥 生产环境必须修改!
POSTGRES_PASSWORD 数据库密码 glean生产环境请修改!
ADMIN_PASSWORD 管理员密码 Admin123!请修改!
WEB_PORT Web 界面端口 80
ADMIN_PORT 管理员仪表盘端口 3001
CREATE_ADMIN 是否自动创建管理员 true(设为 false 可禁用)

所有配置选项详见 .env.example

Docker 镜像

预构建镜像已发布至 GitHub Container Registry:

  • ghcr.io/leslieleung/glean-backend:latest - API 服务器与工作进程
  • ghcr.io/leslieleung/glean-web:latest - Web 前端
  • ghcr.io/leslieleung/glean-admin:latest - 管理员仪表盘

支持架构:linux/amd64linux/arm64

测试预发布版本

想提前体验新功能?可以使用预发布版本(alpha/beta/rc):

方法 1:使用环境变量(推荐)

# 在 .env 文件中设置 IMAGE_TAG
echo "IMAGE_TAG=v0.3.0-alpha.1" >> .env

# 或直接导出环境变量
export IMAGE_TAG=v0.3.0-alpha.1

# 使用预发布镜像启动
docker compose up -d

方法 2:内联环境变量

IMAGE_TAG=v0.3.0-alpha.1 docker compose up -d

注意:预发布版本仅用于测试。它们不会触发 Electron 应用的自动更新,不建议用于生产环境。

可用的预发布版本请参见 Releases 页面

部署

默认部署包含所有服务(完整版):

  • Web 应用(端口 80)- 主用户界面
  • 管理员仪表盘(端口 3001)- 用户管理与系统监控
  • 后端 API - FastAPI 服务器
  • Worker - 后台任务处理器(抓取订阅源、清理等)
  • PostgreSQL - 数据库
  • Redis - 任务队列
  • Milvus - 向量数据库,用于智能推荐与偏好学习(第三阶段)

也可使用 docker-compose.lite.yml 进行轻量部署(不含 Milvus)。

详细部署说明与配置请参见 DEPLOY.md

技术栈

后端:

  • Python 3.11+ / FastAPI / SQLAlchemy 2.0
  • PostgreSQL / Redis / arq(任务队列)

前端:

  • React 18 / TypeScript / Vite
  • Tailwind CSS / Zustand / TanStack Query

开发

完整开发环境搭建说明请参见 DEVELOPMENT.md

快速开始:

# 克隆并初始化
git clone https://github.com/LeslieLeung/glean.git
cd glean
npm install

# 启动基础设施
make up

# 初始化数据库(仅首次需要)
make db-upgrade

# 安装 pre-commit 钩子(可选但推荐)
make pre-commit-install

# 启动所有服务
make dev-all

# 访问地址:
# - Web:http://localhost:3000
# - 管理员:http://localhost:3001
# - API 文档:http://localhost:8000/api/docs

Pre-commit 钩子

本项目使用 pre-commit 钩子确保代码质量:

# 安装钩子(一次性设置)
make pre-commit-install

# 手动对所有文件运行钩子
make pre-commit-run

# 卸载钩子(如需要)
make pre-commit-uninstall

钩子会在每次提交时自动运行,检查以下内容:

  • 后端:ruff 格式化、ruff 代码检查、pyright 类型检查
  • 前端:ESLint、Prettier 格式化
  • 通用:尾部空白字符、文件结尾符、YAML/JSON/TOML 验证

路线图

阶段(Phase) 状态 功能(Features)
第一阶段:MVP ✅ 已完成 用户系统、RSS 订阅、阅读器、管理仪表盘(admin dashboard)
第二阶段:组织管理 ✅ 已完成 书签(Bookmarks)、文件夹(folders)、标签(tags)、稍后阅读(read later)
第三阶段:偏好设置 🚧 进行中 嵌入(Embedding)流水线、偏好学习(preference learning)、智能推荐(smart recommendations)
第四阶段:规则引擎 📋 计划中 规则引擎(Rule engine)、Jinja2 条件、自动化操作(automated actions)
第五阶段:AI 功能 📋 计划中 AI 摘要(AI summaries)、自动打标(auto-tagging)、关键词提取(keyword extraction)、自带密钥(BYOK, Bring Your Own Key)支持
第六阶段:扩展功能 📋 计划中 Chrome 扩展、PWA(渐进式 Web 应用)、网页快照(web snapshots)

详细的功能规格说明请参见 产品需求文档

文档

贡献

欢迎贡献!请先阅读我们的 开发指南

  1. Fork 本仓库
  2. 创建特性分支(feature branch)
  3. 进行修改
  4. 运行测试和代码检查(linting)
  5. 提交 Pull Request

许可证

本项目采用 AGPL-3.0 许可证,详情请参见 LICENSE 文件。

版本历史

v0.2.52026/01/29
v0.2.5-alpha.42026/01/22
v0.2.5-alpha.32026/01/22
v0.2.5-alpha.22026/01/22
v0.2.5-alpha.12026/01/22
v0.2.42026/01/16
v0.2.4-alpha.12026/01/06
v0.2.32025/12/24
v0.2.3-alpha.32025/12/22
v0.2.3-alpha.22025/12/19
v0.2.3-alpha.12025/12/19
v0.2.22025/12/17
v0.2.12025/12/16
v0.2.02025/12/15
v0.1.42025/12/02
v0.1.32025/12/01
v0.1.22025/11/30
v0.1.12025/11/30
v0.1.02025/11/30

常见问题

相似工具推荐

ML-For-Beginners

ML-For-Beginners 是由微软推出的一套系统化机器学习入门课程,旨在帮助零基础用户轻松掌握经典机器学习知识。这套课程将学习路径规划为 12 周,包含 26 节精炼课程和 52 道配套测验,内容涵盖从基础概念到实际应用的完整流程,有效解决了初学者面对庞大知识体系时无从下手、缺乏结构化指导的痛点。 无论是希望转型的开发者、需要补充算法背景的研究人员,还是对人工智能充满好奇的普通爱好者,都能从中受益。课程不仅提供了清晰的理论讲解,还强调动手实践,让用户在循序渐进中建立扎实的技能基础。其独特的亮点在于强大的多语言支持,通过自动化机制提供了包括简体中文在内的 50 多种语言版本,极大地降低了全球不同背景用户的学习门槛。此外,项目采用开源协作模式,社区活跃且内容持续更新,确保学习者能获取前沿且准确的技术资讯。如果你正寻找一条清晰、友好且专业的机器学习入门之路,ML-For-Beginners 将是理想的起点。

85k|★★☆☆☆|今天
图像数据工具视频

OpenHands

OpenHands 是一个专注于 AI 驱动开发的开源平台,旨在让智能体(Agent)像人类开发者一样理解、编写和调试代码。它解决了传统编程中重复性劳动多、环境配置复杂以及人机协作效率低等痛点,通过自动化流程显著提升开发速度。 无论是希望提升编码效率的软件工程师、探索智能体技术的研究人员,还是需要快速原型验证的技术团队,都能从中受益。OpenHands 提供了灵活多样的使用方式:既可以通过命令行(CLI)或本地图形界面在个人电脑上轻松上手,体验类似 Devin 的流畅交互;也能利用其强大的 Python SDK 自定义智能体逻辑,甚至在云端大规模部署上千个智能体并行工作。 其核心技术亮点在于模块化的软件智能体 SDK,这不仅构成了平台的引擎,还支持高度可组合的开发模式。此外,OpenHands 在 SWE-bench 基准测试中取得了 77.6% 的优异成绩,证明了其解决真实世界软件工程问题的能力。平台还具备完善的企业级功能,支持与 Slack、Jira 等工具集成,并提供细粒度的权限管理,适合从个人开发者到大型企业的各类用户场景。

70.6k|★★★☆☆|今天
语言模型Agent开发框架

gpt4free

gpt4free 是一个由社区驱动的开源项目,旨在聚合多种可访问的大型语言模型(LLM)和媒体生成接口,让用户能更灵活、便捷地使用前沿 AI 能力。它解决了直接调用各类模型时面临的接口分散、门槛高或成本昂贵等痛点,通过统一的标准将不同提供商的资源整合在一起。 无论是希望快速集成 AI 功能的开发者、需要多模型对比测试的研究人员,还是想免费体验最新技术的普通用户,都能从中受益。gpt4free 提供了丰富的使用方式:既包含易于上手的 Python 和 JavaScript 客户端库,也支持部署本地图形界面(GUI),更提供了兼容 OpenAI 标准的 REST API,方便无缝替换现有应用后端。 其技术亮点在于强大的多提供商支持架构,能够动态调度包括 Opus、Gemini、DeepSeek 等多种主流模型资源,并支持 Docker 一键部署及本地推理。项目秉持社区优先原则,在降低使用门槛的同时,也为贡献者提供了扩展新接口的便利框架,是探索和利用多样化 AI 资源的实用工具。

66k|★★☆☆☆|2天前
插件语言模型Agent

scikit-learn

scikit-learn 是一个基于 Python 构建的开源机器学习库,依托于 SciPy、NumPy 等科学计算生态,旨在让机器学习变得简单高效。它提供了一套统一且简洁的接口,涵盖了从数据预处理、特征工程到模型训练、评估及选择的全流程工具,内置了包括线性回归、支持向量机、随机森林、聚类等在内的丰富经典算法。 对于希望快速验证想法或构建原型的数据科学家、研究人员以及 Python 开发者而言,scikit-learn 是不可或缺的基础设施。它有效解决了机器学习入门门槛高、算法实现复杂以及不同模型间调用方式不统一的痛点,让用户无需重复造轮子,只需几行代码即可调用成熟的算法解决分类、回归、聚类等实际问题。 其核心技术亮点在于高度一致的 API 设计风格,所有估算器(Estimator)均遵循相同的调用逻辑,极大地降低了学习成本并提升了代码的可读性与可维护性。此外,它还提供了强大的模型选择与评估工具,如交叉验证和网格搜索,帮助用户系统地优化模型性能。作为一个由全球志愿者共同维护的成熟项目,scikit-learn 以其稳定性、详尽的文档和活跃的社区支持,成为连接理论学习与工业级应用的最

65.6k|★☆☆☆☆|今天
开发框架其他数据工具

gstack

gstack 是 Y Combinator CEO Garry Tan 亲自开源的一套 AI 工程化配置,旨在将 Claude Code 升级为你的虚拟工程团队。面对单人开发难以兼顾产品战略、架构设计、代码审查及质量测试的挑战,gstack 提供了一套标准化解决方案,帮助开发者实现堪比二十人团队的高效产出。 这套配置特别适合希望提升交付效率的创始人、技术负责人,以及初次尝试 Claude Code 的开发者。gstack 的核心亮点在于内置了 15 个具有明确职责的 AI 角色工具,涵盖 CEO、设计师、工程经理、QA 等职能。用户只需通过简单的斜杠命令(如 `/review` 进行代码审查、`/qa` 执行测试、`/plan-ceo-review` 规划功能),即可自动化处理从需求分析到部署上线的全链路任务。 所有操作基于 Markdown 和斜杠命令,无需复杂配置,完全免费且遵循 MIT 协议。gstack 不仅是一套工具集,更是一种现代化的软件工厂实践,让单人开发者也能拥有严谨的工程流程。

64.3k|★★☆☆☆|今天
Agent插件

keras

Keras 是一个专为人类设计的深度学习框架,旨在让构建和训练神经网络变得简单直观。它解决了开发者在不同深度学习后端之间切换困难、模型开发效率低以及难以兼顾调试便捷性与运行性能的痛点。 无论是刚入门的学生、专注算法的研究人员,还是需要快速落地产品的工程师,都能通过 Keras 轻松上手。它支持计算机视觉、自然语言处理、音频分析及时间序列预测等多种任务。 Keras 3 的核心亮点在于其独特的“多后端”架构。用户只需编写一套代码,即可灵活选择 TensorFlow、JAX、PyTorch 或 OpenVINO 作为底层运行引擎。这一特性不仅保留了 Keras 一贯的高层易用性,还允许开发者根据需求自由选择:利用 JAX 或 PyTorch 的即时执行模式进行高效调试,或切换至速度最快的后端以获得最高 350% 的性能提升。此外,Keras 具备强大的扩展能力,能无缝从本地笔记本电脑扩展至大规模 GPU 或 TPU 集群,是连接原型开发与生产部署的理想桥梁。

63.9k|★★☆☆☆|昨天
开发框架数据工具其他