photoprism

39.5k 2.2k 中等 1 次阅读今天NOASSERTION图像Agent开发框架

AI 解读由 AI 自动生成，仅供参考

PhotoPrism 是一款专为去中心化网络设计的 AI 驱动照片管理应用，旨在帮助用户轻松浏览和管理生活中的影像记忆。它解决了传统相册在整理海量照片时面临的痛点：无需手动分类，即可自动识别图片内容、地理位置及人物面部，让查找特定照片变得像搜索网页一样简单。无论是专业的 RAW 格式还是各类视频文件，PhotoPrism 都能流畅支持，并保留原始画质。

这款工具非常适合注重隐私的家庭用户、摄影爱好者以及希望搭建私有云存储的技术玩家。你可以将其部署在家庭服务器、私人主机或云端，完全掌控数据主权，避免依赖大型科技公司的公共服务。其独特的技术亮点在于强大的本地化 AI 引擎，能够自动提取元数据、生成标签并结合六款高清世界地图展示拍摄轨迹；同时，它提供类似原生应用的渐进式 Web 体验（PWA），在手机、平板和桌面上均能流畅运行。此外，通过 WebDAV 协议，PhotoPrism 还能与手机备份应用及电脑文件系统无缝集成，实现后台自动同步。作为一个开源项目，它在保障功能强大的同时，始终将用户自由与隐私安全放在首位。

使用场景

摄影师李明每年拍摄数万张包含 RAW 格式和 Live Photos 的旅行照片，急需在本地私有服务器上构建一个既能保护隐私又能智能管理的相册系统。

没有 photoprism 时

海量照片散落在多个硬盘文件夹中，手动分类耗时巨大，且难以快速定位特定场景（如“日落”或“雪山”）。
手机备份依赖公有云盘，不仅订阅费用高昂，还担心私人影像数据被第三方扫描或泄露。
无法直接预览专业的 RAW 格式文件和苹果 Live Photos，必须先用其他软件转码才能查看动态效果。
想要查找某次特定旅行的照片时，只能依靠模糊的文件名记忆，缺乏基于地理位置和内容标签的精准搜索。
不同设备间同步困难，在电脑上整理的元数据无法自动同步到手机端查看。

使用 photoprism 后

利用内置 AI 自动分析图片内容，瞬间生成“海滩”、“婚礼”等标签并识别人脸，无需手动整理即可按内容检索。
部署在家庭私有服务器上，所有数据完全自主掌控，既节省了云端存储费，又彻底杜绝了隐私泄露风险。
原生支持 RAW 格式和 Live Photos，鼠标悬停即可查看动态画面，全平台提供一致的流畅浏览体验。
通过六高清世界地图和地理编码功能，直接在地图上点击即可回顾特定地点的所有行程影像。
配置 PhotoSync 或 WebDAV 后，手机照片自动后台备份至服务器，并在所有设备上实时同步最新的元数据和分类。

photoprism 让李明在完全掌控数据隐私的前提下，享受到了媲美商业云盘的智能化相册管理体验。

运行环境要求

操作系统

Linux
macOS
Windows

GPU

未说明（支持 AMD, Intel, ARM 处理器，包括 Raspberry Pi 和 Apple Silicon，通常通过 Docker 运行，未强制要求特定 NVIDIA GPU 或 CUDA 版本）

内存

未说明

依赖

notes该工具主要通过 Docker 容器部署，支持多架构镜像（AMD64, Intel, ARM）。除了浏览器和 Docker 外，无需在宿主机直接安装 Python 或其他依赖库。也可选择使用提供的 tar.gz 包进行非 Docker 安装，但具体环境依赖需参考官方文档。

python未说明

Docker

快速开始

PhotoPrism：用照片浏览你的生活

PhotoPrism® 是一款基于人工智能的照片应用，专为去中心化网络打造。它利用最新技术自动标记和搜索照片，同时不会干扰你的日常使用。你可以在家中、私有服务器上或云端运行它。

想要先体验一下？欢迎试用我们的公开演示版。请注意不要上传任何隐私、非法或冒犯性的图片。

功能概览

我们的使命是提供最用户友好且注重隐私的解决方案，帮助你整理并随时访问自己的照片。 因此，PhotoPrism 从零开始构建，旨在无论你在何处都能运行，同时不牺牲自由、隐私或功能：

浏览所有照片，无需担心 RAW 格式或视频格式
无论你使用手机、平板还是桌面电脑，我们直观的 PWA 应用都能提供原生应用般的体验，并可轻松安装到主屏幕上。
使用强大的搜索过滤器快速找到特定照片和视频，这些过滤器可以组合使用，并适用于多种属性，包括标签、位置、分辨率、颜色、黑白以及质量等。
根据内容和位置自动为照片添加标签，并识别家人和朋友的脸部。
实况照片在你将鼠标悬停在其上方时（例如在卡片视图中搜索 type:live）以及观看幻灯片播放时会自动播放。
六张高分辨率的世界地图和我们的保护隐私的地理编码服务可以帮助你重温旅行的美好回忆，探索世界各地。
支持从 Exif、XMP 以及其他来源（如 Google Photos）提取并合并元数据。
可以使用兼容的应用程序（如 PhotoSync），在后台备份 iOS 和 Android 手机。
WebDAV 客户端，例如微软的 Windows 资源管理器和苹果的 Finder，可以直接连接到 PhotoPrism。这样你就可以像操作本地文件一样，在电脑上打开、编辑和删除文件。

作为一家完全 自筹资金且独立的公司，我们承诺绝不会出售你的数据，并且会始终对我们的软件和服务保持透明度。除非你主动将文件上传至谷歌、亚马逊、微软或苹果的服务，否则你的数据绝不会被共享给这些公司。🔒

开始使用

关于我们自托管社区版的分步安装说明可以在 docs.photoprism.app 上找到——你只需要一个网页浏览器和 Docker 来运行服务器即可。该版本支持 Mac、Linux 和 Windows 系统。

稳定版和开发预览版均以多架构镜像的形式提供，适用于 64 位 AMD、Intel 和 ARM 处理器。这意味着，树莓派和 Apple Silicon 用户也能享受到完全相同的功能，并遵循相同的安装步骤。

如需了解其他安装方式，请参阅我们的入门常见问题解答，例如使用我们提供的 tar.gz 包。

支持我们的使命 💎

PhotoPrism 完全由自筹资金运营，保持独立。 您的持续支持有助于我们向公众提供更多功能，发布定期更新，并始终保持独立！

我们的会员可以享受额外功能，包括访问交互式世界地图，并可加入我们的私人聊天室，与我们的团队交流。目前我们提供以下会员选项：

您可以直接在我们的网站上注册，并通过 Stripe 使用信用卡或 SEPA 付款，无需绑定外部账户，并且可以随时轻松升级或降级。
或者，您也可以通过Patreon使用 PayPal、其他货币支付，并为所有等级选择按月或按年计费。

如果您目前通过Github Sponsors支持我们，您还可以在我们的网站上注册，然后点击“激活 Github Sponsors 会员”按钮来绑定您的账户。有关此操作以及如何绑定 Patreon 账户的详细信息，请参阅我们的激活指南。

如需更改信息、咨询会员相关问题或洽谈商业合作，欢迎随时联系我们。

查看会员常见问题 › 立即注册 ›

您的支持为何如此重要

您的持续支持帮助我们定期发布更新并保持独立，从而实现我们的使命，保护您的隐私。
稳定的资金来源是快速推出您和其他社区成员所请求的新功能的关键。
由于我们完全自筹资金且独立运营，我们可以郑重承诺绝不会出售您的数据，并始终对我们的软件和服务保持透明。

如果您喜欢这个项目，也请在 GitHub 上留下一颗星。这将为我们继续前进提供额外的动力。

衷心感谢所有现任及过往的赞助者，你们慷慨的支持一直是项目成功不可或缺的力量！

查看赞助者 › 查看致谢 ›

获取支持

访问docs.photoprism.app/user-guide，了解如何同步、整理和分享您的照片。如果您在家安装软件时遇到困难，欢迎在Github Discussions中发帖提问，或在我们的社区聊天室中寻求帮助。

对于常见问题，您可以使用我们的故障排除清单快速诊断并解决。符合条件的会员也可通过电子邮件向我们发送技术问题和建议。

即将推出的特性和改进

我们的项目路线图展示了当前正在进行的任务以及接下来将实现的功能。欢迎您为喜欢的想法点赞，让我们了解哪些内容最受欢迎。

请注意，我们实行零错误政策，竭尽全力帮助用户解决问题或解答疑问。然而，这也意味着我们无法给出新功能的确切发布时间。我们的团队收到的需求远远多于能够实现的数量，因此我们强调，我们并无义务实施您所请求的功能、改进或其他变更。尽管如此，我们非常重视您的反馈，并会认真考虑每一条建议。

由于稳定的资金来源是快速推出新功能的关键，我们诚挚地邀请您通过注册个人会员或购买商业许可来支持我们的使命。

成为会员 ›

GitHub Issues ⚠️

我们恳请您不要通过 GitHub Issues 报告 bug，除非您确定发现了一个完全可复现且此前未被报告过的问题，并且该问题必须直接在应用中修复。感谢您的理解与配合！

浏览问题时，请注意，每当有新评论添加时，我们的团队和所有订阅者都会收到 GitHub 发送的邮件通知，因此这些问题仅应用于分享重要信息，而不应被用于讨论、提问或表达个人观点。
为了便于我们调查新的 bug 报告，报告中必须包含完整的复现步骤、所使用的软件版本，以及问题发生环境的相关信息，例如浏览器类型、版本、插件、操作系统、存储类型、处理器类型和内存大小。
如果您需要帮助，或者问题可能是本地配置错误、对软件工作方式存在误解，请直接联系我们或联系社区成员。
这样做不仅能使我们有机会改进文档，提供一流的客户支持，还能避免处理模糊或重复的 bug 报告，以及因回复评论而引发大量通知的情况。

与社区互动

在 Mastodon 或 Bluesky 上关注我们，或加入社区聊天，以获取最新动态、与其他用户交流并分享您的想法。我们的行为准则阐述了与社区成员互动时的“可为”与“不可为”。

作为贡献者，如果您有不便公开讨论的事情，也欢迎直接联系我们。请注意，由于我们收到的邮件数量众多，团队可能无法立即回复您。我们会尽力在五个工作日内或更短时间内给予答复。

每一份贡献都至关重要

我们欢迎任何形式的贡献，包括博客文章、教程、翻译、测试、编写文档以及提交拉取请求。我们的开发者指南包含您开始参与所需的所有信息。

PhotoPrism® 是一项注册商标。使用我们提供的软件和服务，即表示您同意我们的服务条款、隐私政策和行为准则。文档依据 CC BY-NC-SA 4.0 许可证提供；额外条款可能适用。

PhotoPrism 快速上手指南

PhotoPrism 是一款基于 AI 的自托管照片管理应用，支持自动标签、人脸识别和地理位置标记。它完全运行在本地，保护隐私，适合家庭或个人服务器部署。

环境准备

系统要求

操作系统：Linux、macOS 或 Windows（需支持 Docker）
架构支持：64 位 AMD、Intel 或 ARM（包括 Raspberry Pi 和 Apple Silicon）
内存：建议至少 4GB RAM（处理大量照片时建议 8GB+）
存储：根据照片库大小预留足够磁盘空间

前置依赖

Docker
Docker Compose（通常随 Docker 桌面版一起安装）

国内加速提示：如果拉取 Docker 镜像较慢，可配置国内镜像加速器（如阿里云、腾讯云、网易云等）。以阿里云为例：
sudo mkdir -p /etc/docker
sudo tee /etc/docker/daemon.json <<-'EOF'
{
  "registry-mirrors": ["https://<your-id>.mirror.aliyuncs.com"]
}
EOF
sudo systemctl daemon-reload
sudo systemctl restart docker

安装步骤

创建项目目录

mkdir -p ~/photoprism && cd ~/photoprism

下载官方 Docker Compose 配置文件
```
curl -L https://dl.photoprism.app/pkg/docker-compose.yml -o docker-compose.yml
```
若无法访问，可手动创建 docker-compose.yml，内容参考官方文档。
设置管理员密码 编辑 docker-compose.yml，找到 PHOTOPRISM_ADMIN_PASSWORD，修改为强密码：
```
environment:
  PHOTOPRISM_ADMIN_PASSWORD: "your_secure_password"
```
启动服务
```
docker compose up -d
```
验证运行状态
```
docker compose ps
```
确保 photoprism 容器状态为 Up。

基本使用

访问 Web 界面
打开浏览器，访问：
```
http://localhost:2342
```
使用用户名 admin 和你设置的密码登录。
导入照片
将照片放入宿主机的原始照片目录（默认映射为 ./originals）：
```
mkdir -p ~/photoprism/originals
cp -r /path/to/your/photos ~/photoprism/originals/
```
PhotoPrism 会自动索引并分析新照片（首次可能需要几分钟）。
体验核心功能
- 在“探索”中查看 AI 自动生成的标签（如“海滩”、“狗”）
- 在“人物”中查看识别出的人脸
- 在“地图”中按地理位置浏览照片
- 使用搜索栏组合筛选条件，例如：color:blue label:mountain
可选：安装为 PWA
在浏览器中点击地址栏旁的“安装”按钮，即可将 PhotoPrism 添加为桌面或手机主屏应用，获得原生体验。

注意：所有数据均存储在本地，不会上传至任何第三方云服务。

版本历史

231128-f48ff16ef2023/11/28

260305-fad9d53952026/03/05

251130-b3068414c2025/12/01

250707-d28b3101e2025/07/07

250426-27ec7a1282025/04/26

250425-21ddba4592025/04/25

250321-57590c48b2025/03/21

250228-43447fa382025/02/28

250224-834c16bc72025/02/24

250223-b79d219072025/02/23

240915-e1280b2fb2024/09/15

240711-2197af8482024/07/11

240531-60b3a46282024/05/31

240528-977d6c0de2024/05/28

240523-923ee0cf72024/05/23

240420-ef5f14bc42024/04/20

231021-9abea5b552023/10/21

231011-63f7084172023/10/11

230923-e598513502023/09/23

230719-73fa7bbe82023/07/19

常见问题

PhotoPrism 是否支持人脸识别功能？如何使用？

浏览 iPhone 拍摄的 Live Photos 时 CPU 占用过高或出现灰色方块怎么办？

如何批量编辑多张照片的位置、日期或标签？

如何实现导入目录的自动监控和索引（Auto Import）？

如何在 Docker 容器中启用 Intel GPU 进行硬件视频转码？

在哪里可以测试尚未正式发布的开发新功能？

相似工具推荐

openclaw

OpenClaw 是一款专为个人打造的本地化 AI 助手，旨在让你在自己的设备上拥有完全可控的智能伙伴。它打破了传统 AI 助手局限于特定网页或应用的束缚，能够直接接入你日常使用的各类通讯渠道，包括微信、WhatsApp、Telegram、Discord、iMessage 等数十种平台。无论你在哪个聊天软件中发送消息，OpenClaw 都能即时响应，甚至支持在 macOS、iOS 和 Android 设备上进行语音交互，并提供实时的画布渲染功能供你操控。这款工具主要解决了用户对数据隐私、响应速度以及“始终在线”体验的需求。通过将 AI 部署在本地，用户无需依赖云端服务即可享受快速、私密的智能辅助，真正实现了“你的数据，你做主”。其独特的技术亮点在于强大的网关架构，将控制平面与核心助手分离，确保跨平台通信的流畅性与扩展性。 OpenClaw 非常适合希望构建个性化工作流的技术爱好者、开发者，以及注重隐私保护且不愿被单一生态绑定的普通用户。只要具备基础的终端操作能力（支持 macOS、Linux 及 Windows WSL2），即可通过简单的命令行引导完成部署。如果你渴望拥有一个懂你

★ 349.3k|★★★☆☆|1周前

Agent开发框架图像

stable-diffusion-webui

stable-diffusion-webui 是一个基于 Gradio 构建的网页版操作界面，旨在让用户能够轻松地在本地运行和使用强大的 Stable Diffusion 图像生成模型。它解决了原始模型依赖命令行、操作门槛高且功能分散的痛点，将复杂的 AI 绘图流程整合进一个直观易用的图形化平台。无论是希望快速上手的普通创作者、需要精细控制画面细节的设计师，还是想要深入探索模型潜力的开发者与研究人员，都能从中获益。其核心亮点在于极高的功能丰富度：不仅支持文生图、图生图、局部重绘（Inpainting）和外绘（Outpainting）等基础模式，还独创了注意力机制调整、提示词矩阵、负向提示词以及“高清修复”等高级功能。此外，它内置了 GFPGAN 和 CodeFormer 等人脸修复工具，支持多种神经网络放大算法，并允许用户通过插件系统无限扩展能力。即使是显存有限的设备，stable-diffusion-webui 也提供了相应的优化选项，让高质量的 AI 艺术创作变得触手可及。

★ 162.1k|★★★☆☆|1周前

开发框架图像Agent

everything-claude-code

everything-claude-code 是一套专为 AI 编程助手（如 Claude Code、Codex、Cursor 等）打造的高性能优化系统。它不仅仅是一组配置文件，而是一个经过长期实战打磨的完整框架，旨在解决 AI 代理在实际开发中面临的效率低下、记忆丢失、安全隐患及缺乏持续学习能力等核心痛点。通过引入技能模块化、直觉增强、记忆持久化机制以及内置的安全扫描功能，everything-claude-code 能显著提升 AI 在复杂任务中的表现，帮助开发者构建更稳定、更智能的生产级 AI 代理。其独特的“研究优先”开发理念和针对 Token 消耗的优化策略，使得模型响应更快、成本更低，同时有效防御潜在的攻击向量。这套工具特别适合软件开发者、AI 研究人员以及希望深度定制 AI 工作流的技术团队使用。无论您是在构建大型代码库，还是需要 AI 协助进行安全审计与自动化测试，everything-claude-code 都能提供强大的底层支持。作为一个曾荣获 Anthropic 黑客大奖的开源项目，它融合了多语言支持与丰富的实战钩子（hooks），让 AI 真正成长为懂上

★ 155.4k|★★☆☆☆|今天

开发框架Agent语言模型

ComfyUI

ComfyUI 是一款功能强大且高度模块化的视觉 AI 引擎，专为设计和执行复杂的 Stable Diffusion 图像生成流程而打造。它摒弃了传统的代码编写模式，采用直观的节点式流程图界面，让用户通过连接不同的功能模块即可构建个性化的生成管线。这一设计巧妙解决了高级 AI 绘图工作流配置复杂、灵活性不足的痛点。用户无需具备编程背景，也能自由组合模型、调整参数并实时预览效果，轻松实现从基础文生图到多步骤高清修复等各类复杂任务。ComfyUI 拥有极佳的兼容性，不仅支持 Windows、macOS 和 Linux 全平台，还广泛适配 NVIDIA、AMD、Intel 及苹果 Silicon 等多种硬件架构，并率先支持 SDXL、Flux、SD3 等前沿模型。无论是希望深入探索算法潜力的研究人员和开发者，还是追求极致创作自由度的设计师与资深 AI 绘画爱好者，ComfyUI 都能提供强大的支持。其独特的模块化架构允许社区不断扩展新功能，使其成为当前最灵活、生态最丰富的开源扩散模型工具之一，帮助用户将创意高效转化为现实。

★ 108.3k|★★☆☆☆|4天前

开发框架图像Agent

gemini-cli

gemini-cli 是一款由谷歌推出的开源 AI 命令行工具，它将强大的 Gemini 大模型能力直接集成到用户的终端环境中。对于习惯在命令行工作的开发者而言，它提供了一条从输入提示词到获取模型响应的最短路径，无需切换窗口即可享受智能辅助。这款工具主要解决了开发过程中频繁上下文切换的痛点，让用户能在熟悉的终端界面内直接完成代码理解、生成、调试以及自动化运维任务。无论是查询大型代码库、根据草图生成应用，还是执行复杂的 Git 操作，gemini-cli 都能通过自然语言指令高效处理。它特别适合广大软件工程师、DevOps 人员及技术研究人员使用。其核心亮点包括支持高达 100 万 token 的超长上下文窗口，具备出色的逻辑推理能力；内置 Google 搜索、文件操作及 Shell 命令执行等实用工具；更独特的是，它支持 MCP（模型上下文协议），允许用户灵活扩展自定义集成，连接如图像生成等外部能力。此外，个人谷歌账号即可享受免费的额度支持，且项目基于 Apache 2.0 协议完全开源，是提升终端工作效率的理想助手。

★ 100.8k|★★☆☆☆|5天前

插件Agent图像

markitdown

MarkItDown 是一款由微软 AutoGen 团队打造的轻量级 Python 工具，专为将各类文件高效转换为 Markdown 格式而设计。它支持 PDF、Word、Excel、PPT、图片（含 OCR）、音频（含语音转录）、HTML 乃至 YouTube 链接等多种格式的解析，能够精准提取文档中的标题、列表、表格和链接等关键结构信息。在人工智能应用日益普及的今天，大语言模型（LLM）虽擅长处理文本，却难以直接读取复杂的二进制办公文档。MarkItDown 恰好解决了这一痛点，它将非结构化或半结构化的文件转化为模型“原生理解”且 Token 效率极高的 Markdown 格式，成为连接本地文件与 AI 分析 pipeline 的理想桥梁。此外，它还提供了 MCP（模型上下文协议）服务器，可无缝集成到 Claude Desktop 等 LLM 应用中。这款工具特别适合开发者、数据科学家及 AI 研究人员使用，尤其是那些需要构建文档检索增强生成（RAG）系统、进行批量文本分析或希望让 AI 助手直接“阅读”本地文件的用户。虽然生成的内容也具备一定可读性，但其核心优势在于为机器

★ 93.4k|★★☆☆☆|1周前

插件开发框架