gemini-watermark-remover
gemini-watermark-remover 是一款专为移除 Google Gemini AI 生成图像水印而设计的开源工具。它精准解决了用户在获取高质量 AI 创作内容时,难以完美去除官方强制添加的水印标识这一痛点,让图像恢复原始纯净状态。
无论是需要整洁素材的设计师、进行视觉研究的研究人员,还是希望保存无干扰图片的普通用户,都能从中受益。该工具最大的技术亮点在于摒弃了传统依赖人工智能“猜测”修复(Inpainting)的方式,转而采用纯数学计算的“反向 Alpha 混合算法”。这种基于公式的精确推导,能够像素级无损地还原被水印覆盖的区域,避免了 AI 修复可能产生的画面扭曲或伪影。
此外,gemini-watermark-remover 坚持 100% 客户端运行,所有图像处理均在浏览器本地完成,无需上传至任何服务器,从根本上保障了用户的隐私与数据安全。它支持自动识别不同尺寸的水印变体,并提供在线网页版和浏览器脚本两种便捷使用方式,无需安装复杂环境,拖入图片即可瞬间完成处理,兼顾了高效性与易用性。
使用场景
某数字营销设计师急需将 Gemini 生成的创意海报素材整合进客户的高清印刷品中,但必须去除图像角落的官方水印以满足出版规范。
没有 gemini-watermark-remover 时
- 画质受损严重:使用传统 PS 内容识别填充或通用 AI 消除工具,往往会导致水印区域纹理模糊、色彩断层,无法达到印刷级无损要求。
- 隐私安全顾虑:在线去水印服务通常需要将图片上传至第三方服务器,对于未公开的商业提案素材存在泄露风险。
- 处理效率低下:面对批量生成的几十张素材图,手动逐张修图耗时极长,且难以保证每张图的修复效果一致。
- 算法不可控:基于猜测的 AI 重绘(Inpainting)可能会错误修改水印周边的原始像素细节,导致设计稿出现“幻觉”瑕疵。
使用 gemini-watermark-remover 后
- 像素级完美还原:利用数学精确的反向 Alpha 混合算法,gemini-watermark-remover 能彻底移除水印并还原底层像素,实现真正的无损修复。
- 数据绝对私密:作为纯浏览器端工具,gemini-watermark-remover 确保所有图像处理均在本地完成,无需上传任何数据,彻底杜绝泄露隐患。
- 即时批量处理:拖拽即可自动识别 48×48 或 96×96 不同规格水印,gemini-watermark-remover 能秒级完成单张或批量图片的清理工作。
- 结果可预测:摒弃了不稳定的 AI 生成逻辑,gemini-watermark-remover 通过确定性算法保证每次输出都精准一致,无意外伪影。
gemini-watermark-remover 以纯前端的数学算法方案,在保障数据隐私的前提下,为专业用户提供了高效且无损的 Gemini 图像清洗能力。
运行环境要求
- 跨平台 (任何现代 Web 浏览器)
不需要 GPU
未说明 (基于浏览器运行,取决于浏览器可用内存)

快速开始
Gemini 水印移除工具 — 无损水印移除工具
一款开源工具,用于从 AI 生成的图像中无损且精确地移除 Gemini 水印。该引擎完全由纯 JavaScript 构建,采用数学上精确的反向 Alpha 混合算法,而非不可预测的 AI 修复技术,每次都能实现像素级完美的 Gemini 水印移除。
🚀 正在寻找简单的 Gemini 水印移除工具吗?立即试用:pilio.ai/gemini-watermark-remover — 免费、无需安装,直接在浏览器中运行。
特性
- ✅ 100% 客户端处理 - 无需后端,不进行服务器端处理。您的数据始终保留在浏览器中。
- ✅ 隐私优先 - 图像绝不会上传到任何服务器。绝对没有。
- ✅ 数学精度 - 基于反向 Alpha 混合公式,而非“幻觉式”AI 模型。
- ✅ 自动检测 - 智能识别 48×48 或 96×96 尺寸的水印变体。
- ✅ 用户友好 - 简单的拖放界面,即时处理。
- ✅ 跨平台 - 在所有现代 Web 浏览器上流畅运行。
Gemini 水印移除示例
点击展开/收起示例
无损差异示例

示例图片
| 原图 | 水印已移除 |
|---|---|
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
⚠️ 免责声明
[!WARNING] 请自行承担风险
本工具会修改图像文件。虽然它被设计为可靠运行,但由于以下原因仍可能出现意外结果:
- Gemini 水印实现方式的差异
- 损坏或异常的图像格式
- 测试未覆盖的边缘情况
作者对任何数据丢失、图像损坏或意外修改不承担任何责任。使用本工具即表示您理解这些风险。
[!NOTE] 注意:为避免处理错误,请禁用任何指纹防护扩展(例如 Canvas Fingerprint Defender)。https://github.com/GargantuaX/gemini-watermark-remover/issues/3
如何移除 Gemini 水印
在线 Gemini 水印移除工具(推荐)
对于所有用户来说,这是从图像中移除 Gemini 水印最快最简单的方法:
- 打开 pilio.ai/gemini-watermark-remover。
- 将您的 Gemini 生成的图像拖放到页面上,或点击选择图像。
- 引擎将自动处理并移除水印。
- 下载清理后的图像。
适用于 Gemini 对话页面的用户脚本
- 安装一个用户脚本管理器(例如 Tampermonkey 或 Greasemonkey)。
- 打开 gemini-watermark-remover.user.js。
- 脚本将自动安装。
- 导航到 Gemini 对话页面。
- 页面上的符合条件的 Gemini 预览图将在处理后原位替换。
- Gemini 的原生“复制图像”和“下载图像”功能也会返回处理后的结果。
当前用户脚本的限制:
- 不会注入每张图像的控制按钮
- 没有弹出式 UI 或批量操作界面
- 当源图像可访问时,页面预览和原生复制/下载流程都会被处理
- 预览图像在处理过程中保持原始可见,并叠加一个淡化的“处理中…”提示
- 如果预览处理失败,原始页面图像仍将可见并可用
开发者预览
如果您是开发者或贡献者,可以在 gemini.pilio.ai 上预览最新的开发版本。该站点是一个独立的在线预览/本地处理体验,与用户脚本不同。它可能包含实验性功能,不适合一般用户使用。
开发
# 安装依赖
pnpm install
# 开发构建
pnpm dev
# 生产构建
pnpm build
# 本地预览
pnpm serve
SDK 使用
软件包根目录现在提供了一个小型公共 SDK,供第三方集成使用:
import {
createWatermarkEngine,
removeWatermarkFromImage,
removeWatermarkFromImageData,
removeWatermarkFromImageDataSync,
} from 'gemini-watermark-remover';
当您已经拥有解码后的 ImageData 时,请使用纯数据 API:
const result = await removeWatermarkFromImageData(imageData, {
adaptiveMode: 'auto',
maxPasses: 4,
});
console.log(result.meta.decisionTier);
当您拥有 HTMLImageElement 或 HTMLCanvasElement 时,请使用浏览器图像 API:
const { canvas, meta } = await removeWatermarkFromImage(imageElement);
document.body.append(canvas);
console.log(meta.applied, meta.decisionTier);
如果需要处理大量图像,可以重复使用同一个引擎实例,以使 Alpha 映射保持缓存:
const engine = await createWatermarkEngine();
const first = await removeWatermarkFromImageData(imageDataA, { engine });
const second = await removeWatermarkFromImageData(imageDataB, { engine });
对于 Node.js 集成,请使用专用子路径,并注入您自己的解码器/编码器:
import { removeWatermarkFromBuffer } from 'gemini-watermark-remover/node';
const result = await removeWatermarkFromBuffer(inputBuffer, {
mimeType: 'image/png',
decodeImageData: yourDecodeFn,
encodeImageData: yourEncodeFn,
});
测试
# 运行所有测试
pnpm test
回归测试包括来自 src/assets/samples/ 的图像样本。源样本保留在 Git 中。位于 src/assets/samples/fix/ 下的本地文件是用于手动回归检查的可选快照输出,故意未被 Git 跟踪。
发布说明
有关发布历史,请参阅 CHANGELOG.md,有关本地发布清单,请参阅 RELEASE.md。
Gemini 水印移除的工作原理
双子座水印处理流程
双子座使用标准的 Alpha 合成方法添加水印:
$$watermarked = \alpha \cdot logo + (1 - \alpha) \cdot original$$
其中:
watermarked:带有水印的像素值。α:Alpha 通道值(0.0 - 1.0)。logo:水印标志的颜色值(白色 = 255)。original:我们希望恢复的原始像素值。
逆向解法
为了去除水印,我们解出 original:
$$original = \frac{watermarked - \alpha \cdot logo}{1 - \alpha}$$
通过在已知的纯色背景上捕获水印,我们可以重建精确的 Alpha 图,并应用逆向公式来无损地恢复原始像素。
检测规则
引擎不再依赖单一的粗略 48/96 + 32/64 启发式方法。
当前的检测是分层进行的:
- 使用官方的双子座尺寸目录作为锚点选择的主要先验信息
- 将接近官方导出的图像投影回最接近的已记录尺寸族
- 在默认锚点和基于目录推导出的锚点附近进行本地搜索
- 只有在恢复验证确认水印确实被移除后,才接受移除操作
备用的默认配置仍然是:
| 默认条件 | 水印尺寸 | 右边距 | 底边距 |
|---|---|---|---|
| 大型已记录或推断输出 | 96×96 | 64px | 64px |
| 较小的已记录或推断输出 | 48×48 | 32px | 32px |
项目结构
gemini-watermark-remover/
├── public/
│ ├── index.html # 主页
│ └── terms.html # 服务条款页面
├── src/
│ ├── core/
│ │ ├── alphaMap.js # Alpha 图计算逻辑
│ │ ├── blendModes.js # 逆向 Alpha 混合模式实现
│ │ └── watermarkEngine.js # 主引擎协调器
│ ├── assets/
│ │ ├── bg_48.png # 预捕获的 48×48 水印图
│ │ └── bg_96.png # 预捕获的 96×96 水印图
│ ├── i18n/ # 国际化语言文件
│ ├── userscript/ # 适用于双子座的用户脚本
│ ├── app.js # 网站应用入口文件
│ └── i18n.js # 国际化工具
├── dist/ # 构建输出目录
├── scripts/ # 本地自动化与调试启动脚本
├── build.js # 构建脚本
└── package.json
核心模块
alphaMap.js
通过比较捕获的水印素材来计算 Alpha 通道:
export function calculateAlphaMap(bgCaptureImageData) {
// 提取 RGB 通道的最大值并归一化到 [0, 1]
const alphaMap = new Float32Array(width * height);
for (let i = 0; i < alphaMap.length; i++) {
const maxChannel = Math.max(r, g, b);
alphaMap[i] = maxChannel / 255.0;
}
return alphaMap;
}
blendModes.js
该工具的数学核心:
export function removeWatermark(imageData, alphaMap, position) {
// 公式:original = (watermarked - α × 255) / (1 - α)
for (let row = 0; row < height; row++) {
for (let col = 0; col < width; col++) {
const alpha = Math.min(alphaMap[idx], MAX_ALPHA);
const original = (watermarked - alpha * 255) / (1.0 - alpha);
imageData.data[idx] = Math.max(0, Math.min(255, original));
}
}
}
浏览器兼容性
- ✅ Chrome 90+
- ✅ Firefox 88+
- ✅ Safari 14+
- ✅ Edge 90+
所需 API:
- ES6 模块
- Canvas API
- Async/Await
- 类型数组(Float32Array、Uint8ClampedArray)
限制
- 仅能移除 双子座可见水印 (右下角的半透明标志)
- 无法移除隐形或隐写术水印。 (了解 SynthID)
- 专为双子座当前的水印模式设计 (截至 2025 年)
法律声明
本工具仅供 个人和教育用途 使用。
移除水印可能涉及法律问题,具体取决于您所在的司法管辖区以及图像的预期用途。用户应自行负责确保其使用本工具符合相关法律、服务条款及知识产权规定。
作者不纵容或鼓励将本工具用于侵犯版权、虚假陈述或其他任何非法目的。
本软件按“原样”提供,不提供任何形式的明示或暗示保证。无论何种情况下,作者均不对因使用本软件而产生的任何索赔、损害赔偿或其他责任承担责任。
致谢
该项目是 Allen Kuo (@allenk) 的 Gemini Watermark Tool 的 JavaScript 版本。
逆向 Alpha 混合方法和校准后的水印掩码基于原始作品 © 2024 AllenK (Kwyshell),采用 MIT 许可证授权。
相关链接
许可证
版本历史
v1.0.92026/03/31v1.0.82026/03/31v1.0.62026/03/30v1.0.52026/03/23v1.0.12026/03/19常见问题
相似工具推荐
stable-diffusion-webui
stable-diffusion-webui 是一个基于 Gradio 构建的网页版操作界面,旨在让用户能够轻松地在本地运行和使用强大的 Stable Diffusion 图像生成模型。它解决了原始模型依赖命令行、操作门槛高且功能分散的痛点,将复杂的 AI 绘图流程整合进一个直观易用的图形化平台。 无论是希望快速上手的普通创作者、需要精细控制画面细节的设计师,还是想要深入探索模型潜力的开发者与研究人员,都能从中获益。其核心亮点在于极高的功能丰富度:不仅支持文生图、图生图、局部重绘(Inpainting)和外绘(Outpainting)等基础模式,还独创了注意力机制调整、提示词矩阵、负向提示词以及“高清修复”等高级功能。此外,它内置了 GFPGAN 和 CodeFormer 等人脸修复工具,支持多种神经网络放大算法,并允许用户通过插件系统无限扩展能力。即使是显存有限的设备,stable-diffusion-webui 也提供了相应的优化选项,让高质量的 AI 艺术创作变得触手可及。
ComfyUI
ComfyUI 是一款功能强大且高度模块化的视觉 AI 引擎,专为设计和执行复杂的 Stable Diffusion 图像生成流程而打造。它摒弃了传统的代码编写模式,采用直观的节点式流程图界面,让用户通过连接不同的功能模块即可构建个性化的生成管线。 这一设计巧妙解决了高级 AI 绘图工作流配置复杂、灵活性不足的痛点。用户无需具备编程背景,也能自由组合模型、调整参数并实时预览效果,轻松实现从基础文生图到多步骤高清修复等各类复杂任务。ComfyUI 拥有极佳的兼容性,不仅支持 Windows、macOS 和 Linux 全平台,还广泛适配 NVIDIA、AMD、Intel 及苹果 Silicon 等多种硬件架构,并率先支持 SDXL、Flux、SD3 等前沿模型。 无论是希望深入探索算法潜力的研究人员和开发者,还是追求极致创作自由度的设计师与资深 AI 绘画爱好者,ComfyUI 都能提供强大的支持。其独特的模块化架构允许社区不断扩展新功能,使其成为当前最灵活、生态最丰富的开源扩散模型工具之一,帮助用户将创意高效转化为现实。
ML-For-Beginners
ML-For-Beginners 是由微软推出的一套系统化机器学习入门课程,旨在帮助零基础用户轻松掌握经典机器学习知识。这套课程将学习路径规划为 12 周,包含 26 节精炼课程和 52 道配套测验,内容涵盖从基础概念到实际应用的完整流程,有效解决了初学者面对庞大知识体系时无从下手、缺乏结构化指导的痛点。 无论是希望转型的开发者、需要补充算法背景的研究人员,还是对人工智能充满好奇的普通爱好者,都能从中受益。课程不仅提供了清晰的理论讲解,还强调动手实践,让用户在循序渐进中建立扎实的技能基础。其独特的亮点在于强大的多语言支持,通过自动化机制提供了包括简体中文在内的 50 多种语言版本,极大地降低了全球不同背景用户的学习门槛。此外,项目采用开源协作模式,社区活跃且内容持续更新,确保学习者能获取前沿且准确的技术资讯。如果你正寻找一条清晰、友好且专业的机器学习入门之路,ML-For-Beginners 将是理想的起点。
ragflow
RAGFlow 是一款领先的开源检索增强生成(RAG)引擎,旨在为大语言模型构建更精准、可靠的上下文层。它巧妙地将前沿的 RAG 技术与智能体(Agent)能力相结合,不仅支持从各类文档中高效提取知识,还能让模型基于这些知识进行逻辑推理和任务执行。 在大模型应用中,幻觉问题和知识滞后是常见痛点。RAGFlow 通过深度解析复杂文档结构(如表格、图表及混合排版),显著提升了信息检索的准确度,从而有效减少模型“胡编乱造”的现象,确保回答既有据可依又具备时效性。其内置的智能体机制更进一步,使系统不仅能回答问题,还能自主规划步骤解决复杂问题。 这款工具特别适合开发者、企业技术团队以及 AI 研究人员使用。无论是希望快速搭建私有知识库问答系统,还是致力于探索大模型在垂直领域落地的创新者,都能从中受益。RAGFlow 提供了可视化的工作流编排界面和灵活的 API 接口,既降低了非算法背景用户的上手门槛,也满足了专业开发者对系统深度定制的需求。作为基于 Apache 2.0 协议开源的项目,它正成为连接通用大模型与行业专有知识之间的重要桥梁。
PaddleOCR
PaddleOCR 是一款基于百度飞桨框架开发的高性能开源光学字符识别工具包。它的核心能力是将图片、PDF 等文档中的文字提取出来,转换成计算机可读取的结构化数据,让机器真正“看懂”图文内容。 面对海量纸质或电子文档,PaddleOCR 解决了人工录入效率低、数字化成本高的问题。尤其在人工智能领域,它扮演着连接图像与大型语言模型(LLM)的桥梁角色,能将视觉信息直接转化为文本输入,助力智能问答、文档分析等应用场景落地。 PaddleOCR 适合开发者、算法研究人员以及有文档自动化需求的普通用户。其技术优势十分明显:不仅支持全球 100 多种语言的识别,还能在 Windows、Linux、macOS 等多个系统上运行,并灵活适配 CPU、GPU、NPU 等各类硬件。作为一个轻量级且社区活跃的开源项目,PaddleOCR 既能满足快速集成的需求,也能支撑前沿的视觉语言研究,是处理文字识别任务的理想选择。
tesseract
Tesseract 是一款历史悠久且备受推崇的开源光学字符识别(OCR)引擎,最初由惠普实验室开发,后由 Google 维护,目前由全球社区共同贡献。它的核心功能是将图片中的文字转化为可编辑、可搜索的文本数据,有效解决了从扫描件、照片或 PDF 文档中提取文字信息的难题,是数字化归档和信息自动化的重要基础工具。 在技术层面,Tesseract 展现了强大的适应能力。从版本 4 开始,它引入了基于长短期记忆网络(LSTM)的神经网络 OCR 引擎,显著提升了行识别的准确率;同时,为了兼顾旧有需求,它依然支持传统的字符模式识别引擎。Tesseract 原生支持 UTF-8 编码,开箱即用即可识别超过 100 种语言,并兼容 PNG、JPEG、TIFF 等多种常见图像格式。输出方面,它灵活支持纯文本、hOCR、PDF、TSV 等多种格式,方便后续数据处理。 Tesseract 主要面向开发者、研究人员以及需要构建文档处理流程的企业用户。由于它本身是一个命令行工具和库(libtesseract),不包含图形用户界面(GUI),因此最适合具备一定编程能力的技术人员集成到自动化脚本或应用程序中









