AI 解读由 AI 自动生成，仅供参考

MouseTooltipTranslator 是一款功能强大的浏览器扩展插件，旨在打破语言障碍，让用户能够即时翻译网页上的任何内容。它主要解决了用户在浏览外文网站、阅读 PDF 文档、电子书、漫画或观看视频时，因语言不通而需要频繁复制粘贴或使用独立翻译页面的痛点。

这款工具非常适合普通网民、语言学习者、研究人员以及需要处理多语言资料的办公人士使用。其核心亮点在于“鼠标悬停即译”的便捷交互：只需将鼠标移至文字上方或选中段落，翻译结果便会以气泡形式立即显示。除了基础的文本翻译（支持谷歌和必应引擎），它还集成了多项实用技术：内置 OCR 功能，可直接识别并翻译图片中的文字（如漫画）；支持 YouTube 和 Netflix 的双语字幕显示；具备文本转语音（TTS）功能，按住快捷键即可聆听发音；甚至能通过语音识别进行翻译。无论是浏览 Gmail、Google Docs，还是研读学术文献，MouseTooltipTranslator 都能提供流畅的多语言阅读体验，且完全免费开源，支持 Chrome、Edge 和 Firefox 主流浏览器。

使用场景

一位从事跨国技术调研的产品经理，正需要在 Chrome 浏览器中快速阅读日文技术文档、PDF 报告以及观看无字幕的 YouTube 教程视频。

没有 MouseTooltipTranslator 时

打断阅读流：遇到不懂的外文单词或句子，必须手动复制粘贴到翻译网页，频繁切换标签页导致思路不断中断。
无法处理特殊格式：面对扫描版 PDF 或图片形式的漫画/图表，传统翻译工具无法提取文字，只能依靠肉眼猜测或手动打字。
视频学习门槛高：观看只有外语字幕甚至无字幕的 YouTube 技术演示时，难以实时理解关键术语，学习效率极低。
发音确认困难：遇到生僻的专业术语，需要额外打开词典网站查询读音，无法在写作或沟通前快速确认发音。

使用 MouseTooltipTranslator 后

即指即译流畅体验：鼠标悬停或选中文字即可直接在气泡框显示译文，支持 Google 和 Bing 双引擎，阅读过程丝滑无阻。
OCR 破解图片文字：按住 Shift 键并将鼠标移至图片或扫描版 PDF 上，自动触发 OCR 识别并翻译，轻松搞定日文技术手册和漫画资料。
双语字幕辅助观影：在观看 YouTube 视频时自动开启双字幕模式，实时对照母语与外语，彻底消除语言障碍。
快捷键听音辨义：按下左 Ctrl 键即可调用 TTS 朗读选中内容，无需跳转页面即可确认专业术语的标准发音。

MouseTooltipTranslator 将繁琐的“复制 - 跳转 - 粘贴”流程简化为一次鼠标悬停，让跨语言信息获取变得像阅读母语一样自然高效。

运行环境要求

操作系统

Windows
macOS
Linux

GPU

未说明

内存

未说明

依赖

notes该工具是一个浏览器扩展（支持 Chrome、Edge、Firefox），无需独立服务器环境。自行构建需安装 Node.js 18 版本，通过 npm 安装依赖并打包。功能依赖在线服务（Google/Bing 翻译、Google TTS、PDF.js），OCR 功能在鼠标悬停图片时触发。

python未说明

Node.js 18

npm

快速开始

鼠标提示翻译器

鼠标悬停即可一键翻译任意语言 - Chrome 扩展程序

从 Chrome 网上应用店、Edge 扩展商店和 Firefox 插件下载

结果

Alt Text OCR 结果

特性

将鼠标悬停或选中文本即可翻译
按住左 Ctrl 键可使用 Google TTS（文本转语音）收听发音
按住右 Alt 键可翻译输入框中的文字（或已高亮显示的文本）
使用 Google 翻译和 Bing 翻译进行翻译
支持 PDF 文件，利用 PDF.js 显示翻译后的提示信息
支持 YouTube 视频的双语字幕
按住左 Shift 键并鼠标悬停在图片上时，会进行 OCR 处理（例如漫画）
支持语音识别翻译

使用方法

使用方法

自行构建安装

安装 Node.js，https://nodejs.org/en/ ，Node 18
打开终端并输入以下命令：

git clone https://github.com/ttop32/MouseTooltipTranslator.git
cd MouseTooltipTranslator
npm install 
npm run build        // 或 'npm run watch' 用于开发

您将看到 MouseTooltipTranslator/build 路径
打开 Chrome 浏览器，访问 chrome://extensions/
在右上角启用开发者模式
将文件夹（MouseTooltipTranslator/build）作为未打包的扩展程序加载

贡献者

_丹尼尔·K	_{阿尔达·萨塔塔·菲特里阿吉耶}	_{阿诺伊尔·本·坦福斯}	_{Lg28literconvectionmicrowaveoven}	_Null	_黄文日
_JG	_Null	_陈阮进成	_{西尔维斯特里，哈维尔}	_Null

Crowdin 贡献者

_{daniel k (ttop32)} _{10222 words} _{am, ar, bn, bg, ca, zh-CN, zh-TW, hr, cs, da, nl, en-AU, en-GB, en-US, et, fil, fi, fr, de, el, gu-IN, he, hi, hu, id, it, ja, kn, ko, lv, lt, ms, ml-IN, mr, no, fa, pl, pt-PT, pt-BR, ro, ru, sr, sk, sl, es-ES, es-419, sw, sv-SE, ta, te, th, tr, uk, vi}	_D0n-A _{443 words} _{en-US, ru}	_SFGFDSD _{352 words} _{zh-CN, zh-TW}	_{Logan Shen (merlette)} _{251 words} _{zh-CN, zh-TW}	_s-upakit _{234 words} _th
_{Eduardo_91} _{207 words} _pt-BR	_{Duong.Kayce (Nhoxpipicool)} _{192 words} _vi	_{ODK (odk-0160)} _{93 words} _tr	_{미르냥 (Mirnyang)} _{83 words} _ko	_{Heliana Moreira (helimoreira)} _{73 words} _pt-BR
_{Anwar Ben Tanfous (neoOpus)} _{73 words} _ar	_{Nejdet ACAR (nejdetacar)} _{63 words} _tr	_{EdsonBittencourt} _{57 words} _pt-BR	_{Samo (SamoE)} _{31 words} _tr	_{ID Hunter (ASAP) (annatomika.one)} _{27 words} _ru
_Amydette _{24 words} _fil	_{CreeperYeeter2} _{13 words} _en-AU	_{IT SUPPORT (TTT01)} _{3 words} _th	_n3g _{3 words} _ru

在Crowdin上翻译 🚀

我们正在寻找任何本地化贡献者。欢迎随时在Crowdin上进行贡献。

更改日志

更改日志

隐私政策

隐私政策

致谢与参考文献

MouseTooltipTranslator 快速上手指南

MouseTooltipTranslator 是一款强大的浏览器扩展，支持鼠标悬停或选中文本即时翻译、PDF 双语字幕、图片 OCR 识别及语音朗读功能。

环境准备

在自行构建之前，请确保您的开发环境满足以下要求：

操作系统：Windows / macOS / Linux
核心依赖：Node.js (推荐版本 18)
- 国内用户建议使用淘宝 Node.js 镜像或 nvm 进行安装。
浏览器：Google Chrome、Microsoft Edge 或 Firefox（用于加载调试）

安装步骤（源码构建）

如果您希望从源码构建并安装扩展，请按以下步骤操作：

克隆项目代码 打开终端，执行以下命令获取源代码：

git clone https://github.com/ttop32/MouseTooltipTranslator.git
cd MouseTooltipTranslator

安装依赖 注：国内网络环境下，建议配置 npm 镜像源以加速下载。

# 可选：设置淘宝镜像源
npm config set registry https://registry.npmmirror.com

# 安装依赖
npm install

构建项目 执行构建命令生成发布文件：
```
npm run build
```
开发模式下可使用 npm run watch 实时监听变化。
加载扩展
- 构建完成后，在项目根目录下会生成 MouseTooltipTranslator/build 文件夹。
- 打开 Chrome/Edge 浏览器，访问 chrome://extensions/。
- 开启右上角的 “开发者模式”。
- 点击 “加载已解压的扩展程序”，选择上述 build 文件夹即可。

提示：若无需自行构建，可直接前往 Chrome 网上应用店、Edge 插件商店或 Firefox 附加组件直接安装正式版。

基本使用

安装成功后，无需复杂配置，即可通过以下方式体验核心功能：

悬停/选中翻译 将鼠标悬停在任意外文文本上，或高亮选中文本，即可自动弹出翻译提示框（支持 Google 和 Bing 翻译引擎）。
听发音 (TTS) 按住 左 Ctrl 键并悬停在文本上，即可调用 Google TTS 朗读该段文字。
输入框翻译 在输入框中输入文字（或选中已有文字），按住 右 Alt 键，即可实时翻译输入内容。
图片 OCR 识别 按住 左 Shift 键并将鼠标悬停在图片（如漫画、截图）上，系统将自动提取图片中的文字并进行翻译。
YouTube 双语字幕 在观看 YouTube 视频时，扩展会自动启用双字幕模式，方便语言学习。

版本历史

0.1.2112026/01/06

0.1.2102026/01/03

0.1.2092026/01/03

0.1.2082025/12/31

0.1.2072025/11/26

0.1.2062025/11/24

0.1.2052025/10/25

0.1.2042025/10/12

0.1.2032025/09/10

0.1.2022025/09/02

0.1.2012025/09/01

0.1.2002025/08/31

0.1.1992025/08/27

0.1.1982025/08/15

0.1.1972025/08/03

0.1.1962025/07/31

0.1.1952025/07/25

0.1.1942025/06/29

0.1.1932025/06/26

0.1.1922025/06/25

常见问题

构建项目时遇到 '@vitejs/plugin-vue requires vue' 错误怎么办？

为什么设置“从某种语言翻译”到同一种语言时没有自动跳过翻译？

如何配置才能让语音朗读自动匹配选中文本的语言？

插件是否支持显示单词的多种翻译含义？

为什么插件在 Proton Mail 的邮件正文中无法工作？

相似工具推荐

openclaw

OpenClaw 是一款专为个人打造的本地化 AI 助手，旨在让你在自己的设备上拥有完全可控的智能伙伴。它打破了传统 AI 助手局限于特定网页或应用的束缚，能够直接接入你日常使用的各类通讯渠道，包括微信、WhatsApp、Telegram、Discord、iMessage 等数十种平台。无论你在哪个聊天软件中发送消息，OpenClaw 都能即时响应，甚至支持在 macOS、iOS 和 Android 设备上进行语音交互，并提供实时的画布渲染功能供你操控。这款工具主要解决了用户对数据隐私、响应速度以及“始终在线”体验的需求。通过将 AI 部署在本地，用户无需依赖云端服务即可享受快速、私密的智能辅助，真正实现了“你的数据，你做主”。其独特的技术亮点在于强大的网关架构，将控制平面与核心助手分离，确保跨平台通信的流畅性与扩展性。 OpenClaw 非常适合希望构建个性化工作流的技术爱好者、开发者，以及注重隐私保护且不愿被单一生态绑定的普通用户。只要具备基础的终端操作能力（支持 macOS、Linux 及 Windows WSL2），即可通过简单的命令行引导完成部署。如果你渴望拥有一个懂你

★ 349.3k|★★★☆☆|今天

Agent开发框架图像

stable-diffusion-webui

stable-diffusion-webui 是一个基于 Gradio 构建的网页版操作界面，旨在让用户能够轻松地在本地运行和使用强大的 Stable Diffusion 图像生成模型。它解决了原始模型依赖命令行、操作门槛高且功能分散的痛点，将复杂的 AI 绘图流程整合进一个直观易用的图形化平台。无论是希望快速上手的普通创作者、需要精细控制画面细节的设计师，还是想要深入探索模型潜力的开发者与研究人员，都能从中获益。其核心亮点在于极高的功能丰富度：不仅支持文生图、图生图、局部重绘（Inpainting）和外绘（Outpainting）等基础模式，还独创了注意力机制调整、提示词矩阵、负向提示词以及“高清修复”等高级功能。此外，它内置了 GFPGAN 和 CodeFormer 等人脸修复工具，支持多种神经网络放大算法，并允许用户通过插件系统无限扩展能力。即使是显存有限的设备，stable-diffusion-webui 也提供了相应的优化选项，让高质量的 AI 艺术创作变得触手可及。

★ 162.1k|★★★☆☆|昨天

开发框架图像Agent

ComfyUI

ComfyUI 是一款功能强大且高度模块化的视觉 AI 引擎，专为设计和执行复杂的 Stable Diffusion 图像生成流程而打造。它摒弃了传统的代码编写模式，采用直观的节点式流程图界面，让用户通过连接不同的功能模块即可构建个性化的生成管线。这一设计巧妙解决了高级 AI 绘图工作流配置复杂、灵活性不足的痛点。用户无需具备编程背景，也能自由组合模型、调整参数并实时预览效果，轻松实现从基础文生图到多步骤高清修复等各类复杂任务。ComfyUI 拥有极佳的兼容性，不仅支持 Windows、macOS 和 Linux 全平台，还广泛适配 NVIDIA、AMD、Intel 及苹果 Silicon 等多种硬件架构，并率先支持 SDXL、Flux、SD3 等前沿模型。无论是希望深入探索算法潜力的研究人员和开发者，还是追求极致创作自由度的设计师与资深 AI 绘画爱好者，ComfyUI 都能提供强大的支持。其独特的模块化架构允许社区不断扩展新功能，使其成为当前最灵活、生态最丰富的开源扩散模型工具之一，帮助用户将创意高效转化为现实。

★ 107.7k|★★☆☆☆|3天前

开发框架图像Agent

Deep-Live-Cam

Deep-Live-Cam 是一款专注于实时换脸与视频生成的开源工具，用户仅需一张静态照片，即可通过“一键操作”实现摄像头画面的即时变脸或制作深度伪造视频。它有效解决了传统换脸技术流程繁琐、对硬件配置要求极高以及难以实时预览的痛点，让高质量的数字内容创作变得触手可及。这款工具不仅适合开发者和技术研究人员探索算法边界，更因其极简的操作逻辑（仅需三步：选脸、选摄像头、启动），广泛适用于普通用户、内容创作者、设计师及直播主播。无论是为了动画角色定制、服装展示模特替换，还是制作趣味短视频和直播互动，Deep-Live-Cam 都能提供流畅的支持。其核心技术亮点在于强大的实时处理能力，支持口型遮罩（Mouth Mask）以保留使用者原始的嘴部动作，确保表情自然精准；同时具备“人脸映射”功能，可同时对画面中的多个主体应用不同面孔。此外，项目内置了严格的内容安全过滤机制，自动拦截涉及裸露、暴力等不当素材，并倡导用户在获得授权及明确标注的前提下合规使用，体现了技术发展与伦理责任的平衡。

★ 88.9k|★★★☆☆|今天

开发框架图像Agent

ML-For-Beginners

ML-For-Beginners 是由微软推出的一套系统化机器学习入门课程，旨在帮助零基础用户轻松掌握经典机器学习知识。这套课程将学习路径规划为 12 周，包含 26 节精炼课程和 52 道配套测验，内容涵盖从基础概念到实际应用的完整流程，有效解决了初学者面对庞大知识体系时无从下手、缺乏结构化指导的痛点。无论是希望转型的开发者、需要补充算法背景的研究人员，还是对人工智能充满好奇的普通爱好者，都能从中受益。课程不仅提供了清晰的理论讲解，还强调动手实践，让用户在循序渐进中建立扎实的技能基础。其独特的亮点在于强大的多语言支持，通过自动化机制提供了包括简体中文在内的 50 多种语言版本，极大地降低了全球不同背景用户的学习门槛。此外，项目采用开源协作模式，社区活跃且内容持续更新，确保学习者能获取前沿且准确的技术资讯。如果你正寻找一条清晰、友好且专业的机器学习入门之路，ML-For-Beginners 将是理想的起点。

★ 85k|★★☆☆☆|昨天

图像数据工具视频

ragflow

RAGFlow 是一款领先的开源检索增强生成（RAG）引擎，旨在为大语言模型构建更精准、可靠的上下文层。它巧妙地将前沿的 RAG 技术与智能体（Agent）能力相结合，不仅支持从各类文档中高效提取知识，还能让模型基于这些知识进行逻辑推理和任务执行。在大模型应用中，幻觉问题和知识滞后是常见痛点。RAGFlow 通过深度解析复杂文档结构（如表格、图表及混合排版），显著提升了信息检索的准确度，从而有效减少模型“胡编乱造”的现象，确保回答既有据可依又具备时效性。其内置的智能体机制更进一步，使系统不仅能回答问题，还能自主规划步骤解决复杂问题。这款工具特别适合开发者、企业技术团队以及 AI 研究人员使用。无论是希望快速搭建私有知识库问答系统，还是致力于探索大模型在垂直领域落地的创新者，都能从中受益。RAGFlow 提供了可视化的工作流编排界面和灵活的 API 接口，既降低了非算法背景用户的上手门槛，也满足了专业开发者对系统深度定制的需求。作为基于 Apache 2.0 协议开源的项目，它正成为连接通用大模型与行业专有知识之间的重要桥梁。

★ 77.1k|★★★☆☆|2天前

Agent图像开发框架