[{"data":1,"prerenderedAt":-1},["ShallowReactive",2],{"similar-dmMaze--BallonsTranslator":3,"tool-dmMaze--BallonsTranslator":61},[4,18,26,36,44,53],{"id":5,"name":6,"github_repo":7,"description_zh":8,"stars":9,"difficulty_score":10,"last_commit_at":11,"category_tags":12,"status":17},4358,"openclaw","openclaw\u002Fopenclaw","OpenClaw 是一款专为个人打造的本地化 AI 助手，旨在让你在自己的设备上拥有完全可控的智能伙伴。它打破了传统 AI 助手局限于特定网页或应用的束缚，能够直接接入你日常使用的各类通讯渠道，包括微信、WhatsApp、Telegram、Discord、iMessage 等数十种平台。无论你在哪个聊天软件中发送消息，OpenClaw 都能即时响应，甚至支持在 macOS、iOS 和 Android 设备上进行语音交互，并提供实时的画布渲染功能供你操控。\n\n这款工具主要解决了用户对数据隐私、响应速度以及“始终在线”体验的需求。通过将 AI 部署在本地，用户无需依赖云端服务即可享受快速、私密的智能辅助，真正实现了“你的数据，你做主”。其独特的技术亮点在于强大的网关架构，将控制平面与核心助手分离，确保跨平台通信的流畅性与扩展性。\n\nOpenClaw 非常适合希望构建个性化工作流的技术爱好者、开发者，以及注重隐私保护且不愿被单一生态绑定的普通用户。只要具备基础的终端操作能力（支持 macOS、Linux 及 Windows WSL2），即可通过简单的命令行引导完成部署。如果你渴望拥有一个懂你",349277,3,"2026-04-06T06:32:30",[13,14,15,16],"Agent","开发框架","图像","数据工具","ready",{"id":19,"name":20,"github_repo":21,"description_zh":22,"stars":23,"difficulty_score":10,"last_commit_at":24,"category_tags":25,"status":17},3808,"stable-diffusion-webui","AUTOMATIC1111\u002Fstable-diffusion-webui","stable-diffusion-webui 是一个基于 Gradio 构建的网页版操作界面，旨在让用户能够轻松地在本地运行和使用强大的 Stable Diffusion 图像生成模型。它解决了原始模型依赖命令行、操作门槛高且功能分散的痛点，将复杂的 AI 绘图流程整合进一个直观易用的图形化平台。\n\n无论是希望快速上手的普通创作者、需要精细控制画面细节的设计师，还是想要深入探索模型潜力的开发者与研究人员，都能从中获益。其核心亮点在于极高的功能丰富度：不仅支持文生图、图生图、局部重绘（Inpainting）和外绘（Outpainting）等基础模式，还独创了注意力机制调整、提示词矩阵、负向提示词以及“高清修复”等高级功能。此外，它内置了 GFPGAN 和 CodeFormer 等人脸修复工具，支持多种神经网络放大算法，并允许用户通过插件系统无限扩展能力。即使是显存有限的设备，stable-diffusion-webui 也提供了相应的优化选项，让高质量的 AI 艺术创作变得触手可及。",162132,"2026-04-05T11:01:52",[14,15,13],{"id":27,"name":28,"github_repo":29,"description_zh":30,"stars":31,"difficulty_score":32,"last_commit_at":33,"category_tags":34,"status":17},1381,"everything-claude-code","affaan-m\u002Feverything-claude-code","everything-claude-code 是一套专为 AI 编程助手（如 Claude Code、Codex、Cursor 等）打造的高性能优化系统。它不仅仅是一组配置文件，而是一个经过长期实战打磨的完整框架，旨在解决 AI 代理在实际开发中面临的效率低下、记忆丢失、安全隐患及缺乏持续学习能力等核心痛点。\n\n通过引入技能模块化、直觉增强、记忆持久化机制以及内置的安全扫描功能，everything-claude-code 能显著提升 AI 在复杂任务中的表现，帮助开发者构建更稳定、更智能的生产级 AI 代理。其独特的“研究优先”开发理念和针对 Token 消耗的优化策略，使得模型响应更快、成本更低，同时有效防御潜在的攻击向量。\n\n这套工具特别适合软件开发者、AI 研究人员以及希望深度定制 AI 工作流的技术团队使用。无论您是在构建大型代码库，还是需要 AI 协助进行安全审计与自动化测试，everything-claude-code 都能提供强大的底层支持。作为一个曾荣获 Anthropic 黑客大奖的开源项目，它融合了多语言支持与丰富的实战钩子（hooks），让 AI 真正成长为懂上",142651,2,"2026-04-06T23:34:12",[14,13,35],"语言模型",{"id":37,"name":38,"github_repo":39,"description_zh":40,"stars":41,"difficulty_score":32,"last_commit_at":42,"category_tags":43,"status":17},2271,"ComfyUI","Comfy-Org\u002FComfyUI","ComfyUI 是一款功能强大且高度模块化的视觉 AI 引擎，专为设计和执行复杂的 Stable Diffusion 图像生成流程而打造。它摒弃了传统的代码编写模式，采用直观的节点式流程图界面，让用户通过连接不同的功能模块即可构建个性化的生成管线。\n\n这一设计巧妙解决了高级 AI 绘图工作流配置复杂、灵活性不足的痛点。用户无需具备编程背景，也能自由组合模型、调整参数并实时预览效果，轻松实现从基础文生图到多步骤高清修复等各类复杂任务。ComfyUI 拥有极佳的兼容性，不仅支持 Windows、macOS 和 Linux 全平台，还广泛适配 NVIDIA、AMD、Intel 及苹果 Silicon 等多种硬件架构，并率先支持 SDXL、Flux、SD3 等前沿模型。\n\n无论是希望深入探索算法潜力的研究人员和开发者，还是追求极致创作自由度的设计师与资深 AI 绘画爱好者，ComfyUI 都能提供强大的支持。其独特的模块化架构允许社区不断扩展新功能，使其成为当前最灵活、生态最丰富的开源扩散模型工具之一，帮助用户将创意高效转化为现实。",107888,"2026-04-06T11:32:50",[14,15,13],{"id":45,"name":46,"github_repo":47,"description_zh":48,"stars":49,"difficulty_score":32,"last_commit_at":50,"category_tags":51,"status":17},4721,"markitdown","microsoft\u002Fmarkitdown","MarkItDown 是一款由微软 AutoGen 团队打造的轻量级 Python 工具，专为将各类文件高效转换为 Markdown 格式而设计。它支持 PDF、Word、Excel、PPT、图片（含 OCR）、音频（含语音转录）、HTML 乃至 YouTube 链接等多种格式的解析，能够精准提取文档中的标题、列表、表格和链接等关键结构信息。\n\n在人工智能应用日益普及的今天，大语言模型（LLM）虽擅长处理文本，却难以直接读取复杂的二进制办公文档。MarkItDown 恰好解决了这一痛点，它将非结构化或半结构化的文件转化为模型“原生理解”且 Token 效率极高的 Markdown 格式，成为连接本地文件与 AI 分析 pipeline 的理想桥梁。此外，它还提供了 MCP（模型上下文协议）服务器，可无缝集成到 Claude Desktop 等 LLM 应用中。\n\n这款工具特别适合开发者、数据科学家及 AI 研究人员使用，尤其是那些需要构建文档检索增强生成（RAG）系统、进行批量文本分析或希望让 AI 助手直接“阅读”本地文件的用户。虽然生成的内容也具备一定可读性，但其核心优势在于为机器",93400,"2026-04-06T19:52:38",[52,14],"插件",{"id":54,"name":55,"github_repo":56,"description_zh":57,"stars":58,"difficulty_score":10,"last_commit_at":59,"category_tags":60,"status":17},4487,"LLMs-from-scratch","rasbt\u002FLLMs-from-scratch","LLMs-from-scratch 是一个基于 PyTorch 的开源教育项目，旨在引导用户从零开始一步步构建一个类似 ChatGPT 的大型语言模型（LLM）。它不仅是同名技术著作的官方代码库，更提供了一套完整的实践方案，涵盖模型开发、预训练及微调的全过程。\n\n该项目主要解决了大模型领域“黑盒化”的学习痛点。许多开发者虽能调用现成模型，却难以深入理解其内部架构与训练机制。通过亲手编写每一行核心代码，用户能够透彻掌握 Transformer 架构、注意力机制等关键原理，从而真正理解大模型是如何“思考”的。此外，项目还包含了加载大型预训练权重进行微调的代码，帮助用户将理论知识延伸至实际应用。\n\nLLMs-from-scratch 特别适合希望深入底层原理的 AI 开发者、研究人员以及计算机专业的学生。对于不满足于仅使用 API，而是渴望探究模型构建细节的技术人员而言，这是极佳的学习资源。其独特的技术亮点在于“循序渐进”的教学设计：将复杂的系统工程拆解为清晰的步骤，配合详细的图表与示例，让构建一个虽小但功能完备的大模型变得触手可及。无论你是想夯实理论基础，还是为未来研发更大规模的模型做准备",90106,"2026-04-06T11:19:32",[35,15,13,14],{"id":62,"github_repo":63,"name":64,"description_en":65,"description_zh":66,"ai_summary_zh":66,"readme_en":67,"readme_zh":68,"quickstart_zh":69,"use_case_zh":70,"hero_image_url":71,"owner_login":72,"owner_name":73,"owner_avatar_url":74,"owner_bio":73,"owner_company":73,"owner_location":73,"owner_email":75,"owner_twitter":73,"owner_website":73,"owner_url":76,"languages":77,"stars":98,"forks":99,"last_commit_at":100,"license":101,"difficulty_score":10,"env_os":102,"env_gpu":103,"env_ram":104,"env_deps":105,"category_tags":117,"github_topics":118,"view_count":32,"oss_zip_url":73,"oss_zip_packed_at":73,"status":17,"created_at":134,"updated_at":135,"faqs":136,"releases":178},4835,"dmMaze\u002FBallonsTranslator","BallonsTranslator","深度学习辅助漫画翻译工具, 支持一键机翻和简单的图像\u002F文本编辑 | Yet another computer-aided comic\u002Fmanga translation tool powered by deeplearning","BallonTranslator 是一款专为漫画和条漫爱好者打造的深度学习辅助翻译工具。它致力于解决外语漫画阅读中的语言障碍，通过自动化流程将繁琐的“检测、抹字、翻译、回填”步骤整合为一键操作，让用户能轻松生成排版自然的中文化漫画。\n\n这款工具特别适合希望快速汉化日漫或美漫的普通读者、字幕组译者以及二次元内容创作者。无需深厚的编程背景，用户即可在图形界面中完成从图片导入到最终导出的全过程；同时也支持命令行模式，方便开发者进行批量处理。\n\n其核心技术亮点在于智能的文本回填算法。BallonTranslator 不仅能精准识别气泡内的文字并自动擦除，还能根据原文的字体颜色、轮廓、角度及对齐方式，将译文完美还原到画面中，最大程度保留原作的视觉风格。此外，它还提供了强大的所见即所得编辑功能，包括修复画笔、富文本调整及 Word 文档导入导出，允许用户对机翻结果进行精细化校对与润色。无论是简单的日常阅读，还是专业的本地化制作，BallonTranslator 都能提供高效且友好的支持。","> [!IMPORTANT]  \n> **如打算公开分享本工具的机翻结果，且没有有经验的译者进行过完整的翻译或校对，请在显眼位置注明机翻。**\n\n# BallonTranslator\n简体中文 | [English](\u002FREADME_EN.md) | [pt-BR](doc\u002FREADME_PT-BR.md) | [Русский](doc\u002FREADME_RU.md) | [日本語](doc\u002FREADME_JA.md) | [Indonesia](doc\u002FREADME_ID.md) | [Tiếng Việt](doc\u002FREADME_VI.md) | [한국어](doc\u002FREADME_KO.md) | [Español](doc\u002FREADME_ES.md) | [Français](doc\u002FREADME_FR.md)\n\n深度学习辅助漫画翻译工具，支持一键机翻和简单的图像\u002F文本编辑  \n\n\u003Cimg src=\"https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002FdmMaze_BallonsTranslator_readme_28d97e77d346.jpg\" div align=center>\n\n\u003Cp align=center>\n界面预览\n\u003C\u002Fp>\n\n# Features\n* 一键机翻  \n  - 译文回填参考对原文排版的估计，包括颜色，轮廓，角度，朝向，对齐方式等\n  - 最后效果取决于文本检测，识别，抹字，机翻四个模块的整体表现  \n  - 支持日漫和美漫\n  - 英译中，日译英排版已优化，文本布局以提取到的背景泡为参考，中文基于 pkuseg 进行断句，日译中竖排待改善\n  \n* 图像编辑  \n  支持掩膜编辑和修复画笔\n  \n* 文本编辑  \n  - 支持所见即所得地富文本编辑和一些基础排版格式调整、[字体样式预设](https:\u002F\u002Fgithub.com\u002FdmMaze\u002FBallonsTranslator\u002Fpull\u002F311)\n  - 支持全文\u002F原文\u002F译文查找替换\n  - 支持导入导出 word 文档\n\n* 适用于条漫\n\n# 使用说明\n\n## Windows\n如果用 Windows 而且不想自己手动配置环境，而且能正常访问互联网:  \n从 [MEGA](https:\u002F\u002Fmega.nz\u002Ffolder\u002FgmhmACoD#dkVlZ2nphOkU5-2ACb5dKw) 或 [Google Drive](https:\u002F\u002Fdrive.google.com\u002Fdrive\u002Ffolders\u002F1uElIYRLNakJj-YS0Kd3r3HE-wzeEvrWd?usp=sharing) 下载 BallonsTranslator_dev_src_with_gitpython.7z，解压并运行 launch_win.bat 启动程序。如果无法自动下载库和模型，手动下载 data 和 ballontrans_pylibs_win.7z 并解压到程序目录下。  \n运行 scripts\u002Flocal_gitpull.bat 获取更新。 \n注意这些打包版无法在 Windows 7 上运行，win 7 用户需要自行安装 [Python 3.8](https:\u002F\u002Fwww.python.org\u002Fdownloads\u002Frelease\u002Fpython-3810\u002F) 运行源码。\n\n## 运行源码\n\n安装 [Python](https:\u002F\u002Fwww.python.org\u002Fdownloads\u002Frelease\u002Fpython-31011) **\u003C= 3.12** (别用微软应用商店版) 和 [Git](https:\u002F\u002Fgit-scm.com\u002Fdownloads)\n\n```bash\n# 克隆仓库\n$ git clone https:\u002F\u002Fgithub.com\u002FdmMaze\u002FBallonsTranslator.git ; cd BallonsTranslator\n\n# 启动程序\n$ python3 launch.py\n\n# 更新程序\npython3 launch.py --update\n```\n\n第一次运行会自动安装 torch 等依赖项并下载所需模型和文件，如果模型下载失败，需要手动从 [MEGA](https:\u002F\u002Fmega.nz\u002Ffolder\u002FgmhmACoD#dkVlZ2nphOkU5-2ACb5dKw) 或 [Google Drive](https:\u002F\u002Fdrive.google.com\u002Fdrive\u002Ffolders\u002F1uElIYRLNakJj-YS0Kd3r3HE-wzeEvrWd?usp=sharing) 下载 data 文件夹(或者报错里提到缺失的文件)，并保存到源码目录下的对应位置。\n\n## 构建 macOS 应用(适用 apple silicon 芯片)\n[参考](doc\u002FmacOS_app_CN.md)  \n可能会有各种问题，目前还是推荐跑源码\n\n## 一键翻译\n**建议在命令行终端下运行程序**，首次运行请先配置好源语言\u002F目标语言，打开一个带图片的文件夹，点击 Run 等待翻译完成  \n\u003Cimg src=\"https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002FdmMaze_BallonsTranslator_readme_cc6e66f9d60c.gif\">  \n\n一键机翻嵌字格式如大小、颜色等默认是由程序决定的，可以在设置面板->嵌字菜单中改用全局设置。全局字体格式就是未编辑任何文本块时右侧字体面板显示的格式:  \n\u003Cimg src=\"https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002FdmMaze_BallonsTranslator_readme_ab8397f572c8.png\"> \n\n## 画板\n\n## 修复画笔\n\u003Cimg src=\"https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002FdmMaze_BallonsTranslator_readme_afa81344ee16.gif\">\n\u003Cp align = \"center\">\n修复画笔\n\u003C\u002Fp>\n\n### 矩形工具\n\u003Cimg src=\"https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002FdmMaze_BallonsTranslator_readme_df8aac17d624.gif\">\n\u003Cp align = \"center\">\n矩形工具\n\u003C\u002Fp>\n\n按下鼠标左键拖动矩形框抹除框内文字，按下右键拉框清除框内修复结果。  \n抹除结果取决于算法(gif 中的\"方法1\"和\"方法2\")对文字区域估算的准确程度，一般拉的框最好稍大于需要抹除的文本块。两种方法都比较玄学，能够应付绝大多数简单文字简单背景，部分复杂背景简单文字\u002F简单背景复杂文字，少数复杂背景复杂文字，可以多拉几次试试。  \n勾选\"自动\"拉完框立即修复，否则需要按下\"修复\"或者空格键才进行修复，或 ```Ctrl+D``` 删除矩形选框。 \n\n## 文本编辑\n\u003Cimg src=\"https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002FdmMaze_BallonsTranslator_readme_188e46ad4528.gif\">\n\n\n\u003Cp align = \"center\">\n文本编辑\n\u003C\u002Fp>\n\n\u003Cimg src=\"https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002FdmMaze_BallonsTranslator_readme_c1cb79245055.gif\" div align=center>\n\u003Cp align=center>\n批量文本格式调整及自动排版\n\u003C\u002Fp>\n\n\u003Cimg src=\"https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002FdmMaze_BallonsTranslator_readme_c732ea2e2907.gif\" div align=center>\n\u003Cp align=center>\nOCR并翻译选中文本框\n\u003C\u002Fp>\n\n## 界面说明及快捷键\n* Ctrl+Z，Ctrl+Y 可以撤销重做大部分操作，注意翻页后撤消重做栈会清空\n* A\u002FD 或 pageUp\u002FDown 翻页，如果当前页面未保存会自动保存\n* T 切换到文本编辑模式下(底部最右\"T\"图标)，W激活文本块创建模式后在画布右键拉文本框\n* P 切换到画板模式，右下角滑条改原图透明度\n* 标题栏->运行 可以启用\u002F禁用任意自动化模块，全部禁用后Run会根据全局字体样式和嵌字设置重新渲染文本  \n* 设置面板配置各自动化模块参数\n* Ctrl++\u002F- 或滚轮缩放画布\n* Ctrl+A 可选中界面中所有文本块\n* Ctrl+F 查找当前页，Ctrl+G全局查找\n* 0-9调整嵌字\u002F原图透明度\n* 文本编辑下 ```Ctrl+B``` 加粗，```Ctrl+U``` 下划线，```Ctrl+I``` 斜体\n* 字体样式面板-\"特效\"修改透明度添加阴影\n* ```Alt+Arrow Keys``` 或 ```Alt+WASD``` (正在编辑文本块时 ```pageDown``` 或 ```pageUp```) 在文本块间切换\n\n\u003Cimg src=\"https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002FdmMaze_BallonsTranslator_readme_3d6e50123ddd.png\">  \n\n## 命令行模式 (无GUI)\n``` python\npython launch.py --headless --exec_dirs \"[DIR_1],[DIR_2]...\"\n```\n所有设置 (如检测模型, 原语言目标语言等) 会从 config\u002Fconfig.json 导入。  \n如果渲染字体大小不对, 通过 ```--ldpi ``` 指定 Logical DPI 大小, 通常为 96 和 72。\n\n# 自动化模块\n本项目重度依赖 [manga-image-translator](https:\u002F\u002Fgithub.com\u002Fzyddnys\u002Fmanga-image-translator)，在线服务器和模型训练需要费用，有条件请考虑支持一下\n- Ko-fi: \u003Chttps:\u002F\u002Fko-fi.com\u002Fvoilelabs>\n- Patreon: \u003Chttps:\u002F\u002Fwww.patreon.com\u002Fvoilelabs>\n- 爱发电: \u003Chttps:\u002F\u002Fafdian.net\u002F@voilelabs>\n\nSugoi 翻译器作者: [mingshiba](https:\u002F\u002Fwww.patreon.com\u002Fmingshiba)\n  \n### 文本检测\n * 暂时仅支持日文(方块字都差不多)和英文检测，训练代码和说明见https:\u002F\u002Fgithub.com\u002FdmMaze\u002Fcomic-text-detector\n * 支持使用 [星河云(团子漫画OCR)](https:\u002F\u002Fcloud.stariver.org.cn\u002F)的文本检测，需要填写用户名和密码，每次启动时会自动登录。\n   * 详细说明见 [团子OCR说明](doc\u002F团子OCR说明.md)\n * `YSGDetector` 是由 [lhj5426](https:\u002F\u002Fgithub.com\u002Flhj5426) 训练的模型，能更好地过滤日漫\u002FCG里的拟声词。需要手动从 [YSGYoloDetector](https:\u002F\u002Fhuggingface.co\u002FYSGforMTL\u002FYSGYoloDetector) 下载模型放到 data\u002Fmodels 目录下。\n\n\n### OCR\n * 所有 mit 模型来自 manga-image-translator，支持日英汉识别和颜色提取\n * [manga_ocr](https:\u002F\u002Fgithub.com\u002Fkha-white\u002Fmanga-ocr) 来自 [kha-white](https:\u002F\u002Fgithub.com\u002Fkha-white)，支持日语识别，注意选用该模型程序不会提取颜色\n * [PaddleOCRVLManga](https:\u002F\u002Fhuggingface.co\u002Fjzhang533\u002FPaddleOCR-VL-For-Manga) 支持日语识别，选用该模型程序不会提取颜色\n * 支持使用 [星河云(团子漫画OCR)](https:\u002F\u002Fcloud.stariver.org.cn\u002F)的OCR，需要填写用户名和密码，每次启动时会自动登录。\n   * 目前的实现方案是逐个textblock进行OCR，速度较慢，准确度没有明显提升，不推荐使用。如果有需要，请使用团子Detector。\n   * 推荐文本检测设置为团子Detector时，将OCR设为none_ocr，直接读取文本，节省时间和请求次数。\n   * 详细说明见 [团子OCR说明](doc\u002F团子OCR说明.md)\n * OCR设置项: 字体识别。把[字体识别模型（YuzuMarker.FontDetection）](https:\u002F\u002Fgithub.com\u002FJeffersonQin\u002FYuzuMarker.FontDetection)下载下来放在data\\models\\YuzuMarker.FontDetection目录下。\n  需要的三个文件分别是```data\\models\\YuzuMarker.FontDetection\\font_dataset``` ，  ```data\\models\\YuzuMarker.FontDetection\\name=4x-epoch=18-step=368676.ckpt```，  ```data\\font_demo_cache.bin```  \n  识别到的置信率大于60%的字体名称会保存在json文件的```_detected_font_name```字段中。目前没做可视化外显，使用[脚本](scripts\u002FBTjson_to_LPtxt.pyw)导出LabelPlus txt时可选带上字体字号信息，导入到其他软件（如PS\u002FID）嵌字用。\n\n### 图像修复\n  * AOT 修复模型来自 manga-image-translator\n  * patchmatch 是非深度学习算法，也是PS修复画笔背后的算法，实现来自 [PyPatchMatch](https:\u002F\u002Fgithub.com\u002Fvacancy\u002FPyPatchMatch)，本程序用的是我的[修改版](https:\u002F\u002Fgithub.com\u002FdmMaze\u002FPyPatchMatchInpaint)\n  * lama* 是微调过的[lama](https:\u002F\u002Fgithub.com\u002Fadvimman\u002Flama)\n  \n\n### 翻译器\n\n * 谷歌翻译器已经关闭中国服务，大陆再用需要设置全局代理，并在设置面板把 url 换成*.com\n * 彩云，需要申请 [token](https:\u002F\u002Fdashboard.caiyunapp.com\u002F)\n * papago  \n * DeepL 和 Sugoi (及它的 CT2 Translation 转换)翻译器，感谢 [Snowad14](https:\u002F\u002Fgithub.com\u002FSnowad14)，如果要使用Sugoi翻译器(仅日译英)，下载[离线模型](https:\u002F\u002Fdrive.google.com\u002Fdrive\u002Ffolders\u002F1KnDlfUM9zbnYFTo6iCbnBaBKabXfnVJm)，将 ```sugoi_translator``` 移入 BallonsTranslator\u002Fballontranslator\u002Fdata\u002Fmodels。 \n * 支持 [Sakura-13B-Galgame](https:\u002F\u002Fgithub.com\u002FSakuraLLM\u002FSakura-13B-Galgame)。如果在本地单卡上运行且显存不足，可以在设置面板里勾选 ```low vram mode``` (默认启用)。\n * DeepLX 请参考[Vercel](https:\u002F\u002Fgithub.com\u002Fbropines\u002FDeeplx-vercel) 或 [deeplx](https:\u002F\u002Fgithub.com\u002FOwO-Network\u002FDeepLX)\n * 支持两个版本的 OpenAI 兼容翻译器，支持兼容 OpenAI API 的官方或第三方LLM提供商，需要在设置面板里配置。\n   * 无后缀版本token消耗更小，但分句稳定性稍差，长文本翻译可能有问题。\n   * exp后缀版本token消耗更大，但稳定性更好，且在Prompt中进行了“越狱”，适合长文本翻译。\n * [m2m100](https:\u002F\u002Fhuggingface.co\u002Ffacebook\u002Fm2m100_1.2B): 下载并将 m2m100-1.2B-ctranslate2 移到 data\u002Fmodels 目录下\n\n其它优秀的离线英文翻译模型请参考[这条讨论](https:\u002F\u002Fgithub.com\u002FdmMaze\u002FBallonsTranslator\u002Fdiscussions\u002F515)  \n如需添加新的翻译器请参考[加别的翻译器](doc\u002F加别的翻译器.md)，本程序添加新翻译器只需要继承基类实现两个接口即可不需要理会代码其他部分，欢迎大佬提 pr\n\n## 杂\n* 电脑带 Nvidia 显卡或 Apple silicon 默认启用 GPU 加速\n* 感谢 [bropines](https:\u002F\u002Fgithub.com\u002Fbropines) 提供俄语翻译\n* 第三方输入法可能会造成右侧编辑框显示 bug，见[#76](https:\u002F\u002Fgithub.com\u002FdmMaze\u002FBallonsTranslator\u002Fissues\u002F76)，暂时不打算修\n* 选中文本迷你菜单支持*聚合词典专业划词翻译*[沙拉查词](https:\u002F\u002Fsaladict.crimx.com): [安装说明](doc\u002Fsaladict_chs.md)\n\u003Cdetails>\n  \u003Csummary>\u003Ci>启用 AMD ROCm 显卡加速方法\u003C\u002Fi>\u003C\u002Fsummary>\n\n### 通用方案 ZLUDA (ROCm)\n\n**优点:**\n文本和文本框识别速度比社区预览版略快，当然比 CPU 更快\n\n**缺点:**\n需要额外安装并进行相关配置才可工作，首次启动以及更换识别模型、显卡驱动升级等都需要长时间预热缓存\n\n**安装步骤:**\n\n1. 更新显卡驱动至最新版 (建议 24.12.1 及以上，根据自身系统环境下载并安装 [AMD HIP SDK Page](https:\u002F\u002Fwww.amd.com\u002Fen\u002Fdeveloper\u002Fresources\u002Frocm-hub\u002Fhip-sdk.html)  )\n2. 下载 [ZLUDA](https:\u002F\u002Fgithub.com\u002Flshqqytiger\u002FZLUDA\u002Freleases) 并解压到 zluda 文件夹内，复制 zluda 文件夹到系统盘下: 比如c盘 (C:\\zluda)  \n3. 配置系统环境变量，以 windows 10 系统为例:设置 - 系统属性 - 高级系统设置 - 环境变量 - 系统变量 - 找到 path 变量，点击编辑，在最后添加 `C:\\zluda` 和 `%HIP_PATH%bin` 两项  \n4. 替换 CUDA 库的动态链接文件: 将 `C:\\zluda` 文件夹内的 `cublas.dll` `cusparse.dll` 和 `nvrtc.dll` 复制出一份到桌面，按如下规则重命名复制出来的文件  \n\n**注意事项**\n\n注意 HIP SDK 和 ZLUDA 版本对应关系，建议使用较新的AMD显卡驱动程序。\n\n|Windows 版本 | HIP SDK 版本 | ZLUDA 版本 |\n|---|---|---|\n|Windows 11 | 7.1.1 | 3.9.6 |\n|Windows 10 和 11 | 6.4.2 | 3.9.5 |  \n|Windows 10 和 11 | 6.2.4 | 3.9.5 |  \n|Windows 10 和 11 | 6.1.2 | 3.9.5 |  \n\n\n```\n  原文件名 → 新文件名\n\n  cublas.dll → cublas64_11.dll\n\n  cusparse.dll → cusparse64_11.dll\n\n  nvrtc.dll → nvrtc64_112_0.dll\n```\n  将已经重命名的文件替换掉 `BallonsTranslator\\ballontrans_pylibs_win\\Lib\\site-packages\\torch\\lib\\` 目录中的同名文件\n\n5. 启动程序并设置 OCR 和文本检测 为 Cuda **(图像修复请继续使用 CPU)**\n6. 运行 OCR 并等待 ZLUDA 编译 PTX 文件 **(首次编译大概需要 5-10 分钟，取决于 CPU 性能)**,**下次运行无需编译**\n\n### 原生方案 (ROCm in Windows)\n\n**警告:**\n需要 Python 3.12 和 HIP SDK 6.4 以及 AMD 2026.1.1 驱动，需要重新安装依赖库。\n\n2026年AMD终于在 2026.1.1 驱动下正式支持 ROCm 在 windows系统下工作了。不幸的是AMD官方发布的新的 Pytorch 三件套需要 Python 3.12 版本。\n所以如果想使用原生 AI 加速，需要卸载项目内建的 Python 3.10 并移除 3.10 版本的库。重新安装内嵌 Python 3.12 并重新安装相关依赖库。\n\n**优点:**\n无需额外安装，开箱即用。（并不是）且图像修复工具可以正常使用 CUDA 加速。\n\n**缺点:**\n对显卡限制大，对 Python 版本也有要求。\n\n**安装步骤:**\n\n1. 检查显卡是否在 AMD 显卡驱动 AI 套件支持范围内。\n2. 确保 HIP SDK 为 6.4.x, Python 相关依赖库已经更新为 3.12 版本。\n3. 使用 [launch_win_amd_nightly.bat](launch_win_amd_nightly.bat) 启动程序。\n4. 检查 OCR 和文本检测、图像修复设置是否为 CUDA。\n\n**注意事项**\nlaunch_win_amd_nightly.bat 为了保证最大兼容性，默认下载并使用的是 Rocm6.4 的 Pytorch 三件套，如果需要 ROCm7，需要手动更新对应版本的 Pytorch。\n并且需要额外安装 ROCm7 自身的三个SDK库。\n \n\u003C\u002Fdetails>\n","> [!IMPORTANT]  \n> **如打算公开分享本工具的机翻结果，且没有有经验的译者进行过完整的翻译或校对，请在显眼位置注明机翻。**\n\n# BallonTranslator\n简体中文 | [English](\u002FREADME_EN.md) | [pt-BR](doc\u002FREADME_PT-BR.md) | [Русский](doc\u002FREADME_RU.md) | [日本語](doc\u002FREADME_JA.md) | [Indonesia](doc\u002FREADME_ID.md) | [Tiếng Việt](doc\u002FREADME_VI.md) | [한국어](doc\u002FREADME_KO.md) | [Español](doc\u002FREADME_ES.md) | [Français](doc\u002FREADME_FR.md)\n\n深度学习辅助漫画翻译工具，支持一键机翻和简单的图像\u002F文本编辑  \n\n\u003Cimg src=\"https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002FdmMaze_BallonsTranslator_readme_28d97e77d346.jpg\" div align=center>\n\n\u003Cp align=center>\n界面预览\n\u003C\u002Fp>\n\n# Features\n* 一键机翻  \n  - 译文回填参考对原文排版的估计，包括颜色，轮廓，角度，朝向，对齐方式等\n  - 最后效果取决于文本检测，识别，抹字，机翻四个模块的整体表现  \n  - 支持日漫和美漫\n  - 英译中，日译英排版已优化，文本布局以提取到的背景泡为参考，中文基于 pkuseg 进行断句，日译中竖排待改善\n  \n* 图像编辑  \n  支持掩膜编辑和修复画笔\n  \n* 文本编辑  \n  - 支持所见即所得地富文本编辑和一些基础排版格式调整、[字体样式预设](https:\u002F\u002Fgithub.com\u002FdmMaze\u002FBallonsTranslator\u002Fpull\u002F311)\n  - 支持全文\u002F原文\u002F译文查找替换\n  - 支持导入导出 word 文档\n\n* 适用于条漫\n\n# 使用说明\n\n## Windows\n如果用 Windows 而且不想自己手动配置环境，而且能正常访问互联网:  \n从 [MEGA](https:\u002F\u002Fmega.nz\u002Ffolder\u002FgmhmACoD#dkVlZ2nphOkU5-2ACb5dKw) 或 [Google Drive](https:\u002F\u002Fdrive.google.com\u002Fdrive\u002Ffolders\u002F1uElIYRLNakJj-YS0Kd3r3HE-wzeEvrWd?usp=sharing) 下载 BallonsTranslator_dev_src_with_gitpython.7z，解压并运行 launch_win.bat 启动程序。如果无法自动下载库和模型，手动下载 data 和 ballontrans_pylibs_win.7z 并解压到程序目录下。  \n运行 scripts\u002Flocal_gitpull.bat 获取更新。 \n注意这些打包版无法在 Windows 7 上运行，win 7 用户需要自行安装 [Python 3.8](https:\u002F\u002Fwww.python.org\u002Fdownloads\u002Frelease\u002Fpython-3810\u002F) 运行源码。\n\n## 运行源码\n\n安装 [Python](https:\u002F\u002Fwww.python.org\u002Fdownloads\u002Frelease\u002Fpython-31011) **\u003C= 3.12** (别用微软应用商店版) 和 [Git](https:\u002F\u002Fgit-scm.com\u002Fdownloads)\n\n```bash\n# 克隆仓库\n$ git clone https:\u002F\u002Fgithub.com\u002FdmMaze\u002FBallonsTranslator.git ; cd BallonsTranslator\n\n# 启动程序\n$ python3 launch.py\n\n# 更新程序\npython3 launch.py --update\n```\n\n第一次运行会自动安装 torch 等依赖项并下载所需模型和文件，如果模型下载失败，需要手动从 [MEGA](https:\u002F\u002Fmega.nz\u002Ffolder\u002FgmhmACoD#dkVlZ2nphOkU5-2ACb5dKw) 或 [Google Drive](https:\u002F\u002Fdrive.google.com\u002Fdrive\u002Ffolders\u002F1uElIYRLNakJj-YS0Kd3r3HE-wzeEvrWd?usp=sharing) 下载 data 文件夹(或者报错里提到缺失的文件)，并保存到源码目录下的对应位置。\n\n## 构建 macOS 应用(适用 apple silicon 芯片)\n[参考](doc\u002FmacOS_app_CN.md)  \n可能会有各种问题，目前还是推荐跑源码\n\n## 一键翻译\n**建议在命令行终端下运行程序**，首次运行请先配置好源语言\u002F目标语言，打开一个带图片的文件夹，点击 Run 等待翻译完成  \n\u003Cimg src=\"https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002FdmMaze_BallonsTranslator_readme_cc6e66f9d60c.gif\">  \n\n一键机翻嵌字格式如大小、颜色等默认是由程序决定的，可以在设置面板->嵌字菜单中改用全局设置。全局字体格式就是未编辑任何文本块时右侧字体面板显示的格式:  \n\u003Cimg src=\"https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002FdmMaze_BallonsTranslator_readme_ab8397f572c8.png\"> \n\n## 画板\n\n## 修复画笔\n\u003Cimg src=\"https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002FdmMaze_BallonsTranslator_readme_afa81344ee16.gif\">\n\u003Cp align = \"center\">\n修复画笔\n\u003C\u002Fp>\n\n### 矩形工具\n\u003Cimg src=\"https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002FdmMaze_BallonsTranslator_readme_df8aac17d624.gif\">\n\u003Cp align = \"center\">\n矩形工具\n\u003C\u002Fp>\n\n按下鼠标左键拖动矩形框抹除框内文字，按下右键拉框清除框内修复结果。  \n抹除结果取决于算法(gif 中的\"方法1\"和\"方法2\")对文字区域估算的准确程度，一般拉的框最好稍大于需要抹除的文本块。两种方法都比较玄学，能够应付绝大多数简单文字简单背景，部分复杂背景简单文字\u002F简单背景复杂文字，少数复杂背景复杂文字，可以多拉几次试试。  \n勾选\"自动\"拉完框立即修复，否则需要按下\"修复\"或者空格键才进行修复，或 ```Ctrl+D``` 删除矩形选框。 \n\n## 文本编辑\n\u003Cimg src=\"https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002FdmMaze_BallonsTranslator_readme_188e46ad4528.gif\">\n\n\n\u003Cp align = \"center\">\n文本编辑\n\u003C\u002Fp>\n\n\u003Cimg src=\"https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002FdmMaze_BallonsTranslator_readme_c1cb79245055.gif\" div align=center>\n\u003Cp align=center>\n批量文本格式调整及自动排版\n\u003C\u002Fp>\n\n\u003Cimg src=\"https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002FdmMaze_BallonsTranslator_readme_c732ea2e2907.gif\" div align=center>\n\u003Cp align=center>\nOCR并翻译选中文本框\n\u003C\u002Fp>\n\n## 界面说明及快捷键\n* Ctrl+Z，Ctrl+Y 可以撤销重做大部分操作，注意翻页后撤消重做栈会清空\n* A\u002FD 或 pageUp\u002FDown 翻页，如果当前页面未保存会自动保存\n* T 切换到文本编辑模式下(底部最右\"T\"图标)，W激活文本块创建模式后在画布右键拉文本框\n* P 切换到画板模式，右下角滑条改原图透明度\n* 标题栏->运行 可以启用\u002F禁用任意自动化模块，全部禁用后Run会根据全局字体样式和嵌字设置重新渲染文本  \n* 设置面板配置各自动化模块参数\n* Ctrl++\u002F- 或滚轮缩放画布\n* Ctrl+A 可选中界面中所有文本块\n* Ctrl+F 查找当前页，Ctrl+G全局查找\n* 0-9调整嵌字\u002F原图透明度\n* 文本编辑下 ```Ctrl+B``` 加粗，```Ctrl+U``` 下划线，```Ctrl+I``` 斜体\n* 字体样式面板-\"特效\"修改透明度添加阴影\n* ```Alt+Arrow Keys``` 或 ```Alt+WASD``` (正在编辑文本块时 ```pageDown``` 或 ```pageUp```) 在文本块间切换\n\n\u003Cimg src=\"https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002FdmMaze_BallonsTranslator_readme_3d6e50123ddd.png\">  \n\n## 命令行模式 (无GUI)\n``` python\npython launch.py --headless --exec_dirs \"[DIR_1],[DIR_2]...\"\n```\n所有设置 (如检测模型, 原语言目标语言等) 会从 config\u002Fconfig.json 导入。  \n如果渲染字体大小不对, 通过 ```--ldpi ``` 指定 Logical DPI 大小, 通常为 96 和 72。\n\n# 自动化模块\n本项目重度依赖 [manga-image-translator](https:\u002F\u002Fgithub.com\u002Fzyddnys\u002Fmanga-image-translator)，在线服务器和模型训练需要费用，有条件请考虑支持一下\n- Ko-fi: \u003Chttps:\u002F\u002Fko-fi.com\u002Fvoilelabs>\n- Patreon: \u003Chttps:\u002F\u002Fwww.patreon.com\u002Fvoilelabs>\n- 爱发电: \u003Chttps:\u002F\u002Fafdian.net\u002F@voilelabs>\n\nSugoi 翻译器作者: [mingshiba](https:\u002F\u002Fwww.patreon.com\u002Fmingshiba)\n  \n### 文本检测\n * 暂时仅支持日文(方块字都差不多)和英文检测，训练代码和说明见https:\u002F\u002Fgithub.com\u002FdmMaze\u002Fcomic-text-detector\n * 支持使用 [星河云(团子漫画OCR)](https:\u002F\u002Fcloud.stariver.org.cn\u002F)的文本检测，需要填写用户名和密码，每次启动时会自动登录。\n   * 详细说明见 [团子OCR说明](doc\u002F团子OCR说明.md)\n * `YSGDetector` 是由 [lhj5426](https:\u002F\u002Fgithub.com\u002Flhj5426) 训练的模型，能更好地过滤日漫\u002FCG里的拟声词。需要手动从 [YSGYoloDetector](https:\u002F\u002Fhuggingface.co\u002FYSGforMTL\u002FYSGYoloDetector) 下载模型放到 data\u002Fmodels 目录下。\n\n\n### OCR\n * 所有 mit 模型来自 manga-image-translator，支持日英汉识别和颜色提取\n * [manga_ocr](https:\u002F\u002Fgithub.com\u002Fkha-white\u002Fmanga-ocr) 来自 [kha-white](https:\u002F\u002Fgithub.com\u002Fkha-white)，支持日语识别，注意选用该模型程序不会提取颜色\n * [PaddleOCRVLManga](https:\u002F\u002Fhuggingface.co\u002Fjzhang533\u002FPaddleOCR-VL-For-Manga) 支持日语识别，选用该模型程序不会提取颜色\n * 支持使用 [星河云(团子漫画OCR)](https:\u002F\u002Fcloud.stariver.org.cn\u002F)的OCR，需要填写用户名和密码，每次启动时会自动登录。\n   * 目前的实现方案是逐个textblock进行OCR，速度较慢，准确度没有明显提升，不推荐使用。如果有需要，请使用团子Detector。\n   * 推荐文本检测设置为团子Detector时，将OCR设为none_ocr，直接读取文本，节省时间和请求次数。\n   * 详细说明见 [团子OCR说明](doc\u002F团子OCR说明.md)\n * OCR设置项: 字体识别。把[字体识别模型（YuzuMarker.FontDetection）](https:\u002F\u002Fgithub.com\u002FJeffersonQin\u002FYuzuMarker.FontDetection)下载下来放在data\\models\\YuzuMarker.FontDetection目录下。\n  需要的三个文件分别是```data\\models\\YuzuMarker.FontDetection\\font_dataset``` ，  ```data\\models\\YuzuMarker.FontDetection\\name=4x-epoch=18-step=368676.ckpt```，  ```data\\font_demo_cache.bin```  \n  识别到的置信率大于60%的字体名称会保存在json文件的```_detected_font_name```字段中。目前没做可视化外显，使用[脚本](scripts\u002FBTjson_to_LPtxt.pyw)导出LabelPlus txt时可选带上字体字号信息，导入到其他软件（如PS\u002FID）嵌字用。\n\n### 图像修复\n  * AOT 修复模型来自 manga-image-translator\n  * patchmatch 是非深度学习算法，也是PS修复画笔背后的算法，实现来自 [PyPatchMatch](https:\u002F\u002Fgithub.com\u002Fvacancy\u002FPyPatchMatch)，本程序用的是我的[修改版](https:\u002F\u002Fgithub.com\u002FdmMaze\u002FPyPatchMatchInpaint)\n  * lama* 是微调过的[lama](https:\u002F\u002Fgithub.com\u002Fadvimman\u002Flama)\n  \n\n### 翻译器\n\n * 谷歌翻译器已经关闭中国服务，大陆再用需要设置全局代理，并在设置面板把 url 换成*.com\n * 彩云，需要申请 [token](https:\u002F\u002Fdashboard.caiyunapp.com\u002F)\n * papago  \n * DeepL 和 Sugoi (及它的 CT2 Translation 转换)翻译器，感谢 [Snowad14](https:\u002F\u002Fgithub.com\u002FSnowad14)，如果要使用Sugoi翻译器(仅日译英)，下载[离线模型](https:\u002F\u002Fdrive.google.com\u002Fdrive\u002Ffolders\u002F1KnDlfUM9zbnYFTo6iCbnBaBKabXfnVJm)，将 ```sugoi_translator``` 移入 BallonsTranslator\u002Fballontranslator\u002Fdata\u002Fmodels。 \n * 支持 [Sakura-13B-Galgame](https:\u002F\u002Fgithub.com\u002FSakuraLLM\u002FSakura-13B-Galgame)。如果在本地单卡上运行且显存不足，可以在设置面板里勾选 ```low vram mode``` (默认启用)。\n * DeepLX 请参考[Vercel](https:\u002F\u002Fgithub.com\u002Fbropines\u002FDeeplx-vercel) 或 [deeplx](https:\u002F\u002Fgithub.com\u002FOwO-Network\u002FDeepLX)\n * 支持两个版本的 OpenAI 兼容翻译器，支持兼容 OpenAI API 的官方或第三方LLM提供商，需要在设置面板里配置。\n   * 无后缀版本token消耗更小，但分句稳定性稍差，长文本翻译可能有问题。\n   * exp后缀版本token消耗更大，但稳定性更好，且在Prompt中进行了“越狱”，适合长文本翻译。\n * [m2m100](https:\u002F\u002Fhuggingface.co\u002Ffacebook\u002Fm2m100_1.2B): 下载并将 m2m100-1.2B-ctranslate2 移到 data\u002Fmodels 目录下\n\n其它优秀的离线英文翻译模型请参考[这条讨论](https:\u002F\u002Fgithub.com\u002FdmMaze\u002FBallonsTranslator\u002Fdiscussions\u002F515)  \n如需添加新的翻译器请参考[加别的翻译器](doc\u002F加别的翻译器.md)，本程序添加新翻译器只需要继承基类实现两个接口即可不需要理会代码其他部分，欢迎大佬提 pr\n\n## 杂\n* 电脑带 Nvidia 显卡或 Apple silicon 默认启用 GPU 加速\n* 感谢 [bropines](https:\u002F\u002Fgithub.com\u002Fbropines) 提供俄语翻译\n* 第三方输入法可能会造成右侧编辑框显示 bug，见[#76](https:\u002F\u002Fgithub.com\u002FdmMaze\u002FBallonsTranslator\u002Fissues\u002F76)，暂时不打算修\n* 选中文本迷你菜单支持*聚合词典专业划词翻译*[沙拉查词](https:\u002F\u002Fsaladict.crimx.com): [安装说明](doc\u002Fsaladict_chs.md)\n\u003Cdetails>\n  \u003Csummary>\u003Ci>启用 AMD ROCm 显卡加速方法\u003C\u002Fi>\u003C\u002Fsummary>\n\n### 通用方案 ZLUDA (ROCm)\n\n**优点:**\n文本和文本框识别速度比社区预览版略快，当然比 CPU 更快\n\n**缺点:**\n需要额外安装并进行相关配置才可工作，首次启动以及更换识别模型、显卡驱动升级等都需要长时间预热缓存\n\n**安装步骤:**\n\n1. 更新显卡驱动至最新版 (建议 24.12.1 及以上，根据自身系统环境下载并安装 [AMD HIP SDK Page](https:\u002F\u002Fwww.amd.com\u002Fen\u002Fdeveloper\u002Fresources\u002Frocm-hub\u002Fhip-sdk.html)  )\n2. 下载 [ZLUDA](https:\u002F\u002Fgithub.com\u002Flshqqytiger\u002FZLUDA\u002Freleases) 并解压到 zluda 文件夹内，复制 zluda 文件夹到系统盘下: 比如c盘 (C:\\zluda)  \n3. 配置系统环境变量，以 windows 10 系统为例:设置 - 系统属性 - 高级系统设置 - 环境变量 - 系统变量 - 找到 path 变量，点击编辑，在最后添加 `C:\\zluda` 和 `%HIP_PATH%bin` 两项  \n4. 替换 CUDA 库的动态链接文件: 将 `C:\\zluda` 文件夹内的 `cublas.dll` `cusparse.dll` 和 `nvrtc.dll` 复制出一份到桌面，按如下规则重命名复制出来的文件  \n\n**注意事项**\n\n注意 HIP SDK 和 ZLUDA 版本对应关系，建议使用较新的AMD显卡驱动程序。\n\n|Windows 版本 | HIP SDK 版本 | ZLUDA 版本 |\n|---|---|---|\n|Windows 11 | 7.1.1 | 3.9.6 |\n|Windows 10 和 11 | 6.4.2 | 3.9.5 |  \n|Windows 10 和 11 | 6.2.4 | 3.9.5 |  \n|Windows 10 和 11 | 6.1.2 | 3.9.5 |  \n\n\n```\n  原文件名 → 新文件名\n\n  cublas.dll → cublas64_11.dll\n\n  cusparse.dll → cusparse64_11.dll\n\n  nvrtc.dll → nvrtc64_112_0.dll\n```\n  将已经重命名的文件替换掉 `BallonsTranslator\\ballontrans_pylibs_win\\Lib\\site-packages\\torch\\lib\\` 目录中的同名文件\n\n5. 启动程序并设置 OCR 和文本检测 为 Cuda **(图像修复请继续使用 CPU)**\n6. 运行 OCR 并等待 ZLUDA 编译 PTX 文件 **(首次编译大概需要 5-10 分钟，取决于 CPU 性能)**,**下次运行无需编译**\n\n### 原生方案 (ROCm in Windows)\n\n**警告:**\n需要 Python 3.12 和 HIP SDK 6.4 以及 AMD 2026.1.1 驱动，需要重新安装依赖库。\n\n2026年AMD终于在 2026.1.1 驱动下正式支持 ROCm 在 windows系统下工作了。不幸的是AMD官方发布的新的 Pytorch 三件套需要 Python 3.12 版本。\n所以如果想使用原生 AI 加速，需要卸载项目内建的 Python 3.10 并移除 3.10 版本的库。重新安装内嵌 Python 3.12 并重新安装相关依赖库。\n\n**优点:**\n无需额外安装，开箱即用。（并不是）且图像修复工具可以正常使用 CUDA 加速。\n\n**缺点:**\n对显卡限制大，对 Python 版本也有要求。\n\n**安装步骤:**\n\n1. 检查显卡是否在 AMD 显卡驱动 AI 套件支持范围内。\n2. 确保 HIP SDK 为 6.4.x, Python 相关依赖库已经更新为 3.12 版本。\n3. 使用 [launch_win_amd_nightly.bat](launch_win_amd_nightly.bat) 启动程序。\n4. 检查 OCR 和文本检测、图像修复设置是否为 CUDA。\n\n**注意事项**\nlaunch_win_amd_nightly.bat 为了保证最大兼容性，默认下载并使用的是 Rocm6.4 的 Pytorch 三件套，如果需要 ROCm7，需要手动更新对应版本的 Pytorch。\n并且需要额外安装 ROCm7 自身的三个SDK库。\n \n\u003C\u002Fdetails>","# BallonsTranslator 快速上手指南\n\nBallonsTranslator 是一款基于深度学习的漫画翻译辅助工具，支持一键机翻、文本检测、图像修复及富文本编辑，适用于日漫和美漫的汉化工作。\n\n## 环境准备\n\n### 系统要求\n- **操作系统**: Windows 10\u002F11 (推荐), macOS (Apple Silicon), Linux\n- **Python 版本**: Python 3.8 - 3.12 (**注意**: 请勿使用微软应用商店版的 Python)\n- **硬件加速**: \n  - NVIDIA 显卡或 Apple Silicon 芯片默认启用 GPU 加速\n  - AMD 显卡需额外配置 (详见官方文档)\n- **网络**: 首次运行需联网下载模型和依赖库\n\n### 前置依赖\n- **Git**: 用于克隆代码仓库\n- **基础运行库**: 程序会自动安装 `torch` 等核心依赖\n\n## 安装步骤\n\n### 方法一：Windows 免配置启动（推荐新手）\n如果你使用 Windows 且希望避免手动配置环境：\n\n1. 下载打包文件：\n   - [MEGA 下载链接](https:\u002F\u002Fmega.nz\u002Ffolder\u002FgmhmACoD#dkVlZ2nphOkU5-2ACb5dKw)\n   - 或 [Google Drive 下载链接](https:\u002F\u002Fdrive.google.com\u002Fdrive\u002Ffolders\u002F1uElIYRLNakJj-YS0Kd3r3HE-wzeEvrWd?usp=sharing)\n   - 文件名：`BallonsTranslator_dev_src_with_gitpython.7z`\n\n2. 解压文件并双击运行 `launch_win.bat` 启动程序。\n\n3. **若自动下载失败**：\n   - 手动下载 `data` 文件夹和 `ballontrans_pylibs_win.7z`。\n   - 将其解压到程序根目录下。\n\n4. **更新程序**：\n   运行 `scripts\u002Flocal_gitpull.bat` 获取最新版本。\n\n> **注意**: 打包版不支持 Windows 7。Win7 用户请使用方法二自行安装 Python 3.8 运行源码。\n\n### 方法二：源码运行（通用）\n\n1. **安装依赖软件**：\n   - 安装 [Python](https:\u002F\u002Fwww.python.org\u002Fdownloads\u002Frelease\u002Fpython-31011) (版本 \u003C= 3.12)\n   - 安装 [Git](https:\u002F\u002Fgit-scm.com\u002Fdownloads)\n\n2. **克隆仓库并启动**：\n   ```bash\n   # 克隆仓库\n   git clone https:\u002F\u002Fgithub.com\u002FdmMaze\u002FBallonsTranslator.git\n   cd BallonsTranslator\n\n   # 启动程序（首次运行会自动安装依赖并下载模型）\n   python3 launch.py\n   ```\n\n3. **模型下载失败处理**：\n   如果自动下载模型失败，请手动从上述 MEGA 或 Google Drive 链接下载 `data` 文件夹，并将其放置在源码根目录下。\n\n4. **更新程序**：\n   ```bash\n   python3 launch.py --update\n   ```\n\n## 基本使用\n\n### 1. 一键机翻\n这是最核心的功能，可自动完成检测、识别、抹字和翻译回填。\n\n1. **启动程序**：建议在命令行终端运行 `python3 launch.py` 以便查看日志。\n2. **加载图片**：打开包含漫画图片的文件夹。\n3. **配置语言**：在设置面板中确认“源语言”和“目标语言”（如：日语 -> 中文）。\n4. **执行翻译**：点击界面上的 **Run** 按钮。\n   - 程序将自动执行文本检测、OCR、背景修复和译文回填。\n   - 回填效果会参考原文的颜色、轮廓、角度和对齐方式。\n\n### 2. 图像与文本编辑\n机翻完成后，通常需要进行人工校对和精修。\n\n- **修复画笔 (Inpainting)**:\n  - 使用矩形工具框选需要抹除的文字区域。\n  - 按下鼠标左键拖动框选，松开后自动修复（或按空格键\u002F\"修复\"按钮）。\n  - 若效果不佳，可尝试调整框选范围稍大于文字块，或切换修复算法。\n\n- **文本编辑**:\n  - 按 `T` 键或点击底部\"T\"图标进入文本编辑模式。\n  - 支持富文本编辑（加粗 `Ctrl+B`、斜体 `Ctrl+I`、下划线 `Ctrl+U`）。\n  - 支持批量调整字体样式和自动排版。\n  - 可按 `Ctrl+F` 查找替换全文内容。\n\n- **快捷键速查**:\n  - `A` \u002F `D` 或 `PageUp` \u002F `PageDown`: 翻页（未保存时自动保存）。\n  - `Ctrl + Z` \u002F `Ctrl + Y`: 撤销 \u002F 重做。\n  - `Ctrl + 滚轮`: 缩放画布。\n  - `P`: 切换画板模式（调整原图透明度）。\n  - `Alt + 方向键`: 在文本块间快速切换。\n\n### 3. 导出结果\n- 编辑完成后，可直接截图或使用内置功能导出。\n- 支持导入\u002F导出 Word 文档进行协作校对。\n- 支持导出带有字体信息的 LabelPlus txt 文件，便于在 PS 等专业软件中进一步嵌字。\n\n> **重要提示**: 若公开分享机翻结果且未经人工完整校对，请务必在显眼位置注明“机翻”。","某汉化组志愿者正紧急处理一批刚发布的日文生肉漫画，需要在极短时间内完成从图片清理到中文嵌字的全流程。\n\n### 没有 BallonsTranslator 时\n- **人工抹字耗时巨大**：译者需手动在 Photoshop 中用仿制图章一点点涂抹原文气泡，遇到复杂背景极易留痕或破坏画面，单页处理往往超过 20 分钟。\n- **排版还原困难**：翻译后的中文文本长度与原文差异大，手动调整字体大小、颜色及旋转角度以匹配原气泡形状极其繁琐，常出现文字溢出或遮挡背景的情况。\n- **协作流程割裂**：翻译、修图、嵌字由不同人员分段进行，依赖微信或文档反复传递文件，版本管理混乱，一旦需要修改译文，整个链条都要返工。\n\n### 使用 BallonsTranslator 后\n- **一键智能抹字与回填**：利用深度学习模型自动检测并擦除日文，同时根据原文气泡的轮廓、颜色和角度，自动将机翻后的中文完美回填，单页处理缩短至 2 分钟内。\n- **所见即所得的精细编辑**：内置富文本编辑器支持直接调整字体样式、粗细及阴影，提供批量自动排版功能，确保中文译文在视觉上与原漫风格高度统一。\n- **全流程一体化作业**：支持导入导出 Word 文档便于校对，且能在同一界面完成 OCR、翻译、修图和最终渲染，志愿者可独立闭环完成高质量汉化，大幅降低沟通成本。\n\nBallonsTranslator 通过自动化深度学习工作流，将原本需要多人协作数小时的漫画汉化工程，转化为单人即可快速交付的高效创作过程。","https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002FdmMaze_BallonsTranslator_28d97e77.jpg","dmMaze",null,"https:\u002F\u002Foss.gittoolsai.com\u002Favatars\u002FdmMaze_b0461302.png","beneathlimbo@gmail.com","https:\u002F\u002Fgithub.com\u002FdmMaze",[78,82,86,90,94],{"name":79,"color":80,"percentage":81},"Python","#3572A5",96.5,{"name":83,"color":84,"percentage":85},"JavaScript","#f1e05a",1.5,{"name":87,"color":88,"percentage":89},"CSS","#663399",1.2,{"name":91,"color":92,"percentage":93},"Shell","#89e051",0.5,{"name":95,"color":96,"percentage":97},"Batchfile","#C1F12E",0.3,4686,305,"2026-04-06T15:56:37","GPL-3.0","Windows, macOS","非必需。支持 NVIDIA GPU (默认启用加速) 和 Apple Silicon。AMD GPU 需通过 ZLUDA 或原生 ROCm (需特定驱动和 Python 3.12) 配置。显存需求取决于模型，Sakura-13B 等大模型在单卡运行时若显存不足可开启 'low vram mode'。","未说明",{"notes":106,"python":107,"dependencies":108},"1. Windows 用户可直接下载打包版运行，无需手动配置环境（不支持 Win7）。2. 首次运行会自动下载依赖库和模型文件（如检测、OCR、修复、翻译模型），若失败需手动从 MEGA 或 Google Drive 下载 data 文件夹。3. 支持多种翻译引擎（Google, DeepL, Sakura-13B, OpenAI 兼容接口等），部分需配置 API Token 或下载离线模型。4. macOS Apple Silicon 构建应用可能存在不稳定，推荐直接运行源码。5. 文本检测主要支持日文和英文。",">=3.8, \u003C=3.12 (推荐 3.10.11，禁止使用微软应用商店版)",[109,110,111,112,113,114,115,116],"torch","gitpython","manga-image-translator (核心依赖)","PaddleOCR","manga_ocr","transformers (隐含于 m2m100\u002FSakura)","ctranslate2","PyPatchMatch",[14,35,15],[119,120,121,122,123,124,125,126,127,128,129,130,131,132,133],"comics","computer-aided-translation","deep-learning","manga","ocr","scene-text-detection","inpainting","pytorch","computer-vision","auto-translation","chinese-translation","qt","qt6","pyqt","pyqt6","2026-03-27T02:49:30.150509","2026-04-07T13:28:55.303443",[137,142,146,150,155,159,164,169,174],{"id":138,"question_zh":139,"answer_zh":140,"source_url":141},21984,"如何安装 BallonsTranslator 的开发版（DEV）？","可以通过 Git Bash 或 GitHub Desktop 安装。\n1. Git Bash 方式：安装 Git Bash，打开命令行执行 `git clone https:\u002F\u002Fgithub.com\u002FdmMaze\u002FBallonsTranslator`，进入目录后执行 `git switch dev` 切换到开发分支。更新时运行 `git pull`。\n2. GitHub Desktop 方式：克隆仓库后，点击 'Current Branch' 选择 'Dev' 分支。更新时点击 'Fetch origin' 然后 'Pull'。\n3. 模型安装：下载 data 文件夹并解压到 BallonsTranslator 目录，运行 `launch_win.bat` (Windows) 或 `python launch.py` (Linux\u002FMac)。\n注意：必须安装 Python 3.10.x 版本（3.9 已弃用）。","https:\u002F\u002Fgithub.com\u002FdmMaze\u002FBallonsTranslator\u002Fissues\u002F187",{"id":143,"question_zh":144,"answer_zh":145,"source_url":141},21985,"首次启动时遇到界面语言文件找不到（en_CN.qm）的错误怎么办？","这是一个配置生成时的已知问题。解决方法是：首次启动生成 config 文件后，先在软件设置中将界面语言切换为英文，然后再切换回中文。这样 config 配置文件中的语言文件路径就会正确更新为 `zh_CN.qm`，错误即可消除。",{"id":147,"question_zh":148,"answer_zh":149,"source_url":141},21986,"模型文件下载经常中断或报错（如 400MB 处失败）如何解决？","这通常是网络环境问题。建议尝试更换网络环境多次重试。如果源码运行报错，可能是模型下载不完整导致 torch 读取失败。可以尝试切换到特定的提交版本（如 849800a），该版本更换了下载接口。也可以手动测试加载模型代码 `import torch; torch.load('data\u002Fmodels\u002Flama_large_512px.ckpt', map_location='cpu')` 来确认具体哪个模型损坏。",{"id":151,"question_zh":152,"answer_zh":153,"source_url":154},21987,"新手是否可以直接下载压缩包使用，还是需要克隆仓库？","可以直接下载核心压缩包（如 Ballonstranslator-1.30-core.7z）以及对应的 data 文件，无需克隆仓库或通过命令行执行程序。解压后直接运行即可使用。","https:\u002F\u002Fgithub.com\u002FdmMaze\u002FBallonsTranslator\u002Fissues\u002F68",{"id":156,"question_zh":157,"answer_zh":158,"source_url":154},21988,"为什么设置了“替换文本”功能，但翻译结果没有变化？","这是因为操作对象错误。“替换文本”功能针对的是**机翻后的结果**，而不是原文。你需要输入机器翻译出来的关键词作为被替换对象，才能生效。如果输入的是原文关键词，替换不会起作用。",{"id":160,"question_zh":161,"answer_zh":162,"source_url":163},21989,"检测模型经常将两个靠近的大气泡合并成一个，如何处理？","这不是模型本身的问题，而是后处理逻辑导致的。请在设置中取消勾选“合并矩形检测”（Merge Rectangles）选项。该功能旨在合并 OCR 识别出的分散文字，但会导致相邻气泡被错误合并，关闭后即可解决。","https:\u002F\u002Fgithub.com\u002FdmMaze\u002FBallonsTranslator\u002Fissues\u002F1058",{"id":165,"question_zh":166,"answer_zh":167,"source_url":168},21990,"如果想自己训练检测模型以适配 BallonsTranslator，需要注意什么标签和参数？","1. 标签系统：目前使用拼音标签系统，例如 balloon (气球), qipao (旗袍), fangkuai (方块), changfangtiao (长方条) 等。旧模型标签除 qipao 外大部分仍可沿用。\n2. 训练参数：强烈建议在训练、验证和推理时将 `agnostic_nms` 参数设置为 `True`，否则会影响模型在不同类别上的表现。\n3. 模型格式：软件主要支持 ONNX 格式，训练完成后需转换为 ONNX 以便直接使用。","https:\u002F\u002Fgithub.com\u002FdmMaze\u002FBallonsTranslator\u002Fissues\u002F811",{"id":170,"question_zh":171,"answer_zh":172,"source_url":173},21991,"如何在界面上显示文本框的序号？","该功能已增加。默认情况下不显示序号，你可以按下键盘上的 **F2** 键来切换文本框序号的显示与隐藏。","https:\u002F\u002Fgithub.com\u002FdmMaze\u002FBallonsTranslator\u002Fissues\u002F937",{"id":175,"question_zh":176,"answer_zh":177,"source_url":141},21992,"MacOS 用户编译 OpenCV 库时报错或生成的库文件过小怎么办？","如果是为了使用 PatchMatch 功能，编译 OpenCV 时可以精简模块以减小体积并避免报错。在 CMake 配置时，去掉不需要的模块，仅保留 `core`, `imgcodecs` 和 `imgproc` 模块即可满足需求。",[179,184,189,194,199,204,209,214,219,224,229,234],{"id":180,"version":181,"summary_zh":182,"released_at":183},135634,"v1.4.0","任何低于1.4.0的版本均已弃用，不再推荐使用。  \r\n请阅读README文件以安装最新版本。","2023-11-29T17:55:55",{"id":185,"version":186,"summary_zh":187,"released_at":188},135635,"v1.3.35","注意: 下载最新版Ballonstranslator-1.3.xx, 解压并覆盖到**Ballontranslator-1.3.0-core**或者较旧的安装目录以更新程序。\n\n下载最新版本的Ballonstranslator-1.3.xx，并将其解压后覆盖**Ballontranslator-1.3.0-core**或更早版本的安装目录，即可完成应用更新。)\n\n## 下载\n[MEGA](https:\u002F\u002Fmega.nz\u002Ffolder\u002FgmhmACoD#dkVlZ2nphOkU5-2ACb5dKw) 或 [Google Drive](https:\u002F\u002Fdrive.google.com\u002Fdrive\u002Ffolders\u002F1uElIYRLNakJj-YS0Kd3r3HE-wzeEvrWd?usp=sharing)\n\n## 更新说明\n1. 选中文本迷你菜单支持*聚合词典专业划词翻译*[沙拉查词](https:\u002F\u002Fsaladict.crimx.com): [安装说明](doc\u002Fsaladict_chs.md)\n\u003Cimg src = \"https:\u002F\u002Fgithub.com\u002FdmMaze\u002FBallonsTranslator\u002Fblob\u002Fmaster\u002Fdoc\u002Fsrc\u002Fsaladict_doc.jpg\">\n\n2. 支持替换OCR和机翻结果中的关键字, 见编辑菜单或设置面板 [#78](https:\u002F\u002Fgithub.com\u002FdmMaze\u002FBallonsTranslator\u002Fissues\u002F78)\n3. 支持拖拽导入文件夹 [#77](https:\u002F\u002Fgithub.com\u002FdmMaze\u002FBallonsTranslator\u002Fissues\u002F77)\n4. 编辑文本时隐藏控制小方块 [#81](https:\u002F\u002Fgithub.com\u002FdmMaze\u002FBallonsTranslator\u002Fissues\u002F81)\n5. 从PyQt5换到PyQt6以支持更好的嵌字预览, [避免PyQt5与nuitka的线程兼容性问题](https:\u002F\u002Fgithub.com\u002FNuitka\u002FNuitka\u002Fissues\u002F251)\n6. 支持改变嵌字层透明度 (#88) 注意只是预览, 不会改变渲染结果, 嵌字透明度在右侧菜单效果里改\n7. log文件写进data\u002Flogs\n8. 修复繁体直排bug (#96)\n9. 彩云和deepl目标语言支持繁体 (#100)\n10. 支持读取.webp图片 (#85)\n11. 支持从某些源站下载\u002F更新图片，感谢[ROKOLYT](https:\u002F\u002Fgithub.com\u002FROKOLYT)\n\n## 更改记录\n1. 在文本选择后的迷你菜单中添加对[saladict](https:\u002F\u002Fsaladict.crimx.com)（*一体化专业弹出式词典及页面翻译工具*）的支持。[安装指南](doc\u002Fsaladict.md) \n2. 支持对OCR及机器翻译结果中的关键词进行替换 [#78](https:\u002F\u002Fgithub.com\u002FdmMaze\u002FBallonsTranslator\u002Fissues\u002F78): 编辑 -> ```机器翻译关键词替换```  \n3. 支持通过拖放方式导入文件夹 [#77](https:\u002F\u002Fgithub.com\u002FdmMaze\u002FBallonsTranslator\u002Fissues\u002F77)\n4. 在开始编辑文本时隐藏控制块。[#81](https:\u002F\u002Fgithub.com\u002FdmMaze\u002FBallonsTranslator\u002Fissues\u002F81)\n5. 迁移到PyQt6，以获得更好的文字渲染预览效果，并提高与nuitka的兼容性[参见此处](https:\u002F\u002Fgithub.com\u002FNuitka\u002FNuitka\u002Fissues\u002F251)\n6. 支持设置文字图层的透明度 (#88)\n7. 将日志输出至data\u002Flogs\n8. 修复了CHT方向设置错误的问题 (#96)\n9. 如果彩云和DeepL需要将简体中文转换为繁体中文，则进行相应转换 (#100)\n10. 支持webp格式 (#85)\n11. 基于gallery-dl实现素材下载功能 (#131)，感谢[ROKOLYT](https:\u002F\u002Fgithub.com\u002FROKOLYT)","2023-01-07T17:39:39",{"id":190,"version":191,"summary_zh":192,"released_at":193},135636,"v1.3.20","## 下载\n[Google Drive](https:\u002F\u002Fdrive.google.com\u002Fdrive\u002Ffolders\u002F1uElIYRLNakJj-YS0Kd3r3HE-wzeEvrWd?usp=sharing)\n\n## 更新说明\n1. 适应具有极端宽高比的图片比如条漫\n2. 支持粘贴到多个选中的文本编辑框\n3. 修bug\n4. OCR\u002F翻译\u002F修复选中文字区域, 填字样式会继承选中的文字框自己的\n   单行文本建议选用ctc_48px, 多行日文选mangocr, 目前对多行其它语言不太行, 需要重新训练检测模型\n注意如果用**ctc_48px**要保证框在竖排模式下且尽可能贴合单行文本\n\n\n## 更改记录\n1. 适配了宽高比极高的图片，例如网络漫画。\n2. 支持将文本粘贴到多个已选中的文本块中。\n3. 修复了一些错误。\n4. 对选定的文本区域进行 OCR、翻译或修复操作，\n   文字样式将沿用对应选中文本块的样式。\n   对于单行文本，推荐使用 ctc_48px；对于多行日语文本，推荐使用 mangocr。目前 ctc_48px 在处理多行其他语言时效果不佳，需要重新训练检测模型以提升其泛化能力。\n请注意，如果使用 **ctc_48px**，请确保文本框处于竖排模式，并尽量紧密贴合单行文本。\n\u003Cimg src=\"https:\u002F\u002Fgithub.com\u002FdmMaze\u002FBallonsTranslator\u002Fraw\u002Fmaster\u002Fdoc\u002Fsrc\u002Focrselected.gif\" div align=center>","2022-12-30T07:14:25",{"id":195,"version":196,"summary_zh":197,"released_at":198},135637,"v1.3.15","## 下载\n[Google Drive](https:\u002F\u002Fdrive.google.com\u002Fdrive\u002Ffolders\u002F1uElIYRLNakJj-YS0Kd3r3HE-wzeEvrWd?usp=sharing)\n\n## 更新说明\n1. 修复了若干 bug\n2. 优化了保存逻辑\n3. 画笔现在可以设置为方形（实验性功能）\n\n## 更改日志\n1. 修复了若干 bug\n2. 优化了保存逻辑\n3. 绘图\u002F修复工具的笔触形状可设置为矩形（实验性功能）","2022-11-29T05:23:56",{"id":200,"version":201,"summary_zh":202,"released_at":203},135638,"v1.3.14","## 下载\n[腾讯云](https:\u002F\u002Fshare.weiyun.com\u002FxoRhz9i4) 或 [Google Drive](https:\u002F\u002Fdrive.google.com\u002Fdrive\u002Ffolders\u002F1uElIYRLNakJj-YS0Kd3r3HE-wzeEvrWd?usp=sharing)\n\n## 更新说明\n1. 支持深色模式: 视图->深色模式\n2. 修复了若干 bug\n\n## 更改日志\n1. 支持深色模式: 视图->深色模式\n2. 修复了若干 bug","2022-10-25T02:52:07",{"id":205,"version":206,"summary_zh":207,"released_at":208},135639,"v1.3.12","## 下载\n[腾讯云](https:\u002F\u002Fshare.weiyun.com\u002FxoRhz9i4) 或 [Google Drive](https:\u002F\u002Fdrive.google.com\u002Fdrive\u002Ffolders\u002F1uElIYRLNakJj-YS0Kd3r3HE-wzeEvrWd?usp=sharing)\n\n## 更新说明\n1. 支持全局(Ctrl+G)\u002F当前页(Ctrl+F)查找替换\n2. 原来的文本编辑器局部撤销重做并入全局文本编辑撤销重做栈, 画板撤销重做现在和文本编辑分离\n3. Word文档导入导出bug修复\n4. 基于 https:\u002F\u002Fgithub.com\u002FzhiyiYo\u002FPyQt-Frameless-Window 重写无边框窗口\n\n## 更改日志\n1. 支持全局搜索(Ctrl+G)和当前页面搜索(Ctrl+F)。\n2. 各文本编辑器的本地撤销重做栈已合并为一个主文本编辑撤销重做栈，文本编辑撤销重做栈现与绘图板的撤销重做栈分离。\n3. 修复了 Word 文档导入导出中的错误。\n4. 基于 https:\u002F\u002Fgithub.com\u002FzhiyiYo\u002FPyQt-Frameless-Window 对无边框窗口进行了重构。","2022-09-24T07:32:42",{"id":210,"version":211,"summary_zh":212,"released_at":213},135640,"v1.3.8","## 下载\r\n[腾讯云](https:\u002F\u002Fshare.weiyun.com\u002FxoRhz9i4) 或 [Google Drive](https:\u002F\u002Fdrive.google.com\u002Fdrive\u002Ffolders\u002F1uElIYRLNakJj-YS0Kd3r3HE-wzeEvrWd?usp=sharing)\r\n\r\n## 更新说明\r\n1. 画笔工具修复及优化\r\n2. 修正界面缩放\r\n3. 支持添加自定义字体样式预设, 支持调整文字透明度和阴影, 详见https:\u002F\u002Fgithub.com\u002FdmMaze\u002FBallonsTranslator\u002Fpull\u002F38\r\n4. 支持导入导出word文档, 支持打开*.json项目文件, 详见https:\u002F\u002Fgithub.com\u002FdmMaze\u002FBallonsTranslator\u002Fpull\u002F40\r\n\r\n## 更改日志\r\n1. 画笔工具错误修复与优化\r\n2. 修复缩放问题\r\n3. 支持创建字体样式预设，支持文本图形效果（阴影和透明度），详情请参阅 https:\u002F\u002Fgithub.com\u002FdmMaze\u002FBallonsTranslator\u002Fpull\u002F38\r\n4. 支持 Word 文档 (*.docx) 的导入导出：https:\u002F\u002Fgithub.com\u002FdmMaze\u002FBallonsTranslator\u002Fpull\u002F40","2022-09-13T02:39:24",{"id":215,"version":216,"summary_zh":217,"released_at":218},135641,"v1.3.4","## 下载\n[腾讯云](https:\u002F\u002Fshare.weiyun.com\u002FxoRhz9i4) 或 [Google Drive](https:\u002F\u002Fdrive.google.com\u002Fdrive\u002Ffolders\u002F1uElIYRLNakJj-YS0Kd3r3HE-wzeEvrWd?usp=sharing)\n\n## 更新说明\n1. 添加离线日译英模型Sugoi Translator（仅日译英，作者[mingshiba](https:\u002F\u002Fwww.patreon.com\u002Fmingshiba)，已获得集成授权），感谢[@Snowad14](https:\u002F\u002Fgithub.com\u002FSnowad14)提供CT2转换模型。\n2. 来自[bropines](https:\u002F\u002Fgithub.com\u002Fbropines)的俄语本地化支持。\n3. 文本编辑支持字距调节。\n4. 调整竖排符号及半角字符位置规则，详见https:\u002F\u002Fgithub.com\u002FdmMaze\u002FBallonsTranslator\u002Fpull\u002F30。\n\n## 更改记录\n1. 添加 Sugoi Translator（仅日英翻译，由[mingshiba](https:\u002F\u002Fwww.patreon.com\u002Fmingshiba)制作并授权）：请下载由[@Snowad14](https:\u002F\u002Fgithub.com\u002FSnowad14)转换的[模型](https:\u002F\u002Fdrive.google.com\u002Fdrive\u002Ffolders\u002F1KnDlfUM9zbnYFTo6iCbnBaBKabXfnVJm)，并将“sugoi_translator”文件夹放入“data”目录中。\n2. 增加对俄语的支持，感谢[bropines](https:\u002F\u002Fgithub.com\u002Fbropines)。\n3. 支持字母间距调整。\n4. 重新优化竖排文本显示，并修复文本渲染相关问题：https:\u002F\u002Fgithub.com\u002FdmMaze\u002FBallonsTranslator\u002Fpull\u002F30","2022-08-31T09:49:40",{"id":220,"version":221,"summary_zh":222,"released_at":223},135642,"v1.3.0","## 下载\r\n[腾讯云](https:\u002F\u002Fshare.weiyun.com\u002FxoRhz9i4) 或 [Google Drive](https:\u002F\u002Fdrive.google.com\u002Fdrive\u002Ffolders\u002F1uElIYRLNakJj-YS0Kd3r3HE-wzeEvrWd?usp=sharing)\r\n\r\n## 更新说明\r\n1. 修复DeepL翻译器的bug, 感谢[@Snowad14](https:\u002F\u002Fgithub.com\u002FSnowad14)\r\n2. 修复部分字体偏小+轮廓导致看不清的问题\r\n3. 支持**全局字体格式**(一键机翻字体格式): 在控制面板->嵌字菜单里将相应项从\"由程序决定\"改为\"使用全局设置\"后启用. 注意全局设置就是未编辑任何文本块时右侧字体格式面板的那些设置.  \r\n4. 添加**新的修复模型**: lama-mpe (默认启用)\r\n5. 文本块支持多选和**批量调整格式** (ctrl+鼠标左键或者按下右键拉框框选)\r\n6. 支持日译英, 英译中的**自动排版**, 基于提取出的背景气泡, 目标语言为中文时会自动断句(基于pkuseg). 勾选设置面板->常规->嵌字->自动排版后将对一键机翻生效(默认启用). \r\n\r\n## 更改记录\r\n1. 修复了 DeepL 翻译器的错误，感谢 [@Snowad14](https:\u002F\u002Fgithub.com\u002FSnowad14) 的贡献。\r\n2. 修复了字体大小和描边问题，该问题会导致文字难以辨认。\r\n3. 支持**全局字体格式**（即一键机翻时使用的字体格式）：在设置面板 -> 字幕编辑中，将相应选项由“由程序自动决定”改为“使用全局设置”即可启用。请注意，全局设置是指场景中未编辑任何文本块时，右侧字体格式面板上显示的那些设置。\r\n4. 新增**新的修复模型**：lama-mpe，并将其设为默认模型。\r\n5. 支持多选文本块并进行批量格式化操作。\r\n6. 改进了日语转英文、英文转中文的排版功能（在设置面板 -> 字幕编辑中，默认已启用“自动排版”），该功能同样适用于通过右键菜单选择的多个文本块。","2022-08-17T12:53:09",{"id":225,"version":226,"summary_zh":227,"released_at":228},135643,"v1.2.0","## 下载\r\n[国内网盘](https:\u002F\u002Fcowtransfer.com\u002Fs\u002Fb336741eec834b)  | [Google Drive](https:\u002F\u002Fdrive.google.com\u002Fdrive\u002Ffolders\u002F1uElIYRLNakJj-YS0Kd3r3HE-wzeEvrWd?usp=sharing)\r\n下载最新版本压缩包, 解压并替换旧版内容.    \r\n\r\n复制最新版本的文件到旧程序文件夹中，即可完成程序更新。    \r\n\r\n## 更新说明\r\n\r\n1. 支持DeepL翻译器, 感谢[@Snowad14](https:\u002F\u002Fgithub.com\u002FSnowad14)\r\n2. 增加来自manga-image-translator的新OCR模型, 支持韩语识别\r\n3. 修复了若干bug","2022-05-19T12:10:21",{"id":230,"version":231,"summary_zh":232,"released_at":233},135644,"v1.1.0","## 下载\r\n[国内网盘](https:\u002F\u002Fcowtransfer.com\u002Fs\u002Fb336741eec834b)  | [Google Drive](https:\u002F\u002Fdrive.google.com\u002Fdrive\u002Ffolders\u002F1uElIYRLNakJj-YS0Kd3r3HE-wzeEvrWd?usp=sharing)\r\n下载最新版本压缩包, 解压并替换旧版内容.    \r\n\r\nCopy newest version files to the older program folder to get the grogram updated.  \r\n\r\n## 更新说明\r\n\r\n1. 用qthread存编辑图片, 避免翻页卡顿\r\n2. 图像修复策略优化: \r\n   - 修复算法和**CPU模式**下的修复模型输入由整张图片改为文本块\r\n   - 可选由程序自动评估当前块是否有必要调用开销大的修复方法, 在设置-图像修复启用\u002F禁用, 启用后纯色背景对话泡将会由计算出的背景色直接填充  \r\n  \r\n    优化后图像修复阶段速度提升至原来的2x-5x不等\r\n\r\n3. 添加矩形工具\r\n4. 更多快捷键\r\n5. 修bug","2022-04-17T08:20:37",{"id":235,"version":236,"summary_zh":237,"released_at":238},135645,"alpha","[国内网盘](https:\u002F\u002Fcowtransfer.com\u002Fs\u002Fb336741eec834b)  | [Google Drive](https:\u002F\u002Fdrive.google.com\u002Fdrive\u002Ffolders\u002F1uElIYRLNakJj-YS0Kd3r3HE-wzeEvrWd?usp=sharing)","2022-04-10T04:00:47"]