[{"data":1,"prerenderedAt":-1},["ShallowReactive",2],{"similar-YaoFANGUK--video-subtitle-extractor":3,"tool-YaoFANGUK--video-subtitle-extractor":61},[4,18,26,36,44,53],{"id":5,"name":6,"github_repo":7,"description_zh":8,"stars":9,"difficulty_score":10,"last_commit_at":11,"category_tags":12,"status":17},4358,"openclaw","openclaw\u002Fopenclaw","OpenClaw 是一款专为个人打造的本地化 AI 助手，旨在让你在自己的设备上拥有完全可控的智能伙伴。它打破了传统 AI 助手局限于特定网页或应用的束缚，能够直接接入你日常使用的各类通讯渠道，包括微信、WhatsApp、Telegram、Discord、iMessage 等数十种平台。无论你在哪个聊天软件中发送消息，OpenClaw 都能即时响应，甚至支持在 macOS、iOS 和 Android 设备上进行语音交互，并提供实时的画布渲染功能供你操控。\n\n这款工具主要解决了用户对数据隐私、响应速度以及“始终在线”体验的需求。通过将 AI 部署在本地，用户无需依赖云端服务即可享受快速、私密的智能辅助，真正实现了“你的数据，你做主”。其独特的技术亮点在于强大的网关架构，将控制平面与核心助手分离，确保跨平台通信的流畅性与扩展性。\n\nOpenClaw 非常适合希望构建个性化工作流的技术爱好者、开发者，以及注重隐私保护且不愿被单一生态绑定的普通用户。只要具备基础的终端操作能力（支持 macOS、Linux 及 Windows WSL2），即可通过简单的命令行引导完成部署。如果你渴望拥有一个懂你",349277,3,"2026-04-06T06:32:30",[13,14,15,16],"Agent","开发框架","图像","数据工具","ready",{"id":19,"name":20,"github_repo":21,"description_zh":22,"stars":23,"difficulty_score":10,"last_commit_at":24,"category_tags":25,"status":17},3808,"stable-diffusion-webui","AUTOMATIC1111\u002Fstable-diffusion-webui","stable-diffusion-webui 是一个基于 Gradio 构建的网页版操作界面，旨在让用户能够轻松地在本地运行和使用强大的 Stable Diffusion 图像生成模型。它解决了原始模型依赖命令行、操作门槛高且功能分散的痛点，将复杂的 AI 绘图流程整合进一个直观易用的图形化平台。\n\n无论是希望快速上手的普通创作者、需要精细控制画面细节的设计师，还是想要深入探索模型潜力的开发者与研究人员，都能从中获益。其核心亮点在于极高的功能丰富度：不仅支持文生图、图生图、局部重绘（Inpainting）和外绘（Outpainting）等基础模式，还独创了注意力机制调整、提示词矩阵、负向提示词以及“高清修复”等高级功能。此外，它内置了 GFPGAN 和 CodeFormer 等人脸修复工具，支持多种神经网络放大算法，并允许用户通过插件系统无限扩展能力。即使是显存有限的设备，stable-diffusion-webui 也提供了相应的优化选项，让高质量的 AI 艺术创作变得触手可及。",162132,"2026-04-05T11:01:52",[14,15,13],{"id":27,"name":28,"github_repo":29,"description_zh":30,"stars":31,"difficulty_score":32,"last_commit_at":33,"category_tags":34,"status":17},1381,"everything-claude-code","affaan-m\u002Feverything-claude-code","everything-claude-code 是一套专为 AI 编程助手（如 Claude Code、Codex、Cursor 等）打造的高性能优化系统。它不仅仅是一组配置文件，而是一个经过长期实战打磨的完整框架，旨在解决 AI 代理在实际开发中面临的效率低下、记忆丢失、安全隐患及缺乏持续学习能力等核心痛点。\n\n通过引入技能模块化、直觉增强、记忆持久化机制以及内置的安全扫描功能，everything-claude-code 能显著提升 AI 在复杂任务中的表现，帮助开发者构建更稳定、更智能的生产级 AI 代理。其独特的“研究优先”开发理念和针对 Token 消耗的优化策略，使得模型响应更快、成本更低，同时有效防御潜在的攻击向量。\n\n这套工具特别适合软件开发者、AI 研究人员以及希望深度定制 AI 工作流的技术团队使用。无论您是在构建大型代码库，还是需要 AI 协助进行安全审计与自动化测试，everything-claude-code 都能提供强大的底层支持。作为一个曾荣获 Anthropic 黑客大奖的开源项目，它融合了多语言支持与丰富的实战钩子（hooks），让 AI 真正成长为懂上",151314,2,"2026-04-11T23:32:58",[14,13,35],"语言模型",{"id":37,"name":38,"github_repo":39,"description_zh":40,"stars":41,"difficulty_score":32,"last_commit_at":42,"category_tags":43,"status":17},2271,"ComfyUI","Comfy-Org\u002FComfyUI","ComfyUI 是一款功能强大且高度模块化的视觉 AI 引擎，专为设计和执行复杂的 Stable Diffusion 图像生成流程而打造。它摒弃了传统的代码编写模式，采用直观的节点式流程图界面，让用户通过连接不同的功能模块即可构建个性化的生成管线。\n\n这一设计巧妙解决了高级 AI 绘图工作流配置复杂、灵活性不足的痛点。用户无需具备编程背景，也能自由组合模型、调整参数并实时预览效果，轻松实现从基础文生图到多步骤高清修复等各类复杂任务。ComfyUI 拥有极佳的兼容性，不仅支持 Windows、macOS 和 Linux 全平台，还广泛适配 NVIDIA、AMD、Intel 及苹果 Silicon 等多种硬件架构，并率先支持 SDXL、Flux、SD3 等前沿模型。\n\n无论是希望深入探索算法潜力的研究人员和开发者，还是追求极致创作自由度的设计师与资深 AI 绘画爱好者，ComfyUI 都能提供强大的支持。其独特的模块化架构允许社区不断扩展新功能，使其成为当前最灵活、生态最丰富的开源扩散模型工具之一，帮助用户将创意高效转化为现实。",108322,"2026-04-10T11:39:34",[14,15,13],{"id":45,"name":46,"github_repo":47,"description_zh":48,"stars":49,"difficulty_score":32,"last_commit_at":50,"category_tags":51,"status":17},6121,"gemini-cli","google-gemini\u002Fgemini-cli","gemini-cli 是一款由谷歌推出的开源 AI 命令行工具，它将强大的 Gemini 大模型能力直接集成到用户的终端环境中。对于习惯在命令行工作的开发者而言，它提供了一条从输入提示词到获取模型响应的最短路径，无需切换窗口即可享受智能辅助。\n\n这款工具主要解决了开发过程中频繁上下文切换的痛点，让用户能在熟悉的终端界面内直接完成代码理解、生成、调试以及自动化运维任务。无论是查询大型代码库、根据草图生成应用，还是执行复杂的 Git 操作，gemini-cli 都能通过自然语言指令高效处理。\n\n它特别适合广大软件工程师、DevOps 人员及技术研究人员使用。其核心亮点包括支持高达 100 万 token 的超长上下文窗口，具备出色的逻辑推理能力；内置 Google 搜索、文件操作及 Shell 命令执行等实用工具；更独特的是，它支持 MCP（模型上下文协议），允许用户灵活扩展自定义集成，连接如图像生成等外部能力。此外，个人谷歌账号即可享受免费的额度支持，且项目基于 Apache 2.0 协议完全开源，是提升终端工作效率的理想助手。",100752,"2026-04-10T01:20:03",[52,13,15,14],"插件",{"id":54,"name":55,"github_repo":56,"description_zh":57,"stars":58,"difficulty_score":32,"last_commit_at":59,"category_tags":60,"status":17},4721,"markitdown","microsoft\u002Fmarkitdown","MarkItDown 是一款由微软 AutoGen 团队打造的轻量级 Python 工具，专为将各类文件高效转换为 Markdown 格式而设计。它支持 PDF、Word、Excel、PPT、图片（含 OCR）、音频（含语音转录）、HTML 乃至 YouTube 链接等多种格式的解析，能够精准提取文档中的标题、列表、表格和链接等关键结构信息。\n\n在人工智能应用日益普及的今天，大语言模型（LLM）虽擅长处理文本，却难以直接读取复杂的二进制办公文档。MarkItDown 恰好解决了这一痛点，它将非结构化或半结构化的文件转化为模型“原生理解”且 Token 效率极高的 Markdown 格式，成为连接本地文件与 AI 分析 pipeline 的理想桥梁。此外，它还提供了 MCP（模型上下文协议）服务器，可无缝集成到 Claude Desktop 等 LLM 应用中。\n\n这款工具特别适合开发者、数据科学家及 AI 研究人员使用，尤其是那些需要构建文档检索增强生成（RAG）系统、进行批量文本分析或希望让 AI 助手直接“阅读”本地文件的用户。虽然生成的内容也具备一定可读性，但其核心优势在于为机器",93400,"2026-04-06T19:52:38",[52,14],{"id":62,"github_repo":63,"name":64,"description_en":65,"description_zh":66,"ai_summary_zh":66,"readme_en":67,"readme_zh":68,"quickstart_zh":69,"use_case_zh":70,"hero_image_url":71,"owner_login":72,"owner_name":73,"owner_avatar_url":74,"owner_bio":75,"owner_company":75,"owner_location":76,"owner_email":77,"owner_twitter":75,"owner_website":78,"owner_url":79,"languages":80,"stars":93,"forks":94,"last_commit_at":95,"license":96,"difficulty_score":10,"env_os":97,"env_gpu":98,"env_ram":99,"env_deps":100,"category_tags":110,"github_topics":111,"view_count":32,"oss_zip_url":75,"oss_zip_packed_at":75,"status":17,"created_at":120,"updated_at":121,"faqs":122,"releases":158},6794,"YaoFANGUK\u002Fvideo-subtitle-extractor","video-subtitle-extractor","视频硬字幕提取，生成srt文件。无需申请第三方API，本地实现文本识别。基于深度学习的视频字幕提取框架，包含字幕区域检测、字幕内容提取。A GUI tool for extracting hard-coded subtitle (hardsub) from videos and generating srt files. ","video-subtitle-extractor 是一款专为提取视频“硬字幕”而设计的开源工具，能将嵌入在画面中的字幕自动识别并转换为可编辑的 SRT 外挂字幕文件。它主要解决了用户面对无字幕源或硬字幕视频时，无法直接修改、翻译或关闭字幕的痛点，无需依赖任何第三方在线 API，所有文本识别过程均在本地完成，充分保障了数据隐私与处理效率。\n\n这款软件非常适合需要处理外语生肉视频的字幕组、视频创作者以及普通观影爱好者。其核心技术亮点在于基于深度学习的本地 OCR 框架，集成了字幕区域检测与内容提取功能，支持包括中英日韩在内的 87 种语言识别。为了兼顾速度与精度，video-subtitle-extractor 提供了“快速”、“自动”和“精准”三种模式：日常使用推荐自动模式，它能根据硬件环境智能切换模型；若对准确率有极致要求，也可启用 GPU 加速的精准模式逐帧检测。此外，它还具备批量处理、水印过滤及自定义文本修正等实用功能，让用户能轻松获得高质量的字幕文件。","简体中文 | [English](README_en.md)\n\n\u003Cp align=\"center\">\u003Cimg src=\"https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002FYaoFANGUK_video-subtitle-extractor_readme_febeb308b2f6.png\" alt=\"VSE Logo\" width=\"128\"\u002F>\u003C\u002Fp>\n\n## 项目简介\n\n![License](https:\u002F\u002Fimg.shields.io\u002Fbadge\u002FLicense-Apache%202-red.svg)\n![python version](https:\u002F\u002Fimg.shields.io\u002Fbadge\u002FPython-3.12+-blue.svg)\n![support os](https:\u002F\u002Fimg.shields.io\u002Fbadge\u002FOS-Windows\u002FmacOS\u002FLinux-green.svg)  \n\nVideo-subtitle-extractor (VSE) 是一款将视频中的硬字幕提取为外挂字幕文件(srt格式)的软件\n主要实现了以下功能：\n\n- 提取视频中的关键帧\n- 检测视频帧中文本的所在位置\n- 识别视频帧中文本的内容\n- 过滤非字幕区域的文本\n- 去除水印、台标文本、原视频硬字幕，可配合：[video-subtitle-remover (VSR) ](https:\u002F\u002Fgithub.com\u002FYaoFANGUK\u002Fvideo-subtitle-remover\u002Ftree\u002Fmain)\n- 去除重复字幕行，生成srt字幕文件\u002Ftxt文本文件\n- 支持视频字幕**批量提取**\n- 多语言：支持**简体中文（中英双语）**、**繁体中文**、**英文**、**日语**、**韩语**、**越南语**、**阿拉伯语**、**法语**、**德语**、**俄语**、**西班牙语**、**葡萄牙语**、**意大利语**等**87种**语言的字幕提取\n- 多模式：\n  - **快速**：（推荐）使用轻量模型，快速提取字幕，可能丢少量字幕、存在少量错别字\n  - **自动**：（推荐）自动判断模型，CPU下使用轻量模型；GPU下使用精准模型，提取字幕速度较慢，可能丢少量字幕、几乎不存在错别字\n  - **精准**：（不推荐）使用精准模型，GPU下逐帧检测，不丢字幕，几乎不存在错别字，但速度**非常慢**\n\n> 请优先使用快速\u002F自动模式，如果前两种模式存在较多丢字幕轴情况时，再使用精准模式\n \n\u003Cp style=\"text-align:center;\">\u003Cimg src=\"https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002FYaoFANGUK_video-subtitle-extractor_readme_fdf7ba5d3e7a.png\" alt=\"demo.png\"\u002F>\u003C\u002Fp>\n\n**项目特色**：\n\n- 采用本地进行OCR识别，无需设置调用任何API，不需要接入百度、阿里等在线OCR服务即可本地完成文本识别\n- 支持GPU加速，GPU加速后可以获得更高的准确率与更快的提取速度\n\n**使用说明**：\n\n- 有使用问题请加群讨论，QQ群：210150985（已满）、806152575（已满）、816881808（已满）、295894827\n\n- 点击【打开】后选择视频文件，调整字幕区域，点击【运行】\n  - 单文件提取：打开文件的时候选择**单个**视频\n  - **批量提取**：打开文件的时候选择**多个**视频，确保每个视频的分辨率、字幕区域保持一致\n\n- 去除水印文本\u002F替换特定文本：\n> 如果视频中出现特定的文本需要删除，或者特定的文本需要替换，可以编辑 ``backend\u002Fconfigs\u002FtypoMap.json``文件，加入你要替换或去除的内容\n\n```json\n{\n\t\"l'm\": \"I'm\",\n\t\"l just\": \"I just\",\n\t\"Let'sqo\": \"Let's go\",\n\t\"Iife\": \"life\",\n\t\"威筋\": \"威胁\",\n  \t\"性感荷官在线发牌\": \"\"\n}\n```\n\n> 这样就可以把文本中出现的所有“威筋”替换为“威胁”，所有的“性感荷官在线发牌”文本删除\n\n- 视频以及程序路径请**不要带中文和空格**，否则可能出现未知错误！！！\n\n > 如：以下存放视频和代码的路径都不行\n >\n > D:\\下载\\vse\\运行程序.exe（路径含中文）\n >\n > E:\\study\\kaoyan\\sanshang youya.mp4 （路径含空格） \n\n- 直接下载压缩包解压运行，如果不能运行再按照下面的教程，尝试源码安装conda环境运行\n\n**下载地址**：\u003Ca href=\"https:\u002F\u002Fgithub.com\u002FYaoFANGUK\u002Fvideo-subtitle-extractor\u002Freleases\"> Release \u003C\u002Fa>\n\n> **有任何改进意见请在ISSUES和DISCUSSION中提出**\n\n> NVIDIA官方提供了各GPU型号的计算能力列表，您可以参考链接: [CUDA GPUs](https:\u002F\u002Fdeveloper.nvidia.com\u002Fcuda-gpus) 查看你的GPU适合哪个CUDA版本\n\n> NVIDIA 50系显卡需要使用cuda12.8.0及以上版本, 但Paddle3.3.1目前仍未支持，所以建议使用Directml通用版本\n\n**识别模式选择说明**：\n|    模式名称    | GPU | OCR模型尺寸 | 字幕检测引擎 | 备注 |\n|---------------|-----|---------|------|------|\n|    快速        | 有\u002F无 | 迷你  | VideoSubFinder | |\n|    自动  | 有| 大  | VideoSubFinder |  推荐   |\n|    自动  | 无| 迷你  | VideoSubFinder |  推荐   |\n|    精准        | 有\u002F无| 大  | VSE | 非常慢 |\n> Windows\u002FLinux\u002FMacOS环境下字幕检测引擎都是VideoSubFinder\n\n## 演示\n\n- GUI版：[点击查看GPU版本源码运行的安装教程 👈](https:\u002F\u002Fwww.bilibili.com\u002Fvideo\u002Fbv11L4y1Y7Tj)\n\n\u003Cp style=\"text-align:center;\">\u003Cimg src=\"https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002FYaoFANGUK_video-subtitle-extractor_readme_5f2eb7127429.gif\" alt=\"demo.gif\"\u002F>\u003C\u002Fp>\n\n\n## 源码使用说明\n\n#### 1. 安装 Python\n\n请确保您已经安装了 Python 3.12+\n\n- Windows 用户可以前往 [Python 官网](https:\u002F\u002Fwww.python.org\u002Fdownloads\u002Fwindows\u002F) 下载并安装 Python\n- MacOS 用户可以使用 Homebrew 安装：\n  ```shell\n  brew install python@3.12\n  ```\n- Linux 用户可以使用包管理器安装，例如 Ubuntu\u002FDebian：\n  ```shell\n  sudo apt update && sudo apt install python3.12 python3.12-venv python3.12-dev\n  ```\n\n#### 2. 安装依赖文件\n\n请使用虚拟环境来管理项目依赖，避免与系统环境冲突\n\n（1）创建虚拟环境并激活\n```shell\npython -m venv videoEnv\n```\n\n- Windows：\n```shell\nvideoEnv\\\\Scripts\\\\activate\n```\n- MacOS\u002FLinux：\n```shell\nsource videoEnv\u002Fbin\u002Factivate\n```\n\n#### 3. 创建并激活项目目录\n\n切换到源码所在目录：\n```shell\ncd \u003C源码所在目录>\n```\n> 例如：如果您的源代码放在 D 盘的 tools 文件夹下，并且源代码的文件夹名为 video-subtitle-extractor，则输入：\n> ```shell\n> cd D:\u002Ftools\u002Fvideo-subtitle-extractor-main\n> ```\n\n#### 4. 安装合适的运行环境\n\n本项目支持 CUDA（NVIDIA显卡加速）、CPU（无 GPU）、DirectML（AMD、Intel等GPU\u002FAPU加速）、ONNX四种运行模式\n\n##### (1) CUDA（NVIDIA 显卡用户）\n\n> 请确保您的 NVIDIA 显卡驱动支持所选 CUDA 版本\n\n- 推荐 CUDA 11.8，对应 cuDNN 8.6.0\n\n- 安装 CUDA：\n  - Windows：[CUDA 11.8 下载](https:\u002F\u002Fdeveloper.download.nvidia.com\u002Fcompute\u002Fcuda\u002F11.8.0\u002Flocal_installers\u002Fcuda_11.8.0_522.06_windows.exe)\n  - Linux：\n    ```shell\n    wget https:\u002F\u002Fdeveloper.download.nvidia.com\u002Fcompute\u002Fcuda\u002F11.8.0\u002Flocal_installers\u002Fcuda_11.8.0_520.61.05_linux.run\n    sudo sh cuda_11.8.0_520.61.05_linux.run\n    ```\n  - MacOS 不支持 CUDA\n\n- 安装 cuDNN（CUDA 11.8 对应 cuDNN 8.6.0）：\n  - [Windows cuDNN 8.6.0 下载](https:\u002F\u002Fdeveloper.download.nvidia.cn\u002Fcompute\u002Fredist\u002Fcudnn\u002Fv8.6.0\u002Flocal_installers\u002F11.8\u002Fcudnn-windows-x86_64-8.6.0.163_cuda11-archive.zip)\n  - [Linux cuDNN 8.6.0 下载](https:\u002F\u002Fdeveloper.download.nvidia.cn\u002Fcompute\u002Fredist\u002Fcudnn\u002Fv8.6.0\u002Flocal_installers\u002F11.8\u002Fcudnn-linux-x86_64-8.6.0.163_cuda11-archive.tar.xz)\n  - 安装方法请参考 NVIDIA 官方文档\n\n- 安装 PaddlePaddle GPU 版本（CUDA 11.8）：\n  ```shell\n  pip install paddlepaddle-gpu==3.3.1 -i https:\u002F\u002Fwww.paddlepaddle.org.cn\u002Fpackages\u002Fstable\u002Fcu118\u002F\n  pip install -r requirements.txt\n  ```\n\n##### (2) DirectML（AMD、Intel等GPU\u002FAPU加速卡用户）\n\n- 适用于 Windows 设备的 AMD\u002FNVIDIA\u002FIntel GPU\n- 安装 ONNX Runtime DirectML 版本：\n  ```shell\n  pip install paddlepaddle==3.3.1 -i https:\u002F\u002Fwww.paddlepaddle.org.cn\u002Fpackages\u002Fstable\u002Fcpu\u002F\n  pip install -r requirements.txt\n  pip install -r requirements_directml.txt\n  ```\n\n##### (3) ONNX (适合macOS、AMD ROCm等环境加速用户, 基础环境与DirectML方式一致，未测试！)\n\n- 使用这个方式部署请勿反馈Issues\n- 适用于 Linux 或 macOS 设备的 AMD\u002FMetal GPU\u002FApple Silicon GPU\n- 安装 ONNX Runtime DirectML 版本：\n  ```shell\n  pip install paddlepaddle==3.3.1 -i https:\u002F\u002Fwww.paddlepaddle.org.cn\u002Fpackages\u002Fstable\u002Fcpu\u002F\n  pip install -r requirements.txt\n\n  # 阅读文档 https:\u002F\u002Fonnxruntime.ai\u002Fdocs\u002Fexecution-providers\u002F\n  # 根据你的设备选择合适的执行后端, 参考requirements_directml.txt文件修改成合适你环境的依赖\n\n  # 例如:\n  # requirements_coreml.txt\n  #   paddle2onnx==1.3.1\n  #   onnxruntime-coreml==1.13.1\n\n  pip install -r requirements_coreml.txt\n  ```\n\n##### (4) CPU 运行（无 GPU 加速）\n\n- 适用于没有 GPU 或不希望使用 GPU 的情况\n- 直接安装 CPU 版本 PaddlePaddle：\n  ```shell\n  pip install paddlepaddle==3.3.1 -i https:\u002F\u002Fwww.paddlepaddle.org.cn\u002Fpackages\u002Fstable\u002Fcpu\u002F\n  pip install -r requirements.txt\n  ```\n\n#### 5. 运行程序\n\n- 运行图形化界面版本（GUI）\n\n```shell\npython gui.py\n```\n\n- 运行命令行版本（CLI）\n\n```shell\npython .\u002Fbackend\u002Fmain.py\n```\n\n## 常见问题与解决方案\n\n#### 1. 运行不正常\u002F没有结果\u002Fcuda及cudnn问题\n\n解决方案：根据自己的显卡型号、显卡驱动版本，安装对应的cuda与cudnn\n\n#### 2. 7z文件解压错误\n\n解决方案：升级7-zip解压程序到最新版本\n\n## 赞助\n\u003Cimg src=\"https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002FYaoFANGUK_video-subtitle-extractor_readme_19ca3f0543b0.png\" width=\"600\">\n\n","简体中文 | [English](README_en.md)\n\n\u003Cp align=\"center\">\u003Cimg src=\"https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002FYaoFANGUK_video-subtitle-extractor_readme_febeb308b2f6.png\" alt=\"VSE Logo\" width=\"128\"\u002F>\u003C\u002Fp>\n\n## 项目简介\n\n![License](https:\u002F\u002Fimg.shields.io\u002Fbadge\u002FLicense-Apache%202-red.svg)\n![python version](https:\u002F\u002Fimg.shields.io\u002Fbadge\u002FPython-3.12+-blue.svg)\n![support os](https:\u002F\u002Fimg.shields.io\u002Fbadge\u002FOS-Windows\u002FmacOS\u002FLinux-green.svg)  \n\nVideo-subtitle-extractor (VSE) 是一款将视频中的硬字幕提取为外挂字幕文件(srt格式)的软件\n主要实现了以下功能：\n\n- 提取视频中的关键帧\n- 检测视频帧中文本的所在位置\n- 识别视频帧中文本的内容\n- 过滤非字幕区域的文本\n- 去除水印、台标文本、原视频硬字幕，可配合：[video-subtitle-remover (VSR) ](https:\u002F\u002Fgithub.com\u002FYaoFANGUK\u002Fvideo-subtitle-remover\u002Ftree\u002Fmain)\n- 去除重复字幕行，生成srt字幕文件\u002Ftxt文本文件\n- 支持视频字幕**批量提取**\n- 多语言：支持**简体中文（中英双语）**、**繁体中文**、**英文**、**日语**、**韩语**、**越南语**、**阿拉伯语**、**法语**、**德语**、**俄语**、**西班牙语**、**葡萄牙语**、**意大利语**等**87种**语言的字幕提取\n- 多模式：\n  - **快速**：（推荐）使用轻量模型，快速提取字幕，可能丢少量字幕、存在少量错别字\n  - **自动**：（推荐）自动判断模型，CPU下使用轻量模型；GPU下使用精准模型，提取字幕速度较慢，可能丢少量字幕、几乎不存在错别字\n  - **精准**：（不推荐）使用精准模型，GPU下逐帧检测，不丢字幕，几乎不存在错别字，但速度**非常慢**\n\n> 请优先使用快速\u002F自动模式，如果前两种模式存在较多丢字幕轴情况时，再使用精准模式\n \n\u003Cp style=\"text-align:center;\">\u003Cimg src=\"https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002FYaoFANGUK_video-subtitle-extractor_readme_fdf7ba5d3e7a.png\" alt=\"demo.png\"\u002F>\u003C\u002Fp>\n\n**项目特色**：\n\n- 采用本地进行OCR识别，无需设置调用任何API，不需要接入百度、阿里等在线OCR服务即可本地完成文本识别\n- 支持GPU加速，GPU加速后可以获得更高的准确率与更快的提取速度\n\n**使用说明**：\n\n- 有使用问题请加群讨论，QQ群：210150985（已满）、806152575（已满）、816881808（已满）、295894827\n\n- 点击【打开】后选择视频文件，调整字幕区域，点击【运行】\n  - 单文件提取：打开文件的时候选择**单个**视频\n  - **批量提取**：打开文件的时候选择**多个**视频，确保每个视频的分辨率、字幕区域保持一致\n\n- 去除水印文本\u002F替换特定文本：\n> 如果视频中出现特定的文本需要删除，或者特定的文本需要替换，可以编辑 ``backend\u002Fconfigs\u002FtypoMap.json``file，加入你要替换或去除的内容\n\n```json\n{\n\t\"l'm\": \"I'm\",\n\t\"l just\": \"I just\",\n\t\"Let'sqo\": \"Let's go\",\n\t\"Iife\": \"life\",\n\t\"威筋\": \"威胁\",\n  \t\"性感荷官在线发牌\": \"\"\n}\n```\n\n> 这样就可以把文本中出现的所有“威筋”替换为“威胁”，所有的“性感荷官在线发牌”文本删除\n\n- 视频以及程序路径请**不要带中文和空格**，否则可能出现未知错误！！！\n\n > 如：以下存放视频和代码的路径都不行\n >\n > D:\\下载\\vse\\运行程序.exe（路径含中文）\n >\n > E:\\study\\kaoyan\\sanshang youya.mp4 （路径含空格） \n\n- 直接下载压缩包解压运行，如果不能运行再按照下面的教程，尝试源码安装conda环境运行\n\n**下载地址**：\u003Ca href=\"https:\u002F\u002Fgithub.com\u002FYaoFANGUK\u002Fvideo-subtitle-extractor\u002Freleases\"> Release \u003C\u002Fa>\n\n> **有任何改进意见请在ISSUES和DISCUSSION中提出**\n\n> NVIDIA官方提供了各GPU型号的计算能力列表，您可以参考链接: [CUDA GPUs](https:\u002F\u002Fdeveloper.nvidia.com\u002Fcuda-gpus) 查看你的GPU适合哪个CUDA版本\n\n> NVIDIA 50系显卡需要使用cuda12.8.0及以上版本, 但Paddle3.3.1目前仍未支持，所以建议使用Directml通用版本\n\n**识别模式选择说明**：\n|    模式名称    | GPU | OCR模型尺寸 | 字幕检测引擎 | 备注 |\n|---------------|-----|---------|------|------|\n|    快速        | 有\u002F无 | 迷你  | VideoSubFinder | |\n|    自动  | 有| 大  | VideoSubFinder |  推荐   |\n|    自动  | 无| 迷你  | VideoSubFinder |  推荐   |\n|    精准        | 有\u002F无| 大  | VSE | 非常慢 |\n> Windows\u002FLinux\u002FMacOS环境下字幕检测引擎都是VideoSubFinder\n\n## 演示\n\n- GUI版：[点击查看GPU版本源码运行的安装教程 👈](https:\u002F\u002Fwww.bilibili.com\u002Fvideo\u002Fbv11L4y1Y7Tj)\n\n\u003Cp style=\"text-align:center;\">\u003Cimg src=\"https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002FYaoFANGUK_video-subtitle-extractor_readme_5f2eb7127429.gif\" alt=\"demo.gif\"\u002F>\u003C\u002Fp>\n\n\n## 源码使用说明\n\n#### 1. 安装 Python\n\n请确保您已经安装了 Python 3.12+\n\n- Windows 用户可以前往 [Python 官网](https:\u002F\u002Fwww.python.org\u002Fdownloads\u002Fwindows\u002F) 下载并安装 Python\n- MacOS 用户可以使用 Homebrew 安装：\n  ```shell\n  brew install python@3.12\n  ```\n- Linux 用户可以使用包管理器安装，例如 Ubuntu\u002FDebian：\n  ```shell\n  sudo apt update && sudo apt install python3.12 python3.12-venv python3.12-dev\n  ```\n\n#### 2. 安装依赖文件\n\n请使用虚拟环境来管理项目依赖，避免与系统环境冲突\n\n（1）创建虚拟环境并激活\n```shell\npython -m venv videoEnv\n```\n\n- Windows：\n```shell\nvideoEnv\\\\Scripts\\\\activate\n```\n- MacOS\u002FLinux：\n```shell\nsource videoEnv\u002Fbin\u002Factivate\n```\n\n#### 3. 创建并激活项目目录\n\n切换到源码所在目录：\n```shell\ncd \u003C源码所在目录>\n```\n> 例如：如果您的源代码放在 D 盘的 tools 文件夹下，并且源代码的文件夹名为 video-subtitle-extractor，则输入：\n> ```shell\n> cd D:\u002Ftools\u002Fvideo-subtitle-extractor-main\n> ```\n\n#### 4. 安装合适的运行环境\n\n本项目支持 CUDA（NVIDIA显卡加速）、CPU（无 GPU）、DirectML（AMD、Intel等GPU\u002FAPU加速）、ONNX四种运行模式\n\n##### (1) CUDA（NVIDIA 显卡用户）\n\n> 请确保您的 NVIDIA 显卡驱动支持所选 CUDA 版本\n\n- 推荐 CUDA 11.8，对应 cuDNN 8.6.0\n\n- 安装 CUDA：\n  - Windows：[CUDA 11.8 下载](https:\u002F\u002Fdeveloper.download.nvidia.com\u002Fcompute\u002Fcuda\u002F11.8.0\u002Flocal_installers\u002Fcuda_11.8.0_522.06_windows.exe)\n  - Linux：\n    ```shell\n    wget https:\u002F\u002Fdeveloper.download.nvidia.com\u002Fcompute\u002Fcuda\u002F11.8.0\u002Flocal_installers\u002Fcuda_11.8.0_520.61.05_linux.run\n    sudo sh cuda_11.8.0_520.61.05_linux.run\n    ```\n  - MacOS 不支持 CUDA\n\n- 安装 cuDNN（CUDA 11.8 对应 cuDNN 8.6.0）：\n  - [Windows cuDNN 8.6.0 下载](https:\u002F\u002Fdeveloper.download.nvidia.cn\u002Fcompute\u002Fredist\u002Fcudnn\u002Fv8.6.0\u002Flocal_installers\u002F11.8\u002Fcudnn-windows-x86_64-8.6.0.163_cuda11-archive.zip)\n  - [Linux cuDNN 8.6.0 下载](https:\u002F\u002Fdeveloper.download.nvidia.cn\u002Fcompute\u002Fredist\u002Fcudnn\u002Fv8.6.0\u002Flocal_installers\u002F11.8\u002Fcudnn-linux-x86_64-8.6.0.163_cuda11-archive.tar.xz)\n  - 安装方法请参考 NVIDIA 官方文档\n\n- 安装 PaddlePaddle GPU 版本（CUDA 11.8）：\n  ```shell\n  pip install paddlepaddle-gpu==3.3.1 -i https:\u002F\u002Fwww.paddlepaddle.org.cn\u002Fpackages\u002Fstable\u002Fcu118\u002F\n  pip install -r requirements.txt\n  ```\n\n##### (2) DirectML（AMD、Intel等GPU\u002FAPU加速卡用户）\n\n- 适用于 Windows 设备的 AMD\u002FNVIDIA\u002FIntel GPU\n- 安装 ONNX Runtime DirectML 版本：\n  ```shell\n  pip install paddlepaddle==3.3.1 -i https:\u002F\u002Fwww.paddlepaddle.org.cn\u002Fpackages\u002Fstable\u002Fcpu\u002F\n  pip install -r requirements.txt\n  pip install -r requirements_directml.txt\n  ```\n\n##### (3) ONNX (适合macOS、AMD ROCm等环境加速用户, 基础环境与DirectML方式一致，未测试！)\n\n- 使用这个方式部署请勿反馈Issues\n- 适用于 Linux 或 macOS 设备的 AMD\u002FMetal GPU\u002FApple Silicon GPU\n- 安装 ONNX Runtime DirectML 版本：\n  ```shell\n  pip install paddlepaddle==3.3.1 -i https:\u002F\u002Fwww.paddlepaddle.org.cn\u002Fpackages\u002Fstable\u002Fcpu\u002F\n  pip install -r requirements.txt\n\n  # 阅读文档 https:\u002F\u002Fonnxruntime.ai\u002Fdocs\u002Fexecution-providers\u002F\n  # 根据你的设备选择合适的执行后端, 参考requirements_directml.txt文件修改成合适你环境的依赖\n\n  # 例如:\n  # requirements_coreml.txt\n  #   paddle2onnx==1.3.1\n  #   onnxruntime-coreml==1.13.1\n\n  pip install -r requirements_coreml.txt\n  ```\n\n##### (4) CPU 运行（无 GPU 加速）\n\n- 适用于没有 GPU 或不希望使用 GPU 的情况\n- 直接安装 CPU 版本 PaddlePaddle：\n  ```shell\n  pip install paddlepaddle==3.3.1 -i https:\u002F\u002Fwww.paddlepaddle.org.cn\u002Fpackages\u002Fstable\u002Fcpu\u002F\n  pip install -r requirements.txt\n  ```\n\n#### 5. 运行程序\n\n- 运行图形化界面版本（GUI）\n\n```shell\npython gui.py\n```\n\n- 运行命令行版本（CLI）\n\n```shell\npython .\u002Fbackend\u002Fmain.py\n```\n\n## 常见问题与解决方案\n\n#### 1. 运行不正常\u002F没有结果\u002Fcuda及cudnn问题\n\n解决方案：根据自己的显卡型号、显卡驱动版本，安装对应的cuda与cudnn\n\n#### 2. 7z文件解压错误\n\n解决方案：升级7-zip解压程序到最新版本\n\n## 赞助\n\u003Cimg src=\"https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002FYaoFANGUK_video-subtitle-extractor_readme_19ca3f0543b0.png\" width=\"600\">","# video-subtitle-extractor 快速上手指南\n\n**video-subtitle-extractor (VSE)** 是一款本地化视频硬字幕提取工具，支持将视频中的硬字幕提取为 SRT 或 TXT 格式。它无需调用在线 API，支持 GPU 加速，并涵盖全球 87 种语言。\n\n## 1. 环境准备\n\n### 系统要求\n- **操作系统**：Windows \u002F macOS \u002F Linux\n- **Python 版本**：3.12 或更高版本\n- **硬件建议**：\n  - **NVIDIA 显卡**：推荐安装 CUDA 11.8 + cuDNN 8.6.0 以获得最佳性能。\n  - **AMD\u002FIntel 显卡**：Windows 用户可使用 DirectML 加速。\n  - **无独立显卡**：可使用 CPU 模式运行（速度较慢）。\n\n### 前置依赖\n- 确保已安装 **Git**（用于克隆代码）和 **7-Zip**（最新版，用于解压）。\n- **路径规范**：项目代码和视频文件的路径中**严禁包含中文和空格**，否则会导致运行错误。\n  - ✅ 正确示例：`D:\u002Ftools\u002Fvse\u002Fvideo.mp4`\n  - ❌ 错误示例：`D:\u002F下载\u002F我的视频.mp4` 或 `E:\u002Fstudy\u002Fmy video.mp4`\n\n## 2. 安装步骤\n\n### 第一步：获取源码与创建虚拟环境\n打开终端（CMD\u002FPowerShell\u002FTerminal），进入目标目录并执行：\n\n```bash\n# 克隆项目（或手动下载解压后进入目录）\ngit clone https:\u002F\u002Fgithub.com\u002FYaoFANGUK\u002Fvideo-subtitle-extractor.git\ncd video-subtitle-extractor\n\n# 创建虚拟环境\npython -m venv videoEnv\n\n# 激活虚拟环境\n# Windows:\nvideoEnv\\Scripts\\activate\n# macOS\u002FLinux:\nsource videoEnv\u002Fbin\u002Factivate\n```\n\n### 第二步：安装依赖库\n根据您的硬件环境选择以下**一种**方式进行安装（国内用户推荐使用提供的镜像源）：\n\n#### 方案 A：NVIDIA 显卡用户 (CUDA 加速，推荐)\n*需预先安装 CUDA 11.8 和 cuDNN 8.6.0*\n```bash\npip install paddlepaddle-gpu==3.3.1 -i https:\u002F\u002Fwww.paddlepaddle.org.cn\u002Fpackages\u002Fstable\u002Fcu118\u002F\npip install -r requirements.txt\n```\n\n#### 方案 B：AMD\u002FIntel 显卡用户 (DirectML 加速，仅限 Windows)\n```bash\npip install paddlepaddle==3.3.1 -i https:\u002F\u002Fwww.paddlepaddle.org.cn\u002Fpackages\u002Fstable\u002Fcpu\u002F\npip install -r requirements.txt\npip install -r requirements_directml.txt\n```\n\n#### 方案 C：无显卡用户 (CPU 模式)\n```bash\npip install paddlepaddle==3.3.1 -i https:\u002F\u002Fwww.paddlepaddle.org.cn\u002Fpackages\u002Fstable\u002Fcpu\u002F\npip install -r requirements.txt\n```\n\n> **macOS 用户注意**：目前主要支持 CPU 模式或通过 ONNX\u002FCoreML 配置（需自行修改依赖文件），建议优先尝试 CPU 模式。\n\n## 3. 基本使用\n\n安装完成后，确保虚拟环境处于激活状态，且在项目根目录下。\n\n### 启动图形界面 (GUI)\n这是最简单的使用方式，适合单文件或批量处理。\n\n```bash\npython gui.py\n```\n\n**操作流程：**\n1. 点击界面上的 **【打开】** 按钮。\n2. 选择视频文件：\n   - **单文件提取**：选择一个视频。\n   - **批量提取**：按住 Ctrl\u002FShift 选择多个视频（要求所有视频的分辨率和字幕区域一致）。\n3. 在预览窗口中调整**字幕区域**框选范围。\n4. 选择识别模式：\n   - **快速**：轻量模型，速度最快，适合大多数情况。\n   - **自动**：智能判断（GPU 用大模型，CPU 用小模型），推荐首选。\n   - **精准**：逐帧检测，速度极慢，仅在丢字严重时使用。\n5. 点击 **【运行】** 开始提取，生成的 `.srt` 或 `.txt` 文件将保存在视频同级目录。\n\n### 命令行使用 (CLI)\n如需通过脚本调用：\n\n```bash\npython .\u002Fbackend\u002Fmain.py\n```\n*(具体参数请参考源码或帮助文档)*\n\n### 高级技巧：文本修正\n若提取结果中包含水印或特定错别字，可编辑 `backend\u002Fconfigs\u002FtypoMap.json` 文件进行替换或删除：\n\n```json\n{\n    \"威筋\": \"威胁\",\n    \"性感荷官在线发牌\": \"\"\n}\n```\n*上述配置会将“威筋”自动修正为“威胁”，并直接删除“性感荷官在线发牌”这行文字。*","某高校字幕组志愿者正在处理一批无官方字幕的海外公开课视频，急需将其转化为可编辑的中文字幕以便翻译和发布。\n\n### 没有 video-subtitle-extractor 时\n- **人工听写效率极低**：志愿者需反复暂停视频手动听录，一部 45 分钟的课程耗时数小时，且容易因听力疲劳产生错漏。\n- **依赖付费在线服务**：若使用第三方 OCR API 批量处理，不仅面临高昂的费用，还需担心视频内容上传后的隐私泄露风险。\n- **硬字幕无法分离**：视频中的硬编码字幕与画面融为一体，无法直接提取文本进行校对或重新排版，只能覆盖新字幕导致画面杂乱。\n- **多语言支持受限**：面对日语、韩语等非英语课程，普通免费工具识别率极低，往往需要寻找特定语种的昂贵专业服务。\n\n### 使用 video-subtitle-extractor 后\n- **本地自动化提取**：利用 GPU 加速的深度学习模型，video-subtitle-extractor 可在本地离线运行，几分钟内自动将硬字幕转换为标准的 SRT 文件，效率提升数十倍。\n- **零成本且安全**：无需申请任何 API 密钥或上传视频至云端，完全在本地完成从帧检测到文本识别的全过程，彻底消除费用顾虑与数据隐私隐患。\n- **智能清洗与去重**：工具自动过滤水印、台标及重复行，并支持通过配置文件一键修正常见识别错误（如将\"l'm\"修正为\"I'm\"），直接生成高质量字幕底稿。\n- **广泛语种覆盖**：内置支持包括日、韩、法、德等 87 种语言的识别模型，无论是哪种语言的公开课，都能通过“自动”模式获得高精度的提取结果。\n\nvideo-subtitle-extractor 通过将复杂的硬字幕提取流程本地化、自动化，让个人和小团队也能以零成本高效完成多语言视频的字幕重建工作。","https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002FYaoFANGUK_video-subtitle-extractor_fdf7ba5d.png","YaoFANGUK","天涯古巷","https:\u002F\u002Foss.gittoolsai.com\u002Favatars\u002FYaoFANGUK_9407e9a5.jpg",null,"Nottingham, UK","flavioy@live.com","YaoFANGUK.github.io","https:\u002F\u002Fgithub.com\u002FYaoFANGUK",[81,85,89],{"name":82,"color":83,"percentage":84},"Python","#3572A5",99.9,{"name":86,"color":87,"percentage":88},"Batchfile","#C1F12E",0.1,{"name":90,"color":91,"percentage":92},"Shell","#89e051",0,8612,882,"2026-04-11T16:04:09","Apache-2.0","Windows, macOS, Linux","非必需。支持 NVIDIA GPU (推荐 CUDA 11.8, cuDNN 8.6.0，PaddlePaddle-GPU 3.3.1)；支持 AMD\u002FIntel GPU (通过 DirectML)；支持 Apple Silicon\u002FAMD ROCm (通过 ONNX Runtime)。NVIDIA 50 系显卡需 CUDA 12.8+，但因 PaddlePaddle 暂未支持，建议使用 DirectML 版本。","未说明",{"notes":101,"python":102,"dependencies":103},"1. 视频及程序路径严禁包含中文和空格，否则会导致运行错误。2. 提供快速、自动、精准三种模式，推荐优先使用快速或自动模式。3. 支持 87 种语言的字幕提取。4. 可通过编辑 typoMap.json 文件实现特定文本的替换或删除（如去水印）。5. 若使用源码安装，强烈建议使用虚拟环境管理依赖。6. 遇到 7z 解压错误请升级 7-Zip 到最新版本。","3.12+",[104,105,106,107,108,109],"paddlepaddle-gpu==3.3.1 (CUDA 环境)","paddlepaddle==3.3.1 (CPU\u002FDirectML 环境)","onnxruntime","paddle2onnx","VideoSubFinder","7-zip (用于解压)",[15,14],[112,113,114,115,116,117,118,119],"deep-learning","ocr","subtitles","srt","hardsub","extract","ripper","subrip","2026-03-27T02:49:30.150509","2026-04-12T14:02:34.006750",[123,128,133,138,143,148,153],{"id":124,"question_zh":125,"answer_zh":126,"source_url":127},30638,"如何在 Python 代码中调用该工具进行批量处理？","可以通过导入 backend.main 模块中的 SubtitleExtractor 类来调用。示例代码如下：\nfrom backend.main import SubtitleExtractor\n# 输入视频路径和字幕区域\nse = SubtitleExtractor(video_path, subtitle_area)\n# 开始提取字幕\nse.run()","https:\u002F\u002Fgithub.com\u002FYaoFANGUK\u002Fvideo-subtitle-extractor\u002Fissues\u002F66",{"id":129,"question_zh":130,"answer_zh":131,"source_url":132},30639,"Windows 下安装依赖时出现 geos_c.dll 找不到模块的错误如何解决？","这是 Shapely 库的问题。解决方案是先卸载现有的 Shapely，然后使用 conda 重新安装。具体命令如下：\npip uninstall Shapely -y\nconda install Shapely","https:\u002F\u002Fgithub.com\u002FYaoFANGUK\u002Fvideo-subtitle-extractor\u002Fissues\u002F25",{"id":134,"question_zh":135,"answer_zh":136,"source_url":137},30640,"程序卡在\"running Verify Fluid Program\"步骤不动怎么办？","可以在 config.py 文件中删除 fluid.install_check.run_check() 这一行代码，跳过环境检查步骤即可正常运行。","https:\u002F\u002Fgithub.com\u002FYaoFANGUK\u002Fvideo-subtitle-extractor\u002Fissues\u002F19",{"id":139,"question_zh":140,"answer_zh":141,"source_url":142},30641,"使用 GPU 加速版（v2.0+）时出现 CUDNN error(9) CUDNN_STATUS_NOT_SUPPORTED 报错如何解决？","这通常是由于 CUDA 和 cuDNN 版本不兼容导致的。建议将环境配置为 CUDA 11.7 搭配 cuDNN 8.5.0 版本，该组合已验证可稳定极速运行且无报错。不要使用 cuDNN 8.9 或 CUDA 12 搭配旧版驱动。","https:\u002F\u002Fgithub.com\u002FYaoFANGUK\u002Fvideo-subtitle-extractor\u002Fissues\u002F232",{"id":144,"question_zh":145,"answer_zh":146,"source_url":147},30642,"生成的 SRT 字幕最后一行时间轴显示为 00:00:00,000 导致无法显示怎么办？","这是 OpenCV 获取时间戳返回 0 导致的 Bug，在新版本中已修复。如果仍遇到此问题，在 Windows 下尝试使用非精确模式（调用 VideoSubFinderWXW.exe），该模式下通常不会出现此问题。","https:\u002F\u002Fgithub.com\u002FYaoFANGUK\u002Fvideo-subtitle-extractor\u002Fissues\u002F67",{"id":149,"question_zh":150,"answer_zh":151,"source_url":152},30643,"“精准模式”和“快速模式”有什么区别？为什么快速模式会丢失字幕？","精准模式会对每一帧进行处理并使用 DBNet 检测文本，不依赖参数设置，鲁棒性更好但需要强大的显卡支持；快速模式使用传统图像算法查找字幕，需要调整参数且可能因参数设置不当或 VSF 版本问题导致丢字幕。目前两种模式都已换用高精度识别模型。若快速模式丢字幕严重，建议检查 VideoSubFinder (VSF) 的版本或尝试精准模式。","https:\u002F\u002Fgithub.com\u002FYaoFANGUK\u002Fvideo-subtitle-extractor\u002Fissues\u002F141",{"id":154,"question_zh":155,"answer_zh":156,"source_url":157},30644,"为什么我的 GPU 加速处理速度非常慢（如 3 小时视频处理了 6 个半小时）？","正常情况下（如使用 10 系列显卡），60 分钟视频应在 10 分钟内完成。如果速度极慢，请确认：1. 是否真正启用了 GPU 加速（运行时是否有相关打印信息）；2. 是否使用了正确的版本（如 v2.0）；3. CUDA 和 cuDNN 环境配置是否正确（参考 CUDNN 报错问题的解决方案）。","https:\u002F\u002Fgithub.com\u002FYaoFANGUK\u002Fvideo-subtitle-extractor\u002Fissues\u002F218",[159,164,168,173,178],{"id":160,"version":161,"summary_zh":162,"released_at":163},222536,"2.2.0","🚀 VSE v2.2.0 正式版发布✨\n🎉 新特性\n· ⚡ 支持同步时间轴\n· 🗂️ 支持设置字幕保存路径\n· 🌐 添加土耳其语翻译\n· 🧹界面优化\n· 🐍 Python 3.13 + 升级PaddleOCRv5，准确率更高\n· 💎 支持MacOS M系列芯片","2026-04-04T23:51:48",{"id":165,"version":166,"summary_zh":75,"released_at":167},222537,"2.0.3","2025-04-24T23:47:40",{"id":169,"version":170,"summary_zh":171,"released_at":172},222538,"2.0.0","v2.0.0 新功能：\n\n- 发布 Windows 版本的 CPU、GPU 可执行程序\n- 更新 V4 版识别与检测模型，识别精度更高\n- 新增自动模式\n- 优化精准模式\n- 新增界面多语言支持：简体中文、繁体中文、英文、韩文、日文、越南语、西班牙语\n- 新增识别字幕语言：支持 87 种语言识别\n","2023-10-07T01:14:00",{"id":174,"version":175,"summary_zh":176,"released_at":177},222539,"1.0.0","> 2022年6月28日更新\n\nv1.0.0 新功能：\n\n- 发布Windows版本的CPU、GPU可执行程序\n- 新增进度条\n- 新增视频批量处理：点击```打开```可以选择多个视频，顺序处理\n- 优化精准识别模式，更快的识别速度\n- 新增界面多语言支持：简体中文、繁体中文、英文\n- 新增识别字幕语言：阿拉伯语、俄语、西班牙语、葡萄牙语、意大利语\n\n\n> GPU版本使用：请下载vse_windows_GPU.7z后进行解压（第一次运行时可以会自动安装依赖，需要耐心等待）","2021-12-21T12:46:17",{"id":179,"version":180,"summary_zh":181,"released_at":182},222540,"0.1.0","新功能：\nv0.1.0\n- GUI界面\n- 发布Windows、MacOS平台下的CPU版本可执行程序，暂不支持GPU加速","2021-04-14T08:56:30"]