[{"data":1,"prerenderedAt":-1},["ShallowReactive",2],{"similar-WEIFENG2333--VideoCaptioner":3,"tool-WEIFENG2333--VideoCaptioner":64},[4,17,27,35,43,56],{"id":5,"name":6,"github_repo":7,"description_zh":8,"stars":9,"difficulty_score":10,"last_commit_at":11,"category_tags":12,"status":16},3808,"stable-diffusion-webui","AUTOMATIC1111\u002Fstable-diffusion-webui","stable-diffusion-webui 是一个基于 Gradio 构建的网页版操作界面，旨在让用户能够轻松地在本地运行和使用强大的 Stable Diffusion 图像生成模型。它解决了原始模型依赖命令行、操作门槛高且功能分散的痛点，将复杂的 AI 绘图流程整合进一个直观易用的图形化平台。\n\n无论是希望快速上手的普通创作者、需要精细控制画面细节的设计师，还是想要深入探索模型潜力的开发者与研究人员，都能从中获益。其核心亮点在于极高的功能丰富度：不仅支持文生图、图生图、局部重绘（Inpainting）和外绘（Outpainting）等基础模式，还独创了注意力机制调整、提示词矩阵、负向提示词以及“高清修复”等高级功能。此外，它内置了 GFPGAN 和 CodeFormer 等人脸修复工具，支持多种神经网络放大算法，并允许用户通过插件系统无限扩展能力。即使是显存有限的设备，stable-diffusion-webui 也提供了相应的优化选项，让高质量的 AI 艺术创作变得触手可及。",162132,3,"2026-04-05T11:01:52",[13,14,15],"开发框架","图像","Agent","ready",{"id":18,"name":19,"github_repo":20,"description_zh":21,"stars":22,"difficulty_score":23,"last_commit_at":24,"category_tags":25,"status":16},1381,"everything-claude-code","affaan-m\u002Feverything-claude-code","everything-claude-code 是一套专为 AI 编程助手（如 Claude Code、Codex、Cursor 等）打造的高性能优化系统。它不仅仅是一组配置文件，而是一个经过长期实战打磨的完整框架，旨在解决 AI 代理在实际开发中面临的效率低下、记忆丢失、安全隐患及缺乏持续学习能力等核心痛点。\n\n通过引入技能模块化、直觉增强、记忆持久化机制以及内置的安全扫描功能，everything-claude-code 能显著提升 AI 在复杂任务中的表现，帮助开发者构建更稳定、更智能的生产级 AI 代理。其独特的“研究优先”开发理念和针对 Token 消耗的优化策略，使得模型响应更快、成本更低，同时有效防御潜在的攻击向量。\n\n这套工具特别适合软件开发者、AI 研究人员以及希望深度定制 AI 工作流的技术团队使用。无论您是在构建大型代码库，还是需要 AI 协助进行安全审计与自动化测试，everything-claude-code 都能提供强大的底层支持。作为一个曾荣获 Anthropic 黑客大奖的开源项目，它融合了多语言支持与丰富的实战钩子（hooks），让 AI 真正成长为懂上",140436,2,"2026-04-05T23:32:43",[13,15,26],"语言模型",{"id":28,"name":29,"github_repo":30,"description_zh":31,"stars":32,"difficulty_score":23,"last_commit_at":33,"category_tags":34,"status":16},2271,"ComfyUI","Comfy-Org\u002FComfyUI","ComfyUI 是一款功能强大且高度模块化的视觉 AI 引擎，专为设计和执行复杂的 Stable Diffusion 图像生成流程而打造。它摒弃了传统的代码编写模式，采用直观的节点式流程图界面，让用户通过连接不同的功能模块即可构建个性化的生成管线。\n\n这一设计巧妙解决了高级 AI 绘图工作流配置复杂、灵活性不足的痛点。用户无需具备编程背景，也能自由组合模型、调整参数并实时预览效果，轻松实现从基础文生图到多步骤高清修复等各类复杂任务。ComfyUI 拥有极佳的兼容性，不仅支持 Windows、macOS 和 Linux 全平台，还广泛适配 NVIDIA、AMD、Intel 及苹果 Silicon 等多种硬件架构，并率先支持 SDXL、Flux、SD3 等前沿模型。\n\n无论是希望深入探索算法潜力的研究人员和开发者，还是追求极致创作自由度的设计师与资深 AI 绘画爱好者，ComfyUI 都能提供强大的支持。其独特的模块化架构允许社区不断扩展新功能，使其成为当前最灵活、生态最丰富的开源扩散模型工具之一，帮助用户将创意高效转化为现实。",107662,"2026-04-03T11:11:01",[13,14,15],{"id":36,"name":37,"github_repo":38,"description_zh":39,"stars":40,"difficulty_score":23,"last_commit_at":41,"category_tags":42,"status":16},3704,"NextChat","ChatGPTNextWeb\u002FNextChat","NextChat 是一款轻量且极速的 AI 助手，旨在为用户提供流畅、跨平台的大模型交互体验。它完美解决了用户在多设备间切换时难以保持对话连续性，以及面对众多 AI 模型不知如何统一管理的痛点。无论是日常办公、学习辅助还是创意激发，NextChat 都能让用户随时随地通过网页、iOS、Android、Windows、MacOS 或 Linux 端无缝接入智能服务。\n\n这款工具非常适合普通用户、学生、职场人士以及需要私有化部署的企业团队使用。对于开发者而言，它也提供了便捷的自托管方案，支持一键部署到 Vercel 或 Zeabur 等平台。\n\nNextChat 的核心亮点在于其广泛的模型兼容性，原生支持 Claude、DeepSeek、GPT-4 及 Gemini Pro 等主流大模型，让用户在一个界面即可自由切换不同 AI 能力。此外，它还率先支持 MCP（Model Context Protocol）协议，增强了上下文处理能力。针对企业用户，NextChat 提供专业版解决方案，具备品牌定制、细粒度权限控制、内部知识库整合及安全审计等功能，满足公司对数据隐私和个性化管理的高标准要求。",87618,"2026-04-05T07:20:52",[13,26],{"id":44,"name":45,"github_repo":46,"description_zh":47,"stars":48,"difficulty_score":23,"last_commit_at":49,"category_tags":50,"status":16},2268,"ML-For-Beginners","microsoft\u002FML-For-Beginners","ML-For-Beginners 是由微软推出的一套系统化机器学习入门课程，旨在帮助零基础用户轻松掌握经典机器学习知识。这套课程将学习路径规划为 12 周，包含 26 节精炼课程和 52 道配套测验，内容涵盖从基础概念到实际应用的完整流程，有效解决了初学者面对庞大知识体系时无从下手、缺乏结构化指导的痛点。\n\n无论是希望转型的开发者、需要补充算法背景的研究人员，还是对人工智能充满好奇的普通爱好者，都能从中受益。课程不仅提供了清晰的理论讲解，还强调动手实践，让用户在循序渐进中建立扎实的技能基础。其独特的亮点在于强大的多语言支持，通过自动化机制提供了包括简体中文在内的 50 多种语言版本，极大地降低了全球不同背景用户的学习门槛。此外，项目采用开源协作模式，社区活跃且内容持续更新，确保学习者能获取前沿且准确的技术资讯。如果你正寻找一条清晰、友好且专业的机器学习入门之路，ML-For-Beginners 将是理想的起点。",84991,"2026-04-05T10:45:23",[14,51,52,53,15,54,26,13,55],"数据工具","视频","插件","其他","音频",{"id":57,"name":58,"github_repo":59,"description_zh":60,"stars":61,"difficulty_score":10,"last_commit_at":62,"category_tags":63,"status":16},3128,"ragflow","infiniflow\u002Fragflow","RAGFlow 是一款领先的开源检索增强生成（RAG）引擎，旨在为大语言模型构建更精准、可靠的上下文层。它巧妙地将前沿的 RAG 技术与智能体（Agent）能力相结合，不仅支持从各类文档中高效提取知识，还能让模型基于这些知识进行逻辑推理和任务执行。\n\n在大模型应用中，幻觉问题和知识滞后是常见痛点。RAGFlow 通过深度解析复杂文档结构（如表格、图表及混合排版），显著提升了信息检索的准确度，从而有效减少模型“胡编乱造”的现象，确保回答既有据可依又具备时效性。其内置的智能体机制更进一步，使系统不仅能回答问题，还能自主规划步骤解决复杂问题。\n\n这款工具特别适合开发者、企业技术团队以及 AI 研究人员使用。无论是希望快速搭建私有知识库问答系统，还是致力于探索大模型在垂直领域落地的创新者，都能从中受益。RAGFlow 提供了可视化的工作流编排界面和灵活的 API 接口，既降低了非算法背景用户的上手门槛，也满足了专业开发者对系统深度定制的需求。作为基于 Apache 2.0 协议开源的项目，它正成为连接通用大模型与行业专有知识之间的重要桥梁。",77062,"2026-04-04T04:44:48",[15,14,13,26,54],{"id":65,"github_repo":66,"name":67,"description_en":68,"description_zh":69,"ai_summary_zh":69,"readme_en":70,"readme_zh":71,"quickstart_zh":72,"use_case_zh":73,"hero_image_url":74,"owner_login":75,"owner_name":76,"owner_avatar_url":77,"owner_bio":78,"owner_company":79,"owner_location":80,"owner_email":79,"owner_twitter":79,"owner_website":79,"owner_url":81,"languages":82,"stars":95,"forks":96,"last_commit_at":97,"license":98,"difficulty_score":90,"env_os":99,"env_gpu":100,"env_ram":101,"env_deps":102,"category_tags":109,"github_topics":110,"view_count":23,"oss_zip_url":79,"oss_zip_packed_at":79,"status":16,"created_at":115,"updated_at":116,"faqs":117,"releases":148},4105,"WEIFENG2333\u002FVideoCaptioner","VideoCaptioner","🎬 卡卡字幕助手 | VideoCaptioner - 基于 LLM 的智能字幕助手 - 视频字幕生成、断句、校正、字幕翻译全流程处理！- A powered tool for easy and efficient video subtitling.","VideoCaptioner 是一款基于大语言模型（LLM）的智能视频字幕处理助手，旨在为用户提供从语音识别、字幕断句优化、多语言翻译到视频合成的一站式解决方案。它有效解决了传统字幕制作中识别不准、断句生硬、翻译缺乏语境以及人工校对耗时费力等痛点，让视频本地化和内容创作变得更加高效流畅。\n\n这款工具兼具专业性与易用性，既适合需要批量处理视频的开发者通过命令行（CLI）集成工作流，也提供了友好的图形界面（GUI），让普通用户、内容创作者及设计师无需编写代码即可轻松上手。其核心技术亮点在于结合了词级时间戳与语音活动检测（VAD）以确保高准确率，并利用 LLM 强大的语义理解能力进行智能断句和上下文感知翻译，使生成的字幕阅读体验自然顺畅。此外，VideoCaptioner 内置了必剪语音识别和必应\u002F谷歌翻译等免费服务，安装即用；同时也支持灵活配置各类兼容 OpenAI 接口的大模型，以满足更高阶的优化需求。无论是制作双语字幕还是快速转录会议记录，VideoCaptioner 都能显著提升工作效率。","\u003Cdiv align=\"center\">\n  \u003Cimg src=\"https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002FWEIFENG2333_VideoCaptioner_readme_913b4d9bd901.png\" alt=\"VideoCaptioner Logo\" width=\"100\">\n  \u003Ch1>VideoCaptioner\u003C\u002Fh1>\n  \u003Cp>基于大语言模型的视频字幕处理工具 — 语音识别、字幕优化、翻译、视频合成一站式处理\u003C\u002Fp>\n\n  [在线文档](https:\u002F\u002Fweifeng2333.github.io\u002FVideoCaptioner\u002F) · [CLI 使用](#cli-命令行) · [GUI 桌面版](#gui-桌面版) · [Claude Code Skill](#claude-code-skill)\n\u003C\u002Fdiv>\n\n## 安装\n\n```bash\npip install videocaptioner          # 仅安装 CLI（轻量，无 GUI 依赖）\npip install videocaptioner[gui]     # 安装 CLI + GUI 桌面版\n```\n\n免费功能（必剪语音识别、必应\u002F谷歌翻译）**无需任何配置，安装即用**。\n\n## CLI 命令行\n\n```bash\n# 语音转录（免费，无需 API Key）\nvideocaptioner transcribe video.mp4 --asr bijian\n\n# 字幕翻译（免费必应翻译）\nvideocaptioner subtitle input.srt --translator bing --target-language en\n\n# 全流程：转录 → 优化 → 翻译 → 合成\nvideocaptioner process video.mp4 --target-language ja\n\n# 字幕烧录到视频\nvideocaptioner synthesize video.mp4 -s subtitle.srt\n\n# 下载在线视频\nvideocaptioner download \"https:\u002F\u002Fyoutube.com\u002Fwatch?v=xxx\"\n```\n\n需要 LLM 功能（字幕优化、大模型翻译）时，配置 API Key：\n\n```bash\nvideocaptioner config set llm.api_key \u003Cyour-key>\nvideocaptioner config set llm.api_base https:\u002F\u002Fapi.openai.com\u002Fv1\nvideocaptioner config set llm.model gpt-4o-mini\n```\n\n配置优先级：`命令行参数 > 环境变量 (VIDEOCAPTIONER_*) > 配置文件 > 默认值`。运行 `videocaptioner config show` 查看当前配置。\n\n\u003Cdetails>\n\u003Csummary>所有 CLI 命令一览\u003C\u002Fsummary>\n\n| 命令 | 说明 |\n|------|------|\n| `transcribe` | 语音转字幕。引擎：`faster-whisper`、`whisper-api`、`bijian`（免费）、`jianying`（免费）、`whisper-cpp` |\n| `subtitle` | 字幕优化\u002F翻译。翻译服务：`llm`、`bing`（免费）、`google`（免费） |\n| `synthesize` | 字幕烧录到视频（软字幕\u002F硬字幕） |\n| `process` | 全流程处理 |\n| `download` | 下载 YouTube、B站等平台视频 |\n| `config` | 配置管理（`show`、`set`、`get`、`path`、`init`） |\n\n运行 `videocaptioner \u003C命令> --help` 查看完整参数。完整 CLI 文档见 [docs\u002Fcli.md](docs\u002Fcli.md)。\n\n\u003C\u002Fdetails>\n\n## GUI 桌面版\n\n```bash\npip install videocaptioner[gui]\nvideocaptioner                      # 无参数时自动打开桌面版\n```\n\n\u003Cdetails>\n\u003Csummary>其他安装方式：Windows 安装包 \u002F macOS 一键脚本\u003C\u002Fsummary>\n\n**Windows**：从 [Release](https:\u002F\u002Fgithub.com\u002FWEIFENG2333\u002FVideoCaptioner\u002Freleases) 下载安装包\n\n**macOS**：\n```bash\ncurl -fsSL https:\u002F\u002Fraw.githubusercontent.com\u002FWEIFENG2333\u002FVideoCaptioner\u002Fmaster\u002Fscripts\u002Frun.sh | bash\n```\n\n\u003C\u002Fdetails>\n\n\n\u003C!-- \u003Cdiv align=\"center\">\n  \u003Cimg src=\"https:\u002F\u002Fh1.appinn.me\u002Ffile\u002F1731487405884_main.png\" alt=\"界面预览\" width=\"90%\" style=\"border-radius: 5px;\">\n\u003C\u002Fdiv> -->\n\n![页面预览](https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002FWEIFENG2333_VideoCaptioner_readme_dd8f6a2022c3.png)\n![页面预览](https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002FWEIFENG2333_VideoCaptioner_readme_7d0d096f61eb.png)\n\n## LLM API 配置\n\nLLM 仅用于字幕优化和大模型翻译，免费功能（必剪识别、必应翻译）无需配置。\n\n支持所有 OpenAI 兼容接口的服务商：\n\n| 服务商 | 官网 |\n|--------|------|\n| **VideoCaptioner 中转站** | [api.videocaptioner.cn](https:\u002F\u002Fapi.videocaptioner.cn) — 高并发，性价比高，支持 GPT\u002FClaude\u002FGemini 等 |\n| SiliconCloud | [cloud.siliconflow.cn](https:\u002F\u002Fcloud.siliconflow.cn\u002Fi\u002FHF95kaoz) |\n| DeepSeek | [platform.deepseek.com](https:\u002F\u002Fplatform.deepseek.com) |\n\n在软件设置或 CLI 中填入 API Base URL 和 API Key 即可。[详细配置教程](https:\u002F\u002Fweifeng2333.github.io\u002FVideoCaptioner\u002Fconfig\u002Fllm)\n\n## Claude Code Skill\n\n本项目提供了 [Claude Code Skill](https:\u002F\u002Fcode.claude.com\u002Fdocs\u002Fen\u002Fskills.md)，让 AI 编程助手可以直接调用 VideoCaptioner 处理视频。\n\n安装到 Claude Code：\n\n```bash\nmkdir -p ~\u002F.claude\u002Fskills\u002Fvideocaptioner\ncp skills\u002FSKILL.md ~\u002F.claude\u002Fskills\u002Fvideocaptioner\u002FSKILL.md\n```\n\n然后在 Claude Code 中输入 `\u002Fvideocaptioner transcribe video.mp4 --asr bijian` 即可使用。\n\n## 工作原理\n\n```\n音视频输入 → 语音识别 → 字幕断句 → LLM 优化 → 翻译 → 视频合成\n```\n\n- 词级时间戳 + VAD 语音活动检测，识别准确率高\n- LLM 语义理解断句，字幕阅读体验自然流畅\n- 上下文感知翻译，支持反思优化机制\n- 批量并发处理，效率高\n\n## 开发\n\n```bash\ngit clone https:\u002F\u002Fgithub.com\u002FWEIFENG2333\u002FVideoCaptioner.git\ncd VideoCaptioner\nuv sync && uv run videocaptioner     # 运行 GUI\nuv run videocaptioner --help          # 运行 CLI\nuv run pyright                        # 类型检查\nuv run pytest tests\u002Ftest_cli\u002F -q      # 运行测试\n```\n\n## 许可证\n\n[GPL-3.0](LICENSE)\n\n[![Star History Chart](https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002FWEIFENG2333_VideoCaptioner_readme_bcff438398ad.png)](https:\u002F\u002Fstar-history.com\u002F#WEIFENG2333\u002FVideoCaptioner&Date)\n","\u003Cdiv align=\"center\">\n  \u003Cimg src=\"https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002FWEIFENG2333_VideoCaptioner_readme_913b4d9bd901.png\" alt=\"VideoCaptioner Logo\" width=\"100\">\n  \u003Ch1>VideoCaptioner\u003C\u002Fh1>\n  \u003Cp>基于大语言模型的视频字幕处理工具 — 语音识别、字幕优化、翻译、视频合成一站式处理\u003C\u002Fp>\n\n  [在线文档](https:\u002F\u002Fweifeng2333.github.io\u002FVideoCaptioner\u002F) · [CLI 使用](#cli-命令行) · [GUI 桌面版](#gui-桌面版) · [Claude Code Skill](#claude-code-skill)\n\u003C\u002Fdiv>\n\n## 安装\n\n```bash\npip install videocaptioner          # 仅安装 CLI（轻量，无 GUI 依赖）\npip install videocaptioner[gui]     # 安装 CLI + GUI 桌面版\n```\n\n免费功能（必剪语音识别、必应\u002F谷歌翻译）**无需任何配置，安装即用**。\n\n## CLI 命令行\n\n```bash\n# 语音转录（免费，无需 API Key）\nvideocaptioner transcribe video.mp4 --asr bijian\n\n# 字幕翻译（免费必应翻译）\nvideocaptioner subtitle input.srt --translator bing --target-language en\n\n# 全流程：转录 → 优化 → 翻译 → 合成\nvideocaptioner process video.mp4 --target-language ja\n\n# 字幕烧录到视频\nvideocaptioner synthesize video.mp4 -s subtitle.srt\n\n# 下载在线视频\nvideocaptioner download \"https:\u002F\u002Fyoutube.com\u002Fwatch?v=xxx\"\n```\n\n需要 LLM 功能（字幕优化、大模型翻译）时，配置 API Key：\n\n```bash\nvideocaptioner config set llm.api_key \u003Cyour-key>\nvideocaptioner config set llm.api_base https:\u002F\u002Fapi.openai.com\u002Fv1\nvideocaptioner config set llm.model gpt-4o-mini\n```\n\n配置优先级：`命令行参数 > 环境变量 (VIDEOCAPTIONER_*) > 配置文件 > 默认值`。运行 `videocaptioner config show` 查看当前配置。\n\n\u003Cdetails>\n\u003Csummary>所有 CLI 命令一览\u003C\u002Fsummary>\n\n| 命令 | 说明 |\n|------|------|\n| `transcribe` | 语音转字幕。引擎：`faster-whisper`、`whisper-api`、`bijian`（免费）、`jianying`（免费）、`whisper-cpp` |\n| `subtitle` | 字幕优化\u002F翻译。翻译服务：`llm`、`bing`（免费）、`google`（免费） |\n| `synthesize` | 字幕烧录到视频（软字幕\u002F硬字幕） |\n| `process` | 全流程处理 |\n| `download` | 下载 YouTube、B站等平台视频 |\n| `config` | 配置管理（`show`、`set`、`get`、`path`、`init`） |\n\n运行 `videocaptioner \u003C命令> --help` 查看完整参数。完整 CLI 文档见 [docs\u002Fcli.md](docs\u002Fcli.md)。\n\n\u003C\u002Fdetails>\n\n## GUI 桌面版\n\n```bash\npip install videocaptioner[gui]\nvideocaptioner                      # 无参数时自动打开桌面版\n```\n\n\u003Cdetails>\n\u003Csummary>其他安装方式：Windows 安装包 \u002F macOS 一键脚本\u003C\u002Fsummary>\n\n**Windows**：从 [Release](https:\u002F\u002Fgithub.com\u002FWEIFENG2333\u002FVideoCaptioner\u002Freleases) 下载安装包\n\n**macOS**：\n```bash\ncurl -fsSL https:\u002F\u002Fraw.githubusercontent.com\u002FWEIFENG2333\u002FVideoCaptioner\u002Fmaster\u002Fscripts\u002Frun.sh | bash\n```\n\n\u003C\u002Fdetails>\n\n\n\u003C!-- \u003Cdiv align=\"center\">\n  \u003Cimg src=\"https:\u002F\u002Fh1.appinn.me\u002Ffile\u002F1731487405884_main.png\" alt=\"界面预览\" width=\"90%\" style=\"border-radius: 5px;\">\n\u003C\u002Fdiv> -->\n\n![页面预览](https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002FWEIFENG2333_VideoCaptioner_readme_dd8f6a2022c3.png)\n![页面预览](https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002FWEIFENG2333_VideoCaptioner_readme_7d0d096f61eb.png)\n\n## LLM API 配置\n\nLLM 仅用于字幕优化和大模型翻译，免费功能（必剪识别、必应翻译）无需配置。\n\n支持所有 OpenAI 兼容接口的服务商：\n\n| 服务商 | 官网 |\n|--------|------|\n| **VideoCaptioner 中转站** | [api.videocaptioner.cn](https:\u002F\u002Fapi.videocaptioner.cn) — 高并发，性价比高，支持 GPT\u002FClaude\u002FGemini 等 |\n| SiliconCloud | [cloud.siliconflow.cn](https:\u002F\u002Fcloud.siliconflow.cn\u002Fi\u002FHF95kaoz) |\n| DeepSeek | [platform.deepseek.com](https:\u002F\u002Fplatform.deepseek.com) |\n\n在软件设置或 CLI 中填入 API Base URL 和 API Key 即可。[详细配置教程](https:\u002F\u002Fweifeng2333.github.io\u002FVideoCaptioner\u002Fconfig\u002Fllm)\n\n## Claude Code Skill\n\n本项目提供了 [Claude Code Skill](https:\u002F\u002Fcode.claude.com\u002Fdocs\u002Fen\u002Fskills.md)，让 AI 编程助手可以直接调用 VideoCaptioner 处理视频。\n\n安装到 Claude Code：\n\n```bash\nmkdir -p ~\u002F.claude\u002Fskills\u002Fvideocaptioner\ncp skills\u002FSKILL.md ~\u002F.claude\u002Fskills\u002Fvideocaptioner\u002FSKILL.md\n```\n\n然后在 Claude Code 中输入 `\u002Fvideocaptioner transcribe video.mp4 --asr bijian` 即可使用。\n\n## 工作原理\n\n```\n音视频输入 → 语音识别 → 字幕断句 → LLM 优化 → 翻译 → 视频合成\n```\n\n- 词级时间戳 + VAD 语音活动检测，识别准确率高\n- LLM 语义理解断句，字幕阅读体验自然流畅\n- 上下文感知翻译，支持反思优化机制\n- 批量并发处理，效率高\n\n## 开发\n\n```bash\ngit clone https:\u002F\u002Fgithub.com\u002FWEIFENG2333\u002FVideoCaptioner.git\ncd VideoCaptioner\nuv sync && uv run videocaptioner     # 运行 GUI\nuv run videocaptioner --help          # 运行 CLI\nuv run pyright                        # 类型检查\nuv run pytest tests\u002Ftest_cli\u002F -q      # 运行测试\n```\n\n## 许可证\n\n[GPL-3.0](LICENSE)\n\n[![Star History Chart](https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002FWEIFENG2333_VideoCaptioner_readme_bcff438398ad.png)](https:\u002F\u002Fstar-history.com\u002F#WEIFENG2333\u002FVideoCaptioner&Date)","# VideoCaptioner 快速上手指南\n\nVideoCaptioner 是一款基于大语言模型的视频字幕处理工具，提供语音识别、字幕优化、翻译及视频合成的一站式解决方案。支持免费引擎（必剪识别、必应\u002F谷歌翻译）无需配置即可使用。\n\n## 环境准备\n\n- **操作系统**：Windows \u002F macOS \u002F Linux\n- **Python 版本**：建议 Python 3.8+\n- **前置依赖**：\n  - 基础功能仅需安装 Python 环境。\n  - 若使用 GUI 桌面版，需确保系统支持图形界面显示。\n  - （可选）若需使用 LLM 高级功能（字幕润色、大模型翻译），需准备兼容 OpenAI 接口的 API Key。\n\n## 安装步骤\n\n### 方式一：通过 pip 安装（推荐）\n\n**仅安装 CLI 命令行版（轻量，无 GUI 依赖）：**\n```bash\npip install videocaptioner\n```\n\n**安装 CLI + GUI 桌面完整版：**\n```bash\npip install videocaptioner[gui]\n```\n\n> **提示**：国内用户若下载缓慢，可指定国内镜像源安装：\n> ```bash\n> pip install videocaptioner[gui] -i https:\u002F\u002Fpypi.tuna.tsinghua.edu.cn\u002Fsimple\n> ```\n\n### 方式二：直接运行桌面版（Windows\u002FmacOS）\n\n- **Windows**：前往 [Release 页面](https:\u002F\u002Fgithub.com\u002FWEIFENG2333\u002FVideoCaptioner\u002Freleases) 下载安装包直接安装。\n- **macOS**：执行一键脚本安装：\n  ```bash\n  curl -fsSL https:\u002F\u002Fraw.githubusercontent.com\u002FWEIFENG2333\u002FVideoCaptioner\u002Fmaster\u002Fscripts\u002Frun.sh | bash\n  ```\n\n## 基本使用\n\n### 1. 启动 GUI 桌面版\n安装完成后，直接在终端输入以下命令即可打开图形界面，适合新手可视化操作：\n```bash\nvideocaptioner\n```\n\n### 2. CLI 命令行快速体验\n\n**场景 A：免费语音转录（无需 API Key）**\n使用必剪引擎将视频转为字幕：\n```bash\nvideocaptioner transcribe video.mp4 --asr bijian\n```\n\n**场景 B：免费字幕翻译**\n使用必应翻译将字幕译为英文：\n```bash\nvideocaptioner subtitle input.srt --translator bing --target-language en\n```\n\n**场景 C：全流程自动化处理**\n一键完成“转录 → 优化 → 翻译 → 合成”，目标语言设为日语：\n```bash\nvideocaptioner process video.mp4 --target-language ja\n```\n\n**场景 D：字幕烧录到视频**\n将字幕文件硬编码压制到视频中：\n```bash\nvideocaptioner synthesize video.mp4 -s subtitle.srt\n```\n\n### 3. 配置 LLM（可选）\n若需使用大模型进行字幕润色或高质量翻译，配置 API Key 即可：\n```bash\nvideocaptioner config set llm.api_key \u003Cyour-key>\nvideocaptioner config set llm.api_base https:\u002F\u002Fapi.openai.com\u002Fv1\nvideocaptioner config set llm.model gpt-4o-mini\n```\n> **推荐**：可使用国内高速中转服务 `https:\u002F\u002Fapi.videocaptioner.cn` 作为 `api_base`，支持 GPT\u002FClaude\u002FGemini 等模型。","一位独立知识博主每周需将长达 45 分钟的英文技术讲座视频转化为带中文字幕的 B 站投稿，以维持高频更新。\n\n### 没有 VideoCaptioner 时\n- **流程割裂严重**：需要分别在剪映、Arctime 和翻译软件间切换，手动导出导入字幕文件，耗时且易出错。\n- **断句阅读困难**：自动生成的字幕往往按时间切片强行截断，导致一句话被拆成两行，观众阅读体验极差。\n- **翻译生硬机械**：直接使用机器翻译缺乏上下文理解，专业术语（如\"Transformer 架构\"）常被误译，需人工逐句校对。\n- **时间成本高昂**：从原始视频到最终合成，单人全流程处理往往需要 3-4 小时，严重挤压内容创作时间。\n\n### 使用 VideoCaptioner 后\n- **一站式自动化**：通过一条 `videocaptioner process` 命令或 GUI 一键操作，自动完成转录、优化、翻译到合成的全链路。\n- **LLM 智能断句**：利用大语言模型理解语义重新断句，确保每行字幕语义完整，符合人类自然阅读习惯。\n- **上下文精准翻译**：配置 LLM 后进行上下文感知翻译，准确识别技术术语并自动润色，译文流畅度接近人工精翻。\n- **效率显著提升**：全流程缩短至 20 分钟以内（主要等待渲染），博主可将节省下的 3 小时用于打磨脚本与互动。\n\nVideoCaptioner 将繁琐的字幕工程转化为简单的自动化流程，让创作者能专注于内容本身而非技术细节。","https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002FWEIFENG2333_VideoCaptioner_dd8f6a20.png","WEIFENG2333","BKK","https:\u002F\u002Foss.gittoolsai.com\u002Favatars\u002FWEIFENG2333_90822293.jpg","I am a student in South China Normal University. I want to study in Github and try to make some contributions to the community.",null,"South","https:\u002F\u002Fgithub.com\u002FWEIFENG2333",[83,87,91],{"name":84,"color":85,"percentage":86},"Python","#3572A5",98.6,{"name":88,"color":89,"percentage":90},"Shell","#89e051",1,{"name":92,"color":93,"percentage":94},"Batchfile","#C1F12E",0.4,13882,1132,"2026-04-05T15:22:37","GPL-3.0","Windows, macOS, Linux","未说明（支持免费必剪\u002F建英语音识别及云端 LLM，本地 Whisper 引擎如 faster-whisper\u002Fwhisper-cpp 可能受益于 GPU 但未明确强制要求）","未说明",{"notes":103,"python":104,"dependencies":105},"1. 提供免费免配置功能：必剪\u002F建英语音识别、必应\u002F谷歌翻译，无需 API Key 即可使用。2. 高级功能（字幕优化、大模型翻译）需配置兼容 OpenAI 接口的 LLM API Key。3. 提供 CLI 命令行、GUI 桌面版（含 Windows 安装包和 macOS 一键脚本）以及 Claude Code Skill 多种使用方式。4. 推荐使用 'uv' 工具进行开发环境同步和运行。","未说明（通过 uv 和 pip 安装，暗示兼容主流 Python 3 版本）",[106,107,108],"faster-whisper","whisper-cpp","uv",[15,14,13,52],[111,112,113,114],"ai","subtitle","translate","video-subtile","2026-03-27T02:49:30.150509","2026-04-06T09:06:55.393728",[118,123,128,133,138,143],{"id":119,"question_zh":120,"answer_zh":121,"source_url":122},18712,"使用 NVIDIA 50 系显卡（如 RTX 5060 Ti）运行 FasterWhisper Large V2 模型时，报错 \"cuBLAS failed with status CUBLAS_STATUS_NOT_SUPPORTED\" 导致转录失败，如何解决？","这是针对 50 系显卡的兼容性问题。维护者已确认该问题，并将在后续的 1.4 版本中进行修复。请等待软件更新到 1.4 或更高版本即可解决。","https:\u002F\u002Fgithub.com\u002FWEIFENG2333\u002FVideoCaptioner\u002Fissues\u002F443",{"id":124,"question_zh":125,"answer_zh":126,"source_url":127},18713,"下载 YouTube 视频时提示 \"Requested format is not available\" 错误，如何处理？","该问题通常是由于内置的下载工具 `yt-dlp` 版本过旧导致的。新版本软件已经更新了 `yt-dlp` 包，升级软件到最新版本即可解决此问题。","https:\u002F\u002Fgithub.com\u002FWEIFENG2333\u002FVideoCaptioner\u002Fissues\u002F199",{"id":129,"question_zh":130,"answer_zh":131,"source_url":132},18714,"语音转录第一次生成的字幕有问题，第二次重试时瞬间生成但内容仍是第一次的错误结果，如何清除缓存或重置状态？","这是缓存机制导致的问题。在 1.4 新版本中，软件增加了“缓存一键开关”功能。用户可以通过该功能手动清除缓存或关闭缓存机制，从而强制重新进行转录。","https:\u002F\u002Fgithub.com\u002FWEIFENG2333\u002FVideoCaptioner\u002Fissues\u002F376",{"id":134,"question_zh":135,"answer_zh":136,"source_url":137},18715,"使用 Fast Whisper 模型生成俄语字幕时，即使关闭了单字时间戳选项，生成的字幕依然是逐个单词显示而非整句，如何解决？","针对俄语等特定语言的断句问题，维护者已经在后续版本中进行了优化和修复。如果当前使用的 exe 可执行文件尚未包含此修复，请耐心等待官方发布更新后的安装包。","https:\u002F\u002Fgithub.com\u002FWEIFENG2333\u002FVideoCaptioner\u002Fissues\u002F518",{"id":139,"question_zh":140,"answer_zh":141,"source_url":142},18716,"使用 B 站接口（bcut）进行转录时，日志出现 \"504 Server Error: Gateway Time-out\" 错误，原因是什么？","该错误通常是由于网络连接问题导致的。可能是未开启网络代理，或者当前的网络环境不稳定，导致无法连接到 B 站的音频上传服务。请检查网络设置或尝试开启代理后重试。","https:\u002F\u002Fgithub.com\u002FWEIFENG2333\u002FVideoCaptioner\u002Fissues\u002F319",{"id":144,"question_zh":145,"answer_zh":146,"source_url":147},18717,"批量处理视频时，如果 LLM 翻译服务中途掉线导致部分失败，是否有机制自动切换服务或重试？","目前建议通过配置第三方 API 聚合客户端（如 new-api 或 uni-api）来解决。这些客户端支持配置多个上游服务商并自动轮询，当某个服务商掉线时会自动切换到可用的节点，从而提高批量处理的稳定性。","https:\u002F\u002Fgithub.com\u002FWEIFENG2333\u002FVideoCaptioner\u002Fissues\u002F368",[149,154,159,164,169,174,179,184,189],{"id":150,"version":151,"summary_zh":152,"released_at":153},109187,"v1.4.1","## 变更内容\n* 修复(安全)：升级 esbuild 以修复跨域资源共享 (CORS) 漏洞，由 @WEIFENG2333 在 https:\u002F\u002Fgithub.com\u002FWEIFENG2333\u002FVideoCaptioner\u002Fpull\u002F879 中完成\n* 重构：统一音频输入参数命名，由 @WEIFENG2333 在 https:\u002F\u002Fgithub.com\u002FWEIFENG2333\u002FVideoCaptioner\u002Fpull\u002F887 中完成\n* 删除：移除过时的测试文档和测试文件，由 @WEIFENG2333 在 https:\u002F\u002Fgithub.com\u002FWEIFENG2333\u002FVideoCaptioner\u002Fpull\u002F888 中完成\n* 新功能：支持 macOS 平台上的 WhisperCpp GPU 加速，由 @A1nair 在 https:\u002F\u002Fgithub.com\u002FWEIFENG2333\u002FVideoCaptioner\u002Fpull\u002F910 中完成\n* 新功能：添加圆角背景字幕支持，并优化多项功能，由 @WEIFENG2333 在 https:\u002F\u002Fgithub.com\u002FWEIFENG2333\u002FVideoCaptioner\u002Fpull\u002F954 中完成\n* 修复：修复转录进度条回退问题，由 @WEIFENG2333 在 https:\u002F\u002Fgithub.com\u002FWEIFENG2333\u002FVideoCaptioner\u002Fpull\u002F955 中完成\n* UI：改进批量处理和合成界面，由 @WEIFENG2333 在 https:\u002F\u002Fgithub.com\u002FWEIFENG2333\u002FVideoCaptioner\u002Fpull\u002F978 中完成\n* 新功能：增强 LLM 日志记录和配置选项，由 @WEIFENG2333 在 https:\u002F\u002Fgithub.com\u002FWEIFENG2333\u002FVideoCaptioner\u002Fpull\u002F979 中完成\n* 新功能：改进 LLM 日志界面，并优化翻译提示，由 @claude 协助 @WEIFENG2333 在 https:\u002F\u002Fgithub.com\u002FWEIFENG2333\u002FVideoCaptioner\u002Fpull\u002F980 中完成\n* 新功能：ASR 语言支持自动检测，由 @WEIFENG2333 在 https:\u002F\u002Fgithub.com\u002FWEIFENG2333\u002FVideoCaptioner\u002Fpull\u002F992 中完成\n* 新功能：添加命令行接口 (CLI)，重构项目结构，并进行 pip 打包，由 @WEIFENG2333 在 https:\u002F\u002Fgithub.com\u002FWEIFENG2333\u002FVideoCaptioner\u002Fpull\u002F1043 中完成\n* CI：使用 hatch-vcs 自动化版本管理，并添加质量门控，由 @WEIFENG2333 在 https:\u002F\u002Fgithub.com\u002FWEIFENG2333\u002FVideoCaptioner\u002Fpull\u002F1054 中完成\n\n## 新贡献者\n* @A1nair 在 https:\u002F\u002Fgithub.com\u002FWEIFENG2333\u002FVideoCaptioner\u002Fpull\u002F910 中完成了首次贡献\n\n**完整变更日志**：https:\u002F\u002Fgithub.com\u002FWEIFENG2333\u002FVideoCaptioner\u002Fcommits\u002Fv1.4.1","2026-03-28T10:09:46",{"id":155,"version":156,"summary_zh":157,"released_at":158},109188,"v1.3.3","## 🔧 问题修复\n\n1. 优化字幕显示问题\n2. 优化Ollama和LM Studio的显示问题\n3. 添加VideoCaptioner官方API的显示\n4. 修复不能批量转录页面无法使用的问题\n5. 修复无法自定义预览图片的问题\n6. 优化双行字幕的导入问题\n\n下载地址：[https:\u002F\u002Fwwwm.lanzoue.com\u002Fii14G2pdsbej](https:\u002F\u002Fwwwm.lanzoue.com\u002Fii14G2pdsbej)","2025-03-02T16:15:59",{"id":160,"version":161,"summary_zh":162,"released_at":163},109189,"v1.3.2","为了避免一些新手开发者产生混淆，对部分命名进行了优化。\n提供了日志翻译、优化以及分割后的日志。","2025-02-09T06:21:07",{"id":165,"version":166,"summary_zh":167,"released_at":168},109190,"v1.3.1","## 🔧 问题修复\n\n### 翻译功能优化\n- 修复谷歌翻译服务语言选择不正确的问题\n- 修复微软翻译服务准确性问题，提升翻译质量\n\n### 系统兼容性改进\n- 修复在未选择 CUDA 设备时出现的 WinError 报错问题\n- 优化设备选择逻辑，提升程序稳定性\n\n### 字幕处理优化\n- 修复**视频字幕合成失败**的问题\n- 修复 ASS 格式单语字幕内容缺失的问题\n\n## 💡 使用建议\n\n1. 建议所有用户升级到此版本以获得更稳定的体验\n2. 如果您在使用过程中遇到任何问题，欢迎在 GitHub 上提交 Issue\n\n## 📥 下载地址\n\nWindows 用户可以通过以下方式下载：\n\n- [GitHub Release] 下载 `VideoCaptioner-Setup-win64-v1.3.1.exe`\n- 蓝奏云盘：[点击下载](https:\u002F\u002Fwwwm.lanzoue.com\u002FiXtI72n59ysh)\n\n## 🙏 致谢\n\n感谢社区用户的反馈，帮助我们不断改进软件质量！\n\n---\n\n如果您觉得这个项目对您有帮助，欢迎给我们一个 Star ⭐️","2025-02-08T07:54:34",{"id":170,"version":171,"summary_zh":172,"released_at":173},109191,"v1.3.0","经过一段时间的代码重构与优化，我很高兴地宣布 VideoCaptioner v1.3.0 正式发布！\n\n此版本带来了许多改进\n\n### 🚀 核心功能增强\n\n*   **代码架构重构**：对代码进行了完整的重构，优化了整体性能。\n*   **模块分离**：字幕优化与翻译功能分离，您可以更灵活地选择处理选项。\n*   **批量处理**：新增批量处理功能，支持**批量字幕**、**批量转录**、**批量字幕视频合成**。\n*   **UI 优化**：全面优化了 UI 界面与交互细节，带来更便捷的体验。\n\n### 🤖 多种优化与升级\n\n*   **扩展 LLM 支持**：新增对以下 LLM 模型支持，为您提供更多选择：\n    *   SiliconCloud\n    *   DeepSeek\n    *   Ollama\n    *   Gemini\n    *   ChatGLM\n*   **集成多种翻译服务**：\n    *   DeepLx\n    *   Bing\n    *   Google\n    *   LLM\n*   **新增模型支持**：新增 `faster-whisper-large-v3-turbo` 模型支持。\n*   **多种 VAD 方法**：新增多种 VAD（语音活动检测）方法，提高语音识别准确性。\n*   **自定义反思翻译**：支持自定义反思翻译开关，您可以根据需要开启或关闭此功能。\n*   **字幕断句优化**：\n    *   支持语义\u002F句子两种断句模式。\n    *   优化断句、优化、翻译提示词。\n*   缓存机制优化优化字幕、转录缓存机制，提高处理速度。\n*   新增中文字幕自动换行功能，使字幕更美观。\n*   新增竖屏字幕样式。\n*   改进字幕时间轴切换，消除闪烁问题。\n*   新增日志文件打开功能。\n*   新增泰语、德语等语言的字幕优化。\n*   新增多种字幕视频格式支持。\n*   优化输出视频工作目录结构。\n\n### 🐛 Bug 修复与其他改进\n\n*   修复 Whisper API 无法使用问题。\n*   修复部分情况转录错误的问题。\n*   修复诸多其他 Bug...\n\n### 📥 获取方式\n\n您也可以通过以下链接下载 VideoCaptioner v1.3.0：\n\n[蓝奏网盘](https:\u002F\u002Fwwwm.lanzoue.com\u002FixsFn2n14bzc)\n\n### 🙏 感谢\n\n感谢所有为 VideoCaptioner 做出贡献的开发者和用户！\n\n如果您在使用过程中遇到任何问题或有任何建议，请随时在 GitHub 上提出 Issue 或 Pull Request。","2025-02-07T10:40:25",{"id":175,"version":176,"summary_zh":177,"released_at":178},109192,"v1.2.0","2024年12月8日发布更新：\n\n## ✨ 新功能\n\n* 新增 **Faster-whisper 支持**，提供**更高质量**的音频转字幕功能 ` 强烈建议使用！！`\n* 新增 **VAD 语音活动检测**，显著减少字幕幻觉现象\n* 新增**人声分离功能**，可有效去除视频背景噪音\n* 新增开关单词时间戳生成选项\n* 新增关闭视频合成选项\n* 新增字幕最大长度设置\n* 新增字幕末尾标点去除设置\n\n## 🔧 优化改进\n\n* 优化字幕优化和翻译的提示词\n* 优化 LLM 字幕断句逻辑，提升断句准确性\n* 优化音频转换格式一致性\n\n## 🐛 问题修复\n\n* 修复进程泄露问题 (#83)\n* 修复断句时 eng_seg_index 变量错误 (#71)\n* 修复音频转换格式不一致问题 (#104)\n* 修复其他导致闪退的问题 (#78)\n* 移除Cpp不稳定的 Whisper-v3 支持 (#93, #64)\n\n## 📥 下载\n\nWindows 用户可以通过以下方式下载：\n* [GitHub Release] 选择 `VideoCaptioner-Setup-win64-v1.2.0.exe` 进行下载\n* [蓝奏云盘](https:\u002F\u002Fwwwm.lanzoue.com\u002FidzKZ2hjcimb)\n\n## 📝 注意事项\n\n* 本次更新优化了音频处理流程，建议更新到最新版本\n\n感谢各位用户的反馈和建议！","2024-12-07T15:15:25",{"id":180,"version":181,"summary_zh":182,"released_at":183},109193,"v1.1.1","2024年11月24日发布更新：\n\n**临时修复管理员权限不足导致路径创建错误的问题**  \n**修复whisper转录过程错误的问题**\n\n## ✨ 新功能\n- 新增 Whisper-v3 模型支持\n- 新增 Whisper API 调用功能\n- 软件主页支持查看软件相关的日志\n- 支持查看字幕优化和反思翻译的日志\n- 支持双语\u002F单语字幕导出选择 (#15)\n- 支持文稿匹配提示对齐功能 (#47)\n- 支持自定义调节字幕位置 (#23)\n- 支持导入 `cookie.txt` 以绕过 Youtube 验证及下载其他网站高清视频 (#9)\n- 字幕文件名现与视频文件名保持一致 (#7)\n\n## 🐛 问题修复\n- 修复字幕导入时的闪退问题 (#16)\n- 优化字幕断句效果 (#20)\n- 优化视频工作目录的文件排布结构 （#7）\n- 修复检测模型可用性时的闪退问题 (#43)\n- 修复下载模型时非中文路径报错问题 (#13)\n- 修复使用 API 时自动翻译的问题 (#10)\n- 修复软件内一些功能不统一的问题\n- 优化字幕断句的效果\n\n为了后续更新的方便，新版本使用安装包的形式，以往压缩包的版本不再使用，用户可以直接删除之前的版本。（如果不想再次下载模型请先进行备份）\n\n也可以通过蓝奏网盘下载安装包：https:\u002F\u002Fwwwm.lanzoue.com\u002FiR8Tp2g2bzli\n\n","2024-11-24T04:37:29",{"id":185,"version":186,"summary_zh":187,"released_at":188},109194,"v1.1.0","# VideoCaptioner v1.1.0\n\n2024年11月23日发布更新：\n\n## ✨ 新功能\n- 新增 Whisper-v3 模型支持\n- 新增 Whisper API 调用功能\n- 软件主页支持查看软件相关的日志\n- 支持查看字幕优化和反思翻译的日志\n- 支持双语\u002F单语字幕导出选择 (#15)\n- 支持文稿匹配提示对齐功能 (#47)\n- 支持自定义调节字幕位置 (#23)\n- 支持导入 `cookie.txt` 以绕过 Youtube 验证及下载其他网站高清视频 (#9)\n- 字幕文件名现与视频文件名保持一致 (#7)\n\n## 🐛 问题修复\n- 修复字幕导入时的闪退问题 (#16)\n- 优化字幕断句效果 (#20)\n- 优化视频工作目录的文件排布结构 （#7）\n- 修复检测模型可用性时的闪退问题 (#43)\n- 修复下载模型时非中文路径报错问题 (#13)\n- 修复使用 API 时自动翻译的问题 (#10)\n- 修复软件内一些功能不统一的问题\n- 优化字幕断句的效果\n\n为了后续更新的方便，新版本使用安装包的形式，以往压缩包的版本不再使用，用户可以直接删除之前的版本。（如果不想再次下载模型请先进行备份）\n\n也可以通过蓝奏网盘下载安装包：https:\u002F\u002Fwwwm.lanzoue.com\u002FiKMhH2g0se9a\n\n","2024-11-23T14:46:09",{"id":190,"version":191,"summary_zh":192,"released_at":193},109195,"v1.0.0","## 🎉 首个正式版本发布!\n\n✨我们很高兴地发布 VideoCaptioner v1.0.0 版本。这是一款基于大语言模型的智能视频字幕处理助手，支持字幕生成、断句、优化、翻译等全流程处理。\n\n程序中可能还存在一些我没有发现的小BUG，如果遇到欢迎随时提出。\n\n## 📥 下载\n\n- Windows用户: \n  - 下载 `VideoCaptioner-win-v1.0.0.7z`\n  - 解压后运行 `VideoCaptioner.exe`\n\n- MacOS用户:\n  - 请参考项目README进行源码安装\n\n## 📋 使用说明\n\n1. 运行程序后可直接拖拽视频文件进行处理\n2. 可选配置LLM API以获得更好的优化效果\n3. 支持自定义字幕样式和排版方式\n\n\n## 📝 反馈\n\n目前我还要兼顾学业，维护可能会稍缓，但是欢迎如有任何问题或建议，欢迎在GitHub提交 [Issue](https:\u002F\u002Fgithub.com\u002FWEIFENG2333\u002FVideoCaptioner\u002Fissues)。\n\n感谢支持！","2024-11-12T16:40:38"]