[{"data":1,"prerenderedAt":-1},["ShallowReactive",2],{"similar-linyqh--NarratoAI":3,"tool-linyqh--NarratoAI":62},[4,18,26,36,46,54],{"id":5,"name":6,"github_repo":7,"description_zh":8,"stars":9,"difficulty_score":10,"last_commit_at":11,"category_tags":12,"status":17},4358,"openclaw","openclaw\u002Fopenclaw","OpenClaw 是一款专为个人打造的本地化 AI 助手，旨在让你在自己的设备上拥有完全可控的智能伙伴。它打破了传统 AI 助手局限于特定网页或应用的束缚，能够直接接入你日常使用的各类通讯渠道，包括微信、WhatsApp、Telegram、Discord、iMessage 等数十种平台。无论你在哪个聊天软件中发送消息，OpenClaw 都能即时响应，甚至支持在 macOS、iOS 和 Android 设备上进行语音交互，并提供实时的画布渲染功能供你操控。\n\n这款工具主要解决了用户对数据隐私、响应速度以及“始终在线”体验的需求。通过将 AI 部署在本地，用户无需依赖云端服务即可享受快速、私密的智能辅助，真正实现了“你的数据，你做主”。其独特的技术亮点在于强大的网关架构，将控制平面与核心助手分离，确保跨平台通信的流畅性与扩展性。\n\nOpenClaw 非常适合希望构建个性化工作流的技术爱好者、开发者，以及注重隐私保护且不愿被单一生态绑定的普通用户。只要具备基础的终端操作能力（支持 macOS、Linux 及 Windows WSL2），即可通过简单的命令行引导完成部署。如果你渴望拥有一个懂你",349277,3,"2026-04-06T06:32:30",[13,14,15,16],"Agent","开发框架","图像","数据工具","ready",{"id":19,"name":20,"github_repo":21,"description_zh":22,"stars":23,"difficulty_score":10,"last_commit_at":24,"category_tags":25,"status":17},3808,"stable-diffusion-webui","AUTOMATIC1111\u002Fstable-diffusion-webui","stable-diffusion-webui 是一个基于 Gradio 构建的网页版操作界面，旨在让用户能够轻松地在本地运行和使用强大的 Stable Diffusion 图像生成模型。它解决了原始模型依赖命令行、操作门槛高且功能分散的痛点，将复杂的 AI 绘图流程整合进一个直观易用的图形化平台。\n\n无论是希望快速上手的普通创作者、需要精细控制画面细节的设计师，还是想要深入探索模型潜力的开发者与研究人员，都能从中获益。其核心亮点在于极高的功能丰富度：不仅支持文生图、图生图、局部重绘（Inpainting）和外绘（Outpainting）等基础模式，还独创了注意力机制调整、提示词矩阵、负向提示词以及“高清修复”等高级功能。此外，它内置了 GFPGAN 和 CodeFormer 等人脸修复工具，支持多种神经网络放大算法，并允许用户通过插件系统无限扩展能力。即使是显存有限的设备，stable-diffusion-webui 也提供了相应的优化选项，让高质量的 AI 艺术创作变得触手可及。",162132,"2026-04-05T11:01:52",[14,15,13],{"id":27,"name":28,"github_repo":29,"description_zh":30,"stars":31,"difficulty_score":32,"last_commit_at":33,"category_tags":34,"status":17},1381,"everything-claude-code","affaan-m\u002Feverything-claude-code","everything-claude-code 是一套专为 AI 编程助手（如 Claude Code、Codex、Cursor 等）打造的高性能优化系统。它不仅仅是一组配置文件，而是一个经过长期实战打磨的完整框架，旨在解决 AI 代理在实际开发中面临的效率低下、记忆丢失、安全隐患及缺乏持续学习能力等核心痛点。\n\n通过引入技能模块化、直觉增强、记忆持久化机制以及内置的安全扫描功能，everything-claude-code 能显著提升 AI 在复杂任务中的表现，帮助开发者构建更稳定、更智能的生产级 AI 代理。其独特的“研究优先”开发理念和针对 Token 消耗的优化策略，使得模型响应更快、成本更低，同时有效防御潜在的攻击向量。\n\n这套工具特别适合软件开发者、AI 研究人员以及希望深度定制 AI 工作流的技术团队使用。无论您是在构建大型代码库，还是需要 AI 协助进行安全审计与自动化测试，everything-claude-code 都能提供强大的底层支持。作为一个曾荣获 Anthropic 黑客大奖的开源项目，它融合了多语言支持与丰富的实战钩子（hooks），让 AI 真正成长为懂上",160784,2,"2026-04-19T11:32:54",[14,13,35],"语言模型",{"id":37,"name":38,"github_repo":39,"description_zh":40,"stars":41,"difficulty_score":42,"last_commit_at":43,"category_tags":44,"status":17},8272,"opencode","anomalyco\u002Fopencode","OpenCode 是一款开源的 AI 编程助手（Coding Agent），旨在像一位智能搭档一样融入您的开发流程。它不仅仅是一个代码补全插件，而是一个能够理解项目上下文、自主规划任务并执行复杂编码操作的智能体。无论是生成全新功能、重构现有代码，还是排查难以定位的 Bug，OpenCode 都能通过自然语言交互高效完成，显著减少开发者在重复性劳动和上下文切换上的时间消耗。\n\n这款工具专为软件开发者、工程师及技术研究人员设计，特别适合希望利用大模型能力来提升编码效率、加速原型开发或处理遗留代码维护的专业人群。其核心亮点在于完全开源的架构，这意味着用户可以审查代码逻辑、自定义行为策略，甚至私有化部署以保障数据安全，彻底打破了传统闭源 AI 助手的“黑盒”限制。\n\n在技术体验上，OpenCode 提供了灵活的终端界面（Terminal UI）和正在测试中的桌面应用程序，支持 macOS、Windows 及 Linux 全平台。它兼容多种包管理工具，安装便捷，并能无缝集成到现有的开发环境中。无论您是追求极致控制权的资深极客，还是渴望提升产出的独立开发者，OpenCode 都提供了一个透明、可信",144296,1,"2026-04-16T14:50:03",[13,45],"插件",{"id":47,"name":48,"github_repo":49,"description_zh":50,"stars":51,"difficulty_score":32,"last_commit_at":52,"category_tags":53,"status":17},2271,"ComfyUI","Comfy-Org\u002FComfyUI","ComfyUI 是一款功能强大且高度模块化的视觉 AI 引擎，专为设计和执行复杂的 Stable Diffusion 图像生成流程而打造。它摒弃了传统的代码编写模式，采用直观的节点式流程图界面，让用户通过连接不同的功能模块即可构建个性化的生成管线。\n\n这一设计巧妙解决了高级 AI 绘图工作流配置复杂、灵活性不足的痛点。用户无需具备编程背景，也能自由组合模型、调整参数并实时预览效果，轻松实现从基础文生图到多步骤高清修复等各类复杂任务。ComfyUI 拥有极佳的兼容性，不仅支持 Windows、macOS 和 Linux 全平台，还广泛适配 NVIDIA、AMD、Intel 及苹果 Silicon 等多种硬件架构，并率先支持 SDXL、Flux、SD3 等前沿模型。\n\n无论是希望深入探索算法潜力的研究人员和开发者，还是追求极致创作自由度的设计师与资深 AI 绘画爱好者，ComfyUI 都能提供强大的支持。其独特的模块化架构允许社区不断扩展新功能，使其成为当前最灵活、生态最丰富的开源扩散模型工具之一，帮助用户将创意高效转化为现实。",109154,"2026-04-18T11:18:24",[14,15,13],{"id":55,"name":56,"github_repo":57,"description_zh":58,"stars":59,"difficulty_score":32,"last_commit_at":60,"category_tags":61,"status":17},6121,"gemini-cli","google-gemini\u002Fgemini-cli","gemini-cli 是一款由谷歌推出的开源 AI 命令行工具，它将强大的 Gemini 大模型能力直接集成到用户的终端环境中。对于习惯在命令行工作的开发者而言，它提供了一条从输入提示词到获取模型响应的最短路径，无需切换窗口即可享受智能辅助。\n\n这款工具主要解决了开发过程中频繁上下文切换的痛点，让用户能在熟悉的终端界面内直接完成代码理解、生成、调试以及自动化运维任务。无论是查询大型代码库、根据草图生成应用，还是执行复杂的 Git 操作，gemini-cli 都能通过自然语言指令高效处理。\n\n它特别适合广大软件工程师、DevOps 人员及技术研究人员使用。其核心亮点包括支持高达 100 万 token 的超长上下文窗口，具备出色的逻辑推理能力；内置 Google 搜索、文件操作及 Shell 命令执行等实用工具；更独特的是，它支持 MCP（模型上下文协议），允许用户灵活扩展自定义集成，连接如图像生成等外部能力。此外，个人谷歌账号即可享受免费的额度支持，且项目基于 Apache 2.0 协议完全开源，是提升终端工作效率的理想助手。",100752,"2026-04-10T01:20:03",[45,13,15,14],{"id":63,"github_repo":64,"name":65,"description_en":66,"description_zh":67,"ai_summary_zh":67,"readme_en":68,"readme_zh":69,"quickstart_zh":70,"use_case_zh":71,"hero_image_url":72,"owner_login":73,"owner_name":74,"owner_avatar_url":75,"owner_bio":76,"owner_company":77,"owner_location":77,"owner_email":77,"owner_twitter":77,"owner_website":77,"owner_url":78,"languages":79,"stars":100,"forks":101,"last_commit_at":102,"license":103,"difficulty_score":32,"env_os":104,"env_gpu":105,"env_ram":106,"env_deps":107,"category_tags":113,"github_topics":114,"view_count":32,"oss_zip_url":77,"oss_zip_packed_at":77,"status":17,"created_at":121,"updated_at":122,"faqs":123,"releases":163},9768,"linyqh\u002FNarratoAI","NarratoAI","利用AI大模型，一键解说并剪辑视频； Using AI models to automatically provide commentary and edit videos with a single click.","NarratoAI 是一款专为视频创作者打造的一站式 AI 影视解说与自动化剪辑工具。它巧妙结合大语言模型（LLM）与多模态技术，让用户只需一键操作，即可自动完成从视频理解、文案撰写、智能剪辑到配音和字幕生成的全流程。\n\n过去，制作高质量的影视解说视频需要耗费大量时间在写稿、找素材、剪辑和配音上，门槛高且效率低。NarratoAI 彻底解决了这一痛点，将原本繁琐的多步骤工作流自动化，显著降低创作难度并提升产出效率。无论是想快速制作短视频的自媒体人，还是希望批量处理内容的运营团队，都能从中受益。\n\n该工具特别适合内容创作者、短视频博主以及希望探索 AI 视频工作流的开发者使用。其技术亮点在于支持多种主流大模型（如 DeepSeek、Qwen 等），具备先进的视频帧分析与场景理解能力，并创新性地引入了语音克隆功能，让解说声音更具个性化。此外，项目完全开源免费，拥有活跃的社区支持和持续的版本迭代，是当下利用 AI 赋能视频创作的得力助手。","\n\u003Cdiv align=\"center\">\n\u003Ch1 align=\"center\" style=\"font-size: 2cm;\"> NarratoAI 😎📽️ \u003C\u002Fh1>\n\u003Ch3 align=\"center\">一站式 AI 影视解说+自动化剪辑工具🎬🎞️ \u003C\u002Fh3>\n\n\n\u003Ch3>📖 \u003Ca href=\"README-en.md\">English\u003C\u002Fa> | 简体中文 \u003C\u002Fh3>\n\u003Cdiv align=\"center\">\n\n[\u002F\u002F]: # (  \u003Ca href=\"https:\u002F\u002Ftrendshift.io\u002Frepositories\u002F8731\" target=\"_blank\">\u003Cimg src=\"https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002Flinyqh_NarratoAI_readme_4a68feb902da.png\" alt=\"harry0703%2FNarratoAI | Trendshift\" style=\"width: 250px; height: 55px;\" width=\"250\" height=\"55\"\u002F>\u003C\u002Fa>)\n\u003C\u002Fdiv>\n\u003Cbr>\nNarratoAI 是一个自动化影视解说工具，基于LLM实现文案撰写、自动化视频剪辑、配音和字幕生成的一站式流程，助力高效内容创作。\n\u003Cbr>\n\n> **🔥 隆重推荐：VibeCut 的新范式 —— [Speclip](https:\u002F\u002Fspeclip.com) ，一个真正意义上的剪辑 Agent！[👉 点击免费下载](https:\u002F\u002Fspeclip.com)**\n\n[![madewithlove](https:\u002F\u002Fimg.shields.io\u002Fbadge\u002Fmade_with-%E2%9D%A4-red?style=for-the-badge&labelColor=orange)](https:\u002F\u002Fgithub.com\u002Flinyqh\u002FNarratoAI)\n[![GitHub license](https:\u002F\u002Fimg.shields.io\u002Fgithub\u002Flicense\u002Flinyqh\u002FNarratoAI?style=for-the-badge)](https:\u002F\u002Fgithub.com\u002Flinyqh\u002FNarratoAI\u002Fblob\u002Fmain\u002FLICENSE)\n[![GitHub issues](https:\u002F\u002Fimg.shields.io\u002Fgithub\u002Fissues\u002Flinyqh\u002FNarratoAI?style=for-the-badge)](https:\u002F\u002Fgithub.com\u002Flinyqh\u002FNarratoAI\u002Fissues)\n[![GitHub stars](https:\u002F\u002Fimg.shields.io\u002Fgithub\u002Fstars\u002Flinyqh\u002FNarratoAI?style=for-the-badge)](https:\u002F\u002Fgithub.com\u002Flinyqh\u002FNarratoAI\u002Fstargazers)\n\n\u003Ca href=\"https:\u002F\u002Fdiscord.com\u002Finvite\u002FV2pbAqqQNb\" target=\"_blank\">💬 加入 discord 开源社区，获取项目动态和最新资讯。\u003C\u002Fa>\n\n\u003Ch2>\u003Ca href=\"https:\u002F\u002Fp9mf6rjv3c.feishu.cn\u002Fwiki\u002FSP8swLLZki5WRWkhuFvc2CyInDg?from=from_copylink\" target=\"_blank\">🎉🎉🎉 官方文档 🎉🎉🎉\u003C\u002Fa> \u003C\u002Fh2>\n\u003Ch3>首页\u003C\u002Fh3>\n\n![](https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002Flinyqh_NarratoAI_readme_3c67c9d23c5e.png)\n\n\u003C\u002Fdiv>\n\n## 许可证\n本项目仅供学习和研究使用，不得商用。如需商业授权，请联系作者。\n\n## 最新资讯\n- 2026.04.03 发布新版本 0.7.8，重构纪录片逐帧分析链路，统一共享服务并优化抽帧、缓存、视觉并发与文案生成流程\n- 2026.03.27 发布新版本 0.7.7，出于安全考虑，已移除 LiteLLM 依赖，统一使用 OpenAI 兼容请求链路\n- 2025.11.20 发布新版本 0.7.5，新增 [IndexTTS2](https:\u002F\u002Fgithub.com\u002Findex-tts\u002Findex-tts) 语音克隆支持\n- 2025.10.15 发布新版本 0.7.3，升级大模型供应商管理能力\n- 2025.09.10 发布新版本 0.7.2，新增腾讯云tts\n- 2025.08.18 发布新版本 0.7.1，支持 **语音克隆** 和 最新大模型\n- 2025.05.11 发布新版本 0.6.0，支持 **短剧解说** 和 优化剪辑流程\n- 2025.03.06 发布新版本 0.5.2，支持 DeepSeek R1 和 DeepSeek V3 模型进行短剧混剪\n- 2024.12.16 发布新版本 0.3.9，支持阿里 Qwen2-VL 模型理解视频；支持短剧混剪\n- 2024.11.24 开通 discord 社群：https:\u002F\u002Fdiscord.com\u002Finvite\u002FV2pbAqqQNb\n- 2024.11.11 迁移开源社群，欢迎加入！ [加入官方社群](https:\u002F\u002Fgithub.com\u002Flinyqh\u002FNarratoAI\u002Fwiki)\n- 2024.11.10 发布官方文档，详情参见 [官方文档](https:\u002F\u002Fp9mf6rjv3c.feishu.cn\u002Fwiki\u002FSP8swLLZki5WRWkhuFvc2CyInDg)\n- 2024.11.10 发布新版本 v0.3.5；优化视频剪辑流程，\n\n## 重磅福利 🎉\n> 1️⃣\n> **开发者专属福利：一站式AI平台，注册即送体验金！**\n>\n> 还在为接入各种AI模型烦恼吗？向您推荐 302.AI，一个企业级的AI资源中心。一次接入，即可调用上百种AI模型，涵盖语言、图像、音视频等，按量付费，极大降低开发成本。\n>\n> 通过下方我的专属链接注册，**立获1美元免费体验金**，助您轻松开启AI开发之旅。\n>\n> **立即注册领取：** [https:\u002F\u002Fshare.302.ai\u002FI9P6mP](https:\u002F\u002Fshare.302.ai\u002FI9P6mP)\n\n---\n> 2️⃣\n> 即日起全面支持硅基流动！注册即享2000万免费Token（价值16元平台配额），剪辑10分钟视频仅需0.1元！  \n> \n> 🔥 快速领福利：  \n> 1️⃣ 点击链接注册：https:\u002F\u002Fcloud.siliconflow.cn\u002Fi\u002FMI9PgHwB  \n> 2️⃣ 使用手机号登录，**务必填写邀请码：MI9PgHwB**  \n> 3️⃣ 领取16元配额，极速体验高性价比AI剪辑  \n> \n> 💡 小成本大创作：  \n> 硅基流动API Key一键接入，智能剪辑效率翻倍！  \n> （注：邀请码为福利领取唯一凭证，注册后自动到账）  \n> \n> 立即行动，用「MI9PgHwB」解锁你的AI生产力！\n\n\n## ⚠️谨防被骗 📢\n\n_**1. NarratoAI 是一款完全免费的软件，近期在社交媒体(抖音,B站等)上发现，有人将 NarratoAI 改名后售卖，下面是部分截图，请大家务必提高警惕，切勿上当受骗**_\n\n---\n\n\u003Cdiv style=\"display: flex; flex-wrap: wrap; justify-content: space-around; align-items: flex-start; gap: 10px;\">\n  \u003Cimg src=\"https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002Flinyqh_NarratoAI_readme_e4a32aba1a4e.png\" alt=\"诈骗截图 1\" style=\"width: 23%; max-width: 250px; height: auto; border: 1px solid #ddd; border-radius: 5px; box-shadow: 2px 2px 8px rgba(0,0,0,0.1);\">\n  \u003Cimg src=\"https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002Flinyqh_NarratoAI_readme_799ca1b7d0a7.png\" alt=\"诈骗截图 2\" style=\"width: 23%; max-width: 250px; height: auto; border: 1px solid #ddd; border-radius: 5px; box-shadow: 2px 2px 8px rgba(0,0,0,0.1);\">\n  \u003Cimg src=\"https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002Flinyqh_NarratoAI_readme_7c42e330b84a.png\" alt=\"诈骗截图 3\" style=\"width: 23%; max-width: 250px; height: auto; border: 1px solid #ddd; border-radius: 5px; box-shadow: 2px 2px 8px rgba(0,0,0,0.1);\">\n  \u003Cimg src=\"https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002Flinyqh_NarratoAI_readme_91bfbc507171.png\" alt=\"诈骗截图 4\" style=\"width: 23%; max-width: 250px; height: auto; border: 1px solid #ddd; border-radius: 5px; box-shadow: 2px 2px 8px rgba(0,0,0,0.1);\">\n\u003C\u002Fdiv>\n\n---\n\n## 未来计划 🥳\n- [x] windows 整合包发布\n- [x] 优化剧情生成流程，提升生成效果\n- [x] 发布 0.3.5 整合包\n- [x] 支持阿里 Qwen2-VL 大模型理解视频\n- [x] 支持短剧混剪\n  - [x] 一键合并素材\n  - [x] 一键转录\n  - [x] 一键清理缓存\n- [ ] 支持导出剪映草稿\n- [X] 支持短剧解说\n- [ ] 主角人脸匹配\n- [ ] 支持根据口播，文案，视频素材自动匹配\n- [ ] 支持更多 TTS 引擎\n- [ ] ...\n\n## 快速启动 🚀\n\n### 方式一：macos Docker 部署（macos 推荐）\n```bash\n# 1. 克隆项目\ngit clone https:\u002F\u002Fgithub.com\u002Flinyqh\u002FNarratoAI.git\ncd NarratoAI\n\n# 2. 一键部署\ndocker compose up -d\n\n# 3. 访问应用\n# 浏览器打开 http:\u002F\u002Flocalhost:8501\n```\n### 方式二：整合包（Windows 推荐）\n> *关注微信公众号 **NarratoAI 助手** 右下角菜单栏获取下载链接*\n\n### 方式三：本地运行\n```bash\n# 1. 克隆项目\ngit clone https:\u002F\u002Fgithub.com\u002Flinyqh\u002FNarratoAI.git\ncd NarratoAI\n\n# 2. 安装依赖\npip install -r requirements.txt\n\n# 3. 复制配置文件\ncp config.example.toml config.toml\n\n# 4. 编辑 config.toml，配置你的 API 密钥\n\n# 5. 启动应用\nstreamlit run webui.py --server.maxUploadSize=2048\n\n# 6. 访问应用\n# 浏览器打开 http:\u002F\u002Flocalhost:8501\n```\n\n## 配置要求 📦\n\n- 建议最低 CPU 4核或以上，内存 8G 或以上，显卡非必须\n- Windows 10\u002F11 或 MacOS 11.0 以上系统\n- [Python 3.12+](https:\u002F\u002Fwww.python.org\u002Fdownloads\u002F)\n\n## 反馈建议 📢\n\n👏 1. 可以提交 [issue](https:\u002F\u002Fgithub.com\u002Flinyqh\u002FNarratoAI\u002Fissues)或者 [pull request](https:\u002F\u002Fgithub.com\u002Flinyqh\u002FNarratoAI\u002Fpulls)\n\n💬 2. [加入开源社区交流群](https:\u002F\u002Fgithub.com\u002Flinyqh\u002FNarratoAI\u002Fwiki)\n\n📷 3. 关注公众号【NarratoAI助手】，掌握最新资讯\n\n## 参考项目 📚\n- https:\u002F\u002Fgithub.com\u002FFujiwaraChoki\u002FMoneyPrinter\n- https:\u002F\u002Fgithub.com\u002Fharry0703\u002FMoneyPrinterTurbo\n\n该项目基于以上项目重构而来，增加了影视解说功能，感谢大佬的开源精神 🥳🥳🥳 \n\n## 请作者喝一杯咖啡 ☕️\n\u003Cdiv style=\"display: flex; justify-content: space-between;\">\n  \u003Cimg src=\"https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002Flinyqh_NarratoAI_readme_6ee169b96ed4.png\" alt=\"Image 1\" style=\"width: 350px; height: 350px; margin: auto;\"\u002F>\n  \u003Cimg src=\"https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002Flinyqh_NarratoAI_readme_6410e054e5b7.png\" alt=\"Image 2\" style=\"width: 350px; height: 350px; margin: auto;\"\u002F>\n\u003C\u002Fdiv>\n\n## 赞助\n[![Powered by DartNode](https:\u002F\u002Fdartnode.com\u002Fbranding\u002FDN-Open-Source-sm.png)](https:\u002F\u002Fdartnode.com \"Powered by DartNode - Free VPS for Open Source\")\n\n## 许可证 📝\n\n点击查看 [`LICENSE`](LICENSE) 文件\n\n## Star History\n\n[![Star History Chart](https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002Flinyqh_NarratoAI_readme_5c2565433f72.png)](https:\u002F\u002Fstar-history.com\u002F#linyqh\u002FNarratoAI&Date)\n","\u003Cdiv align=\"center\">\n\u003Ch1 align=\"center\" style=\"font-size: 2cm;\"> NarratoAI 😎📽️ \u003C\u002Fh1>\n\u003Ch3 align=\"center\">一站式 AI 影视解说+自动化剪辑工具🎬🎞️ \u003C\u002Fh3>\n\n\n\u003Ch3>📖 \u003Ca href=\"README-en.md\">English\u003C\u002Fa> | 简体中文 \u003C\u002Fh3>\n\u003Cdiv align=\"center\">\n\n[\u002F\u002F]: # (  \u003Ca href=\"https:\u002F\u002Ftrendshift.io\u002Frepositories\u002F8731\" target=\"_blank\">\u003Cimg src=\"https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002Flinyqh_NarratoAI_readme_4a68feb902da.png\" alt=\"harry0703%2FNarratoAI | Trendshift\" style=\"width: 250px; height: 55px;\" width=\"250\" height=\"55\"\u002F>\u003C\u002Fa>)\n\u003C\u002Fdiv>\n\u003Cbr>\nNarratoAI 是一个自动化影视解说工具，基于LLM实现文案撰写、自动化视频剪辑、配音和字幕生成的一站式流程，助力高效内容创作。\n\u003Cbr>\n\n> **🔥 隆重推荐：VibeCut 的新范式 —— [Speclip](https:\u002F\u002Fspeclip.com) ，一个真正意义上的剪辑 Agent！[👉 点击免费下载](https:\u002F\u002Fspeclip.com)**\n\n[![madewithlove](https:\u002F\u002Fimg.shields.io\u002Fbadge\u002Fmade_with-%E2%9D%A4-red?style=for-the-badge&labelColor=orange)](https:\u002F\u002Fgithub.com\u002Flinyqh\u002FNarratoAI)\n[![GitHub license](https:\u002F\u002Fimg.shields.io\u002Fgithub\u002Flicense\u002Flinyqh\u002FNarratoAI?style=for-the-badge)](https:\u002F\u002Fgithub.com\u002Flinyqh\u002FNarratoAI\u002Fblob\u002Fmain\u002FLICENSE)\n[![GitHub issues](https:\u002F\u002Fimg.shields.io\u002Fgithub\u002Fissues\u002Flinyqh\u002FNarratoAI?style=for-the-badge)](https:\u002F\u002Fgithub.com\u002Flinyqh\u002FNarratoAI\u002Fissues)\n[![GitHub stars](https:\u002F\u002Fimg.shields.io\u002Fgithub\u002Fstars\u002Flinyqh\u002FNarratoAI?style=for-the-badge)](https:\u002F\u002Fgithub.com\u002Flinyqh\u002FNarratoAI\u002Fstargazers)\n\n\u003Ca href=\"https:\u002F\u002Fdiscord.com\u002Finvite\u002FV2pbAqqQNb\" target=\"_blank\">💬 加入 discord 开源社区，获取项目动态和最新资讯。\u003C\u002Fa>\n\n\u003Ch2>\u003Ca href=\"https:\u002F\u002Fp9mf6rjv3c.feishu.cn\u002Fwiki\u002FSP8swLLZki5WRWkhuFvc2CyInDg?from=from_copylink\" target=\"_blank\">🎉🎉🎉 官方文档 🎉🎉🎉\u003C\u002Fa> \u003C\u002Fh2>\n\u003Ch3>首页\u003C\u002Fh3>\n\n![](https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002Flinyqh_NarratoAI_readme_3c67c9d23c5e.png)\n\n\u003C\u002Fdiv>\n\n## 许可证\n本项目仅供学习和研究使用，不得商用。如需商业授权，请联系作者。\n\n## 最新资讯\n- 2026.04.03 发布新版本 0.7.8，重构纪录片逐帧分析链路，统一共享服务并优化抽帧、缓存、视觉并发与文案生成流程\n- 2026.03.27 发布新版本 0.7.7，出于安全考虑，已移除 LiteLLM 依赖，统一使用 OpenAI 兼容请求链路\n- 2025.11.20 发布新版本 0.7.5，新增 [IndexTTS2](https:\u002F\u002Fgithub.com\u002Findex-tts\u002Findex-tts) 语音克隆支持\n- 2025.10.15 发布新版本 0.7.3，升级大模型供应商管理能力\n- 2025.09.10 发布新版本 0.7.2，新增腾讯云tts\n- 2025.08.18 发布新版本 0.7.1，支持 **语音克隆** 和 最新大模型\n- 2025.05.11 发布新版本 0.6.0，支持 **短剧解说** 和 优化剪辑流程\n- 2025.03.06 发布新版本 0.5.2，支持 DeepSeek R1 和 DeepSeek V3 模型进行短剧混剪\n- 2024.12.16 发布新版本 0.3.9，支持阿里 Qwen2-VL 模型理解视频；支持短剧混剪\n- 2024.11.24 开通 discord 社群：https:\u002F\u002Fdiscord.com\u002Finvite\u002FV2pbAqqQNb\n- 2024.11.11 迁移开源社群，欢迎加入！ [加入官方社群](https:\u002F\u002Fgithub.com\u002Flinyqh\u002FNarratoAI\u002Fwiki)\n- 2024.11.10 发布官方文档，详情参见 [官方文档](https:\u002F\u002Fp9mf6rjv3c.feishu.cn\u002Fwiki\u002FSP8swLLZki5WRWkhuFvc2CyInDg)\n- 2024.11.10 发布新版本 v0.3.5；优化视频剪辑流程，\n\n## 重磅福利 🎉\n> 1️⃣\n> **开发者专属福利：一站式AI平台，注册即送体验金！**\n>\n> 还在为接入各种AI模型烦恼吗？向您推荐 302.AI，一个企业级的AI资源中心。一次接入，即可调用上百种AI模型，涵盖语言、图像、音视频等，按量付费，极大降低开发成本。\n>\n> 通过下方我的专属链接注册，**立获1美元免费体验金**，助您轻松开启AI开发之旅。\n>\n> **立即注册领取：** [https:\u002F\u002Fshare.302.ai\u002FI9P6mP](https:\u002F\u002Fshare.302.ai\u002FI9P6mP)\n\n---\n> 2️⃣\n> 即日起全面支持硅基流动！注册即享2000万免费Token（价值16元平台配额），剪辑10分钟视频仅需0.1元！  \n> \n> 🔥 快速领福利：  \n> 1️⃣ 点击链接注册：https:\u002F\u002Fcloud.siliconflow.cn\u002Fi\u002FMI9PgHwB  \n> 2️⃣ 使用手机号登录，**务必填写邀请码：MI9PgHwB**  \n> 3️⃣ 领取16元配额，极速体验高性价比AI剪辑  \n> \n> 💡 小成本大创作：  \n> 硅基流动API Key一键接入，智能剪辑效率翻倍！  \n> （注：邀请码为福利领取唯一凭证，注册后自动到账）  \n> \n> 立即行动，用「MI9PgHwB」解锁你的AI生产力！\n\n\n## ⚠️谨防被骗 📢\n\n_**1. NarratoAI 是一款完全免费的软件，近期在社交媒体(抖音,B站等)上发现，有人将 NarratoAI 改名后售卖，下面是部分截图，请大家务必提高警惕，切勿上当受骗**_\n\n---\n\n\u003Cdiv style=\"display: flex; flex-wrap: wrap; justify-content: space-around; align-items: flex-start; gap: 10px;\">\n  \u003Cimg src=\"https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002Flinyqh_NarratoAI_readme_e4a32aba1a4e.png\" alt=\"诈骗截图 1\" style=\"width: 23%; max-width: 250px; height: auto; border: 1px solid #ddd; border-radius: 5px; box-shadow: 2px 2px 8px rgba(0,0,0,0.1);\">\n  \u003Cimg src=\"https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002Flinyqh_NarratoAI_readme_799ca1b7d0a7.png\" alt=\"诈骗截图 2\" style=\"width: 23%; max-width: 250px; height: auto; border: 1px solid #ddd; border-radius: 5px; box-shadow: 2px 2px 8px rgba(0,0,0,0.1);\">\n  \u003Cimg src=\"https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002Flinyqh_NarratoAI_readme_7c42e330b84a.png\" alt=\"诈骗截图 3\" style=\"width: 23%; max-width: 250px; height: auto; border: 1px solid #ddd; border-radius: 5px; box-shadow: 2px 2px 8px rgba(0,0,0,0.1);\">\n  \u003Cimg src=\"https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002Flinyqh_NarratoAI_readme_91bfbc507171.png\" alt=\"诈骗截图 4\" style=\"width: 23%; max-width: 250px; height: auto; border: 1px solid #ddd; border-radius: 5px; box-shadow: 2px 2px 8px rgba(0,0,0,0.1);\">\n\u003C\u002Fdiv>\n\n---\n\n## 未来计划 🥳\n- [x] windows 整合包发布\n- [x] 优化剧情生成流程，提升生成效果\n- [x] 发布 0.3.5 整合包\n- [x] 支持阿里 Qwen2-VL 大模型理解视频\n- [x] 支持短剧混剪\n  - [x] 一键合并素材\n  - [x] 一键转录\n  - [x] 一键清理缓存\n- [ ] 支持导出剪映草稿\n- [X] 支持短剧解说\n- [ ] 主角人脸匹配\n- [ ] 支持根据口播，文案，视频素材自动匹配\n- [ ] 支持更多 TTS 引擎\n- [ ] ...\n\n## 快速启动 🚀\n\n### 方式一：macos Docker 部署（macos 推荐）\n```bash\n# 1. 克隆项目\ngit clone https:\u002F\u002Fgithub.com\u002Flinyqh\u002FNarratoAI.git\ncd NarratoAI\n\n# 2. 一键部署\ndocker compose up -d\n\n# 3. 访问应用\n# 浏览器打开 http:\u002F\u002Flocalhost:8501\n```\n### 方式二：整合包（Windows 推荐）\n> *关注微信公众号 **NarratoAI 助手** 右下角菜单栏获取下载链接*\n\n### 方式三：本地运行\n```bash\n# 1. 克隆项目\ngit clone https:\u002F\u002Fgithub.com\u002Flinyqh\u002FNarratoAI.git\ncd NarratoAI\n\n# 2. 安装依赖\npip install -r requirements.txt\n\n# 3. 复制配置文件\ncp config.example.toml config.toml\n\n# 4. 编辑 config.toml，配置你的 API 密钥\n\n# 5. 启动应用\nstreamlit run webui.py --server.maxUploadSize=2048\n\n# 6. 访问应用\n# 浏览器打开 http:\u002F\u002Flocalhost:8501\n```\n\n## 配置要求 📦\n\n- 建议最低 CPU 4核或以上，内存 8G 或以上，显卡非必须\n- Windows 10\u002F11 或 MacOS 11.0 以上系统\n- [Python 3.12+](https:\u002F\u002Fwww.python.org\u002Fdownloads\u002F)\n\n## 反馈建议 📢\n\n👏 1. 可以提交 [issue](https:\u002F\u002Fgithub.com\u002Flinyqh\u002FNarratoAI\u002Fissues)或者 [pull request](https:\u002F\u002Fgithub.com\u002Flinyqh\u002FNarratoAI\u002Fpulls)\n\n💬 2. [加入开源社区交流群](https:\u002F\u002Fgithub.com\u002Flinyqh\u002FNarratoAI\u002Fwiki)\n\n📷 3. 关注公众号【NarratoAI助手】，掌握最新资讯\n\n## 参考项目 📚\n- https:\u002F\u002Fgithub.com\u002FFujiwaraChoki\u002FMoneyPrinter\n- https:\u002F\u002Fgithub.com\u002Fharry0703\u002FMoneyPrinterTurbo\n\n该项目基于以上项目重构而来，增加了影视解说功能，感谢大佬的开源精神 🥳🥳🥳 \n\n## 请作者喝一杯咖啡 ☕️\n\u003Cdiv style=\"display: flex; justify-content: space-between;\">\n  \u003Cimg src=\"https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002Flinyqh_NarratoAI_readme_6ee169b96ed4.png\" alt=\"Image 1\" style=\"width: 350px; height: 350px; margin: auto;\"\u002F>\n  \u003Cimg src=\"https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002Flinyqh_NarratoAI_readme_6410e054e5b7.png\" alt=\"Image 2\" style=\"width: 350px; height: 350px; margin: auto;\"\u002F>\n\u003C\u002Fdiv>\n\n## 赞助\n[![Powered by DartNode](https:\u002F\u002Fdartnode.com\u002Fbranding\u002FDN-Open-Source-sm.png)](https:\u002F\u002Fdartnode.com \"Powered by DartNode - Free VPS for Open Source\")\n\n## 许可证 📝\n\n点击查看 [`LICENSE`](LICENSE) 文件\n\n## Star History\n\n[![Star History Chart](https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002Flinyqh_NarratoAI_readme_5c2565433f72.png)](https:\u002F\u002Fstar-history.com\u002F#linyqh\u002FNarratoAI&Date)","# NarratoAI 快速上手指南\n\nNarratoAI 是一款一站式 AI 影视解说与自动化剪辑工具，基于大语言模型（LLM）实现文案撰写、视频剪辑、配音及字幕生成的全流程自动化。\n\n## 环境准备\n\n在开始之前，请确保您的开发环境满足以下要求：\n\n*   **操作系统**：\n    *   Windows 10\u002F11\n    *   MacOS 11.0 及以上\n    *   Linux (支持 Docker 环境)\n*   **硬件配置**：\n    *   CPU：4 核或以上\n    *   内存：8GB 或以上\n    *   显卡：非必须（可选加速）\n*   **软件依赖**：\n    *   [Python 3.12+](https:\u002F\u002Fwww.python.org\u002Fdownloads\u002F)\n    *   Git\n    *   Docker & Docker Compose (仅 Docker 部署方式需要)\n\n## 安装步骤\n\n您可以根据操作系统选择以下任意一种方式进行安装：\n\n### 方式一：Docker 部署（推荐 MacOS\u002FLinux 用户）\n\n此方式环境隔离性好，配置最简单。\n\n```bash\n# 1. 克隆项目\ngit clone https:\u002F\u002Fgithub.com\u002Flinyqh\u002FNarratoAI.git\ncd NarratoAI\n\n# 2. 一键启动服务\ndocker compose up -d\n\n# 3. 访问应用\n# 浏览器打开 http:\u002F\u002Flocalhost:8501\n```\n\n### 方式二：本地源码运行（推荐 Windows 用户）\n\n```bash\n# 1. 克隆项目\ngit clone https:\u002F\u002Fgithub.com\u002Flinyqh\u002FNarratoAI.git\ncd NarratoAI\n\n# 2. 安装 Python 依赖\npip install -r requirements.txt\n\n# 3. 初始化配置文件\ncp config.example.toml config.toml\n\n# 4. 编辑配置\n# 使用文本编辑器打开 config.toml，填入您的 LLM API Key 和 TTS 配置\n\n# 5. 启动应用\nstreamlit run webui.py --server.maxUploadSize=2048\n\n# 6. 访问应用\n# 浏览器打开 http:\u002F\u002Flocalhost:8501\n```\n\n### 方式三：Windows 整合包\n\n对于不熟悉命令行操作的 Windows 用户，可关注微信公众号 **\"NarratoAI 助手\"**，在右下角菜单栏获取官方发布的最新整合包下载链接，解压即可运行。\n\n## 基本使用\n\n启动成功后，在浏览器访问 `http:\u002F\u002Flocalhost:8501` 即可进入操作界面。\n\n1.  **配置模型**：\n    在侧边栏或设置页面，确保已正确填写大模型（如 DeepSeek, Qwen, GPT-4 等）和语音合成（TTS）的 API 密钥。\n    > 💡 **提示**：项目支持硅基流动、302.AI 等国内聚合平台，可降低接入成本。\n\n2.  **上传素材**：\n    点击首页上传按钮，选择需要解说的影视视频文件或短剧片段。\n\n3.  **生成解说**：\n    *   选择生成模式（如：影视解说、短剧混剪）。\n    *   调整文案风格、视频时长等参数。\n    *   点击“开始生成”，系统将自动执行：视频理解 -> 文案创作 -> 语音合成 -> 智能剪辑 -> 字幕添加。\n\n4.  **导出视频**：\n    任务完成后，预览生成结果，支持直接下载最终的视频文件。\n\n---\n**注意**：本项目仅供学习和研究使用，严禁用于商业售卖。请勿轻信社交媒体上收费售卖该软件的行為。","某影视自媒体创作者急需将一部 90 分钟的纪录片快速转化为适合短视频平台传播的 5 分钟解说视频，以抢占热点流量。\n\n### 没有 NarratoAI 时\n- **文案创作耗时**：需人工反复观看素材提炼核心观点，撰写几千字解说稿往往耗费数小时甚至一整天。\n- **剪辑流程繁琐**：要在长达 90 分钟的时间轴上手动定位精彩片段、裁剪画面并重新排序，操作极其枯燥且容易出错。\n- **配音字幕分离**：需要单独寻找配音员或使用其他 TTS 工具生成音频，再手动对齐字幕时间轴，多软件切换效率低下。\n- **迭代成本高昂**：若对解说词或剪辑节奏不满意，修改一处往往牵动全身，重新调整整个工程文件令人崩溃。\n- **产能瓶颈明显**：受限于人力，每天仅能勉强产出一条视频，难以矩阵化运营或快速响应突发热点。\n\n### 使用 NarratoAI 后\n- **一键生成文案**：NarratoAI 利用大模型自动分析视频内容，几分钟内即可输出逻辑清晰、风格生动的解说文案。\n- **自动化智能剪辑**：工具根据文案自动匹配并裁剪对应视频片段，瞬间完成从原始素材到成片的粗剪与精剪。\n- **全流程一体化**：NarratoAI 同步完成高质量语音克隆配音与字幕生成，无需任何外部工具，真正实现“输入视频，输出成片”。\n- **灵活快速迭代**：只需修改提示词或调整文案，NarratoAI 即可自动重新生成视频，试错与优化成本几乎为零。\n- **产能爆发式增长**：原本一天一条的视频产量提升至一天十条，让创作者能轻松覆盖多个账号或尝试不同叙事风格。\n\nNarratoAI 将原本需要数人协作一整天的影视解说制作流程，压缩为单人一键操作的分钟级任务，彻底重塑了短视频内容的生产效率。","https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002Flinyqh_NarratoAI_3c67c9d2.png","linyqh","viccy","https:\u002F\u002Foss.gittoolsai.com\u002Favatars\u002Flinyqh_2b653a74.jpg","一名热衷于( MLOps \u002F LLMOps \u002F AI-Agent)技术应用落地的AI产品研发工程师, 邮箱：linyqemail@163.com",null,"https:\u002F\u002Fgithub.com\u002Flinyqh",[80,84,88,92,96],{"name":81,"color":82,"percentage":83},"Python","#3572A5",98.7,{"name":85,"color":86,"percentage":87},"Shell","#89e051",0.8,{"name":89,"color":90,"percentage":91},"Dockerfile","#384d54",0.3,{"name":93,"color":94,"percentage":95},"Makefile","#427819",0.2,{"name":97,"color":98,"percentage":99},"HTML","#e34c26",0.1,8852,1189,"2026-04-19T10:13:02","NOASSERTION","Windows, macOS","非必须","最低 8GB",{"notes":108,"python":109,"dependencies":110},"支持通过 Docker 在 macOS 上部署，Windows 用户推荐使用整合包。项目依赖外部 API（如大模型、TTS），需在配置文件中设置 API 密钥。显卡非运行必需项，主要依靠 CPU 及云端 API 完成计算任务。","3.12+",[111,112],"streamlit","requirements.txt 中列出的依赖",[45,13,14,35],[115,116,117,118,119,120],"aiagent","aiops","llm","gemini-api","moviepy","python","2026-03-27T02:49:30.150509","2026-04-20T04:06:10.454608",[124,129,134,139,144,149,154,159],{"id":125,"question_zh":126,"answer_zh":127,"source_url":128},43859,"上传视频至 Google Cloud 失败，报错 TimeoutError 或 Connection refused 怎么办？","该错误通常由网络环境问题或 API Key 配置不当引起。请执行以下排查步骤：\n1. 检查 VPN 配置：确保全局代理已开启，且节点稳定，能够访问 Google 服务。\n2. 验证 API Key：确认 Gemini API Key 有效且未过期。\n3. 检查 Google Cloud 存储桶：部分用户反馈需要开通 Google Cloud 服务并绑定信用卡才能使用文件上传功能（Bucket），即使普通账号有时也会受限。\n4. 参考官方故障排查文档：https:\u002F\u002Fthread-marsupial-df8.notion.site\u002F105866888dab80988650fa063b1df4eb","https:\u002F\u002Fgithub.com\u002Flinyqh\u002FNarratoAI\u002Fissues\u002F21",{"id":130,"question_zh":131,"answer_zh":132,"source_url":133},43860,"视频上传成功但一直卡在 PROCESSING 状态，无法生成脚本怎么办？","这通常是因为视频时长超过了当前模型的处理限制。解决方案如下：\n1. 如果视频超过 10 分钟，建议将模型切换为 `gemini-1.5-pro`。\n2. 虽然官方宣称 `gemini-1.5-flash` 支持长达 1 小时的视频，但在实际使用中，过长的视频文件使用该模型容易报 500 错误或一直卡在 PROCESSING 状态。\n3. 尝试剪辑缩短视频长度后重新上传测试。","https:\u002F\u002Fgithub.com\u002Flinyqh\u002FNarratoAI\u002Fissues\u002F19",{"id":135,"question_zh":136,"answer_zh":137,"source_url":138},43861,"Windows 环境下运行时报错 'Could not locate cudnn_ops_infer64_8.dll' 如何解决？","这是缺少 CUDA\u002FcuDNN 依赖库导致的，即使配置为 CPU 模式，某些组件（如 faster-whisper）仍可能尝试加载 CUDA。请按以下步骤修复：\n1. 下载对应的 cuBLAS 和 cuDNN 库文件：访问 https:\u002F\u002Fgithub.com\u002FPurfview\u002Fwhisper-standalone-win\u002Freleases\u002Ftag\u002Flibs 下载 \"cuBLAS.and.cuDNN_CUDA11_win_v2.7z\"（或其他对应版本）。\n2. 解压后找到 `cudnn_ops_infer64_8.dll` 等文件。\n3. 将这些文件复制到 Python 环境的 torch 库目录中，通常路径为：`path\\lib\\python\\Lib\\site-packages\\torch\\lib`。\n4. 重启程序再次尝试。","https:\u002F\u002Fgithub.com\u002Flinyqh\u002FNarratoAI\u002Fissues\u002F77",{"id":140,"question_zh":141,"answer_zh":142,"source_url":143},43862,"项目是否有微信群或交流群可以加入？","目前项目不提供微信群。官方推荐的交流渠道有两个：\n1. Discord 社群\n2. 腾讯频道\n具体的加入链接和邀请码请查看项目 Wiki 页面：https:\u002F\u002Fgithub.com\u002Flinyqh\u002FNarratoAI\u002Fwiki（请注意链接可能会更新，以 Wiki 最新内容为准）。","https:\u002F\u002Fgithub.com\u002Flinyqh\u002FNarratoAI\u002Fissues\u002F23",{"id":145,"question_zh":146,"answer_zh":147,"source_url":148},43863,"如何在 NarratoAI 中使用本地的 Ollama 模型进行解析？","目前代码采用 `itellm` 统一管理模型调用，但直接使用 Ollama（如 `ollama_chat\u002Fqwen2.5-vl`）时，传递图片可能会因编码不统一而报错。\n临时解决方案：检测到使用 Ollama 模型时，修改代码直接调用本地接口，绕过 `itellm` 层。此外，有用户反馈新版在解说与画面匹配（尤其是原片穿插播放）上存在逻辑问题，可能导致剪切异常，建议关注后续版本更新或回退到更稳定的旧版本（如 0.7.1）。","https:\u002F\u002Fgithub.com\u002Flinyqh\u002FNarratoAI\u002Fissues\u002F210",{"id":150,"question_zh":151,"answer_zh":152,"source_url":153},43864,"运行时报错 KeyError: 'st.session_state has no key \"task_id\"' 是什么原因？","该错误通常发生在 Streamlit 会话状态初始化失败时。常见原因包括：\n1. 谷歌云存储（Google Cloud Storage）未正确配置或未开通，导致文件上传失败，进而未能初始化 `task_id`。部分用户反馈需要绑定信用卡开通相关服务。\n2. 网络连接问题导致上传流程中断。\n3. 浏览器缓存或 Session 异常，尝试刷新页面或清除缓存后重试。\n确保 Google Cloud 服务已激活且网络通畅是解决此问题的关键。","https:\u002F\u002Fgithub.com\u002Flinyqh\u002FNarratoAI\u002Fissues\u002F2",{"id":155,"question_zh":156,"answer_zh":157,"source_url":158},43865,"遇到 'ServiceUnavailable: 503 The model is overloaded' 错误怎么处理？","这表明 Google Gemini 模型服务器当前负载过高，暂时无法处理请求。这不是本地配置问题。解决方法：\n1. 等待几分钟后重试。\n2. 避开使用高峰期。\n3. 如果频繁出现，检查是否使用了免费的 API 配额，考虑升级服务或切换到其他可用模型端点。","https:\u002F\u002Fgithub.com\u002Flinyqh\u002FNarratoAI\u002Fissues\u002F29",{"id":160,"question_zh":161,"answer_zh":162,"source_url":148},43866,"v0.7.3 版本启动报错 'from venv import logger' 如何处理？","这是代码导入模块的错误。请按照以下步骤修改源码：\n1. 打开文件：`NarratoAI\u002Fwebui\u002Fcomponents\u002Faudio_settings.py`。\n2. 找到代码行：`from venv import logger`。\n3. 将其替换为：`import logging`。\n4. 保存文件并重新启动程序。",[164,169,174,179,184,189,194,199,204,209,214,219,224,229,234,239,244,249,254,259],{"id":165,"version":166,"summary_zh":167,"released_at":168},351274,"v0.7.8","# 版本 0.7.8 发布说明\n\n## 新功能\n- **纪录片处理增强**: 新增了失败批次的保留功能，并增加了视觉处理的并发能力\n- **性能优化**: 实现了快速帧提取功能，并改进了缓存键机制\n\n## 改进\n- **文档分析流水线重构**: 通过共享分析服务路由适配器\n- **脚本生成优化**: 将最终脚本生成集中到共享服务中\n- **缓存机制增强**: 加固了快速路径回退机制和缓存键前缀\n\n## Bug修复\n- **进度显示问题**: 修复了Streamlit进度值的规范化问题\n- **旁白解析问题**: 修正了纪录片旁白解析和显式视觉覆盖的问题\n- **无效负载处理**: 修复了对格式错误旁白负载的处理失败问题\n- **帧丢失问题**: 解决了当批处理摘要缺失时丢失帧的问题\n- **响应验证**: 在标记成功前验证批处理响应契约\n- **旁白修复**: 恢复了旁白修复和显式视觉覆盖功能\n\n## 性能\n- 新增了快速帧提取功能\n- 优化了缓存键机制以提高性能\n\n这次更新主要针对纪录片处理功能进行了全面优化和修复，增强了系统的稳定性和处理能力。","2026-04-03T05:16:33",{"id":170,"version":171,"summary_zh":172,"released_at":173},351275,"v0.7.7","# 发布说明 v0.7.7\n\n## 新功能\n1. **OpenAI兼容接口迁移**  \n   - 出于安全考虑，已移除LiteLLM依赖，统一使用OpenAI兼容请求链路\n   - 完整迁移至OpenAI兼容接口，提高系统稳定性\n\n2. **语音功能增强**  \n   - 添加对代理服务器的支持\n   - 改进edge-tts字幕处理功能\n\n3. **短剧混剪功能优化**  \n   - 添加字幕文本处理模块\n   - 优化字幕读取和规范化逻辑\n\n## 改进\n1. **配置系统重构**  \n   - 重构配置系统以支持默认值设置\n   - 实现模型名称规范化处理\n\n2. **短剧混剪功能增强**  \n   - 优化字幕上传逻辑，与短剧解说功能保持一致\n   - 优化短剧混剪提示词\n   - 整体提升短剧混剪使用体验\n\n3. **文档更新**  \n   - 在README文件中添加Speclip推荐说明\n   - 更新项目文档\n\n## Bug修复\n1. **短剧混剪相关修复**  \n   - 修复Windows环境下短剧混剪报错问题\n   - 修复Windows环境下字幕加载失败问题\n   - 修复`AttributeError: 'NoneType' object has no attribute 'lower'`错误\n\n2. **代码优化**  \n   - 优化代码注释\n   - 清理冗余代码","2026-03-27T16:36:28",{"id":175,"version":176,"summary_zh":177,"released_at":178},351276,"v0.7.6","# 版本 0.7.6 发布说明\n\n## 🚀 新功能\n- **新增 IndexTTS2 零样本语音克隆引擎支持**：为用户提供了更先进的语音克隆技术选项\n- **新增基础设置项**：完善了软件的基础配置功能，并提供完整的中文翻译支持\n- **显示字幕引擎支持提示**：增强了对字幕功能的支持提示\n\n## ✨ 改进与优化\n- **短剧混剪功能优化**：\n  - 优化了短剧混剪的提示词系统\n  - 提升了短剧混剪的整体使用体验\n- **界面优化**：\n  - 优化了标题样式，提升视觉一致性\n  - 优化了代码注释的清晰度和完整性\n- **国际化支持**：\n  - 更新了示例配置文件\n  - 移除了日文README文件(坚决拥护中国🇨🇳领土主权🔥)\n\n## 🐛 Bug修复\n- 修复了短剧混剪中出现的 `AttributeError: 'NoneType' object has no attribute 'lower'` 报错\n- 移除了开发调试过程中遗留的代码残留\n- 清空了服务端日志，确保用户隐私安全\n- 移除了未使用的 logger 导入\n- 移除了未使用的 tkinter 导入\n\n## ⚠️ 重要提示\n- **建议所有用户重置 Key**：由于安全更新，为确保最佳使用体验，建议用户重置密钥\n- **版本号更新**：当前版本号已更新至 0.7.5\n\n本次更新聚焦于语音克隆功能的增强、用户体验的优化以及各种稳定性修复，建议所有用户及时升级以获得最佳体验。","2025-12-24T05:50:43",{"id":180,"version":181,"summary_zh":182,"released_at":183},351277,"v0.7.5","# 版本 0.7.5 发布说明\n\n## 新功能\n- **新增语音克隆引擎支持**：集成 IndexTTS2 零样本语音克隆引擎\n- **字幕引擎提示功能**：现在会显示当前使用的字幕引擎提示信息\n- **基础设置项**：新增了基础设置面板并提供完整中文翻译支持\n- **WebUI界面更新**：改进了用户界面以支持新添加的功能\n- **LLM服务配置优化**：改进了大型语言模型服务的配置与迁移适配能力，同步更新了相关UI设置\n\n## 改进\n- **LiteLLM提供商增强**：优化了LiteLLM供应商的配置选项\n- **设置界面国际化**：基础设置界面现已提供完整中文翻译\n- **提示词优化**：将\"荒野建造\"提示词修改为更通用的版本\n- **模型供应商管理**：改用litellm统一管理模型供应商\n\n## Bug修复\n- **版本号更新**：修正并同步了项目版本号为0.7.5\n- **UI样式问题**：优化了标题显示样式\n\n## 其他变更\n- 合并了来自linyqh\u002Fpr-199分支的代码更新\n- 同步了origin\u002Fmain分支的最新变更\n\n这个版本主要带来了多项功能增强，特别是在语音克隆和字幕支持方面，同时改进了设置界面的用户体验和国际化支持。建议所有用户升级到此版本以获取最佳体验。","2025-11-19T16:03:26",{"id":185,"version":186,"summary_zh":187,"released_at":188},351278,"v0.7.4","# 发布说明 - 版本 0.7.4\n\n## 新功能\n- 新增 qwen3 TTS 服务支持\n\n## 改进\n- 使用 litellm 统一管理模型供应商\n- 优化 TTS 引擎选项，移除 SoulVoice 引擎相关设置\n- 修改荒野建造提示词为更加通用的提示词，提升适用性\n\n## Bug 修复\n- 修复 Tencent 云 TTS 音色设置在视频生成功能中无效的问题\n- 修复试听 TTS 功能的 bug\n- 修复 docker-compose.yml 中对于 resource 目录的只读权限问题\n- 更新版本号至 0.7.4\n\n## 注意事项\n建议所有用户升级到此版本以获得更稳定的 TTS 服务和改进的功能体验。","2025-10-21T03:50:33",{"id":190,"version":191,"summary_zh":192,"released_at":193},351279,"v0.7.2","# 发布说明 v0.7.2\n\n## 新功能\n- **新增腾讯云TTS服务**: 集成腾讯云文本转语音(TTS)功能，为用户提供更多语音合成选择\n\n## 改进与优化\n- **腾讯TTS引擎优化**: 提升了腾讯云TTS服务的性能和稳定性\n- **Gemini模型参数设置更新**: 优化了Gemini AI模型的请求参数配置\n- **文档更新**: 改进了README文档内容，使其更加清晰易读\n\n## 其他变更\n- 忽略不必要的开发文件\n- 更新项目许可证文件\n- 更新版本号至0.7.2\n\n## 维护更新\n- 合并来自dev072分支的代码\n- 合并腾讯云TTS功能相关的pull request(#180)","2025-09-16T16:12:14",{"id":195,"version":196,"summary_zh":197,"released_at":198},351280,"v0.7.1","# 版本 0.7.1 发布说明\n\n## 新功能\n\n### LLM 功能增强\n- 新增对 gemini-2.5-flash 模型的支持\n- 增强 API 调用的可靠性和稳定性\n\n### TTS 语音合成\n- 添加多引擎 TTS 支持\n- 重构语音设置界面，提供更好的用户体验\n\n## 改进与优化\n\n### 部署与配置\n- 优化 Docker 配置和部署脚本\n- 优化整合包 bat 启动脚本\n- 增强环境检查机制\n\n### 代码重构\n- 移除未使用的代码文件和端口配置\n- 移除废弃脚本文件\n- 移除视频审查功能及相关代码\n- 更新项目版本至 0.7.0\n\n## 依赖更新\n- 新增 Azure 相关依赖\n\n## Bug 修复\n\n### 字幕处理\n- 修复字幕处理逻辑问题\n- 添加字幕有效性检查机制\n\n### 音频处理\n- 修复音频混合时的音量问题\n\n此次更新主要聚焦于功能增强、性能优化和问题修复，建议所有用户升级到此版本以获得更好的使用体验。","2025-08-18T06:52:46",{"id":200,"version":201,"summary_zh":202,"released_at":203},351281,"v0.7.0","# 版本 0.7.0 发布说明\n\n## 🚀 新功能\n\n### 大语言模型(LLM)\n- 新增对 `gemini-2.5-flash` 模型的支持\n- 增强API调用的可靠性\n\n### 语音合成(TTS)\n- 新增多引擎TTS支持\n- 添加 SoulVoice TTS 引擎支持\n- 重构语音设置界面，提供更好的用户体验\n\n### 脚本功能\n- 合并脚本保存与格式验证功能，简化工作流程\n\n### 视频处理\n- 实现统一视频裁剪策略，提升处理一致性\n\n## 🔧 改进与优化\n\n- 优化整合包bat启动脚本和环境检查流程\n- 更新项目版本至0.7.0\n- 更新README文档和提示词内容\n- 添加azure依赖支持\n\n## 🗑️ 移除功能\n\n- 移除废弃的脚本文件\n- 移除视频审查功能及相关代码\n- 移除视频字幕合并功能及相关代码\n- 移除旧视频裁剪逻辑\n\n## 📝 说明\n\n本次发布专注于功能整合与代码清理，移除了多个不再维护的功能模块，同时引入了新的TTS引擎支持和更可靠的LLM调用机制。建议所有用户升级以获得更稳定的体验。\n\n请注意，本次更新包含多个破坏性变更，移除了部分废弃功能，请根据您的实际使用情况评估升级影响。","2025-08-03T13:34:54",{"id":205,"version":206,"summary_zh":207,"released_at":208},351282,"v0.6.8","# 发布说明 v0.6.8\n\n## 新功能\n\n1. **字幕分析与解说生成**  \n   - 更新解说文案生成逻辑，增强字幕内容支持  \n   - 更新解说文案生成要求，提升内容质量和逻辑性  \n   - 重构字幕分析和脚本生成流程，支持统一LLM服务  \n\n2. **LLM功能增强**  \n   - 增强解说文案生成和图片分析功能  \n   - 优化JSON解析处理  \n\n3. **视频处理**  \n   - 新增超级兼容性方案提高视频帧提取成功率  \n   - 增强Windows系统兼容性，解决MJPEG编码问题  \n\n4. **配置更新**  \n   - 更新配置文件结构和内容  \n   - 更新版本号至0.6.7  \n\n## 改进与优化\n\n1. **用户体验**  \n   - 在generate_script_docu.py中更新进度显示和错误提示  \n   - 优化视频帧提取功能的错误处理和用户反馈  \n   - 增强整体兼容性和调试信息  \n\n2. **代码优化**  \n   - 优化短剧解说画面匹配算法  \n   - 删除视频关键帧提取测试脚本  \n   - 更新软件方案的提取命令  \n   - 更新注释说明  \n\n3. **日志系统**  \n   - 注释掉调试信息的日志输出，优化日志记录  \n\n## Bug修复\n\n1. 解决Windows系统的MJPEG编码问题  \n2. 修复日志系统可能产生的冗余输出  \n\n本次更新重点优化了视频处理和解说生成的稳定性与兼容性，特别是在Windows平台的表现。同时改进了LLM服务的集成方式，为用户带来更流畅的创作体验。","2025-07-11T18:29:10",{"id":210,"version":211,"summary_zh":212,"released_at":213},351283,"v0.6.7","# 版本0.6.7 发布说明\n\n## 新功能\n\n### 解说文案生成系统\n- 全面重构解说文案生成流程，支持新的LLM服务架构\n- 引入全新的提示词管理系统，显著提升解说文案生成质量\n- 更新解说文案生成要求，提升产出内容的质量和逻辑性\n- 优化JSON格式输出，增强解析兼容性\n\n### LLM服务增强\n- 重构字幕分析和脚本生成流程，支持统一LLM服务\n- 增强视觉分析器功能，优化JSON解析能力\n- 改进解说文案生成和图片分析功能\n\n### 音频处理\n- 增强音量管理功能\n- 新增智能音量调整能力\n\n## 改进优化\n\n- 更新API配置验证功能，提高系统稳定性\n- 更新作者信息\n- 优化代码注释和文档说明\n\n## 基础更新\n\n- 版本号更新至0.6.7\n\n本次更新主要聚焦于解说文案生成系统的全面升级，引入新的提示词管理系统并优化LLM服务架构，同时增强了音频处理能力，为后续功能扩展打下坚实基础。","2025-07-07T10:59:13",{"id":215,"version":216,"summary_zh":217,"released_at":218},351284,"v0.6.5","# 发布说明 v0.6.5\n\n## 新功能\n- **FFmpeg增强**：实现了智能硬件加速检测和编码器选择功能，提升视频处理效率\n- **音频管理**：统一了音量配置，解决了原声音量默认值不正确的问题\n\n## 问题修复\n- **字幕功能**：修复了字幕开关功能无效的问题\n\n## 改进优化\n- **版本管理**：优化了版本号获取逻辑，现在直接从文件读取版本号\n- **发布流程**：简化了发布说明生成流程，提升了工作效率\n- **CI\u002FCD**：优化了持续集成\u002F持续部署流程，改进了大模型生成发布说明的代码\n- **通知系统**：调整了Discord通知格式，增强了发布说明生成和通知的调试信息\n- **工作流清理**：删除了不再使用的工作流文件，简化项目结构\n\n## 开发工具\n- 更新了多个测试版本(v0.6.2.4, v0.6.2.5)用于CI\u002FCD测试验证","2025-07-02T16:04:40",{"id":220,"version":221,"summary_zh":222,"released_at":223},351285,"v0.6.3","# 版本 0.6.3 发布说明\n\n## 新功能\n\n- **新增 CI\u002FCD 自动化发布流程**：实现了自动化持续集成和部署功能，简化了版本发布流程\n- **增强发布说明自动生成功能**：引入大模型来自动生成发布说明，提高了发布说明的质量和一致性\n\n## 改进\n\n### CI\u002FCD 流程优化\n- 优化了 CI\u002FCD 工作流中的多个环节\n- 简化了发布说明生成流程\n- 增加了发布说明生成和通知的调试信息\n- 删除了不再使用的工作流文件\n- 修复了 CI\u002FCD 流程中的多个问题\n\n### 版本管理\n- 改进了版本号获取逻辑，现在直接从文件读取版本号\n- 版本号管理更加规范，从 0.6.2.5 更新到 0.6.3\n\n### 多媒体处理\n- 优化了 FFmpeg 硬件加速功能\n- 改进了独立显卡的兼容性\n- 美化了 FFmpeg 的日志输出\n\n### 通知系统\n- 优化了 Discord 通知格式，使其更加清晰易读\n\n## 修复\n\n- 修复了 CI\u002FCD 流程中的多个问题\n- 解决了 FFmpeg 硬件加速的兼容性问题\n\n## 其他\n\n- 移除了测试用的工作流文件\n- 清理了开发测试过程中的临时代码","2025-05-19T02:19:30",{"id":225,"version":226,"summary_zh":227,"released_at":228},351286,"v0.6.2.5","# 版本 0.6.2.5 发布说明\n\n## 新功能\n- 新增发布说明生成逻辑调整，使生成的发布说明更加清晰易读\n\n## 改进与优化\n- 优化了Discord通知的消息格式，提升通知的可读性和美观度\n- 移除了不再使用的工作流文件，简化项目结构\n- 版本号更新至0.6.2.5\n\n## 代码维护\n- 清理了过期的工作流配置，保持代码库整洁\n\n本次更新主要聚焦于项目维护和通知优化，提升了自动化工具的可用性和可维护性。","2025-05-19T01:59:56",{"id":230,"version":231,"summary_zh":232,"released_at":233},351287,"v0.6.2.4","# 发布说明 v0.6.2.4\n\n## 改进与优化\n\n1. **调试信息增强**：\n   - 为发布说明生成和通知功能增加了更详细的调试日志信息，便于问题排查\n\n2. **版本更新**：\n   - 将系统版本号更新至0.6.2.4\n\n## 开发相关\n\n- 本次更新主要聚焦于提升开发调试能力，为后续功能开发提供更好的支持\n- 版本号调整遵循语义化版本规范，属于修复性小版本更新\n\n建议所有开发者更新到此版本以获得更好的调试体验。","2025-05-19T01:43:37",{"id":235,"version":236,"summary_zh":237,"released_at":238},351288,"v0.6.2.3","### 版本 0.6.2.3 发布说明  \n\n**改进**  \n- 优化了 CI\u002FCD 流程中使用大模型生成发布说明的代码","2025-05-19T01:36:43",{"id":240,"version":241,"summary_zh":242,"released_at":243},351289,"v0.6.2.1","# 版本 0.6.2.1 发布\n\n## 更新内容\n\n- cicd 测试 3\n- cicd 测试 2\n- cicd 测试\n- cicd 修复 1\n- 测试工作流版本号\n- 新增自动发布 cicd\n","2025-05-19T01:12:39",{"id":245,"version":246,"summary_zh":247,"released_at":248},351290,"v0.6.2","## 更新内容\r\n\r\n- docs(README): 更新README @linyqh (#138)\r\n- 优化 ffmpeg 硬件加速兼容性\r\n\r\n## 贡献者\r\n\r\n@linyqh and github-actions\r\n","2025-05-18T19:04:47",{"id":250,"version":251,"summary_zh":252,"released_at":253},351291,"0.6.0","- 新增短剧解说\r\n- 优化剪辑功能\r\n- 优化视频合并功能\r\n- 移除whisper转录相关代码和依赖","2025-05-10T19:38:42",{"id":255,"version":256,"summary_zh":257,"released_at":258},351292,"v0.5.2","NarratoAI 全面支持DeepSeek模型！注册即享2000万免费Token（价值14元平台配额），剪辑10分钟视频仅需0.1元！  \r\n\r\n🔥 快速领福利：  \r\n1️⃣ 点击链接注册：https:\u002F\u002Fcloud.siliconflow.cn\u002Fi\u002FpyOKqFCV  \r\n2️⃣ 使用手机号登录，务必填写邀请码：pyOKqFCV  \r\n3️⃣ 领取14元配额，极速体验高性价比AI剪辑  \r\n\r\n💡 小成本大创作：  \r\n硅基流动 API Key 一键接入，智能剪辑效率翻倍！  \r\n（注：邀请码为福利领取唯一凭证，注册后自动到账）  \r\n\r\n👀 windows 整合包下载地址：关注微信公众号【NarratoAI助手】获取","2025-03-06T14:25:13",{"id":260,"version":261,"summary_zh":262,"released_at":263},351293,"0.3.9","## 描述\r\n\r\n支持阿里QwenVL大模型，国内网络可用；支持短剧混剪功能，十分钟精彩不断；新增一键合并视频和字幕，素材整理快人一步\r\n\r\n## 更改内容\r\n1. 支持阿里QwenVL大模型，国内网络可用\r\n这次升级有了QwenVL大模型的视频理解能力，而且国内网络就能用，还有免费额度哦。\r\n\r\n2. 支持短剧混剪功能，十分钟精彩不断\r\n工具现在支持短剧混剪，最长支持解析 10 分钟的视频。\r\n\r\n3. 优化时间戳到毫秒级，剪辑超精准\r\n时间戳精确到毫秒了，这对剪辑特别有用。\r\n\r\n4. 新增一键合并视频和字幕，素材整理快人一步\r\n新增的合并视频和字幕功能很方便。\r\n\r\n5. 脚本上传，创作按部就班\r\n有了脚本上传功能\r\n\r\n6. 一键清理缓存，工具运行超流畅\r\n要是工具用久了有点卡，别担心。\r\n\r\n7. 一键转录超便捷，文字提取超轻松\r\n这个一键转录功能超实用。\r\n\r\n8. 支持 TTS生成失败支持自动重试\r\n\r\n这次影视解说工具升级真的很给力，大家赶紧去试试，让你的影视解说创作更上一层楼！\r\n\r\n","2024-12-16T06:14:13"]