[{"data":1,"prerenderedAt":-1},["ShallowReactive",2],{"similar-C-Loftus--QuickPiperAudiobook":3,"tool-C-Loftus--QuickPiperAudiobook":65},[4,23,32,40,48,56],{"id":5,"name":6,"github_repo":7,"description_zh":8,"stars":9,"difficulty_score":10,"last_commit_at":11,"category_tags":12,"status":22},2268,"ML-For-Beginners","microsoft\u002FML-For-Beginners","ML-For-Beginners 是由微软推出的一套系统化机器学习入门课程，旨在帮助零基础用户轻松掌握经典机器学习知识。这套课程将学习路径规划为 12 周，包含 26 节精炼课程和 52 道配套测验，内容涵盖从基础概念到实际应用的完整流程，有效解决了初学者面对庞大知识体系时无从下手、缺乏结构化指导的痛点。\n\n无论是希望转型的开发者、需要补充算法背景的研究人员，还是对人工智能充满好奇的普通爱好者，都能从中受益。课程不仅提供了清晰的理论讲解，还强调动手实践，让用户在循序渐进中建立扎实的技能基础。其独特的亮点在于强大的多语言支持，通过自动化机制提供了包括简体中文在内的 50 多种语言版本，极大地降低了全球不同背景用户的学习门槛。此外，项目采用开源协作模式，社区活跃且内容持续更新，确保学习者能获取前沿且准确的技术资讯。如果你正寻找一条清晰、友好且专业的机器学习入门之路，ML-For-Beginners 将是理想的起点。",85013,2,"2026-04-06T11:09:19",[13,14,15,16,17,18,19,20,21],"图像","数据工具","视频","插件","Agent","其他","语言模型","开发框架","音频","ready",{"id":24,"name":25,"github_repo":26,"description_zh":27,"stars":28,"difficulty_score":29,"last_commit_at":30,"category_tags":31,"status":22},4128,"GPT-SoVITS","RVC-Boss\u002FGPT-SoVITS","GPT-SoVITS 是一款强大的开源语音合成与声音克隆工具，旨在让用户仅需极少量的音频数据即可训练出高质量的个性化语音模型。它核心解决了传统语音合成技术依赖海量录音数据、门槛高且成本大的痛点，实现了“零样本”和“少样本”的快速建模：用户只需提供 5 秒参考音频即可即时生成语音，或使用 1 分钟数据进行微调，从而获得高度逼真且相似度极佳的声音效果。\n\n该工具特别适合内容创作者、独立开发者、研究人员以及希望为角色配音的普通用户使用。其内置的友好 WebUI 界面集成了人声伴奏分离、自动数据集切片、中文语音识别及文本标注等辅助功能，极大地降低了数据准备和模型训练的技术门槛，让非专业人士也能轻松上手。\n\n在技术亮点方面，GPT-SoVITS 不仅支持中、英、日、韩、粤语等多语言跨语种合成，还具备卓越的推理速度，在主流显卡上可实现实时甚至超实时的生成效率。无论是需要快速制作视频配音，还是进行多语言语音交互研究，GPT-SoVITS 都能以极低的数据成本提供专业级的语音合成体验。",56375,3,"2026-04-05T22:15:46",[21],{"id":33,"name":34,"github_repo":35,"description_zh":36,"stars":37,"difficulty_score":29,"last_commit_at":38,"category_tags":39,"status":22},2863,"TTS","coqui-ai\u002FTTS","🐸TTS 是一款功能强大的深度学习文本转语音（Text-to-Speech）开源库，旨在将文字自然流畅地转化为逼真的人声。它解决了传统语音合成技术中声音机械生硬、多语言支持不足以及定制门槛高等痛点，让高质量的语音生成变得触手可及。\n\n无论是希望快速集成语音功能的开发者，还是致力于探索前沿算法的研究人员，亦或是需要定制专属声音的数据科学家，🐸TTS 都能提供得力支持。它不仅预置了覆盖全球 1100 多种语言的训练模型，让用户能够即刻上手，还提供了完善的工具链，支持用户利用自有数据训练新模型或对现有模型进行微调，轻松实现特定风格的声音克隆。\n\n在技术亮点方面，🐸TTS 表现卓越。其最新的 ⓍTTSv2 模型支持 16 种语言，并在整体性能上大幅提升，实现了低于 200 毫秒的超低延迟流式输出，极大提升了实时交互体验。此外，它还无缝集成了 🐶Bark、🐢Tortoise 等社区热门模型，并支持调用上千个 Fairseq 模型，展现了极强的兼容性与扩展性。配合丰富的数据集分析与整理工具，🐸TTS 已成为科研与生产环境中备受信赖的语音合成解决方案。",44971,"2026-04-03T14:47:02",[21,20,13],{"id":41,"name":42,"github_repo":43,"description_zh":44,"stars":45,"difficulty_score":29,"last_commit_at":46,"category_tags":47,"status":22},2375,"LocalAI","mudler\u002FLocalAI","LocalAI 是一款开源的本地人工智能引擎，旨在让用户在任意硬件上轻松运行各类 AI 模型，包括大语言模型、图像生成、语音识别及视频处理等。它的核心优势在于彻底打破了高性能计算的门槛，无需昂贵的专用 GPU，仅凭普通 CPU 或常见的消费级显卡（如 NVIDIA、AMD、Intel 及 Apple Silicon）即可部署和运行复杂的 AI 任务。\n\n对于担心数据隐私的用户而言，LocalAI 提供了“隐私优先”的解决方案，确保所有数据处理均在本地基础设施内完成，无需上传至云端。同时，它完美兼容 OpenAI、Anthropic 等主流 API 接口，这意味着开发者可以无缝迁移现有应用，直接利用本地资源替代云服务，既降低了成本又提升了可控性。\n\nLocalAI 内置了超过 35 种后端支持（如 llama.cpp、vLLM、Whisper 等），并集成了自主 AI 代理、工具调用及检索增强生成（RAG）等高级功能，且具备多用户管理与权限控制能力。无论是希望保护敏感数据的企业开发者、进行算法实验的研究人员，还是想要在个人电脑上体验最新 AI 技术的极客玩家，都能通过 LocalAI 获",44782,"2026-04-02T22:14:26",[13,21,19,17,20,14,16],{"id":49,"name":50,"github_repo":51,"description_zh":52,"stars":53,"difficulty_score":29,"last_commit_at":54,"category_tags":55,"status":22},3108,"bark","suno-ai\u002Fbark","Bark 是由 Suno 推出的开源生成式音频模型，能够根据文本提示创造出高度逼真的多语言语音、音乐、背景噪音及简单音效。与传统仅能朗读文字的语音合成工具不同，Bark 基于 Transformer 架构，不仅能模拟说话，还能生成笑声、叹息、哭泣等非语言声音，甚至能处理带有情感色彩和语气停顿的复杂文本，极大地丰富了音频表达的可能性。\n\n它主要解决了传统语音合成声音机械、缺乏情感以及无法生成非语音类音效的痛点，让创作者能通过简单的文字描述获得生动自然的音频素材。无论是需要为视频配音的内容创作者、探索多模态生成的研究人员，还是希望快速原型设计的开发者，都能从中受益。普通用户也可通过集成的演示页面轻松体验其神奇效果。\n\n技术亮点方面，Bark 支持商业使用（MIT 许可），并在近期更新中实现了显著的推理速度提升，同时提供了适配低显存 GPU 的版本，降低了使用门槛。此外，社区还建立了丰富的提示词库，帮助用户更好地驾驭模型生成特定风格的声音。只需几行 Python 代码，即可将创意文本转化为高质量音频，是连接文字与声音世界的强大桥梁。",39067,"2026-04-04T03:33:35",[21],{"id":57,"name":58,"github_repo":59,"description_zh":60,"stars":61,"difficulty_score":62,"last_commit_at":63,"category_tags":64,"status":22},3788,"airi","moeru-ai\u002Fairi","airi 是一款开源的本地化 AI 伴侣项目，旨在将虚拟角色（如“二次元老婆”或赛博生命）带入用户的现实世界。它的核心目标是复刻并超越知名 AI 主播 Neuro-sama 的能力，让用户能够拥有完全自主掌控、可私有化部署的智能伙伴。\n\nairi 主要解决了用户对高度定制化、具备情感交互能力且数据隐私安全的 AI 角色的需求。不同于依赖云端服务的通用助手，airi 允许用户在本地运行，不仅保护了对话隐私，还赋予了用户定义角色性格与灵魂的自由。它支持实时语音聊天，甚至能直接参与《我的世界》（Minecraft）和《异星工厂》（Factorio）等游戏，实现了从单纯对话到共同娱乐的跨越。\n\n这款工具非常适合喜爱虚拟角色的普通用户、希望搭建个性化 AI 陪伴的技术爱好者，以及研究多模态交互的开发者。其独特的技术亮点在于跨平台支持（涵盖 Web、macOS 和 Windows）以及强大的游戏交互能力，让 AI 不仅能“说”，还能“玩”。通过容器化的灵魂设计，airi 为每个人创造专属数字生命提供了可能，让虚拟陪伴变得更加真实且触手可及。",37086,1,"2026-04-05T10:54:25",[19,21,17],{"id":66,"github_repo":67,"name":68,"description_en":69,"description_zh":70,"ai_summary_zh":70,"readme_en":71,"readme_zh":72,"quickstart_zh":73,"use_case_zh":74,"hero_image_url":75,"owner_login":76,"owner_name":77,"owner_avatar_url":78,"owner_bio":79,"owner_company":80,"owner_location":81,"owner_email":82,"owner_twitter":82,"owner_website":83,"owner_url":84,"languages":85,"stars":98,"forks":99,"last_commit_at":100,"license":101,"difficulty_score":10,"env_os":102,"env_gpu":103,"env_ram":104,"env_deps":105,"category_tags":111,"github_topics":112,"view_count":10,"oss_zip_url":82,"oss_zip_packed_at":82,"status":22,"created_at":117,"updated_at":118,"faqs":119,"releases":149},4781,"C-Loftus\u002FQuickPiperAudiobook","QuickPiperAudiobook","With one command, create a natural-sounding audiobook from a variety of input formats (epub, mobi, txt, PDF, HTML and more!)","QuickPiperAudiobook 是一款能让用户通过一条命令，将各类电子文档（如 EPUB、PDF、TXT、MOBI、HTML 等）一键转换为自然流畅有声书的开源工具。它主要解决了传统文本转语音流程繁琐、依赖在线服务导致隐私泄露，以及难以批量处理多种文件格式的痛点。\n\n这款工具特别适合注重数据隐私的普通读者、希望将技术文档或有声读物本地化的语言学习者，以及喜欢折腾命令行的高效极客用户。其核心亮点在于完全离线运行，所有转换过程均在本地完成，无需上传任何内容，确保了绝对的隐私安全。同时，它内置了对 Piper 高质量语音模型的支持，涵盖全球多种语言，并能自动管理模型下载，用户无需单独安装复杂的语音引擎。此外，它还支持生成带章节标记的 MP3 文件，让听书体验更接近专业出品。无论是想听最新的电子书，还是需要将非英语内容转化为母语音频，QuickPiperAudiobook 都能以极简的方式轻松实现。","\u003Ch1 align=center>QuickPiperAudiobook\u003C\u002Fh1>\n\n\u003Cp align=\"center\">\n  \u003Cb> English \u003C\u002Fb> \n  |\n  \u003Ca href=\".\u002FREADME_PL.md\">Polski\u003C\u002Fa>\n  |\n  \u003Ca href=\".\u002FREADME_ZH.md\">简体中文\u003C\u002Fa>\n\u003C\u002Fp>\n\n\nCreate a natural audiobook for any text content with one command. \n\n - Converts [PDFs, epub, txt, mobi, djvu, HTML, docx, and more](https:\u002F\u002Fmanual.calibre-ebook.com\u002Fgenerated\u002Fen\u002Febook-convert.html)\n - All conversion is done offline and is entirely private\n - Uses [piper models](https:\u002F\u002Frhasspy.github.io\u002Fpiper-samples\u002F); supports many languages\n\nListen to sample output [ here ](.\u002Fexamples\u002F)\n\n## Installing\n\n1. Download the binary via one of the following methods:\n    * A prebuilt [release](https:\u002F\u002Fgithub.com\u002FC-Loftus\u002FQuickPiperAudiobook\u002Freleases\u002F)\n    * `go install github.com\u002FC-Loftus\u002FQuickPiperAudiobook@latest`\n    * (Or build from source using `go build`)\n2. Download `ebook-convert` and make sure it is in your PATH. (This is bundled with [calibre](https:\u002F\u002Fcalibre-ebook.com\u002F))\n3. _(Optional)_ Download `ffmpeg` for mp3 and chapter support \n\n> [!NOTE]  \n> You don't need to have piper installed. This program manages piper and the associated models\n\n## Usage \n\n* Pass in either a local file or a remote URL with the proper extension\n   * i.e. `.\u002FQuickPiperAudiobook test.txt`\n* Specify the `--chapters` flag to generate mp3 chapters for epub files\n   * i.e. `.\u002FQuickPiperAudiobook --chapters test.epub`\n* For a full list of options use the `--help` flag\n   * i.e. `.\u002FQuickPiperAudiobook --help`\n\n### Non-English \u002F UTF-8\n\n* Grab a model for your language of choice (.onnx and .json) from the [piper models](https:\u002F\u002Frhasspy.github.io\u002Fpiper-samples\u002F)\n  * i.e. `pl_PL-gosia-medium.onnx` and corresponding `pl_PL-gosia-medium.onnx.json` (rename if needed)\n* Put them in `~\u002F.config\u002FQuickPiperAudiobook\u002F`\n* Use the `--speak-utf-8` and `--model=`  flags to specify you want utf characters to be spoken with a specific model\n  * i.e. `.\u002FQuickPiperAudiobook --speak-utf-8 --model=pl_PL-gosia-medium.onnx MaszynaTuringa_Wikipedia.pdf`\n\n> [!NOTE]  \n> Consider specifying this model as the default in the configuration file if you plan to use it frequently\n\n### Configuring\n\n* You can create a config file at `~\u002F.config\u002FQuickPiperAudiobook\u002F` to specify preferred values if you do not want to specify these as cli args each time\n  * i.e. you can use any arbitrary model by putting the associated `.onnx` and `.onnx.json` file for it in `~\u002F.config\u002FQuickPiperAudiobook\u002F`\n  * A full example config can be found [here](.\u002Fexamples\u002Fconfig.yaml)\n\n```yml\n# An example for `~\u002F.config\u002FQuickPiperAudiobook\u002Fconfig.yaml`\n\n# the default output directory to use if the user does not specify --output in the cli args\noutput: ~\u002FAudiobooks\n# the default model to use if the user does not specify --model in the cli args\nmodel: \"en_US-hfc_female-medium.onnx\"\n# output the audiobook as an mp3 file (requires ffmpeg in your PATH)\nmp3: false\n# generate chapter metadata when outputting mp3s (requires an epub input and ffmpeg in your PATH)\nchapters: false\n```\n\n## Notes\n\n- Piper does not support progress output. Long audiobooks may take a long time to generate since all computation is being done locally. \n- This repo has been tested on Linux but can also work on MacOS once an upstream bug is fixed with Piper\n\n## Support\n\nThank you for considering supporting this project.\n\nI accept donations on Github or Paypal. If you would like to sponsor this project or reach out to me for business reasons, you can contact me via [email](mailto:github@colton.place) or [my website](https:\u002F\u002Fcolton.place\u002Fcontact\u002F)\n","\u003Ch1 align=center>QuickPiper有声书\u003C\u002Fh1>\n\n\u003Cp align=\"center\">\n  \u003Cb> 英文 \u003C\u002Fb> \n  |\n  \u003Ca href=\".\u002FREADME_PL.md\">波兰语\u003C\u002Fa>\n  |\n  \u003Ca href=\".\u002FREADME_ZH.md\">简体中文\u003C\u002Fa>\n\u003C\u002Fp>\n\n\n只需一条命令，即可为任何文本内容创建自然的有声书。\n\n - 支持转换 [PDF、epub、txt、mobi、djvu、HTML、docx 等格式](https:\u002F\u002Fmanual.calibre-ebook.com\u002Fgenerated\u002Fen\u002Febook-convert.html)\n - 所有转换均在本地离线完成，完全私密\n - 使用 [Piper 模型](https:\u002F\u002Frhasspy.github.io\u002Fpiper-samples\u002F)；支持多种语言\n\n收听示例输出 [这里](.\u002Fexamples\u002F)\n\n## 安装\n\n1. 通过以下任一方式下载二进制文件：\n    * 使用预先构建的[发布版本](https:\u002F\u002Fgithub.com\u002FC-Loftus\u002FQuickPiperAudiobook\u002Freleases\u002F)\n    * `go install github.com\u002FC-Loftus\u002FQuickPiperAudiobook@latest`\n    * （或使用 `go build` 从源代码编译）\n2. 下载 `ebook-convert` 并确保其位于您的 PATH 中。（此工具随 [calibre](https:\u002F\u002Fcalibre-ebook.com\u002F) 一起提供）\n3. _(可选)_ 下载 `ffmpeg` 以支持 MP3 和章节功能\n\n> [!NOTE]  \n> 您无需单独安装 Piper。本程序会自动管理 Piper 及其相关模型\n\n## 使用方法\n\n* 传入带有正确扩展名的本地文件或远程 URL\n   * 例如：`.\u002FQuickPiperAudiobook test.txt`\n* 使用 `--chapters` 标志为 epub 文件生成 MP3 章节\n   * 例如：`.\u002FQuickPiperAudiobook --chapters test.epub`\n* 如需查看完整选项列表，请使用 `--help` 标志\n   * 例如：`.\u002FQuickPiperAudiobook --help`\n\n### 非英语 \u002F UTF-8\n\n* 从 [Piper 模型](https:\u002F\u002Frhasspy.github.io\u002Fpiper-samples\u002F) 获取您所需语言的模型文件（.onnx 和 .json）\n  * 例如：`pl_PL-gosia-medium.onnx` 及其对应的 `pl_PL-gosia-medium.onnx.json`（如有需要请重命名）\n* 将这些文件放入 `~\u002F.config\u002FQuickPiperAudiobook\u002F`\n* 使用 `--speak-utf-8` 和 `--model=` 标志指定使用特定模型朗读 UTF 字符\n  * 例如：`.\u002FQuickPiperAudiobook --speak-utf-8 --model=pl_PL-gosia-medium.onnx MaszynaTuringa_Wikipedia.pdf`\n\n> [!NOTE]  \n> 如果您计划频繁使用该模型，建议将其设置为配置文件中的默认模型\n\n### 配置\n\n* 您可以在 `~\u002F.config\u002FQuickPiperAudiobook\u002F` 创建一个配置文件，以指定首选值，而无需每次都在命令行中输入这些参数。\n  * 例如，您可以将任意模型的相关 `.onnx` 和 `.onnx.json` 文件放入 `~\u002F.config\u002FQuickPiperAudiobook\u002F` 目录中。\n  * 完整的配置示例可在 [这里](.\u002Fexamples\u002Fconfig.yaml) 查看。\n\n```yml\n# `~\u002F.config\u002FQuickPiperAudiobook\u002Fconfig.yaml` 示例\n\n# 如果用户未在命令行中指定 --output，则使用的默认输出目录\noutput: ~\u002FAudiobooks\n# 如果用户未在命令行中指定 --model，则使用的默认模型\nmodel: \"en_US-hfc_female-medium.onnx\"\n# 将有声书输出为 MP3 文件（需要 PATH 中包含 ffmpeg）\nmp3: false\n# 在输出 MP3 时生成章节元数据（需要 epub 输入和 PATH 中包含 ffmpeg）\nchapters: false\n```\n\n## 注意事项\n\n- Piper 不支持进度输出。由于所有计算都在本地进行，因此较长的有声书可能需要较长时间才能生成。\n- 此仓库已在 Linux 上测试过，但在 Piper 的上游 bug 修复后也可在 MacOS 上运行。\n\n## 支持\n\n感谢您考虑支持本项目。\n\n我接受 GitHub 或 PayPal 上的捐赠。如果您希望赞助本项目或因商务原因与我联系，可以通过 [电子邮件](mailto:github@colton.place) 或 [我的网站](https:\u002F\u002Fcolton.place\u002Fcontact\u002F) 与我取得联系。","# QuickPiperAudiobook 快速上手指南\n\nQuickPiperAudiobook 是一款命令行工具，只需一条命令即可将各类文本（PDF、EPUB、TXT 等）转换为自然的有声书。所有转换过程均在本地离线完成，确保数据隐私安全。\n\n## 环境准备\n\n在开始之前，请确保您的系统满足以下要求：\n\n*   **操作系统**：推荐 Linux（macOS 需等待上游 Piper 修复相关 bug 后使用）。\n*   **前置依赖**：\n    1.  **Calibre**：必须安装以获取 `ebook-convert` 工具，并确保其已加入系统 `PATH` 环境变量。\n        *   官网：https:\u002F\u002Fcalibre-ebook.com\n    2.  **FFmpeg**（可选）：如果需要输出 MP3 格式或生成章节元数据，请安装 `ffmpeg` 并加入 `PATH`。\n    3.  **Go 语言环境**（可选）：如果您选择通过 `go install` 方式进行安装。\n\n> **注意**：您无需单独安装 Piper 或其模型，本工具会自动管理。\n\n## 安装步骤\n\n您可以选择以下任意一种方式安装：\n\n### 方法一：下载预编译二进制文件（推荐）\n访问项目的 [Release 页面](https:\u002F\u002Fgithub.com\u002FC-Loftus\u002FQuickPiperAudiobook\u002Freleases\u002F) 下载对应系统的二进制文件，解压后即可使用。\n\n### 方法二：使用 Go 安装\n如果您已配置好 Go 环境，可直接运行：\n```bash\ngo install github.com\u002FC-Loftus\u002FQuickPiperAudiobook@latest\n```\n\n### 方法三：源码编译\n```bash\ngit clone https:\u002F\u002Fgithub.com\u002FC-Loftus\u002FQuickPiperAudiobook.git\ncd QuickPiperAudiobook\ngo build\n```\n\n## 基本使用\n\n### 1. 转换本地文件\n直接传入本地文本文件路径即可生成有声书（默认输出格式取决于配置，通常为 WAV）：\n```bash\n.\u002FQuickPiperAudiobook test.txt\n```\n支持的文件格式包括：PDF, epub, txt, mobi, djvu, HTML, docx 等。\n\n### 2. 转换远程 URL\n工具也支持直接处理网络链接：\n```bash\n.\u002FQuickPiperAudiobook https:\u002F\u002Fexample.com\u002Fbook.pdf\n```\n\n### 3. 生成带章节的 MP3（针对 EPUB）\n若输入文件为 EPUB 且已安装 `ffmpeg`，可使用 `--chapters` 标志生成带有章节元数据的 MP3 文件：\n```bash\n.\u002FQuickPiperAudiobook --chapters test.epub\n```\n\n### 4. 查看完整选项\n如需了解更多参数（如指定输出目录、选择语音模型等），请使用帮助命令：\n```bash\n.\u002FQuickPiperAudiobook --help\n```\n\n> **提示**：首次运行时，工具会自动下载默认的英语语音模型。如需使用其他语言（如中文），请下载对应的 `.onnx` 和 `.json` 模型文件至 `~\u002F.config\u002FQuickPiperAudiobook\u002F` 目录，并通过 `--model` 参数指定。","一位视障开发者急需将最新的技术文档（PDF 格式）和开源项目说明（ePub 格式）转换为有声书，以便在通勤途中高效获取信息。\n\n### 没有 QuickPiperAudiobook 时\n- **流程繁琐断裂**：需要先用 Calibre 将 PDF\u002FePub 转为纯文本，再找独立的 TTS 工具分段合成，最后用音频软件拼接，耗时数小时。\n- **隐私安全风险**：若使用在线转换服务，敏感的内部技术文档或未公开代码说明必须上传至第三方服务器，存在泄露隐患。\n- **多语言支持困难**：遇到非英语的技术资料（如波兰语或中文文档），难以找到自然流畅且免费的离线语音模型进行朗读。\n- **章节导航缺失**：生成的音频往往是单一长文件，无法根据原书目录自动划分章节，导致听众难以定位特定内容。\n\n### 使用 QuickPiperAudiobook 后\n- **一键自动化**：只需执行一条命令（如 `.\u002FQuickPiperAudiobook doc.pdf`），即可自动完成格式解析、文本提取到语音合成的全流程。\n- **完全本地私有**：所有计算均在本地离线完成，无需联网，确保技术文档和数据绝对安全，不离开用户设备。\n- **多语言无缝切换**：通过简单配置下载对应的 Piper 模型（.onnx 文件），即可用自然的母语口音流畅朗读各类小语种资料。\n- **智能章节标记**：配合 `--chapters` 参数和 ffmpeg，能自动识别 ePub 结构并生成带元数据的 MP3 章节文件，实现精准跳转收听。\n\nQuickPiperAudiobook 将原本复杂的多步工作流简化为单次命令行操作，让开发者能在保护隐私的前提下，瞬间将任意格式的文本转化为高质量的离线有声书。","https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002FC-Loftus_QuickPiperAudiobook_353b025f.png","C-Loftus","Colton Loftus","https:\u002F\u002Foss.gittoolsai.com\u002Favatars\u002FC-Loftus_1a76dfb2.png","Center for Geospatial Solutions | CS Princeton '23","@cgs-earth","Boston",null,"https:\u002F\u002Fcolton.place","https:\u002F\u002Fgithub.com\u002FC-Loftus",[86,90,94],{"name":87,"color":88,"percentage":89},"Go","#00ADD8",98.2,{"name":91,"color":92,"percentage":93},"Dockerfile","#384d54",1.3,{"name":95,"color":96,"percentage":97},"Makefile","#427819",0.5,1037,78,"2026-04-06T16:36:27","AGPL-3.0","Linux, macOS","未说明 (基于 CPU 运行，使用 Piper ONNX 模型)","未说明",{"notes":106,"python":107,"dependencies":108},"该工具由 Go 编写，无需安装 Python 或手动配置 Piper。需确保系统已安装 Calibre (提供 ebook-convert) 并加入环境变量；若需输出 MP3 格式或生成章节元数据，需额外安装 ffmpeg。模型文件 (.onnx 和 .json) 可手动下载至配置目录以支持多语言。macOS 支持取决于上游 Piper 项目的 Bug 修复情况。所有转换均在本地离线完成，保障隐私。","不需要 (基于 Go 语言编译的二进制文件)",[109,110],"calibre (ebook-convert)","ffmpeg (可选，用于 MP3 和章节支持)",[21],[113,114,115,116],"audiobooks","piper","productivity","tts","2026-03-27T02:49:30.150509","2026-04-07T10:51:49.632291",[120,125,130,135,140,145],{"id":121,"question_zh":122,"answer_zh":123,"source_url":124},21718,"是否支持 Coqui XTTSv2、Tortoise TTS 或其他高级在线 TTS 服务？","目前不支持。该项目设计初衷是专注于离线、轻量级的 Piper TTS 引擎，以确保无需联网即可快速生成有声书。维护者表示目前没有计划集成需要在线 API（如 ElevenLabs, ChatGPT）或资源消耗巨大的模型（如 Tortoise），以保持项目的简洁性和实用性。","https:\u002F\u002Fgithub.com\u002FC-Loftus\u002FQuickPiperAudiobook\u002Fissues\u002F5",{"id":126,"question_zh":127,"answer_zh":128,"source_url":129},21713,"如何处理波兰语等特殊字符（如 ą, ć, ł）被替换为普通字母的问题？","这是由缺少对变音符号的支持导致的。请在运行命令时添加 `--speak-utf-8` 或 `--speak-diacritics` 参数来启用 UTF-8 特殊字符支持。例如：`.\u002FQuickPiperAudiobook --speak-utf-8 your_file.txt`。该功能已在 v0.0.4 及更高版本中修复。","https:\u002F\u002Fgithub.com\u002FC-Loftus\u002FQuickPiperAudiobook\u002Fissues\u002F8",{"id":131,"question_zh":132,"answer_zh":133,"source_url":134},21714,"运行时提示 'piper directory not found' 或 'no such file or directory' 错误怎么办？","这通常是因为程序未能自动下载或解压 Piper 引擎。解决方法是手动下载 Piper：访问 https:\u002F\u002Fgithub.com\u002Frhasspy\u002Fpiper\u002Freleases\u002Fdownload\u002Fv1.2.0\u002Fpiper_amd64.tar.gz 下载压缩包，将其解压到配置目录（通常为 `~\u002F.config\u002FQuickPiperAudiobook\u002Fpiper`），确保解压后该目录下存在可执行的 `piper` 文件。如果提示权限拒绝，请运行 `chmod +x` 赋予执行权限。","https:\u002F\u002Fgithub.com\u002FC-Loftus\u002FQuickPiperAudiobook\u002Fissues\u002F2",{"id":136,"question_zh":137,"answer_zh":138,"source_url":139},21715,"程序显示生成完成并输出了文件路径，但在该路径下找不到生成的 WAV 文件？","这是因为默认的输出目录（通常是 `~\u002FAudiobooks`）不存在，导致文件无法保存。请手动创建该目录：运行 `mkdir -p ~\u002FAudiobooks`，然后重新运行生成命令即可。","https:\u002F\u002Fgithub.com\u002FC-Loftus\u002FQuickPiperAudiobook\u002Fissues\u002F4",{"id":141,"question_zh":142,"answer_zh":143,"source_url":144},21716,"是否支持选择特定的说话人（Speaker）或使用多说话人模型？","目前版本主要支持单说话人模型，尚未在命令行中直接暴露 `-s` (speaker) 选项。虽然底层 Piper 支持多说话人模型（如 libritts），但 QuickPiperAudiobook 当前主要通过 `--model` 参数切换不同的语音模型文件。如需特定音色，建议直接在 HuggingFace 或 Piper 仓库中寻找对应预训练的单说话人模型文件并在配置中指定。","https:\u002F\u002Fgithub.com\u002FC-Loftus\u002FQuickPiperAudiobook\u002Fissues\u002F11",{"id":146,"question_zh":147,"answer_zh":148,"source_url":124},21717,"如何转换本地 HTML 文件或网页内容为有声书？","工具支持基础的 HTML 转换。只需确保输入文件具有 `.html` 扩展名（如果是本地文件），然后直接运行命令，例如：`.\u002FQuickPiperAudiobook \"Immanuel Kant - Wikipedia.html\"`。程序会自动提取文本内容。注意：目前对复杂网页语义（如隐藏内容、ARIA 角色）的处理较为基础，主要针对纯文本内容进行朗读。",[150,155,160,165,170,175],{"id":151,"version":152,"summary_zh":153,"released_at":154},127736,"v0.0.7","允许通过 `go install github.com\u002FC-Loftus\u002FQuickPiperAudiobook@latest` 进行安装","2025-11-07T16:55:39",{"id":156,"version":157,"summary_zh":158,"released_at":159},127737,"v0.0.5","# 大规模重写；支持 EPUB 章节和 MP3 输出                                                                                                                                                             \n                                                                                                                                                                                                                  \n - 传入 `--mp3` 参数即可生成 MP3 文件。（相比 WAV 格式，MP3 能有效减小音频文件体积）                                                                                                                 \n     - 需要在系统 PATH 中配置 ffmpeg。                                                                                                                                                                               \n - 转换 EPUB 文件时，传入 `--chapters` 参数，即可生成带有章节元数据的 MP3 文件。                                                                                                                      \n     - 为此我们在内部实现了一个 EPUB 解析器。                                                                                                                                                  \n     - 章节元数据以 ID3 标签的形式嵌入；请确保你的 MP3 播放器支持此功能；大多数播放器都支持。例如，iOS 上的 [BookPlayer](https:\u002F\u002Fapps.apple.com\u002Fus\u002Fapp\u002Fbookplayer\u002Fid1138219998) 或 Linux 上的 [mpv](https:\u002F\u002Fmpv.io\u002F) 都能很好地处理。                                                                                                                                                                                                  \n     - 可通过 `--threads` 参数控制转换过程中并发执行的 Goroutine 数量。不过通常情况下无需调整该参数，除非因某些原因导致线程数过高。                                        \n - 日志记录已得到改进，信息更加实用。使用 `--verbose` 参数可启用调试级别日志。                                                                                                                           \n - 代码库内部结构更加清晰                                                                                                                                                                     \n     - 增加了更多测试，并实现了更好的包隔离；同时针对中文内容增加了更多测试用例。                                                                                                                                          \n                                                                               ","2025-02-21T19:46:38",{"id":161,"version":162,"summary_zh":163,"released_at":164},127738,"v0.0.4","* 4800f9a 修复 --speak-diacritics (#12)，以便更好地支持非英语语言。现在将其重命名为 --speak-utf-8，以更清晰地说明其功能。\n  * Colton Loftus \u003C70598503+C-Loftus@users.noreply.github.com>\n* 5b5a73a 创建 FUNDING.yml\n  * Colton Loftus \u003C70598503+C-Loftus@users.noreply.github.com>","2024-10-12T22:20:55",{"id":166,"version":167,"summary_zh":168,"released_at":169},127739,"v0.0.3","修复路径检查，以确认 Piper 是否已安装。\n如果输出目录不存在，则默认创建该目录。\n添加一个 Dockerfile，用于测试和确保结果可复现。","2024-10-08T15:44:34",{"id":171,"version":172,"summary_zh":173,"released_at":174},127740,"v0.0.2","- 更新后，所有配置及 QuickPiper 的安装路径均位于 `~\u002F.config\u002FQuickPiperAudiobook` 下。\n- 更完善的边界情况处理。\n- 使用 `iconv` 将文本转换为不含特殊字符的纯文本，并去除变音符号，以避免在转换为 .txt 文件后按字面意思朗读这些符号。","2024-09-15T03:17:23",{"id":176,"version":177,"summary_zh":82,"released_at":178},127741,"0.0.1","2024-08-26T00:48:30"]