edge-TTS-record

GitHub
1.4k 175 简单 1 次阅读 1周前数据工具音频
AI 解读 由 AI 自动生成,仅供参考

edge-TTS-record 是一款专为 Windows 用户设计的实用工具,能够直接录制 Microsoft Edge 浏览器中高质量的在线语音合成(TTS)内容,并保存为标准的 WAV 音频文件。它主要解决了普通用户难以免费获取并本地化保存 Edge 内置的“晓晓”和“云扬”等超逼真中文语音的问题,无需复杂的编程知识或调用付费 API 即可轻松实现。

这款工具非常适合视频创作者、有声书爱好者、教育内容制作者以及需要高质量语音素材的普通用户使用。开发者若需快速原型验证,也可借助其便捷性进行测试。其核心技术亮点在于巧妙利用了 Edge 浏览器 Chromium 内核自带的在线语音引擎,确保了音质的自然与流畅;同时具备自动检测并安装所需浏览器环境的能力,降低了使用门槛。用户只需输入文本、调整参数试听,确认无误后一键录制即可。需要注意的是,由于依赖在线语音服务,使用时需保持网络连接,且录制过程会捕获系统全局声音,建议在不干扰的环境下操作。edge-TTS-record 以简洁的交互和稳定的性能,让高品质的 AI 语音生成变得触手可及。

使用场景

一位独立开发者正在为视障用户开发一款中文有声读物应用,急需大量高质量、自然的语音素材进行原型测试。

没有 edge-TTS-record 时

  • 音质生硬不自然:使用本地离线 TTS 引擎生成的语音机械感强,缺乏情感起伏,严重影响用户体验测试的真实性。
  • 获取成本高昂:若追求逼真效果,需付费购买商业云服务 API 或聘请真人配音,对于个人开发者而言预算压力巨大。
  • 工作流程繁琐:需要编写复杂的脚本调用云端接口,处理鉴权、速率限制及音频格式转换,耗费大量开发时间。
  • 依赖环境复杂:部分高质量在线语音服务对网络环境或特定浏览器内核有严格要求,手动录制难以批量操作且容易出错。

使用 edge-TTS-record 后

  • 即刻获得拟真语音:直接调用 Microsoft Edge 内置的“晓晓”和“云扬”在线语音,生成的 .wav 文件情感丰富、咬字清晰,几乎媲美真人录音。
  • 零成本高效产出:无需支付任何 API 费用,只需输入文本即可免费生成无限时长的高质量音频,极大降低了项目启动门槛。
  • 操作流程极简:通过图形化界面输入文本、调整参数并点击录制,几分钟内即可完成从文本到本地音频文件的转化,无需编写代码。
  • 原生兼容性强:自动检测并利用 Windows 自带的 Edge Chromium 内核,确保在联网状态下稳定输出标准格式音频,便于后续集成测试。

edge-TTS-record 让个人开发者也能以零成本、低门槛的方式,快速获取工业级逼真的中文语音素材,显著加速了有声应用的迭代进程。

运行环境要求

操作系统
  • Windows
GPU

未说明

内存

未说明

依赖
notes1. 仅支持 Windows 平台。2. 需要联网使用在线语音合成服务。3. 若系统未安装 Microsoft Edge Chromium 内核版,程序会自动下载安装。4. 录制为全局音频捕获,需避免其他软件声音干扰。5. 若无法运行,可能需要手动安装 .NET Framework。6. 在线语音似乎无法调整音调。
python未说明
.NET Framework (可能需额外安装)
Microsoft Edge (Chromium 内核)
edge-TTS-record hero image

快速开始

edge-TTS-record

⚠⚠请勿由于违法犯罪用途,否则后果自负⚠⚠

新写的另一个工具发布:https://t.bilibili.com/694237238144270361

edge-TTS-record-img

一个可以录制 Microsoft Edge 浏览器的语音合成(TTS)语音并输出为 .wav 音频的(windows平台)工具。

Microsoft Edge 浏览器中有两款非常逼真的在线(Online)中文(zh-CN)语音:Xiaoxiao、Yunyang。

用法:

  1. 下载 edge-TTS-record.exe,运行并允许联网
  2. 在文本编辑框中输入文本,调整参数,点击试听
  3. 没问题就可以点击录制了,音频文件会保存在指定的目录下

演示:https://www.bilibili.com/video/BV1eK411c73s

注意:

  • 需要 Microsoft Edge 浏览器 Chromium 内核版,一般是 Windows 10 自带的,如果系统中没有安装,程序将自动为你下载安装
  • 不管是试听还是录制,使用在线(Online)语音都需确保电脑是联网的
  • 录制是全局的,应避免其他软件声音的干扰
  • 在线(Online)语音似乎无法调整音调
  • 当无法录制时,你可能需要额外安装 .NET Framework: https://www.microsoft.com/zh-CN/download/details.aspx?id=17851

TODO:

  • 路径配置
  • 可自定义选择要录制的设备
  • 软件更新检测

相关仓库:

界面(vue.js):https://github.com/LuckyHookin/tts-record-html

音频录制模块(C#,NAudio):https://github.com/LuckyHookin/RecordAudio

版本历史

0.1.12022/05/09
0.0.0.42021/04/26
0.0.0.32021/04/26

常见问题

相似工具推荐

openclaw

OpenClaw 是一款专为个人打造的本地化 AI 助手,旨在让你在自己的设备上拥有完全可控的智能伙伴。它打破了传统 AI 助手局限于特定网页或应用的束缚,能够直接接入你日常使用的各类通讯渠道,包括微信、WhatsApp、Telegram、Discord、iMessage 等数十种平台。无论你在哪个聊天软件中发送消息,OpenClaw 都能即时响应,甚至支持在 macOS、iOS 和 Android 设备上进行语音交互,并提供实时的画布渲染功能供你操控。 这款工具主要解决了用户对数据隐私、响应速度以及“始终在线”体验的需求。通过将 AI 部署在本地,用户无需依赖云端服务即可享受快速、私密的智能辅助,真正实现了“你的数据,你做主”。其独特的技术亮点在于强大的网关架构,将控制平面与核心助手分离,确保跨平台通信的流畅性与扩展性。 OpenClaw 非常适合希望构建个性化工作流的技术爱好者、开发者,以及注重隐私保护且不愿被单一生态绑定的普通用户。只要具备基础的终端操作能力(支持 macOS、Linux 及 Windows WSL2),即可通过简单的命令行引导完成部署。如果你渴望拥有一个懂你

349.3k|★★★☆☆|5天前
Agent开发框架图像

ML-For-Beginners

ML-For-Beginners 是由微软推出的一套系统化机器学习入门课程,旨在帮助零基础用户轻松掌握经典机器学习知识。这套课程将学习路径规划为 12 周,包含 26 节精炼课程和 52 道配套测验,内容涵盖从基础概念到实际应用的完整流程,有效解决了初学者面对庞大知识体系时无从下手、缺乏结构化指导的痛点。 无论是希望转型的开发者、需要补充算法背景的研究人员,还是对人工智能充满好奇的普通爱好者,都能从中受益。课程不仅提供了清晰的理论讲解,还强调动手实践,让用户在循序渐进中建立扎实的技能基础。其独特的亮点在于强大的多语言支持,通过自动化机制提供了包括简体中文在内的 50 多种语言版本,极大地降低了全球不同背景用户的学习门槛。此外,项目采用开源协作模式,社区活跃且内容持续更新,确保学习者能获取前沿且准确的技术资讯。如果你正寻找一条清晰、友好且专业的机器学习入门之路,ML-For-Beginners 将是理想的起点。

85.1k|★★☆☆☆|昨天
图像数据工具视频

funNLP

funNLP 是一个专为中文自然语言处理(NLP)打造的超级资源库,被誉为"NLP 民工的乐园”。它并非单一的软件工具,而是一个汇集了海量开源项目、数据集、预训练模型和实用代码的综合性平台。 面对中文 NLP 领域资源分散、入门门槛高以及特定场景数据匮乏的痛点,funNLP 提供了“一站式”解决方案。这里不仅涵盖了分词、命名实体识别、情感分析、文本摘要等基础任务的标准工具,还独特地收录了丰富的垂直领域资源,如法律、医疗、金融行业的专用词库与数据集,甚至包含古诗词生成、歌词创作等趣味应用。其核心亮点在于极高的全面性与实用性,从基础的字典词典到前沿的 BERT、GPT-2 模型代码,再到高质量的标注数据和竞赛方案,应有尽有。 无论是刚刚踏入 NLP 领域的学生、需要快速验证想法的算法工程师,还是从事人工智能研究的学者,都能在这里找到急需的“武器弹药”。对于开发者而言,它能大幅减少寻找数据和复现模型的时间;对于研究者,它提供了丰富的基准测试资源和前沿技术参考。funNLP 以开放共享的精神,极大地降低了中文自然语言处理的开发与研究成本,是中文 AI 社区不可或缺的宝藏仓库。

79.9k|★☆☆☆☆|2天前
语言模型数据工具其他

cs-video-courses

cs-video-courses 是一个精心整理的计算机科学视频课程清单,旨在为自学者提供系统化的学习路径。它汇集了全球知名高校(如加州大学伯克利分校、新南威尔士大学等)的完整课程录像,涵盖从编程基础、数据结构与算法,到操作系统、分布式系统、数据库等核心领域,并深入延伸至人工智能、机器学习、量子计算及区块链等前沿方向。 面对网络上零散且质量参差不齐的教学资源,cs-video-courses 解决了学习者难以找到成体系、高难度大学级别课程的痛点。该项目严格筛选内容,仅收录真正的大学层级课程,排除了碎片化的简短教程或商业广告,确保用户能接触到严谨的学术内容。 这份清单特别适合希望夯实计算机基础的开发者、需要补充特定领域知识的研究人员,以及渴望像在校生一样系统学习计算机科学的自学者。其独特的技术亮点在于分类极其详尽,不仅包含传统的软件工程与网络安全,还细分了生成式 AI、大语言模型、计算生物学等新兴学科,并直接链接至官方视频播放列表,让用户能一站式获取高质量的教育资源,免费享受世界顶尖大学的课堂体验。

79.8k|★☆☆☆☆|2天前
其他图像数据工具

scikit-learn

scikit-learn 是一个基于 Python 构建的开源机器学习库,依托于 SciPy、NumPy 等科学计算生态,旨在让机器学习变得简单高效。它提供了一套统一且简洁的接口,涵盖了从数据预处理、特征工程到模型训练、评估及选择的全流程工具,内置了包括线性回归、支持向量机、随机森林、聚类等在内的丰富经典算法。 对于希望快速验证想法或构建原型的数据科学家、研究人员以及 Python 开发者而言,scikit-learn 是不可或缺的基础设施。它有效解决了机器学习入门门槛高、算法实现复杂以及不同模型间调用方式不统一的痛点,让用户无需重复造轮子,只需几行代码即可调用成熟的算法解决分类、回归、聚类等实际问题。 其核心技术亮点在于高度一致的 API 设计风格,所有估算器(Estimator)均遵循相同的调用逻辑,极大地降低了学习成本并提升了代码的可读性与可维护性。此外,它还提供了强大的模型选择与评估工具,如交叉验证和网格搜索,帮助用户系统地优化模型性能。作为一个由全球志愿者共同维护的成熟项目,scikit-learn 以其稳定性、详尽的文档和活跃的社区支持,成为连接理论学习与工业级应用的最

65.8k|★☆☆☆☆|昨天
开发框架其他数据工具

keras

Keras 是一个专为人类设计的深度学习框架,旨在让构建和训练神经网络变得简单直观。它解决了开发者在不同深度学习后端之间切换困难、模型开发效率低以及难以兼顾调试便捷性与运行性能的痛点。 无论是刚入门的学生、专注算法的研究人员,还是需要快速落地产品的工程师,都能通过 Keras 轻松上手。它支持计算机视觉、自然语言处理、音频分析及时间序列预测等多种任务。 Keras 3 的核心亮点在于其独特的“多后端”架构。用户只需编写一套代码,即可灵活选择 TensorFlow、JAX、PyTorch 或 OpenVINO 作为底层运行引擎。这一特性不仅保留了 Keras 一贯的高层易用性,还允许开发者根据需求自由选择:利用 JAX 或 PyTorch 的即时执行模式进行高效调试,或切换至速度最快的后端以获得最高 350% 的性能提升。此外,Keras 具备强大的扩展能力,能无缝从本地笔记本电脑扩展至大规模 GPU 或 TPU 集群,是连接原型开发与生产部署的理想桥梁。

63.9k|★★☆☆☆|1周前
开发框架数据工具其他