[{"data":1,"prerenderedAt":-1},["ShallowReactive",2],{"similar-azuwis--pianotrans":3,"tool-azuwis--pianotrans":64},[4,17,27,35,43,56],{"id":5,"name":6,"github_repo":7,"description_zh":8,"stars":9,"difficulty_score":10,"last_commit_at":11,"category_tags":12,"status":16},3808,"stable-diffusion-webui","AUTOMATIC1111\u002Fstable-diffusion-webui","stable-diffusion-webui 是一个基于 Gradio 构建的网页版操作界面，旨在让用户能够轻松地在本地运行和使用强大的 Stable Diffusion 图像生成模型。它解决了原始模型依赖命令行、操作门槛高且功能分散的痛点，将复杂的 AI 绘图流程整合进一个直观易用的图形化平台。\n\n无论是希望快速上手的普通创作者、需要精细控制画面细节的设计师，还是想要深入探索模型潜力的开发者与研究人员，都能从中获益。其核心亮点在于极高的功能丰富度：不仅支持文生图、图生图、局部重绘（Inpainting）和外绘（Outpainting）等基础模式，还独创了注意力机制调整、提示词矩阵、负向提示词以及“高清修复”等高级功能。此外，它内置了 GFPGAN 和 CodeFormer 等人脸修复工具，支持多种神经网络放大算法，并允许用户通过插件系统无限扩展能力。即使是显存有限的设备，stable-diffusion-webui 也提供了相应的优化选项，让高质量的 AI 艺术创作变得触手可及。",162132,3,"2026-04-05T11:01:52",[13,14,15],"开发框架","图像","Agent","ready",{"id":18,"name":19,"github_repo":20,"description_zh":21,"stars":22,"difficulty_score":23,"last_commit_at":24,"category_tags":25,"status":16},1381,"everything-claude-code","affaan-m\u002Feverything-claude-code","everything-claude-code 是一套专为 AI 编程助手（如 Claude Code、Codex、Cursor 等）打造的高性能优化系统。它不仅仅是一组配置文件，而是一个经过长期实战打磨的完整框架，旨在解决 AI 代理在实际开发中面临的效率低下、记忆丢失、安全隐患及缺乏持续学习能力等核心痛点。\n\n通过引入技能模块化、直觉增强、记忆持久化机制以及内置的安全扫描功能，everything-claude-code 能显著提升 AI 在复杂任务中的表现，帮助开发者构建更稳定、更智能的生产级 AI 代理。其独特的“研究优先”开发理念和针对 Token 消耗的优化策略，使得模型响应更快、成本更低，同时有效防御潜在的攻击向量。\n\n这套工具特别适合软件开发者、AI 研究人员以及希望深度定制 AI 工作流的技术团队使用。无论您是在构建大型代码库，还是需要 AI 协助进行安全审计与自动化测试，everything-claude-code 都能提供强大的底层支持。作为一个曾荣获 Anthropic 黑客大奖的开源项目，它融合了多语言支持与丰富的实战钩子（hooks），让 AI 真正成长为懂上",138956,2,"2026-04-05T11:33:21",[13,15,26],"语言模型",{"id":28,"name":29,"github_repo":30,"description_zh":31,"stars":32,"difficulty_score":23,"last_commit_at":33,"category_tags":34,"status":16},2271,"ComfyUI","Comfy-Org\u002FComfyUI","ComfyUI 是一款功能强大且高度模块化的视觉 AI 引擎，专为设计和执行复杂的 Stable Diffusion 图像生成流程而打造。它摒弃了传统的代码编写模式，采用直观的节点式流程图界面，让用户通过连接不同的功能模块即可构建个性化的生成管线。\n\n这一设计巧妙解决了高级 AI 绘图工作流配置复杂、灵活性不足的痛点。用户无需具备编程背景，也能自由组合模型、调整参数并实时预览效果，轻松实现从基础文生图到多步骤高清修复等各类复杂任务。ComfyUI 拥有极佳的兼容性，不仅支持 Windows、macOS 和 Linux 全平台，还广泛适配 NVIDIA、AMD、Intel 及苹果 Silicon 等多种硬件架构，并率先支持 SDXL、Flux、SD3 等前沿模型。\n\n无论是希望深入探索算法潜力的研究人员和开发者，还是追求极致创作自由度的设计师与资深 AI 绘画爱好者，ComfyUI 都能提供强大的支持。其独特的模块化架构允许社区不断扩展新功能，使其成为当前最灵活、生态最丰富的开源扩散模型工具之一，帮助用户将创意高效转化为现实。",107662,"2026-04-03T11:11:01",[13,14,15],{"id":36,"name":37,"github_repo":38,"description_zh":39,"stars":40,"difficulty_score":23,"last_commit_at":41,"category_tags":42,"status":16},3704,"NextChat","ChatGPTNextWeb\u002FNextChat","NextChat 是一款轻量且极速的 AI 助手，旨在为用户提供流畅、跨平台的大模型交互体验。它完美解决了用户在多设备间切换时难以保持对话连续性，以及面对众多 AI 模型不知如何统一管理的痛点。无论是日常办公、学习辅助还是创意激发，NextChat 都能让用户随时随地通过网页、iOS、Android、Windows、MacOS 或 Linux 端无缝接入智能服务。\n\n这款工具非常适合普通用户、学生、职场人士以及需要私有化部署的企业团队使用。对于开发者而言，它也提供了便捷的自托管方案，支持一键部署到 Vercel 或 Zeabur 等平台。\n\nNextChat 的核心亮点在于其广泛的模型兼容性，原生支持 Claude、DeepSeek、GPT-4 及 Gemini Pro 等主流大模型，让用户在一个界面即可自由切换不同 AI 能力。此外，它还率先支持 MCP（Model Context Protocol）协议，增强了上下文处理能力。针对企业用户，NextChat 提供专业版解决方案，具备品牌定制、细粒度权限控制、内部知识库整合及安全审计等功能，满足公司对数据隐私和个性化管理的高标准要求。",87618,"2026-04-05T07:20:52",[13,26],{"id":44,"name":45,"github_repo":46,"description_zh":47,"stars":48,"difficulty_score":23,"last_commit_at":49,"category_tags":50,"status":16},2268,"ML-For-Beginners","microsoft\u002FML-For-Beginners","ML-For-Beginners 是由微软推出的一套系统化机器学习入门课程，旨在帮助零基础用户轻松掌握经典机器学习知识。这套课程将学习路径规划为 12 周，包含 26 节精炼课程和 52 道配套测验，内容涵盖从基础概念到实际应用的完整流程，有效解决了初学者面对庞大知识体系时无从下手、缺乏结构化指导的痛点。\n\n无论是希望转型的开发者、需要补充算法背景的研究人员，还是对人工智能充满好奇的普通爱好者，都能从中受益。课程不仅提供了清晰的理论讲解，还强调动手实践，让用户在循序渐进中建立扎实的技能基础。其独特的亮点在于强大的多语言支持，通过自动化机制提供了包括简体中文在内的 50 多种语言版本，极大地降低了全球不同背景用户的学习门槛。此外，项目采用开源协作模式，社区活跃且内容持续更新，确保学习者能获取前沿且准确的技术资讯。如果你正寻找一条清晰、友好且专业的机器学习入门之路，ML-For-Beginners 将是理想的起点。",84991,"2026-04-05T10:45:23",[14,51,52,53,15,54,26,13,55],"数据工具","视频","插件","其他","音频",{"id":57,"name":58,"github_repo":59,"description_zh":60,"stars":61,"difficulty_score":10,"last_commit_at":62,"category_tags":63,"status":16},3128,"ragflow","infiniflow\u002Fragflow","RAGFlow 是一款领先的开源检索增强生成（RAG）引擎，旨在为大语言模型构建更精准、可靠的上下文层。它巧妙地将前沿的 RAG 技术与智能体（Agent）能力相结合，不仅支持从各类文档中高效提取知识，还能让模型基于这些知识进行逻辑推理和任务执行。\n\n在大模型应用中，幻觉问题和知识滞后是常见痛点。RAGFlow 通过深度解析复杂文档结构（如表格、图表及混合排版），显著提升了信息检索的准确度，从而有效减少模型“胡编乱造”的现象，确保回答既有据可依又具备时效性。其内置的智能体机制更进一步，使系统不仅能回答问题，还能自主规划步骤解决复杂问题。\n\n这款工具特别适合开发者、企业技术团队以及 AI 研究人员使用。无论是希望快速搭建私有知识库问答系统，还是致力于探索大模型在垂直领域落地的创新者，都能从中受益。RAGFlow 提供了可视化的工作流编排界面和灵活的 API 接口，既降低了非算法背景用户的上手门槛，也满足了专业开发者对系统深度定制的需求。作为基于 Apache 2.0 协议开源的项目，它正成为连接通用大模型与行业专有知识之间的重要桥梁。",77062,"2026-04-04T04:44:48",[15,14,13,26,54],{"id":65,"github_repo":66,"name":67,"description_en":68,"description_zh":69,"ai_summary_zh":69,"readme_en":70,"readme_zh":71,"quickstart_zh":72,"use_case_zh":73,"hero_image_url":74,"owner_login":75,"owner_name":76,"owner_avatar_url":77,"owner_bio":78,"owner_company":78,"owner_location":78,"owner_email":78,"owner_twitter":78,"owner_website":79,"owner_url":80,"languages":81,"stars":102,"forks":103,"last_commit_at":104,"license":78,"difficulty_score":10,"env_os":105,"env_gpu":106,"env_ram":107,"env_deps":108,"category_tags":117,"github_topics":118,"view_count":10,"oss_zip_url":78,"oss_zip_packed_at":78,"status":16,"created_at":122,"updated_at":123,"faqs":124,"releases":165},1003,"azuwis\u002Fpianotrans","pianotrans","Simple GUI for ByteDance's Piano Transcription with Pedals","pianotrans 让你轻松把钢琴录音变成带踏板效果的 MIDI 文件！它基于字节跳动的开源技术，能精准捕捉音符和踏板细节，还原真实演奏的丰富层次。以前这类专业转录工具操作复杂，需要技术背景，pianotrans 用直观的图形界面解决了这个痛点——无需编程知识，普通用户也能一键完成：在 Windows、Mac 或 Linux 上打开软件，选中音频或视频文件，几秒后就能生成 MIDI 文件，方便用于教学示范、个人练习或音乐存档。它自动利用 GPU 加速处理（内存需至少 4GB），速度更快；遇到问题还能切换到 CPU 模式确保稳定。特别适合音乐教师、学生或爱好者使用，帮你省去繁琐设置，专注音乐创作本身。试试看，让钢琴录音焕发新生！","## Simple GUI for ByteDance's Piano Transcription with Pedals\r\n\r\n[![Test](https:\u002F\u002Fgithub.com\u002Fazuwis\u002Fpianotrans\u002Factions\u002Fworkflows\u002Ftest.yml\u002Fbadge.svg)](https:\u002F\u002Fgithub.com\u002Fazuwis\u002Fpianotrans\u002Factions\u002Fworkflows\u002Ftest.yml)\r\n\r\n[ByteDance's Piano Transcription][1] is the PyTorch implementation of the\r\npiano transcription system, \"High-resolution Piano Transcription with Pedals\r\nby Regressing Onsets and Offsets Times `[1]`\".\r\n\r\nUsing this, we can transcribe piano recordings into MIDI files with pedals.\r\n\r\nThis is a simple GUI and packaging for Windows and [Nix on Linux\u002FmacOS][2].\r\n\r\n\u003Cp align=\"center\" float=\"left\">\r\n  \u003Cimg src=\"https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002Fazuwis_pianotrans_readme_edbf69324e9d.png\" width=\"49%\" \u002F>\r\n  \u003Cimg src=\"https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002Fazuwis_pianotrans_readme_a8be192efe98.png\" width=\"49%\" \u002F>\r\n  \u003Cimg src=\"https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002Fazuwis_pianotrans_readme_0635a0153f51.png\" width=\"98.6%\" \u002F>\r\n\u003C\u002Fp>\r\n\r\n### Requirement\r\n\r\n* OS: Windows 7 or later (64-bit), Linux, macOS (Intel\u002FM1)\r\n* Memory: at least 4G\r\n\r\nOnly Windows 10, Debian Linux 10, and macOS 12.1 M1 are tested.\r\n\r\n### How to use on Windows\r\n\r\n1. Download [Microsoft Visual C++ Redistributable for Visual Studio 2015, 2017 and 2019][3] `vc_redist_x64.exe` and install\r\n2. Download and unpack [PianoTrans-v1.0.7z][4] (1.5GB download, unpack using [7zip][5])\r\n3. Close other apps to free memory, need at least 2G free memory\r\n4. Run `PianoTrans.exe` in `PianoTrans` directory\r\n5. Choose audio\u002Fvideo files, hold `CTRL` to select multiple files\r\n6. Result MIDI files are in the same directory as the input files\r\n\r\nIf you want right click menu, run `RightClickMenuRegister.bat`, then you can\r\nselect multiple audio\u002Fvideo files, right click and choose `Piano Transcribe`.\r\n\r\nPianoTrans automatically uses GPU for inference, if you encounter any problem,\r\nyou can try `PianoTrans-CPU.bat` to force using CPU.\r\n\r\n### How to use on Linux\u002FmacOS using Nix\r\n\r\nNote: This howto is for [Nix][2] on Linux\u002FmacOS, if you don't use Nix, you can\r\nalso follow the upstream [install and usage][6] guide for Python pip instead.\r\n\r\n1. Open the terminal\r\n2. Install and setup Nix:\r\n   ``` sh\r\n   sh \u003C(curl -L https:\u002F\u002Fnixos.org\u002Fnix\u002Finstall) --daemon\r\n   mkdir -p ~\u002F.config\u002Fnix\r\n   echo 'experimental-features = nix-command flakes' > ~\u002F.config\u002Fnix\u002Fnix.conf\r\n   ```\r\n   See https:\u002F\u002Fnixos.org\u002Fdownload.html for more details\r\n3. Use Nix to install pianotrans:\r\n   ``` sh\r\n   nix profile install github:azuwis\u002Fpianotrans\r\n   ```\r\n4. Run `pianotrans` to open the GUI, choose audio\u002Fvideo files, hold `CTRL`\r\n   (`⌘` for macOS) to select multiple files\r\n\r\nFor CLI usage, run `pianotrans file1 file2 ...`.\r\n\r\nTo upgrade pianotrans, run:\r\n``` sh\r\n$ nix profile list\r\n0 github:azuwis\u002Fpianotrans#defaultPackage.aarch64-linux github:azuwis\u002Fpianotrans\u002Fe19d5fd12f4295816fad49f6398e2e53ed2d2b7a#defaultPackage.aarch64-linux \u002Fnix\u002Fstore\u002Fzdalndvcralish8d43drzslv0p4pm97v-python3.9-pianotrans-0.2.1\r\n# list nix profiles, `0` is pianotrans\r\n$ nix --option tarball-ttl 1 profile upgrade 0\r\n$ nix profile list\r\n0 github:azuwis\u002Fpianotrans#defaultPackage.aarch64-linux github:azuwis\u002Fpianotrans\u002Fe944720dd0dfcc2b87dcc39c1fdaab086eba4ca6#defaultPackage.aarch64-linux \u002Fnix\u002Fstore\u002Frv5iikrdvc7jrc7mqs8mkc21qh2gklhx-python3.9-pianotrans-1.0\r\n# pianotrans upgraded to v1.0\r\n```\r\n\r\n[1]: https:\u002F\u002Fgithub.com\u002Fbytedance\u002Fpiano_transcription\r\n[2]: https:\u002F\u002Fnixos.org\r\n[3]: https:\u002F\u002Fsupport.microsoft.com\u002Fen-us\u002Fhelp\u002F2977003\u002Fthe-latest-supported-visual-c-downloads\r\n[4]: https:\u002F\u002Fgithub.com\u002Fazuwis\u002FPianoTrans\u002Freleases\u002Fdownload\u002Fv1.0\u002FPianoTrans-v1.0.7z\r\n[5]: https:\u002F\u002Fwww.7-zip.org\u002Fdownload.html\r\n[6]: https:\u002F\u002Fgithub.com\u002Fqiuqiangkong\u002Fpiano_transcription_inference\r\n\r\n### FAQ\r\n\r\nQ: Can you improve transcription result?\r\n\r\nA: This project is about packaging for https:\u002F\u002Fgithub.com\u002Fbytedance\u002Fpiano_transcription, as long as it gives you MIDI files, all other issues are out of scope of this project.\r\n\r\nYou should report to the upstream project here https:\u002F\u002Fgithub.com\u002Fbytedance\u002Fpiano_transcription\u002Fissues\r\n\r\n### Changelog\r\n\r\n#### [1.0.1] - 2023-02-09\r\n\r\n* Add `--cli` option to force disable GUI\r\n* Remove filetypes arg from askopenfilenames to avoid crash\r\n* Update Nix flake, and remove mido\u002Fsoundfile\u002Ftorchlibrosa\u002Fpiano-transcription-inference overlay, all patches accepted in nixpkgs, this means more dependances can be fetched directly from Nix binary cache, less local builds\r\n* Add github test workflow\r\n\r\n#### [1.0] - 2022-02-21\r\n\r\n* Support Linux\u002FmacOS using Nix\r\n* All platforms:\r\n  - Add real GUI alongside CLI\r\n  - GUI allow adding files to transcribe queue\r\n* Windows:\r\n  - Right-click menu supports multiple files (need to re-run `RightClickMenuRegister.bat`)\r\n  - Update pytorch to 1.10.2\r\n\r\n#### [0.2.1] - 2021-12-23\r\n\r\n* Update pytorch to 1.10.1.\r\n* Update piano-transcription-inference to 0.0.5\r\n\r\n#### [0.2] - 2021-09-27\r\n\r\n* Update pytorch to 1.9.1.\r\n* Add PianoTrans-CPU.bat to force using CPU for inference.\r\n\r\n#### [0.1] - 2021-02-02\r\n\r\n* Initial release.\r\n\r\n## Cite\r\n`[1]` Qiuqiang Kong, Bochen Li, Xuchen Song, Yuan Wan, and Yuxuan Wang. \"High-resolution Piano Transcription with Pedals by Regressing Onsets and Offsets Times.\" arXiv preprint arXiv:2010.01815 (2020). [[pdf]](https:\u002F\u002Farxiv.org\u002Fpdf\u002F2010.01815.pdf)\r\n","## 适用于字节跳动钢琴转谱（含踏板）的简单 GUI\n\n[![Test](https:\u002F\u002Fgithub.com\u002Fazuwis\u002Fpianotrans\u002Factions\u002Fworkflows\u002Ftest.yml\u002Fbadge.svg)](https:\u002F\u002Fgithub.com\u002Fazuwis\u002Fpianotrans\u002Factions\u002Fworkflows\u002Ftest.yml)\n\n[字节跳动的 Piano Transcription][1] 是钢琴转谱系统的 PyTorch（深度学习框架）实现，该系统名为\"High-resolution Piano Transcription with Pedals by Regressing Onsets and Offsets Times `[1]`\"。\n\n利用此工具，我们可以将钢琴录音转录为包含踏板信息的 MIDI 文件。\n\n这是为 Windows 和 [Linux\u002FmacOS 上的 Nix][2] 提供的简单 GUI（图形用户界面）和打包方案。\n\n\u003Cp align=\"center\" float=\"left\">\n  \u003Cimg src=\"https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002Fazuwis_pianotrans_readme_edbf69324e9d.png\" width=\"49%\" \u002F>\n  \u003Cimg src=\"https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002Fazuwis_pianotrans_readme_a8be192efe98.png\" width=\"49%\" \u002F>\n  \u003Cimg src=\"https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002Fazuwis_pianotrans_readme_0635a0153f51.png\" width=\"98.6%\" \u002F>\n\u003C\u002Fp>\n\n### 系统要求\n\n* OS（操作系统）：Windows 7 或更高版本（64位）、Linux、macOS（Intel\u002FM1）\n* 内存：至少 4G\n\n仅在 Windows 10、Debian Linux 10 和 macOS 12.1 M1 上进行了测试。\n\n### Windows 使用说明\n\n1. 下载 [Microsoft Visual C++ Redistributable for Visual Studio 2015, 2017 and 2019][3] `vc_redist_x64.exe` 并安装\n2. 下载并解压 [PianoTrans-v1.0.7z][4]（下载大小 1.5GB，请使用 [7zip][5] 解压）\n3. 关闭其他应用程序以释放内存，至少需要 2G 可用内存\n4. 在 `PianoTrans` 目录中运行 `PianoTrans.exe`\n5. 选择音频\u002F视频文件，按住 `CTRL`（控制键）可选择多个文件\n6. 生成的 MIDI 文件将与输入文件在同一目录下\n\n如果需要右键菜单功能，请运行 `RightClickMenuRegister.bat`（右键菜单注册脚本），然后您可以选择多个音频\u002F视频文件，右键点击并选择 `Piano Transcribe`。\n\nPianoTrans 会自动使用 GPU（图形处理器）进行推理，如果遇到任何问题，可以尝试运行 `PianoTrans-CPU.bat` 强制使用 CPU（中央处理器）。\n\n### 在 Linux\u002FmacOS 上使用 Nix 的方法\n\n注意：本指南适用于 Linux\u002FmacOS 上的 [Nix][2]（包管理器），如果您不使用 Nix，也可以按照上游的 [安装和使用][6] 指南使用 Python pip。\n\n1. 打开终端\n2. 安装并配置 Nix：\n   ``` sh\n   sh \u003C(curl -L https:\u002F\u002Fnixos.org\u002Fnix\u002Finstall) --daemon\n   mkdir -p ~\u002F.config\u002Fnix\n   echo 'experimental-features = nix-command flakes' > ~\u002F.config\u002Fnix\u002Fnix.conf\n   ```\n   更多详情请访问 https:\u002F\u002Fnixos.org\u002Fdownload.html\n3. 使用 Nix 安装 pianotrans：\n   ``` sh\n   nix profile install github:azuwis\u002Fpianotrans\n   ```\n4. 运行 `pianotrans` 打开 GUI，选择音频\u002F视频文件，按住 `CTRL`（macOS 上为 `⌘`）可选择多个文件\n\nCLI（命令行界面）使用方法：运行 `pianotrans file1 file2 ...`。\n\n升级 pianotrans 请运行：\n``` sh\n$ nix profile list\n0 github:azuwis\u002Fpianotrans#defaultPackage.aarch64-linux github:azuwis\u002Fpianotrans\u002Fe19d5fd12f4295816fad49f6398e2e53ed2d2b7a#defaultPackage.aarch64-linux \u002Fnix\u002Fstore\u002Fzdalndvcralish8d43drzslv0p4pm97v-python3.9-pianotrans-0.2.1\n# 列出 nix profiles，`0` 是 pianotrans\n$ nix --option tarball-ttl 1 profile upgrade 0\n$ nix profile list\n0 github:azuwis\u002Fpianotrans#defaultPackage.aarch64-linux github:azuwis\u002Fpianotrans\u002Fe944720dd0dfcc2b87dcc39c1fdaab086eba4ca6#defaultPackage.aarch64-linux \u002Fnix\u002Fstore\u002Frv5iikrdvc7jrc7mqs8mkc21qh2gklhx-python3.9-pianotrans-1.0\n# pianotrans 已升级到 v1.0\n```\n\n[1]: https:\u002F\u002Fgithub.com\u002Fbytedance\u002Fpiano_transcription\n[2]: https:\u002F\u002Fnixos.org\n[3]: https:\u002F\u002Fsupport.microsoft.com\u002Fen-us\u002Fhelp\u002F2977003\u002Fthe-latest-supported-visual-c-downloads\n[4]: https:\u002F\u002Fgithub.com\u002Fazuwis\u002FPianoTrans\u002Freleases\u002Fdownload\u002Fv1.0\u002FPianoTrans-v1.0.7z\n[5]: https:\u002F\u002Fwww.7-zip.org\u002Fdownload.html\n[6]: https:\u002F\u002Fgithub.com\u002Fqiuqiangkong\u002Fpiano_transcription_inference\n\n### 常见问题\n\nQ：能否改进转录结果？\n\nA：本项目是为 https:\u002F\u002Fgithub.com\u002Fbytedance\u002Fpiano_transcription 提供打包方案，只要它能生成 MIDI 文件，其他所有问题都不在本项目范围内。\n\n您应该向上游项目报告问题：https:\u002F\u002Fgithub.com\u002Fbytedance\u002Fpiano_transcription\u002Fissues\n\n### 更新日志\n\n#### [1.0.1] - 2023-02-09\n\n* 添加 `--cli` 选项以强制禁用 GUI（图形用户界面）\n* 从 askopenfilenames 中移除 filetypes 参数以避免崩溃\n* 更新 Nix flake，并移除 mido\u002Fsoundfile\u002Ftorchlibrosa\u002Fpiano-transcription-inference 的 overlay，所有补丁已被 nixpkgs 接受，这意味着更多依赖可以直接从 Nix 二进制缓存获取，减少本地构建\n* 添加 GitHub 测试工作流\n\n#### [1.0] - 2022-02-21\n\n* 支持使用 Nix 的 Linux\u002FmacOS\n* 所有平台：\n  - 在 CLI（命令行界面）之外添加真正的 GUI（图形用户界面）\n  - GUI 允许添加文件到转录队列\n* Windows：\n  - 右键菜单支持多个文件（需要重新运行 `RightClickMenuRegister.bat`）\n  - 更新 pytorch 到 1.10.2\n\n#### [0.2.1] - 2021-12-23\n\n* 更新 pytorch 到 1.10.1\n* 更新 piano-transcription-inference 到 0.0.5\n\n#### [0.2] - 2021-09-27\n\n* 更新 pytorch 到 1.9.1\n* 添加 PianoTrans-CPU.bat 以强制使用 CPU（中央处理器）进行推理\n\n#### [0.1] - 2021-02-02\n\n* 初始版本\n\n## 引用\n`[1]` Qiuqiang Kong, Bochen Li, Xuchen Song, Yuan Wan, and Yuxuan Wang. \"High-resolution Piano Transcription with Pedals by Regressing Onsets and Offsets Times.\" arXiv preprint arXiv:2010.01815 (2020). [[pdf]](https:\u002F\u002Farxiv.org\u002Fpdf\u002F2010.01815.pdf)","# PianoTrans 快速上手指南\n\n将钢琴录音转换为带踏板的 MIDI 文件。\n\n## 环境准备\n\n**系统要求**\n- Windows 7 或更高版本（64 位）、Linux、macOS（Intel\u002FM1）\n- 至少 4GB 内存（建议关闭其他应用释放至少 2GB 可用内存）\n\n**前置依赖**\n- **Windows**: 需安装 [Microsoft Visual C++ Redistributable for Visual Studio 2015, 2017 and 2019](https:\u002F\u002Fsupport.microsoft.com\u002Fen-us\u002Fhelp\u002F2977003\u002Fthe-latest-supported-visual-c-downloads) (`vc_redist_x64.exe`)\n- **Linux\u002FmacOS**: 需安装 [Nix](https:\u002F\u002Fnixos.org) 包管理器\n\n## 安装步骤\n\n### Windows 安装\n\n1. 下载并安装 Visual C++ Redistributable（`vc_redist_x64.exe`）\n2. 下载 [PianoTrans-v1.0.7z](https:\u002F\u002Fgithub.com\u002Fazuwis\u002FPianoTrans\u002Freleases\u002Fdownload\u002Fv1.0\u002FPianoTrans-v1.0.7z)（1.5GB）\n3. 使用 [7-Zip](https:\u002F\u002Fwww.7-zip.org\u002Fdownload.html) 解压\n4. 进入 `PianoTrans` 目录，双击运行 `PianoTrans.exe`\n\n### Linux\u002FmacOS 安装（使用 Nix）\n\n```sh\n# 1. 安装 Nix\nsh \u003C(curl -L https:\u002F\u002Fnixos.org\u002Fnix\u002Finstall) --daemon\nmkdir -p ~\u002F.config\u002Fnix\necho 'experimental-features = nix-command flakes' > ~\u002F.config\u002Fnix\u002Fnix.conf\n\n# 2. 安装 pianotrans\nnix profile install github:azuwis\u002Fpianotrans\n```\n\n## 基本使用\n\n### GUI 模式\n\n- **Windows**: 运行 `PianoTrans.exe`，选择音频\u002F视频文件（按住 `CTRL` 可多选）\n- **Linux\u002FmacOS**: 终端运行 `pianotrans`，选择文件（按住 `CTRL`\u002F`⌘` 可多选）\n\n转换后的 MIDI 文件将保存在与输入文件相同的目录中。\n\n### 命令行模式\n\n```sh\npianotrans 文件1 文件2 ...\n```\n\n### Windows 右键菜单（可选）\n\n运行 `RightClickMenuRegister.bat` 注册右键菜单，之后可直接右键选择多个文件并点击 `Piano Transcribe` 进行转换。\n\n### 故障排查\n\n若 GPU 模式出现问题，可强制使用 CPU：\n- **Windows**: 运行 `PianoTrans-CPU.bat`\n- **Linux\u002FmacOS**: 暂不支持，建议检查 CUDA 环境","独立音乐制作人小李刚完成一首钢琴曲的即兴创作，用手机录下了 5 个演奏版本，想将最满意的版本转成 MIDI 导入 Logic Pro 进行后期编辑和配器。\n\n### 没有 pianotrans 时\n\n- **手动记谱耗时耗力**：小李需要反复听录音，在钢琴卷帘窗里逐个音符手动输入，一个 3 分钟的曲子至少要花 2 小时，还容易听错音高和节奏。\n- **踏板信息完全丢失**：普通音频转 MIDI 工具只能识别音符，无法捕捉延音踏板、弱音踏板的细微变化，导致转出来的 MIDI 听起来机械呆板，完全失去了原演奏的呼吸感。\n- **技术门槛高**：想尝试字节跳动的开源模型，却发现要安装 Python、PyTorch 和一堆依赖库，命令行参数复杂，对非程序员来说配置环境就要折腾一整天。\n- **批量处理效率低**：5 个录音版本只能逐个处理，每次都要重复设置参数，无法快速对比哪个版本转录效果最好。\n- **转换速度慢**：用 CPU 跑模型，一首曲子要处理 20 分钟，电脑卡得无法做其他事。\n\n### 使用 pianotrans 后\n\n- **几分钟完成转录**：打开 pianotrans 图形界面，拖入音频文件，3 分钟后就拿到标准 MIDI 文件，直接导入 DAW 即可编辑，节省数小时人工。\n- **完整保留演奏细节**：转录结果包含踏板控制信息（CC64、CC67），延音的渐弱、半踏板技巧都被准确捕捉，MIDI 回放与原始录音情感表达一致。\n- **零配置开箱即用**：下载解压后双击 exe 就能运行，无需关心底层环境，小李可以把精力集中在音乐创作而非技术折腾上。\n- **批量处理多个版本**：按住 Ctrl 键选中 5 个录音文件，一键批量转录，转完后直接对比试听，快速选定最佳版本进入后期流程。\n- **GPU 自动加速**：pianotrans 自动调用显卡加速，处理速度提升 5 倍，笔记本风扇安静，还能同时浏览网页找灵感。\n\npianotrans 让创作者从繁琐的技术细节中解放出来，专注于音乐本身，真正实现了\"所弹即所得\"的高效工作流程。","https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002Fazuwis_pianotrans_a8be192e.png","azuwis","Zhong Jianxin","https:\u002F\u002Foss.gittoolsai.com\u002Favatars\u002Fazuwis_3522d999.jpg",null,"https:\u002F\u002Fazuwis.github.io\u002F","https:\u002F\u002Fgithub.com\u002Fazuwis",[82,86,90,94,98],{"name":83,"color":84,"percentage":85},"Nix","#7e7eff",39.8,{"name":87,"color":88,"percentage":89},"PowerShell","#012456",28.7,{"name":91,"color":92,"percentage":93},"Python","#3572A5",28,{"name":95,"color":96,"percentage":97},"Batchfile","#C1F12E",3.4,{"name":99,"color":100,"percentage":101},"Shell","#89e051",0,1455,144,"2026-04-04T07:37:55","Windows, Linux, macOS","非必需，支持GPU自动加速，若遇到问题可使用CPU模式（PianoTrans-CPU.bat）","最低4GB（运行时至少需2GB空闲内存）",{"notes":109,"python":110,"dependencies":111},"Windows用户需安装Visual C++ Redistributable并解压1.5GB预编译包；Linux\u002FmacOS需通过Nix包管理器安装；支持批量处理音视频文件；核心算法来自字节跳动piano_transcription项目；提供右键菜单注册功能（Windows）；转录结果MIDI文件与源文件同目录","未说明（Nix安装方式自动处理依赖）",[112,113,114,115,116],"pytorch>=1.10.2","piano-transcription-inference","mido","soundfile","torchlibrosa",[15,14,13],[119,120,121],"piano","transcription","ai","2026-03-27T02:49:30.150509","2026-04-06T07:15:07.178067",[125,130,135,140,145,150,155,160],{"id":126,"question_zh":127,"answer_zh":128,"source_url":129},4455,"下载时提示需要授权或无法下载怎么办？","请尝试以下方法：1. 使用浏览器自带的下载功能，不要使用迅雷等第三方下载工具；2. 更换浏览器尝试，如Firefox或Google Chrome；3. 在不同网络环境下下载（如家里或公司网络）；4. 多次重试，有时网络不稳定会导致下载失败。","https:\u002F\u002Fgithub.com\u002Fazuwis\u002Fpianotrans\u002Fissues\u002F8",{"id":131,"question_zh":132,"answer_zh":133,"source_url":134},4456,"运行pianotrans.exe时命令提示符窗口闪退，无法选择文件怎么办？","这通常是由于系统中存在冲突的DLL文件导致。解决方法：将C:\\Windows\\System32\\libiomp5md.dll重命名为libiomp5md.dll.bak（建议备份而非删除）。操作后重新运行程序即可。注意：此操作可能影响其他依赖该DLL的程序，如出现问题可恢复文件名。","https:\u002F\u002Fgithub.com\u002Fazuwis\u002Fpianotrans\u002Fissues\u002F3",{"id":136,"question_zh":137,"answer_zh":138,"source_url":139},4457,"程序显示\"Using cuda for inference\"后无反应，如何强制使用CPU运行？","可通过设置环境变量强制使用CPU：1. 右键点击Windows左下角开始图标；2. 选择\"Windows PowerShell\"；3. 输入命令：`$env:CUDA_VISIBLE_DEVICES=\"-1\"`；4. 将PianoTrans.exe文件拖入PowerShell窗口；5. 按Enter键运行。程序将使用CPU而非CUDA进行推理。","https:\u002F\u002Fgithub.com\u002Fazuwis\u002Fpianotrans\u002Fissues\u002F4",{"id":141,"question_zh":142,"answer_zh":143,"source_url":144},4458,"RTX 30系列显卡无法运行程序怎么办？","RTX 30系列显卡需要更新版本的CUDA和PyTorch支持。请升级到PianoTrans v0.2或更高版本。早期版本自带的CUDA组件版本过低，不支持RTX 3070 Ti等30系列显卡。升级后即可正常使用。","https:\u002F\u002Fgithub.com\u002Fazuwis\u002Fpianotrans\u002Fissues\u002F5",{"id":146,"question_zh":147,"answer_zh":148,"source_url":149},4459,"Mac版本无法在旧版macOS上运行怎么办？","目前Mac版本要求macOS 12.0或更高版本，无法在Catalina等旧版本上运行。如果您需要在旧版macOS使用，建议：1. 关注项目更新等待兼容版本；2. 直接使用上游项目https:\u002F\u002Fgithub.com\u002Fqiuqiangkong\u002Fpiano_transcription_inference自行配置；3. 考虑升级macOS系统。","https:\u002F\u002Fgithub.com\u002Fazuwis\u002Fpianotrans\u002Fissues\u002F16",{"id":151,"question_zh":152,"answer_zh":153,"source_url":154},4460,"转换后的MIDI音符长度过长（延音踏板效果），如何缩短？","PianoTrans直接输出上游模型的结果，目前不提供调整音符长度的功能。如需缩短音符，建议在DAW软件（如Logic Pro、Cubase等）中导入MIDI后，使用MIDI编辑功能手动调整音符长度或减少延音踏板效果。此功能改进需向上游项目提出。","https:\u002F\u002Fgithub.com\u002Fazuwis\u002Fpianotrans\u002Fissues\u002F13",{"id":156,"question_zh":157,"answer_zh":158,"source_url":159},4461,"转换后的MIDI文件BPM固定为120，能否修改？","目前转换后的MIDI文件BPM固定为120，软件不提供修改BPM的参数设置。如需调整BPM，请在DAW软件中导入MIDI文件后修改曲速。这是上游模型的设计限制，相关问题请查看项目FAQ页面。","https:\u002F\u002Fgithub.com\u002Fazuwis\u002Fpianotrans\u002Fissues\u002F17",{"id":161,"question_zh":162,"answer_zh":163,"source_url":164},4462,"如何将PianoTrans集成到我自己的程序中？","建议直接使用上游项目https:\u002F\u002Fgithub.com\u002Fqiuqiangkong\u002Fpiano_transcription_inference进行集成，该项目提供了更灵活的API接口。PianoTrans的Windows版1.0之后功能没有变化，主要价值在于提供开箱即用的GUI界面。对于二次开发，使用上游项目更为合适。","https:\u002F\u002Fgithub.com\u002Fazuwis\u002Fpianotrans\u002Fissues\u002F21",[166,170,175,180],{"id":167,"version":168,"summary_zh":78,"released_at":169},103928,"v1.0","2022-02-22T01:09:26",{"id":171,"version":172,"summary_zh":173,"released_at":174},103929,"v0.2.1","* Update pytorch to 1.10.1.\r\n* Update piano-transcription-inference to 0.0.5","2021-12-23T03:04:12",{"id":176,"version":177,"summary_zh":178,"released_at":179},103930,"v0.2","* Update pytorch to 1.9.1\r\n* Add PianoTrans-CPU.bat to force using CPU for inference","2021-09-27T05:52:05",{"id":181,"version":182,"summary_zh":78,"released_at":183},103931,"v0.1","2021-02-03T05:30:41"]