[{"data":1,"prerenderedAt":-1},["ShallowReactive",2],{"similar-arsenetar--dupeguru":3,"tool-arsenetar--dupeguru":65},[4,23,32,40,49,57],{"id":5,"name":6,"github_repo":7,"description_zh":8,"stars":9,"difficulty_score":10,"last_commit_at":11,"category_tags":12,"status":22},2268,"ML-For-Beginners","microsoft\u002FML-For-Beginners","ML-For-Beginners 是由微软推出的一套系统化机器学习入门课程，旨在帮助零基础用户轻松掌握经典机器学习知识。这套课程将学习路径规划为 12 周，包含 26 节精炼课程和 52 道配套测验，内容涵盖从基础概念到实际应用的完整流程，有效解决了初学者面对庞大知识体系时无从下手、缺乏结构化指导的痛点。\n\n无论是希望转型的开发者、需要补充算法背景的研究人员，还是对人工智能充满好奇的普通爱好者，都能从中受益。课程不仅提供了清晰的理论讲解，还强调动手实践，让用户在循序渐进中建立扎实的技能基础。其独特的亮点在于强大的多语言支持，通过自动化机制提供了包括简体中文在内的 50 多种语言版本，极大地降低了全球不同背景用户的学习门槛。此外，项目采用开源协作模式，社区活跃且内容持续更新，确保学习者能获取前沿且准确的技术资讯。如果你正寻找一条清晰、友好且专业的机器学习入门之路，ML-For-Beginners 将是理想的起点。",85092,2,"2026-04-10T11:13:16",[13,14,15,16,17,18,19,20,21],"图像","数据工具","视频","插件","Agent","其他","语言模型","开发框架","音频","ready",{"id":24,"name":25,"github_repo":26,"description_zh":27,"stars":28,"difficulty_score":29,"last_commit_at":30,"category_tags":31,"status":22},5784,"funNLP","fighting41love\u002FfunNLP","funNLP 是一个专为中文自然语言处理（NLP）打造的超级资源库，被誉为\"NLP 民工的乐园”。它并非单一的软件工具，而是一个汇集了海量开源项目、数据集、预训练模型和实用代码的综合性平台。\n\n面对中文 NLP 领域资源分散、入门门槛高以及特定场景数据匮乏的痛点，funNLP 提供了“一站式”解决方案。这里不仅涵盖了分词、命名实体识别、情感分析、文本摘要等基础任务的标准工具，还独特地收录了丰富的垂直领域资源，如法律、医疗、金融行业的专用词库与数据集，甚至包含古诗词生成、歌词创作等趣味应用。其核心亮点在于极高的全面性与实用性，从基础的字典词典到前沿的 BERT、GPT-2 模型代码，再到高质量的标注数据和竞赛方案，应有尽有。\n\n无论是刚刚踏入 NLP 领域的学生、需要快速验证想法的算法工程师，还是从事人工智能研究的学者，都能在这里找到急需的“武器弹药”。对于开发者而言，它能大幅减少寻找数据和复现模型的时间；对于研究者，它提供了丰富的基准测试资源和前沿技术参考。funNLP 以开放共享的精神，极大地降低了中文自然语言处理的开发与研究成本，是中文 AI 社区不可或缺的宝藏仓库。",79857,1,"2026-04-08T20:11:31",[19,14,18],{"id":33,"name":34,"github_repo":35,"description_zh":36,"stars":37,"difficulty_score":29,"last_commit_at":38,"category_tags":39,"status":22},5773,"cs-video-courses","Developer-Y\u002Fcs-video-courses","cs-video-courses 是一个精心整理的计算机科学视频课程清单，旨在为自学者提供系统化的学习路径。它汇集了全球知名高校（如加州大学伯克利分校、新南威尔士大学等）的完整课程录像，涵盖从编程基础、数据结构与算法，到操作系统、分布式系统、数据库等核心领域，并深入延伸至人工智能、机器学习、量子计算及区块链等前沿方向。\n\n面对网络上零散且质量参差不齐的教学资源，cs-video-courses 解决了学习者难以找到成体系、高难度大学级别课程的痛点。该项目严格筛选内容，仅收录真正的大学层级课程，排除了碎片化的简短教程或商业广告，确保用户能接触到严谨的学术内容。\n\n这份清单特别适合希望夯实计算机基础的开发者、需要补充特定领域知识的研究人员，以及渴望像在校生一样系统学习计算机科学的自学者。其独特的技术亮点在于分类极其详尽，不仅包含传统的软件工程与网络安全，还细分了生成式 AI、大语言模型、计算生物学等新兴学科，并直接链接至官方视频播放列表，让用户能一站式获取高质量的教育资源，免费享受世界顶尖大学的课堂体验。",79792,"2026-04-08T22:03:59",[18,13,14,20],{"id":41,"name":42,"github_repo":43,"description_zh":44,"stars":45,"difficulty_score":46,"last_commit_at":47,"category_tags":48,"status":22},3128,"ragflow","infiniflow\u002Fragflow","RAGFlow 是一款领先的开源检索增强生成（RAG）引擎，旨在为大语言模型构建更精准、可靠的上下文层。它巧妙地将前沿的 RAG 技术与智能体（Agent）能力相结合，不仅支持从各类文档中高效提取知识，还能让模型基于这些知识进行逻辑推理和任务执行。\n\n在大模型应用中，幻觉问题和知识滞后是常见痛点。RAGFlow 通过深度解析复杂文档结构（如表格、图表及混合排版），显著提升了信息检索的准确度，从而有效减少模型“胡编乱造”的现象，确保回答既有据可依又具备时效性。其内置的智能体机制更进一步，使系统不仅能回答问题，还能自主规划步骤解决复杂问题。\n\n这款工具特别适合开发者、企业技术团队以及 AI 研究人员使用。无论是希望快速搭建私有知识库问答系统，还是致力于探索大模型在垂直领域落地的创新者，都能从中受益。RAGFlow 提供了可视化的工作流编排界面和灵活的 API 接口，既降低了非算法背景用户的上手门槛，也满足了专业开发者对系统深度定制的需求。作为基于 Apache 2.0 协议开源的项目，它正成为连接通用大模型与行业专有知识之间的重要桥梁。",77062,3,"2026-04-04T04:44:48",[17,13,20,19,18],{"id":50,"name":51,"github_repo":52,"description_zh":53,"stars":54,"difficulty_score":46,"last_commit_at":55,"category_tags":56,"status":22},519,"PaddleOCR","PaddlePaddle\u002FPaddleOCR","PaddleOCR 是一款基于百度飞桨框架开发的高性能开源光学字符识别工具包。它的核心能力是将图片、PDF 等文档中的文字提取出来，转换成计算机可读取的结构化数据，让机器真正“看懂”图文内容。\n\n面对海量纸质或电子文档，PaddleOCR 解决了人工录入效率低、数字化成本高的问题。尤其在人工智能领域，它扮演着连接图像与大型语言模型（LLM）的桥梁角色，能将视觉信息直接转化为文本输入，助力智能问答、文档分析等应用场景落地。\n\nPaddleOCR 适合开发者、算法研究人员以及有文档自动化需求的普通用户。其技术优势十分明显：不仅支持全球 100 多种语言的识别，还能在 Windows、Linux、macOS 等多个系统上运行，并灵活适配 CPU、GPU、NPU 等各类硬件。作为一个轻量级且社区活跃的开源项目，PaddleOCR 既能满足快速集成的需求，也能支撑前沿的视觉语言研究，是处理文字识别任务的理想选择。",75508,"2026-04-13T20:37:22",[19,13,20,18],{"id":58,"name":59,"github_repo":60,"description_zh":61,"stars":62,"difficulty_score":29,"last_commit_at":63,"category_tags":64,"status":22},3215,"awesome-machine-learning","josephmisiti\u002Fawesome-machine-learning","awesome-machine-learning 是一份精心整理的机器学习资源清单，汇集了全球优秀的机器学习框架、库和软件工具。面对机器学习领域技术迭代快、资源分散且难以甄选的痛点，这份清单按编程语言（如 Python、C++、Go 等）和应用场景（如计算机视觉、自然语言处理、深度学习等）进行了系统化分类，帮助使用者快速定位高质量项目。\n\n它特别适合开发者、数据科学家及研究人员使用。无论是初学者寻找入门库，还是资深工程师对比不同语言的技术选型，都能从中获得极具价值的参考。此外，清单还延伸提供了免费书籍、在线课程、行业会议、技术博客及线下聚会等丰富资源，构建了从学习到实践的全链路支持体系。\n\n其独特亮点在于严格的维护标准：明确标记已停止维护或长期未更新的项目，确保推荐内容的时效性与可靠性。作为机器学习领域的“导航图”，awesome-machine-learning 以开源协作的方式持续更新，旨在降低技术探索门槛，让每一位从业者都能高效地站在巨人的肩膀上创新。",72149,"2026-04-03T21:50:24",[20,18],{"id":66,"github_repo":67,"name":68,"description_en":69,"description_zh":70,"ai_summary_zh":70,"readme_en":71,"readme_zh":72,"quickstart_zh":73,"use_case_zh":74,"hero_image_url":75,"owner_login":76,"owner_name":77,"owner_avatar_url":78,"owner_bio":79,"owner_company":79,"owner_location":80,"owner_email":79,"owner_twitter":79,"owner_website":81,"owner_url":82,"languages":83,"stars":106,"forks":107,"last_commit_at":108,"license":109,"difficulty_score":110,"env_os":111,"env_gpu":112,"env_ram":112,"env_deps":113,"category_tags":118,"github_topics":119,"view_count":10,"oss_zip_url":79,"oss_zip_packed_at":79,"status":22,"created_at":122,"updated_at":123,"faqs":124,"releases":159},7377,"arsenetar\u002Fdupeguru","dupeguru","Find duplicate files","dupeGuru 是一款跨平台的图形化实用工具，专为帮助用户快速清理磁盘空间而设计。它能深入扫描 Linux、macOS 和 Windows 系统，精准识别并定位重复文件，无论是完全相同的副本还是内容相似的文件（如不同分辨率的图片），都能被有效发现。通过解决文件冗余问题，dupeGuru 让用户能轻松释放存储空间，保持文件系统整洁有序。\n\n这款工具非常适合普通电脑用户、家庭办公人员以及需要管理大量媒体素材的设计师使用。即使不具备编程背景，用户也能通过直观的界面轻松上手，无需输入复杂命令即可完成扫描与清理工作。\n\n在技术实现上，dupeGuru 基于 Python 3 开发，并采用 Qt 框架构建界面，确保了在不同操作系统上拥有一致且流畅的使用体验。其核心亮点在于智能的文件比对算法，不仅支持按文件名匹配，更能通过内容分析来确认文件是否真正重复，从而避免误删。作为一个开源项目，dupeGuru 持续欢迎社区贡献，致力于为用户提供免费、高效且安全的文件管理方案。","# dupeGuru\n\n[dupeGuru][dupeguru] is a cross-platform (Linux, OS X, Windows) GUI tool to find duplicate files in\na system. It is written mostly in Python 3 and uses [qt](https:\u002F\u002Fwww.qt.io\u002F) for the UI.\n\n## Current status\nStill looking for additional help especially with regards to:\n* OSX maintenance: reproducing bugs, packaging verification.\n* Linux maintenance: reproducing bugs, maintaining PPA repository, Debian package, rpm package.\n* Translations: updating missing strings, transifex project at https:\u002F\u002Fwww.transifex.com\u002Fvoltaicideas\u002Fdupeguru-1\n* Documentation: keeping it up-to-date.\n\n## Contents of this folder\n\nThis folder contains the source for dupeGuru. Its documentation is in `help`, but is also\n[available online][documentation] in its built form. Here's how this source tree is organized:\n\n* core: Contains the core logic code for dupeGuru. It's Python code.\n* qt: UI code for the Qt toolkit. It's written in Python and uses PyQt.\n* images: Images used by the different UI codebases.\n* pkg: Skeleton files required to create different packages\n* help: Help document, written for Sphinx.\n* locale: .po files for localization.\n* hscommon: A collection of helpers used across HS applications.\n\n## How to build dupeGuru from source\n\n### Windows & macOS specific additional instructions\nFor windows instructions see the [Windows Instructions](Windows.md).\n\nFor macos instructions (qt version) see the [macOS Instructions](macos.md).\n\n### Prerequisites\n* [Python 3.7+][python]\n* PyQt5\n\n### System Setup\nWhen running in a linux based environment the following system packages or equivalents are needed to build:\n* python3-pyqt5\n* pyqt5-dev-tools (on some systems, see note)\n* python3-venv (only if using a virtual environment)\n* python3-dev\n* build-essential\n\nNote: On some linux systems pyrcc5 is not put on the path when installing python3-pyqt5, this will cause some issues with the resource files (and icons). These systems should have a respective pyqt5-dev-tools package, which should also be installed. The presence of pyrcc5 can be checked with `which pyrcc5`.  Debian based systems need the extra package, and Arch does not.\n\nTo create packages the following are also needed:\n* python3-setuptools\n* debhelper\n\n### Building with Make\ndupeGuru comes with a makefile that can be used to build and run:\n\n    $ make && make run\n\n### Building without Make\n\n    $ cd \u003CdupeGuru directory>\n    $ python3 -m venv --system-site-packages .\u002Fenv\n    $ source .\u002Fenv\u002Fbin\u002Factivate\n    $ pip install -r requirements.txt\n    $ python build.py\n    $ python run.py\n\n### Generating Debian\u002FUbuntu package\nTo generate packages the extra requirements in requirements-extra.txt must be installed, the\nsteps are as follows:\n\n    $ cd \u003CdupeGuru directory>\n    $ python3 -m venv --system-site-packages .\u002Fenv\n    $ source .\u002Fenv\u002Fbin\u002Factivate\n    $ pip install -r requirements.txt -r requirements-extra.txt\n    $ python build.py --clean\n    $ python package.py\n\nThis can be made a one-liner (once in the directory) as:\n\n    $ bash -c \"python3 -m venv --system-site-packages env && source env\u002Fbin\u002Factivate && pip install -r requirements.txt -r requirements-extra.txt && python build.py --clean && python package.py\"\n\n## Running tests\n\nThe complete test suite is run with [Tox 1.7+][tox]. If you have it installed system-wide, you\ndon't even need to set up a virtualenv. Just `cd` into the root project folder and run `tox`.\n\nIf you don't have Tox system-wide, install it in your virtualenv with `pip install tox` and then\nrun `tox`.\n\nYou can also run automated tests without Tox. Extra requirements for running tests are in\n`requirements-extra.txt`. So, you can do `pip install -r requirements-extra.txt` inside your\nvirtualenv and then `py.test core hscommon`\n\n[dupeguru]: https:\u002F\u002Fdupeguru.voltaicideas.net\u002F\n[cross-toolkit]: http:\u002F\u002Fwww.hardcoded.net\u002Farticles\u002Fcross-toolkit-software\n[documentation]: http:\u002F\u002Fdupeguru.voltaicideas.net\u002Fhelp\u002Fen\u002F\n[python]: http:\u002F\u002Fwww.python.org\u002F\n[pyqt]: http:\u002F\u002Fwww.riverbankcomputing.com\n[tox]: https:\u002F\u002Ftox.readthedocs.org\u002Fen\u002Flatest\u002F\n","# dupeGuru\n\n[dupeGuru][dupeguru] 是一款跨平台（Linux、OS X、Windows）的图形用户界面工具，用于查找系统中的重复文件。它主要使用 Python 3 编写，并采用 [qt](https:\u002F\u002Fwww.qt.io\u002F) 框架构建用户界面。\n\n## 当前状态\n我们仍在寻找更多帮助，尤其是在以下方面：\n* OS X 维护：复现 bug、验证打包。\n* Linux 维护：复现 bug、维护 PPA 仓库、Debian 包和 rpm 包。\n* 翻译：更新缺失的字符串，Transifex 项目地址为 https:\u002F\u002Fwww.transifex.com\u002Fvoltaicideas\u002Fdupeguru-1。\n* 文档：保持文档的最新状态。\n\n## 本文件夹的内容\n\n本文件夹包含 dupeGuru 的源代码。其文档位于 `help` 目录中，同时也以编译好的形式在[在线文档][documentation]中提供。以下是该源码树的组织结构：\n\n* core：包含 dupeGuru 的核心逻辑代码，均为 Python 代码。\n* qt：Qt 工具包的 UI 代码，使用 Python 和 PyQt 编写。\n* images：不同 UI 代码库使用的图片资源。\n* pkg：创建各种软件包所需的模板文件。\n* help：使用 Sphinx 编写的帮助文档。\n* locale：用于本地化的 .po 文件。\n* hscommon：HS 系列应用中通用的辅助工具集合。\n\n## 如何从源代码构建 dupeGuru\n\n### Windows 和 macOS 特定的额外说明\nWindows 的构建说明请参阅 [Windows 指南](Windows.md)。\n\nmacOS 的构建说明（Qt 版本）请参阅 [macOS 指南](macos.md)。\n\n### 前置条件\n* [Python 3.7+][python]\n* PyQt5\n\n### 系统配置\n在基于 Linux 的环境中构建时，需要安装以下系统包或等效包：\n* python3-pyqt5\n* pyqt5-dev-tools（某些系统上需要，请参阅注释）\n* python3-venv（仅当使用虚拟环境时）\n* python3-dev\n* build-essential\n\n**注**：在某些 Linux 系统上，安装 python3-pyqt5 后，pyrcc5 并不会被添加到系统的 PATH 中，这会导致资源文件（包括图标）出现问题。这些系统应安装相应的 pyqt5-dev-tools 包。可以通过运行 `which pyrcc5` 来检查 pyrcc5 是否已正确安装。基于 Debian 的系统需要额外安装此包，而 Arch 系统则不需要。\n\n此外，要创建软件包还需以下依赖：\n* python3-setuptools\n* debhelper\n\n### 使用 Make 构建\ndupeGuru 自带一个 Makefile，可用于构建和运行：\n\n    $ make && make run\n\n### 不使用 Make 构建\n\n    $ cd \u003CdupeGuru 目录>\n    $ python3 -m venv --system-site-packages .\u002Fenv\n    $ source .\u002Fenv\u002Fbin\u002Factivate\n    $ pip install -r requirements.txt\n    $ python build.py\n    $ python run.py\n\n### 生成 Debian\u002FUbuntu 软件包\n要生成软件包，必须先安装 requirements-extra.txt 中列出的额外依赖，步骤如下：\n\n    $ cd \u003CdupeGuru 目录>\n    $ python3 -m venv --system-site-packages .\u002Fenv\n    $ source .\u002Fenv\u002Fbin\u002Factivate\n    $ pip install -r requirements.txt -r requirements-extra.txt\n    $ python build.py --clean\n    $ python package.py\n\n也可以将其简化为一行命令（在目录内执行）：\n\n    $ bash -c \"python3 -m venv --system-site-packages env && source env\u002Fbin\u002Factivate && pip install -r requirements.txt -r requirements-extra.txt && python build.py --clean && python package.py\"\n\n## 运行测试\n\n完整的测试套件通过 [Tox 1.7+][tox] 运行。如果系统全局已安装 Tox，则无需设置虚拟环境，只需进入项目根目录并运行 `tox` 即可。\n\n若系统未安装 Tox，请在虚拟环境中使用 `pip install tox` 安装，然后运行 `tox`。\n\n您也可以不使用 Tox 运行自动化测试。运行测试所需的额外依赖列于 `requirements-extra.txt` 中。因此，您可以在虚拟环境中运行 `pip install -r requirements-extra.txt`，然后执行 `py.test core hscommon`。\n\n[dupeguru]: https:\u002F\u002Fdupeguru.voltaicideas.net\u002F\n[cross-toolkit]: http:\u002F\u002Fwww.hardcoded.net\u002Farticles\u002Fcross-toolkit-software\n[documentation]: http:\u002F\u002Fdupeguru.voltaicideas.net\u002Fhelp\u002Fen\u002F\n[python]: http:\u002F\u002Fwww.python.org\u002F\n[pyqt]: http:\u002F\u002Fwww.riverbankcomputing.com\n[tox]: https:\u002F\u002Ftox.readthedocs.org\u002Fen\u002Flatest\u002F","# dupeGuru 快速上手指南\n\ndupeGuru 是一款跨平台（Linux、macOS、Windows）的图形界面工具，用于查找系统中的重复文件。它主要使用 Python 3 编写，并基于 Qt (PyQt5) 构建用户界面。\n\n## 环境准备\n\n在开始构建之前，请确保您的系统满足以下要求：\n\n### 系统要求\n*   **操作系统**：Linux, macOS, 或 Windows\n*   **Python 版本**：Python 3.7 或更高版本\n\n### 前置依赖\n\n#### Linux 系统\n在基于 Linux 的环境中，需要安装以下系统包（以 Debian\u002FUbuntu 为例）：\n\n```bash\nsudo apt-get update\nsudo apt-get install python3-pyqt5 pyqt5-dev-tools python3-venv python3-dev build-essential python3-setuptools debhelper\n```\n\n> **注意**：部分 Linux 发行版（如 Debian）需要额外安装 `pyqt5-dev-tools` 以确保 `pyrcc5` 可用，否则会导致资源文件和图标加载失败。Arch Linux 通常不需要此额外步骤。\n\n#### macOS & Windows\n*   **macOS**: 请参考项目根目录下的 `macos.md` 获取特定指令。\n*   **Windows**: 请参考项目根目录下的 `Windows.md` 获取特定指令。\n\n#### 通用依赖\n无论何种系统，都需要确保安装了 `PyQt5`。在使用虚拟环境时，将通过 `pip` 自动安装。\n\n> **国内加速建议**：在中国大陆地区，建议在安装 Python 依赖时使用清华或阿里镜像源，以提升下载速度：\n> ```bash\n> pip install -r requirements.txt -i https:\u002F\u002Fpypi.tuna.tsinghua.edu.cn\u002Fsimple\n> ```\n\n## 安装步骤\n\n您可以选择使用 `Make` 工具（推荐）或手动通过 Python 虚拟环境进行构建。\n\n### 方法一：使用 Make 构建（推荐）\n\n如果系统已安装 `make`，这是最简便的方式：\n\n```bash\nmake && make run\n```\n\n### 方法二：手动构建（无 Make）\n\n如果不使用 Make，请按以下步骤操作：\n\n1.  **进入项目目录**\n    ```bash\n    cd \u003CdupeGuru directory>\n    ```\n\n2.  **创建并激活虚拟环境**\n    ```bash\n    python3 -m venv --system-site-packages .\u002Fenv\n    source .\u002Fenv\u002Fbin\u002Factivate\n    # Windows 用户使用: .\\env\\Scripts\\activate\n    ```\n\n3.  **安装依赖**\n    ```bash\n    # 建议使用国内镜像源加速\n    pip install -r requirements.txt -i https:\u002F\u002Fpypi.tuna.tsinghua.edu.cn\u002Fsimple\n    ```\n\n4.  **构建程序**\n    ```bash\n    python build.py\n    ```\n\n5.  **运行程序**\n    ```bash\n    python run.py\n    ```\n\n### 可选：生成 Debian\u002FUbuntu 安装包\n\n如果您需要生成 `.deb` 安装包，需先安装额外依赖 (`requirements-extra.txt`)：\n\n```bash\ncd \u003CdupeGuru directory>\npython3 -m venv --system-site-packages .\u002Fenv\nsource .\u002Fenv\u002Fbin\u002Factivate\npip install -r requirements.txt -r requirements-extra.txt -i https:\u002F\u002Fpypi.tuna.tsinghua.edu.cn\u002Fsimple\npython build.py --clean\npython package.py\n```\n\n或者使用一键命令：\n\n```bash\nbash -c \"python3 -m venv --system-site-packages env && source env\u002Fbin\u002Factivate && pip install -r requirements.txt -r requirements-extra.txt && python build.py --clean && python package.py\"\n```\n\n## 基本使用\n\n构建完成后，启动程序即可看到图形化界面。\n\n1.  **启动应用**\n    执行上述安装步骤中的运行命令（`make run` 或 `python run.py`）。\n\n2.  **扫描重复文件**\n    *   在界面左侧点击 **\"+\"** 按钮添加需要扫描的文件夹。\n    *   选择扫描模式（标准、音乐或图片），针对不同类型文件优化匹配算法。\n    *   点击 **\"Scan\"** 开始扫描。\n\n3.  **处理结果**\n    *   扫描完成后，软件会自动分组显示重复文件。\n    *   您可以手动标记要保留或删除的文件，或使用自动标记功能（如保留最新修改的文件）。\n    *   确认无误后，将选中的文件移至回收站或直接删除。\n\n> 更多详细功能说明和文档，可访问在线帮助文档：http:\u002F\u002Fdupeguru.voltaicideas.net\u002Fhelp\u002Fen\u002F","某自由摄影师在整理跨越三年的项目归档时，发现因多次备份和版本迭代，硬盘中混杂了大量重复的照片素材与工程文件，急需清理以释放存储空间。\n\n### 没有 dupeguru 时\n- 只能依赖操作系统自带的搜索功能按文件名查找，但无法识别内容相同却命名不同的文件（如 `IMG_001.jpg` 与 `DSC_952.jpg`）。\n- 担心误删重要源文件，不得不人工逐个打开图片比对视觉内容，耗时数小时且极易产生视觉疲劳导致漏判。\n- 对于相似但不完全相同的图片（如不同分辨率的导出图），缺乏智能过滤机制，难以制定安全的清理策略。\n- 跨目录操作风险高，手动删除过程中容易误伤其他项目的关联文件，缺乏二次确认的安全缓冲。\n\n### 使用 dupeguru 后\n- 利用“内容匹配”模式快速扫描全盘，精准揪出文件名不同但二进制内容完全一致的冗余文件，无论它们藏得多深。\n- 通过直观的分组界面一键预览重复项，智能标记保留最新或路径最优的文件，将原本半天的工作量压缩至几分钟。\n- 启用“图片相似度”过滤功能，轻松识别并处理那些分辨率不同或经过轻微编辑的近似图片，灵活决定去留。\n- 依托内置的“参考文件夹”保护机制，确保核心归档目录不被误触，仅在指定的临时备份区执行安全删除操作。\n\ndupeguru 通过智能的内容指纹比对技术，将繁琐危险的人工查重重工作转化为安全高效的自动化流程，帮助用户瞬间找回宝贵的存储空间。","https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002Farsenetar_dupeguru_1b544f4f.png","arsenetar","Andrew Senetar","https:\u002F\u002Foss.gittoolsai.com\u002Favatars\u002Farsenetar_3f1150f9.jpg",null,"United States","blog.voltaicideas.net","https:\u002F\u002Fgithub.com\u002Farsenetar",[84,88,92,95,98,102],{"name":85,"color":86,"percentage":87},"Python","#3572A5",95.6,{"name":89,"color":90,"percentage":91},"C","#555555",1.7,{"name":93,"color":79,"percentage":94},"NSIS",1.2,{"name":96,"color":97,"percentage":29},"Objective-C","#438eff",{"name":99,"color":100,"percentage":101},"Makefile","#427819",0.5,{"name":103,"color":104,"percentage":105},"JavaScript","#f1e05a",0.1,7489,496,"2026-04-13T14:16:26","GPL-3.0",4,"Linux, macOS, Windows","未说明",{"notes":114,"python":115,"dependencies":116},"在 Linux 环境下构建需要安装系统级依赖包（如 python3-pyqt5, python3-dev, build-essential 等）。部分 Linux 发行版（如 Debian）需额外安装 pyqt5-dev-tools 以确保 pyrcc5 可用。打包 Debian\u002FUbuntu 版本还需 debhelper。测试运行可选装 Tox。","3.7+",[117],"PyQt5",[18],[120,121],"python","deduplication","2026-03-27T02:49:30.150509","2026-04-14T12:30:14.208581",[125,130,135,140,145,150,154],{"id":126,"question_zh":127,"answer_zh":128,"source_url":129},33113,"Ubuntu PPA 上的 dupeGuru 版本过时了，如何获取最新版本？","PPA 已更新以支持最新的 Ubuntu 版本。目前支持的发行版包括 Focal (20.04) 和 Jammy (22.04)。同时也为 Bionic (18.04) 和 Impish (21.10) 上传了软件包。请注意，非 LTS（长期支持）版本的 Ubuntu 由于支持周期极短，通常不会投入大量精力去维护，建议用户使用 LTS 版本以获得最佳支持。","https:\u002F\u002Fgithub.com\u002Farsenetar\u002Fdupeguru\u002Fissues\u002F484",{"id":131,"question_zh":132,"answer_zh":133,"source_url":134},33114,"macOS Qt 版本在扫描时卡在\"Verified X\u002FX matches\"无法完成，如何解决？","这个问题通常是由旧的配置文件引起的。解决方案是删除所有的偏好设置（preferences），然后重新运行应用程序。具体操作通常是删除相关的配置文件或重置应用数据，之后 Qt 版本即可正常完成扫描并分析图片内容。","https:\u002F\u002Fgithub.com\u002Farsenetar\u002Fdupeguru\u002Fissues\u002F566",{"id":136,"question_zh":137,"answer_zh":138,"source_url":139},33115,"Windows 版本中无法手动更改界面语言，只能跟随系统语言，怎么办？","这是 4.1.0 版本中存在的一个已知问题，界面语言默认锁定为系统语言且设置无效。该问题已在后续的修复（如 PR #775）中得到解决。此外，部分翻译缺失是因为翻译文件未及时更新，建议升级到包含最新翻译文件的版本（如 4.1.1 或更高），以确保界面语言切换功能和翻译完整性正常工作。","https:\u002F\u002Fgithub.com\u002Farsenetar\u002Fdupeguru\u002Fissues\u002F760",{"id":141,"question_zh":142,"answer_zh":143,"source_url":144},33116,"macOS M1 (ARM) 芯片用户应该下载哪个版本的 dupeGuru？","对于使用 M1 芯片的 Mac 用户（如 M1 MBA），已有专门的 ARM\u002FM1 版本可用。在发布页面中，维护者提供了合并后的 Qt 版本以及 Cocoa 版本的安装包，这些版本经过测试可以在 M1 设备上良好运行。请在 GitHub Release 页面查找标注为 macOS Qt (experimental) 或明确提及支持 ARM\u002FM1 的安装包。","https:\u002F\u002Fgithub.com\u002Farsenetar\u002Fdupeguru\u002Fissues\u002F761",{"id":146,"question_zh":147,"answer_zh":148,"source_url":149},33117,"我想参与 dupeGuru 的开发贡献，但需要指导，该如何开始？","项目非常欢迎新贡献者，无论您的技能背景如何（从开发到测试、文档等）。如果您希望获得指导或导师帮助，可以直接在相关的招募 Issue 下留言评论。维护者表示愿意提供指导，您可以先尝试构建项目，如果在构建过程中遇到问题或有兴趣处理特定的开放 Issue，都可以随时沟通获取任务分配。","https:\u002F\u002Fgithub.com\u002Farsenetar\u002Fdupeguru\u002Fissues\u002F300",{"id":151,"question_zh":152,"answer_zh":153,"source_url":134},33118,"为什么应用程序会请求访问某些看似无关的系统路径（如 com.apple.news）？","通常情况下，应用程序不应访问此类路径。如果出现类似 `System Policy: deny(1) file-read-data` 的沙盒违规警告，可能是因为该路径被意外添加到了扫描目录列表中。请检查您的扫描设置，确保没有将整个用户库或系统文件夹误选为扫描目标。如果确认未手动添加，可能是配置残留，重置偏好设置通常能解决此问题。",{"id":155,"question_zh":156,"answer_zh":157,"source_url":158},33119,"Linux 用户除了 PPA 外，还有哪些安装方式或包格式可用？","除了 Ubuntu PPA 外，项目还提供多种 Linux 包格式。包括适用于 Debian\u002FUbuntu 的 .deb 包（支持 x64 架构及源码归档），以及通知了维护者的 Arch Linux 包。社区用户也曾提议发布 Flatpak 版本以增加通用性。对于具体的发行版，建议优先查看 GitHub Release 页面提供的 .deb 包或联系对应发行版的包维护者。","https:\u002F\u002Fgithub.com\u002Farsenetar\u002Fdupeguru\u002Fissues\u002F753",[160,165,170,175,180,185,190,195],{"id":161,"version":162,"summary_zh":163,"released_at":164},255272,"4.3.1","此版本修复了 #1015 问题，该问题会导致在使用标准内容模式扫描时，非重复文件被误标记为重复文件。\n\n## 自上一版本以来的变更\n**完整变更日志**：https:\u002F\u002Fgithub.com\u002Farsenetar\u002Fdupeguru\u002Fcompare\u002F4.3.0...4.3.1\n\n### 功能改进\n* 更新意大利语翻译\n\n### 错误修复\n* 修复缓存数据库异常可能导致文件无法进行哈希计算的问题 (#1015)\n* 为无摘要且长度不为零的文件添加额外保护措施，以防止误判为重复文件\n\n## 其他说明\n* 强烈建议使用 4.2.0 或更高版本的用户升级至此版本，因为该问题自该版本起一直存在。\n* 此处提供的发布文件已使用 GPG 签名（[sig](https:\u002F\u002Fkeys.openpgp.org\u002Fvks\u002Fv1\u002Fby-fingerprint\u002FD276BDB7E11B3DD328935F71C63300DCE48AB2F1)）\n\n## 操作系统软件包\n\n* Debian x64 归档（二进制归档仅兼容使用 Python 3.7\u002F3.8\u002F3.9\u002F3.10 的系统）\n* 基于 deb 构建的 x64 RPM 包（仅兼容使用 Python 3.7\u002F3.8\u002F3.9\u002F3.10 的系统）\n* macOS 版本兼容 Intel 和 M1 Mac，并已签名，但未使用付费开发者证书（#945）。\n* Windows 软件包提供安装程序（exe）和便携版（zip）两种形式。**请注意，Windows 版本是使用 Python 3.8 构建的，仅兼容 Windows 7 及更高版本。**\n* Arch Linux 软件包由 @glubsy 在 https:\u002F\u002Faur.archlinux.org\u002Fpackages\u002Fdupeguru\u002F 维护。\n* Ubuntu PPA 由 @eugenesan 在 https:\u002F\u002Flaunchpad.net\u002F~dupeguru\u002F+archive\u002Fubuntu\u002Fppa 构建。","2022-07-09T00:31:52",{"id":166,"version":167,"summary_zh":168,"released_at":169},255273,"4.3.0","本次发布主要聚焦于性能优化和部分代码清理。\n\n## 自上一版本以来的变更\n**完整变更日志**：https:\u002F\u002Fgithub.com\u002Farsenetar\u002Fdupeguru\u002Fcompare\u002F4.2.1...4.3.0\n### 功能新增\n* 将自定义命令的标准输出重定向到日志文件中 (#1008)\n* 添加扫描性能分析选项\n* 在“关于”对话框中加入更新检查功能\n* 更新翻译\n* 优化 fs.py 中的 stat() 调用\n* 更新目录扫描逻辑，使用 os.scandir() 和 DirEntry 对象\n* 提升 Directories.get_state() 的性能\n* 从 hscommon.path 迁移到 pathlib\n* 文件哈希算法切换为 xxhash，并回退至 md5\n\n### 错误修复\n* 修复 Debian 控制文件中的拼写错误 (#989)\n* 修复扫描后删除时出现的错误 (#988)\n* 修复缺少 polib 依赖的问题，并将其重新添加到 requirements.txt\n* 进行了多项小规模的代码清理工作，包括添加类型注解以及使用 mypy 进行静态检查\n\n## 其他说明\n* 本次更新对文件收集方式进行了较大改动以提升性能，因此可能会出现一些细微的行为差异。\n* 如果您从本版本降级回旧版本，需要删除缓存数据库文件，否则可能会导致兼容性问题。\n* 此处提供的发布文件已使用 GPG 签名。\n\n## 操作系统软件包\n\n* Debian x64 归档（二进制归档仅兼容使用 Python 3.7\u002F3.8\u002F3.9\u002F3.10 的系统）\n* 基于 deb 构建的 x64 RPM 包（仅兼容使用 Python 3.7\u002F3.8\u002F3.9\u002F3.10 的系统）\n* macOS 版本兼容 Intel 和 M1 Mac，并已完成签名，但未使用付费开发者证书 (#945)\n* Windows 软件包提供安装程序（exe）和便携版（zip）两种形式。**请注意，Windows 版本是使用 Python 3.8 构建的，仅兼容 Windows 7 及更高版本。**\n* Arch Linux 软件包由 @glubsy 在 https:\u002F\u002Faur.archlinux.org\u002Fpackages\u002Fdupeguru\u002F 维护。\n* Ubuntu PPA 由 @eugenesan 在 https:\u002F\u002Flaunchpad.net\u002F~dupeguru\u002F+archive\u002Fubuntu\u002Fppa 构建。","2022-07-03T17:02:57",{"id":171,"version":172,"summary_zh":173,"released_at":174},255274,"4.2.1","本次发布添加了一些小的错误修复和代码清理。\n\n## 自上一版本以来的变更\n**完整更新日志**：https:\u002F\u002Fgithub.com\u002Farsenetar\u002Fdupeguru\u002Fcompare\u002F4.2.0...4.2.1\n### 功能\n* 无\n\n### 错误修复\n* 在不支持的系统语言下默认使用英语 (#976)\n* 修复图像查看器缩放数据类型问题 (#978)\n* 修复窗口变化事件引发的错误 (#937, #980)\n* 修复 SQLite 的弃用警告\n* 在安装程序中强制要求最低 Windows 版本 (#983)\n* 修复本地文件的帮助路径\n\n### 构建\n* 停止对 Python 3.6 的支持\n* 添加了 VS Code 项目设置，并为 GitHub Actions 添加了 YAML 验证\n\n## 其他说明\n* 此处托管的发布文件已使用 GPG 签名\n\n## 操作系统软件包\n\n* Debian x64 归档（二进制归档仅兼容使用 Python 3.7\u002F3.8\u002F3.9\u002F3.10 的系统）\n* RPM x64，由 deb 构建而来（仅兼容使用 Python 3.7\u002F3.8\u002F3.9\u002F3.10 的系统）\n* macOS 同时提供 Qt 和 Cocoa 版本（Qt 版本包含所有最新功能），这两个版本均兼容 Intel 和 M1 Mac，并已签名，但未使用付费开发者证书 #945 **这是计划中的最后一个提供 Cocoa 版本的 macOS 发布。**\n* Windows 软件包同时提供安装程序（exe）和便携式版本（zip）。**注意：Windows 版本使用 Python 3.8 构建，仅兼容 Windows 7 及更高版本。**\n* Arch Linux 软件包由 @glubsy 在 https:\u002F\u002Faur.archlinux.org\u002Fpackages\u002Fdupeguru\u002F 维护。\n* Ubuntu PPA 由 @eugenesan 在 https:\u002F\u002Flaunchpad.net\u002F~dupeguru\u002F+archive\u002Fubuntu\u002Fppa 构建。","2022-03-26T22:27:53",{"id":176,"version":177,"summary_zh":178,"released_at":179},255275,"4.2.0","本次发布新增多项功能，进一步提升软件的实用性和用户体验。\n\n## 上次发布以来的变更\n### 功能改进\n\n* 新增马来语和土耳其语支持\n* 为 Windows 版本添加深色主题 (#900)\n* 增加 MD5 文件哈希缓存功能 (#942)\n* 新增大文件部分哈希功能，并提供用户可调整的偏好设置 (#908)\n* 添加便携模式（将设置文件存储在可执行文件旁）\n* 在 Windows 上为 .dupeguru 文件添加关联\n* 支持通过命令行传递 .dupeguru 文件以在启动时加载 (#902)\n* 增加在资源管理器或 Finder 中显示文件的功能 (#895)\n* 将音频标签处理从 hsaudiotag 切换至 mutagen，以支持更多格式 (#440)\n* 针对部分文件选择操作，新增使用 Qt 对话框替代原生操作系统对话框的选项\n* 在错误对话框中添加操作系统和 Python 版本信息，便于排查问题\n* 新增忽略超过指定大小文件的偏好设置 (#430)\n\n### 问题修复\n\n* 修复 macOS 版 Qt 应用程序中本地化资源无法加载的问题\n* 修复“详细信息面板”关闭时出现的错误 (#857, #873)\n* 调整参考背景颜色 (#894, #898)\n* 移除匹配文件名时对 Unicode 字符的截断处理 (#879)\n* 修复在差异视图中删除文件时抛出异常的问题 (#863, #905)\n* 修复仅显示重复文件视图在重新排序结果后未更新的问题 (#757, #910, #911)\n* 修复文件或文件夹名称包含特定字符时无法进行拖放操作的问题 (#897)\n* 修复窗口位置打开时部分位于屏幕外的问题 (#653)\n* 修复照片模式下的 TypeError 异常 (#551)\n* 更改直接删除文件时的提示信息 (#904)\n* 在扫描过程中提供更多反馈 (#700)\n* 进行了代码优化和清理\n\n### 构建相关\n\n* 在 build.py 中添加 Python 版本检查 (#589)\n* 改进标准化构建工具的使用\n* 将 CI\u002FCD 流程迁移到 GitHub Actions，并引入 CodeQL 和 SonarCloud\n\n## 其他说明\n\n* 此处提供的发布文件已使用 GPG 签名\n\n## 操作系统软件包\n\n* Debian x64 架构的二进制归档包（仅兼容使用 Python 3.7\u002F3.8\u002F3.9\u002F3.10 的系统）\n* macOS 提供 Qt 和 Cocoa 两种版本（Qt 版本包含所有最新功能），均兼容 Intel 和 M1 Mac，并已完成签名，但未使用付费开发者证书 #945\n* Windows 软件包同时提供安装程序（exe）和便携版（zip）。**请注意：Windows 版本基于 Python 3.10 构建，仅兼容 Windows 8 及以上版本。如需在官方构建中支持 Windows 7，请为 #983 投票**\n* Arch Linux 软件包由 @glubsy 维护，地址为：https:\u002F\u002Faur.archlinux.org\u002Fpackages\u002Fdupeguru\u002F\n* Ubuntu PPA 由 @eugenesan 构建，地址为：https:\u002F\u002Flaunchpad.net\u002F~dupeguru\u002F+archive\u002Fubuntu\u002Fppa","2022-03-09T13:10:53",{"id":181,"version":182,"summary_zh":183,"released_at":184},255276,"4.1.1","本次发布主要修复了 Windows 系统上的部分翻译问题，并更新了许多语言的翻译。\n\n## 自上一版本以来的变更\n### 功能\n* 新增日语支持\n* 更新国际化和翻译，使其与当前用户界面保持一致。\n* 进行了一些小的翻译和界面语言更新\n### 问题修复\n* 修复 Windows 上的语言选择问题 (#760)\n### 构建\n* 添加了一些关于在基于 Linux 的系统上构建的补充说明\n* 在 build.py 中添加了从 Transifex 导出文件导入的功能\n\n## 其他说明\n* 所有二进制版本均基于 Python 3.8 构建\n* 此处托管的发布文件已使用 GPG 签名\n* Debian 归档包是在 10.8 x64 系统上构建的（二进制归档仅兼容使用 Python 3.7\u002F3.8 且为 64 位系统的环境）\n* macOS 提供 Qt 和 Cocoa 两种版本，均兼容 Intel 和 M1 芯片\n\n## 操作系统软件包\n* Arch Linux 软件包由 @glubsy 在 https:\u002F\u002Faur.archlinux.org\u002Fpackages\u002Fdupeguru\u002F 维护\n* Ubuntu PPA 由 @eugenesan 在 https:\u002F\u002Flaunchpad.net\u002F~dupeguru\u002F+archive\u002Fubuntu\u002Fppa 构建","2021-03-22T05:28:00",{"id":186,"version":187,"summary_zh":188,"released_at":189},255277,"4.1.0","本次发布修复了大量 bug，并带来了几项较为重要的 UI 改进（仅限 Qt 界面）。\n\n## 自上一版本以来的变更\n### 功能\n* 在结果对话框中显示“标记选中项”的快捷键 (#656, #641)\n* 添加启用\u002F禁用粗体字体的选项 (#646, #314) \n* 对详情表格中的差异进行颜色标注，并支持行的移动 (#682)\n* 使用标签页代替独立窗口 (#688)\n* 将目录保存为 XML 格式并可加载 (#706)\n* 在详情对话框中添加图像比较功能 (#683)\n* 更改参考行的背景颜色，并允许用户自定义颜色 (#701)\n* 增加基于正则表达式的排除过滤器功能 (#705)\n\n### Bug 修复\n* 修复详情和结果对话框中行内容被截断的问题 (#655, #654) \n* 修复 Python 3.8 兼容性问题 (#665) \n* 修复文件夹比较信息未在结果表格中显示的问题 (#677, #676)\n* 修复 flake8 检查中的问题 (#672)\n* 修复忽略列表对话框中的自动换行问题 (#687)\n* 进度对话框卡在“已验证 X\u002FX 个匹配”状态 (#693, #694)\n* 修复结果窗口在创建时的行为问题 (#685)\n* 针对解析函数中 EXIF IFD 类型不匹配的问题提供临时解决方案 (#630, #698)\n\n### 构建\n* 更新 CI 构建流程，并添加 Windows 平台的 CI (#572, #669)\n* 更新 Ubuntu 的打包配置 (#593)\n* 进行了一些小的构建优化 (#627, #575, #628, #614)\n* 升级 pytest 版本，扩展 flake8 检查范围，清理各类弃用警告\n* 在打包脚本中，当某些文件未成功构建时添加警告提示 (#691)\n* 为主题使用相对图标路径，以便更轻松地进行覆盖 (#746)\n\n## 其他说明\n* 所有二进制版本均基于 Python 3.8 构建\n* 此处提供的发布文件均已使用 GPG 签名\n* Debian 归档包是在 10.7 x64 系统上构建的（二进制归档仅兼容使用 Python 3.7.x 和 64 位系统的环境）\n\n## 操作系统软件包\n* Arch Linux 软件包由 @glubsy 在 https:\u002F\u002Faur.archlinux.org\u002Fpackages\u002Fdupeguru\u002F 维护\n* Ubuntu PPA 由 @eugenesan 在 https:\u002F\u002Flaunchpad.net\u002F~dupeguru\u002F+archive\u002Fubuntu\u002Fppa 构建","2021-01-12T01:14:28",{"id":191,"version":192,"summary_zh":193,"released_at":194},255278,"4.0.4","本次发布包含多项错误修复以及对 Windows 系统的更好支持。为了逐步推出该版本，二进制文件将随构建完成陆续添加，直至覆盖所有平台。如需跟踪进度，请参阅 #566。\n\n## 自上一版本以来的变更\n* 更新 qt\u002Fplatform.py 以支持其他类 Unix 操作系统 (#444)\n* 修复属性对话框中字体大小缩放问题 [qt] (#504)\n* 更新以支持 Python 3.7\n* 修复结果窗口部分显示在屏幕外的问题 [qt] (#521)\n* 修复简体中文翻译错误\n* 更新德语语言文件 (#479)\n* 修复进度窗口多次关闭调用导致的错误 [qt] (#460, #449)\n* 添加 Travis CI 构建\n* 对 get_files() 和 get_state() 方法进行非递归处理，以提高稳定性 (#421)\n* 更新意大利语语言文件 (#445, #446, #447, #448)\n* 修复 cache_shelve 相关问题 (#402, #439)\n* 更新 Windows 打包与构建 (#438, #456, #461, #491, #474, #490, #565)\n* 处理操作系统终止信号 (#425)\n* 将文档安装设为可选\n* 将 Cocoa UI 移至 dupeguru-cocoa [cocoa]\n\n## 其他说明\n* 所有二进制版本均使用 Python 3.7 构建\n* GitHub 自动生成的源代码归档不包含子模块内容。\n* 此处托管的发布文件已使用 GPG 签名\n\n## 操作系统软件包\n* Arch Linux 软件包由 @glubsy 在 https:\u002F\u002Faur.archlinux.org\u002Fpackages\u002Fdupeguru\u002F 维护。\n* Ubuntu PPA 由 @eugenesan 在 https:\u002F\u002Flaunchpad.net\u002F~dupeguru\u002F+archive\u002Fubuntu\u002Fppa\u002F 构建。","2019-05-14T03:08:38",{"id":196,"version":197,"summary_zh":198,"released_at":199},255279,"4.0.3","在迁移到使用 GitHub 托管发布之前的旧版本。这些文件仅用于临时用途，直到所有平台都更新完毕。\n\n此版本的 PPA 地址为：https:\u002F\u002Flaunchpad.net\u002F~hsoft\u002F+archive\u002Fubuntu\u002Fppa\u002F+packages","2019-05-14T03:44:50"]