[{"data":1,"prerenderedAt":-1},["ShallowReactive",2],{"similar-treeverse--dvc":3,"tool-treeverse--dvc":61},[4,18,26,36,44,53],{"id":5,"name":6,"github_repo":7,"description_zh":8,"stars":9,"difficulty_score":10,"last_commit_at":11,"category_tags":12,"status":17},4358,"openclaw","openclaw\u002Fopenclaw","OpenClaw 是一款专为个人打造的本地化 AI 助手，旨在让你在自己的设备上拥有完全可控的智能伙伴。它打破了传统 AI 助手局限于特定网页或应用的束缚，能够直接接入你日常使用的各类通讯渠道，包括微信、WhatsApp、Telegram、Discord、iMessage 等数十种平台。无论你在哪个聊天软件中发送消息，OpenClaw 都能即时响应，甚至支持在 macOS、iOS 和 Android 设备上进行语音交互，并提供实时的画布渲染功能供你操控。\n\n这款工具主要解决了用户对数据隐私、响应速度以及“始终在线”体验的需求。通过将 AI 部署在本地，用户无需依赖云端服务即可享受快速、私密的智能辅助，真正实现了“你的数据，你做主”。其独特的技术亮点在于强大的网关架构，将控制平面与核心助手分离，确保跨平台通信的流畅性与扩展性。\n\nOpenClaw 非常适合希望构建个性化工作流的技术爱好者、开发者，以及注重隐私保护且不愿被单一生态绑定的普通用户。只要具备基础的终端操作能力（支持 macOS、Linux 及 Windows WSL2），即可通过简单的命令行引导完成部署。如果你渴望拥有一个懂你",349277,3,"2026-04-06T06:32:30",[13,14,15,16],"Agent","开发框架","图像","数据工具","ready",{"id":19,"name":20,"github_repo":21,"description_zh":22,"stars":23,"difficulty_score":10,"last_commit_at":24,"category_tags":25,"status":17},3808,"stable-diffusion-webui","AUTOMATIC1111\u002Fstable-diffusion-webui","stable-diffusion-webui 是一个基于 Gradio 构建的网页版操作界面，旨在让用户能够轻松地在本地运行和使用强大的 Stable Diffusion 图像生成模型。它解决了原始模型依赖命令行、操作门槛高且功能分散的痛点，将复杂的 AI 绘图流程整合进一个直观易用的图形化平台。\n\n无论是希望快速上手的普通创作者、需要精细控制画面细节的设计师，还是想要深入探索模型潜力的开发者与研究人员，都能从中获益。其核心亮点在于极高的功能丰富度：不仅支持文生图、图生图、局部重绘（Inpainting）和外绘（Outpainting）等基础模式，还独创了注意力机制调整、提示词矩阵、负向提示词以及“高清修复”等高级功能。此外，它内置了 GFPGAN 和 CodeFormer 等人脸修复工具，支持多种神经网络放大算法，并允许用户通过插件系统无限扩展能力。即使是显存有限的设备，stable-diffusion-webui 也提供了相应的优化选项，让高质量的 AI 艺术创作变得触手可及。",162132,"2026-04-05T11:01:52",[14,15,13],{"id":27,"name":28,"github_repo":29,"description_zh":30,"stars":31,"difficulty_score":32,"last_commit_at":33,"category_tags":34,"status":17},1381,"everything-claude-code","affaan-m\u002Feverything-claude-code","everything-claude-code 是一套专为 AI 编程助手（如 Claude Code、Codex、Cursor 等）打造的高性能优化系统。它不仅仅是一组配置文件，而是一个经过长期实战打磨的完整框架，旨在解决 AI 代理在实际开发中面临的效率低下、记忆丢失、安全隐患及缺乏持续学习能力等核心痛点。\n\n通过引入技能模块化、直觉增强、记忆持久化机制以及内置的安全扫描功能，everything-claude-code 能显著提升 AI 在复杂任务中的表现，帮助开发者构建更稳定、更智能的生产级 AI 代理。其独特的“研究优先”开发理念和针对 Token 消耗的优化策略，使得模型响应更快、成本更低，同时有效防御潜在的攻击向量。\n\n这套工具特别适合软件开发者、AI 研究人员以及希望深度定制 AI 工作流的技术团队使用。无论您是在构建大型代码库，还是需要 AI 协助进行安全审计与自动化测试，everything-claude-code 都能提供强大的底层支持。作为一个曾荣获 Anthropic 黑客大奖的开源项目，它融合了多语言支持与丰富的实战钩子（hooks），让 AI 真正成长为懂上",142651,2,"2026-04-06T23:34:12",[14,13,35],"语言模型",{"id":37,"name":38,"github_repo":39,"description_zh":40,"stars":41,"difficulty_score":32,"last_commit_at":42,"category_tags":43,"status":17},2271,"ComfyUI","Comfy-Org\u002FComfyUI","ComfyUI 是一款功能强大且高度模块化的视觉 AI 引擎，专为设计和执行复杂的 Stable Diffusion 图像生成流程而打造。它摒弃了传统的代码编写模式，采用直观的节点式流程图界面，让用户通过连接不同的功能模块即可构建个性化的生成管线。\n\n这一设计巧妙解决了高级 AI 绘图工作流配置复杂、灵活性不足的痛点。用户无需具备编程背景，也能自由组合模型、调整参数并实时预览效果，轻松实现从基础文生图到多步骤高清修复等各类复杂任务。ComfyUI 拥有极佳的兼容性，不仅支持 Windows、macOS 和 Linux 全平台，还广泛适配 NVIDIA、AMD、Intel 及苹果 Silicon 等多种硬件架构，并率先支持 SDXL、Flux、SD3 等前沿模型。\n\n无论是希望深入探索算法潜力的研究人员和开发者，还是追求极致创作自由度的设计师与资深 AI 绘画爱好者，ComfyUI 都能提供强大的支持。其独特的模块化架构允许社区不断扩展新功能，使其成为当前最灵活、生态最丰富的开源扩散模型工具之一，帮助用户将创意高效转化为现实。",107888,"2026-04-06T11:32:50",[14,15,13],{"id":45,"name":46,"github_repo":47,"description_zh":48,"stars":49,"difficulty_score":32,"last_commit_at":50,"category_tags":51,"status":17},4721,"markitdown","microsoft\u002Fmarkitdown","MarkItDown 是一款由微软 AutoGen 团队打造的轻量级 Python 工具，专为将各类文件高效转换为 Markdown 格式而设计。它支持 PDF、Word、Excel、PPT、图片（含 OCR）、音频（含语音转录）、HTML 乃至 YouTube 链接等多种格式的解析，能够精准提取文档中的标题、列表、表格和链接等关键结构信息。\n\n在人工智能应用日益普及的今天，大语言模型（LLM）虽擅长处理文本，却难以直接读取复杂的二进制办公文档。MarkItDown 恰好解决了这一痛点，它将非结构化或半结构化的文件转化为模型“原生理解”且 Token 效率极高的 Markdown 格式，成为连接本地文件与 AI 分析 pipeline 的理想桥梁。此外，它还提供了 MCP（模型上下文协议）服务器，可无缝集成到 Claude Desktop 等 LLM 应用中。\n\n这款工具特别适合开发者、数据科学家及 AI 研究人员使用，尤其是那些需要构建文档检索增强生成（RAG）系统、进行批量文本分析或希望让 AI 助手直接“阅读”本地文件的用户。虽然生成的内容也具备一定可读性，但其核心优势在于为机器",93400,"2026-04-06T19:52:38",[52,14],"插件",{"id":54,"name":55,"github_repo":56,"description_zh":57,"stars":58,"difficulty_score":10,"last_commit_at":59,"category_tags":60,"status":17},4487,"LLMs-from-scratch","rasbt\u002FLLMs-from-scratch","LLMs-from-scratch 是一个基于 PyTorch 的开源教育项目，旨在引导用户从零开始一步步构建一个类似 ChatGPT 的大型语言模型（LLM）。它不仅是同名技术著作的官方代码库，更提供了一套完整的实践方案，涵盖模型开发、预训练及微调的全过程。\n\n该项目主要解决了大模型领域“黑盒化”的学习痛点。许多开发者虽能调用现成模型，却难以深入理解其内部架构与训练机制。通过亲手编写每一行核心代码，用户能够透彻掌握 Transformer 架构、注意力机制等关键原理，从而真正理解大模型是如何“思考”的。此外，项目还包含了加载大型预训练权重进行微调的代码，帮助用户将理论知识延伸至实际应用。\n\nLLMs-from-scratch 特别适合希望深入底层原理的 AI 开发者、研究人员以及计算机专业的学生。对于不满足于仅使用 API，而是渴望探究模型构建细节的技术人员而言，这是极佳的学习资源。其独特的技术亮点在于“循序渐进”的教学设计：将复杂的系统工程拆解为清晰的步骤，配合详细的图表与示例，让构建一个虽小但功能完备的大模型变得触手可及。无论你是想夯实理论基础，还是为未来研发更大规模的模型做准备",90106,"2026-04-06T11:19:32",[35,15,13,14],{"id":62,"github_repo":63,"name":64,"description_en":65,"description_zh":66,"ai_summary_zh":66,"readme_en":67,"readme_zh":68,"quickstart_zh":69,"use_case_zh":70,"hero_image_url":71,"owner_login":72,"owner_name":73,"owner_avatar_url":74,"owner_bio":75,"owner_company":76,"owner_location":76,"owner_email":77,"owner_twitter":78,"owner_website":79,"owner_url":80,"languages":81,"stars":90,"forks":91,"last_commit_at":92,"license":93,"difficulty_score":94,"env_os":95,"env_gpu":96,"env_ram":96,"env_deps":97,"category_tags":106,"github_topics":108,"view_count":32,"oss_zip_url":76,"oss_zip_packed_at":76,"status":17,"created_at":116,"updated_at":117,"faqs":118,"releases":147},4828,"treeverse\u002Fdvc","dvc","🦉 Data Versioning and ML Experiments","DVC（Data Version Control）是一款专为机器学习项目设计的命令行工具与 VS Code 插件，旨在帮助开发者和研究人员构建可复现的 AI 工作流。它核心解决了大体积数据与模型文件难以通过 Git 直接版本管理的痛点：DVC 将实际数据存储于云端的对象存储中，而仅在 Git 仓库里保留轻量级的版本元数据，从而实现了代码与数据的协同版本控制。\n\n除了基础的数据版本管理，DVC 还内置了轻量级流水线引擎。当用户修改部分代码或数据时，它能智能识别依赖关系，仅重新运行受影响的步骤，大幅提升实验迭代效率。此外，DVC 支持在本地 Git 环境中无缝追踪、对比和复现实验结果，无需部署额外的服务器即可管理复杂的参数、指标及性能图表。\n\n这款工具特别适合从事机器学习工程、数据科学研究的开发者团队。其独特的技术亮点在于“像管理代码一样管理数据”的理念，以及无需服务器即可实现的分布式实验协作能力。通过 DVC，团队可以轻松共享实验环境，确保任何成员都能一键复现他人的研究成果，让机器学习项目的开发过程更加规范、透明且高效。","|Banner|\n\n`Website \u003Chttps:\u002F\u002Fdvc.org>`_\n• `Docs \u003Chttps:\u002F\u002Fdvc.org\u002Fdoc>`_\n• `Blog \u003Chttp:\u002F\u002Fblog.dataversioncontrol.com>`_\n• `Tutorial \u003Chttps:\u002F\u002Fdvc.org\u002Fdoc\u002Fget-started>`_\n• `Related Technologies \u003Chttps:\u002F\u002Fdvc.org\u002Fdoc\u002Fuser-guide\u002Frelated-technologies>`_\n• `How DVC works`_\n• `VS Code Extension`_\n• `Installation`_\n• `Contributing`_\n• `Community and Support`_\n\n|CI| |Python Version| |Coverage| |VS Code| |DOI|\n\n|PyPI| |PyPI Downloads| |Packages| |Brew| |Conda| |Choco| |Snap|\n\n|\n\n**Data Version Control** or **DVC** is a command line tool and `VS Code Extension`_ to help you develop reproducible machine learning projects:\n\n#. **Version** your data and models.\n   Store them in your cloud storage but keep their version info in your Git repo.\n\n#. **Iterate** fast with lightweight pipelines.\n   When you make changes, only run the steps impacted by those changes.\n\n#. **Track** experiments in your local Git repo (no servers needed).\n\n#. **Compare** any data, code, parameters, model, or performance plots.\n\n#. **Share** experiments and automatically reproduce anyone's experiment.\n\nQuick start\n===========\n\n    Please read our `Command Reference \u003Chttps:\u002F\u002Fdvc.org\u002Fdoc\u002Fcommand-reference>`_ for a complete list.\n\nA common CLI workflow includes:\n\n\n+-----------------------------------+----------------------------------------------------------------------------------------------------+\n| Task                              | Terminal                                                                                           |\n+===================================+====================================================================================================+\n| Track data                        | | ``$ git add train.py params.yaml``                                                               |\n|                                   | | ``$ dvc add images\u002F``                                                                            |\n+-----------------------------------+----------------------------------------------------------------------------------------------------+\n| Connect code and data             | | ``$ dvc stage add -n featurize -d images\u002F -o features\u002F python featurize.py``                     |\n|                                   | | ``$ dvc stage add -n train -d features\u002F -d train.py -o model.p -M metrics.json python train.py`` |\n+-----------------------------------+----------------------------------------------------------------------------------------------------+\n| Make changes and experiment       | | ``$ dvc exp run -n exp-baseline``                                                                |\n|                                   | | ``$ vi train.py``                                                                                |\n|                                   | | ``$ dvc exp run -n exp-code-change``                                                             |\n+-----------------------------------+----------------------------------------------------------------------------------------------------+\n| Compare and select experiments    | | ``$ dvc exp show``                                                                               |\n|                                   | | ``$ dvc exp apply exp-baseline``                                                                 |\n+-----------------------------------+----------------------------------------------------------------------------------------------------+\n| Share code                        | | ``$ git add .``                                                                                  |\n|                                   | | ``$ git commit -m 'The baseline model'``                                                         |\n|                                   | | ``$ git push``                                                                                   |\n+-----------------------------------+----------------------------------------------------------------------------------------------------+\n| Share data and ML models          | | ``$ dvc remote add myremote -d s3:\u002F\u002Fmybucket\u002Fimage_cnn``                                         |\n|                                   | | ``$ dvc push``                                                                                   |\n+-----------------------------------+----------------------------------------------------------------------------------------------------+\n\nHow DVC works\n=============\n\n    We encourage you to read our `Get Started\n    \u003Chttps:\u002F\u002Fdvc.org\u002Fdoc\u002Fget-started>`_ docs to better understand what DVC\n    does and how it can fit your scenarios.\n\nThe closest *analogies* to describe the main DVC features are these:\n\n#. **Git for data**: Store and share data artifacts (like Git-LFS but without a server) and models, connecting them with a Git repository. Data management meets GitOps!\n#. **Makefiles** for ML: Describes how data or model artifacts are built from other data and code in a standard format. Now you can version your data pipelines with Git.\n#. Local **experiment tracking**: Turn your machine into an ML experiment management platform, and collaborate with others using existing Git hosting (Github, Gitlab, etc.).\n\nGit is employed as usual to store and version code (including DVC meta-files as placeholders for data).\nDVC `stores data and model files \u003Chttps:\u002F\u002Fdvc.org\u002Fdoc\u002Fstart\u002Fdata-management>`_ seamlessly in a cache outside of Git, while preserving almost the same user experience as if they were in the repo.\nTo share and back up the *data cache*, DVC supports multiple remote storage platforms - any cloud (S3, Azure, Google Cloud, etc.) or on-premise network storage (via SSH, for example).\n\n|Flowchart|\n\n`DVC pipelines \u003Chttps:\u002F\u002Fdvc.org\u002Fdoc\u002Fstart\u002Fdata-management\u002Fdata-pipelines>`_ (computational graphs) connect code and data together.\nThey specify all steps required to produce a model: input dependencies including code, data, commands to run; and output information to be saved.\n\nLast but not least, `DVC Experiment Versioning \u003Chttps:\u002F\u002Fdvc.org\u002Fdoc\u002Fstart\u002Fexperiments>`_ lets you prepare and run a large number of experiments.\nTheir results can be filtered and compared based on hyperparameters and metrics, and visualized with multiple plots.\n\n.. _`VS Code Extension`:\n\nVS Code Extension\n=================\n\n|VS Code|\n\nTo use DVC as a GUI right from your VS Code IDE, install the `DVC Extension \u003Chttps:\u002F\u002Fmarketplace.visualstudio.com\u002Fitems?itemName=Iterative.dvc>`_ from the Marketplace.\nIt currently features experiment tracking and data management, and more features (data pipeline support, etc.) are coming soon!\n\n|VS Code Extension Overview|\n\n    Note: You'll have to install core DVC on your system separately (as detailed\n    below). The Extension will guide you if needed.\n\nInstallation\n============\n\nThere are several ways to install DVC: in VS Code; using ``snap``, ``choco``, ``brew``, ``conda``, ``pip``; or with an OS-specific package.\nFull instructions are `available here \u003Chttps:\u002F\u002Fdvc.org\u002Fdoc\u002Fget-started\u002Finstall>`_.\n\nSnapcraft (Linux)\n-----------------\n\n|Snap|\n\n.. code-block:: bash\n\n   snap install dvc --classic\n\nThis corresponds to the latest tagged release.\nAdd ``--beta`` for the latest tagged release candidate, or ``--edge`` for the latest ``main`` version.\n\nChocolatey (Windows)\n--------------------\n\n|Choco|\n\n.. code-block:: bash\n\n   choco install dvc\n\nBrew (mac OS)\n-------------\n\n|Brew|\n\n.. code-block:: bash\n\n   brew install dvc\n\nAnaconda (Any platform)\n-----------------------\n\n|Conda|\n\n.. code-block:: bash\n\n   conda install -c conda-forge mamba # installs much faster than conda\n   mamba install -c conda-forge dvc\n\nDepending on the remote storage type you plan to use to keep and share your data, you might need to install optional dependencies: `dvc-s3`, `dvc-azure`, `dvc-gdrive`, `dvc-gs`, `dvc-oss`, `dvc-ssh`.\n\nPyPI (Python)\n-------------\n\n|PyPI|\n\n.. code-block:: bash\n\n   pip install dvc\n\nDepending on the remote storage type you plan to use to keep and share your data, you might need to specify one of the optional dependencies: ``s3``, ``gs``, ``azure``, ``oss``, ``ssh``. Or ``all`` to include them all.\nThe command should look like this: ``pip install 'dvc[s3]'`` (in this case AWS S3 dependencies such as ``boto3`` will be installed automatically).\n\nTo install the development version, run:\n\n.. code-block:: bash\n\n   pip install \"dvc @ git+https:\u002F\u002Fgithub.com\u002Ftreeverse\u002Fdvc\"\n\nPackage (Platform-specific)\n---------------------------\n\n|Packages|\n\nSelf-contained packages for Linux, Windows, and Mac are available.\nThe latest version of the packages can be found on the GitHub `releases page \u003Chttps:\u002F\u002Fgithub.com\u002Ftreeverse\u002Fdvc\u002Freleases>`_.\n\nUbuntu \u002F Debian (deb)\n^^^^^^^^^^^^^^^^^^^^^\n.. code-block:: bash\n\n   sudo wget https:\u002F\u002Fdvc.org\u002Fdeb\u002Fdvc.list -O \u002Fetc\u002Fapt\u002Fsources.list.d\u002Fdvc.list\n   wget -qO - https:\u002F\u002Fdvc.org\u002Fdeb\u002Fiterative.asc | sudo apt-key add -\n   sudo apt update\n   sudo apt install dvc\n\nFedora \u002F CentOS (rpm)\n^^^^^^^^^^^^^^^^^^^^^\n.. code-block:: bash\n\n   sudo wget https:\u002F\u002Fdvc.org\u002Frpm\u002Fdvc.repo -O \u002Fetc\u002Fyum.repos.d\u002Fdvc.repo\n   sudo rpm --import https:\u002F\u002Fdvc.org\u002Frpm\u002Fiterative.asc\n   sudo yum update\n   sudo yum install dvc\n\nContributing\n============\n\nContributions are welcome!\nPlease see our `Contributing Guide \u003Chttps:\u002F\u002Fdvc.org\u002Fdoc\u002Fuser-guide\u002Fcontributing\u002Fcore>`_ for more details.\nThanks to all our contributors!\n\n|Contribs|\n\nCommunity and Support\n=====================\n\n* `Twitter \u003Chttps:\u002F\u002Ftwitter.com\u002FDVCorg>`_\n* `Forum \u003Chttps:\u002F\u002Fdiscuss.dvc.org\u002F>`_\n* `Discord Chat \u003Chttps:\u002F\u002Fdvc.org\u002Fchat>`_\n* `Email \u003Cmailto:support@dvc.org>`_\n* `Mailing List \u003Chttps:\u002F\u002Fdvc.org\u002Fcommunity#subscribe>`_\n\nCopyright\n=========\n\nThis project is distributed under the Apache license version 2.0 (see the LICENSE file in the project root).\n\nBy submitting a pull request to this project, you agree to license your contribution under the Apache license version 2.0 to this project.\n\nCitation\n========\n\n|DOI|\n\nIterative, *DVC: Data Version Control - Git for Data & Models* (2020)\n`DOI:10.5281\u002Fzenodo.012345 \u003Chttps:\u002F\u002Fdoi.org\u002F10.5281\u002Fzenodo.3677553>`_.\n\nBarrak, A., Eghan, E.E. and Adams, B. `On the Co-evolution of ML Pipelines and Source Code - Empirical Study of DVC Projects \u003Chttps:\u002F\u002Fmcis.cs.queensu.ca\u002Fpublications\u002F2021\u002Fsaner.pdf>`_ , in Proceedings of the 28th IEEE International Conference on Software Analysis, Evolution, and Reengineering, SANER 2021. Hawaii, USA.\n\n\n.. |Banner| image:: https:\u002F\u002Fdvc.org\u002Fimg\u002Flogo-github-readme.png\n   :target: https:\u002F\u002Fdvc.org\n   :alt: DVC logo\n\n.. |VS Code Extension Overview| image:: https:\u002F\u002Fraw.githubusercontent.com\u002Ftreeverse\u002Fvscode-dvc\u002Fmain\u002Fextension\u002Fdocs\u002Foverview.gif\n   :alt: DVC Extension for VS Code\n\n.. |CI| image:: https:\u002F\u002Fgithub.com\u002Ftreeverse\u002Fdvc\u002Factions\u002Fworkflows\u002Ftests.yaml\u002Fbadge.svg\n   :target: https:\u002F\u002Fgithub.com\u002Ftreeverse\u002Fdvc\u002Factions\u002Fworkflows\u002Ftests.yaml\n   :alt: GHA Tests\n\n.. |Python Version| image:: https:\u002F\u002Fimg.shields.io\u002Fpypi\u002Fpyversions\u002Fdvc\n   :target: https:\u002F\u002Fpypi.org\u002Fproject\u002Fdvc\n   :alt: Python Version\n\n.. |Coverage| image:: https:\u002F\u002Fcodecov.io\u002Fgh\u002Ftreeverse\u002Fdvc\u002Fbranch\u002Fmain\u002Fgraph\u002Fbadge.svg\n   :target: https:\u002F\u002Fcodecov.io\u002Fgh\u002Ftreeverse\u002Fdvc\n   :alt: Codecov\n\n.. |Snap| image:: https:\u002F\u002Fimg.shields.io\u002Fbadge\u002Fsnap-install-82BEA0.svg?logo=snapcraft\n   :target: https:\u002F\u002Fsnapcraft.io\u002Fdvc\n   :alt: Snapcraft\n\n.. |Choco| image:: https:\u002F\u002Fimg.shields.io\u002Fchocolatey\u002Fv\u002Fdvc?label=choco\n   :target: https:\u002F\u002Fchocolatey.org\u002Fpackages\u002Fdvc\n   :alt: Chocolatey\n\n.. |Brew| image:: https:\u002F\u002Fimg.shields.io\u002Fhomebrew\u002Fv\u002Fdvc?label=brew\n   :target: https:\u002F\u002Fformulae.brew.sh\u002Fformula\u002Fdvc\n   :alt: Homebrew\n\n.. |Conda| image:: https:\u002F\u002Fanaconda.org\u002Fconda-forge\u002Fdvc\u002Fbadges\u002Fversion.svg\n   :target: https:\u002F\u002Fanaconda.org\u002Fconda-forge\u002Fdvc\n   :alt: Conda-forge\n\n.. |PyPI| image:: https:\u002F\u002Fimg.shields.io\u002Fpypi\u002Fv\u002Fdvc.svg?label=pip&logo=PyPI&logoColor=white\n   :target: https:\u002F\u002Fpypi.org\u002Fproject\u002Fdvc\n   :alt: PyPI\n\n.. |PyPI Downloads| image:: https:\u002F\u002Fimg.shields.io\u002Fpypi\u002Fdm\u002Fdvc.svg?color=blue&label=Downloads&logo=pypi&logoColor=gold\n   :target: https:\u002F\u002Fpypi.org\u002Fproject\u002Fdvc\n   :alt: PyPI Downloads\n\n.. |Packages| image:: https:\u002F\u002Fimg.shields.io\u002Fbadge\u002Fdeb|pkg|rpm|exe-blue\n   :target: https:\u002F\u002Fdvc.org\u002Fdoc\u002Finstall\n   :alt: deb|pkg|rpm|exe\n\n.. |DOI| image:: https:\u002F\u002Fimg.shields.io\u002Fbadge\u002FDOI-10.5281\u002Fzenodo.3677553-blue.svg\n   :target: https:\u002F\u002Fdoi.org\u002F10.5281\u002Fzenodo.3677553\n   :alt: DOI\n\n.. |Flowchart| image:: https:\u002F\u002Fdvc.org\u002Fimg\u002Fflow.gif\n   :target: https:\u002F\u002Fdvc.org\u002Fimg\u002Fflow.gif\n   :alt: how_dvc_works\n\n.. |Contribs| image:: https:\u002F\u002Fcontrib.rocks\u002Fimage?repo=treeverse\u002Fdvc\n   :target: https:\u002F\u002Fgithub.com\u002Ftreeverse\u002Fdvc\u002Fgraphs\u002Fcontributors\n   :alt: Contributors\n\n.. |VS Code| image:: https:\u002F\u002Fimg.shields.io\u002Fvisual-studio-marketplace\u002Fv\u002FIterative.dvc?color=blue&label=VSCode&logo=visualstudiocode&logoColor=blue\n   :target: https:\u002F\u002Fmarketplace.visualstudio.com\u002Fitems?itemName=Iterative.dvc\n   :alt: VS Code Extension\n","|横幅|\n\n`网站 \u003Chttps:\u002F\u002Fdvc.org>`_\n• `文档 \u003Chttps:\u002F\u002Fdvc.org\u002Fdoc>`_\n• `博客 \u003Chttp:\u002F\u002Fblog.dataversioncontrol.com>`_\n• `教程 \u003Chttps:\u002F\u002Fdvc.org\u002Fdoc\u002Fget-started>`_\n• `相关技术 \u003Chttps:\u002F\u002Fdvc.org\u002Fdoc\u002Fuser-guide\u002Frelated-technologies>`_\n• `DVC 工作原理`_\n• `VS Code 扩展`_\n• `安装`_\n• `贡献代码`_\n• `社区与支持`_\n\n|CI| |Python 版本| |覆盖率| |VS Code| |DOI|\n\n|PyPI| |PyPI 下载量| |软件包| |Brew| |Conda| |Choco| |Snap|\n\n|\n\n**数据版本控制**，简称 **DVC**，是一款命令行工具及 `VS Code 扩展`_，旨在帮助您开发可复现的机器学习项目：\n\n#. **版本化**您的数据和模型。\n   将它们存储在云端，但将版本信息保留在 Git 仓库中。\n\n#. 使用轻量级流水线快速迭代。\n   当您进行更改时，仅运行受这些更改影响的步骤。\n\n#. 在本地 Git 仓库中**跟踪**实验（无需服务器）。\n\n#. 比较任何数据、代码、超参数、模型或性能图表。\n\n#. 分享实验，并自动复现他人的实验。\n\n快速入门\n===========\n\n    请参阅我们的 `命令参考 \u003Chttps:\u002F\u002Fdvc.org\u002Fdoc\u002Fcommand-reference>`_ 以获取完整列表。\n\n常见的 CLI 工作流程包括：\n\n\n+-----------------------------------+----------------------------------------------------------------------------------------------------+\n| 任务                              | 终端                                                                                           |\n+===================================+====================================================================================================+\n| 跟踪数据                        | | ``$ git add train.py params.yaml``                                                               |\n|                                   | | ``$ dvc add images\u002F``                                                                            |\n+-----------------------------------+----------------------------------------------------------------------------------------------------+\n| 连接代码和数据             | | ``$ dvc stage add -n featurize -d images\u002F -o features\u002F python featurize.py``                     |\n|                                   | | ``$ dvc stage add -n train -d features\u002F -d train.py -o model.p -M metrics.json python train.py`` |\n+-----------------------------------+----------------------------------------------------------------------------------------------------+\n| 进行更改并实验       | | ``$ dvc exp run -n exp-baseline``                                                                |\n|                                   | | ``$ vi train.py``                                                                                |\n|                                   | | ``$ dvc exp run -n exp-code-change``                                                             |\n+-----------------------------------+----------------------------------------------------------------------------------------------------+\n| 比较并选择实验    | | ``$ dvc exp show``                                                                               |\n|                                   | | ``$ dvc exp apply exp-baseline``                                                                 |\n+-----------------------------------+----------------------------------------------------------------------------------------------------+\n| 分享代码                        | | ``$ git add .``                                                                                  |\n|                                   | | ``$ git commit -m '基准模型'``                                                         |\n|                                   | | ``$ git push``                                                                                   |\n+-----------------------------------+----------------------------------------------------------------------------------------------------+\n| 分享数据和机器学习模型          | | ``$ dvc remote add myremote -d s3:\u002F\u002Fmybucket\u002Fimage_cnn``                                         |\n|                                   | | ``$ dvc push``                                                                                   |\n+-----------------------------------+----------------------------------------------------------------------------------------------------+\n\nDVC 工作原理\n=============\n\n    我们建议您阅读我们的 `入门指南 \u003Chttps:\u002F\u002Fdvc.org\u002Fdoc\u002Fget-started>`_，以便更好地理解 DVC 的功能及其如何适应您的场景。\n\n描述 DVC 主要功能的最贴切类比是：\n\n#. **数据版控 Git**：存储和分享数据制品（类似 Git-LFS，但无需服务器）以及模型，并将其与 Git 仓库连接起来。数据管理与 GitOps 相结合！\n#. **适用于机器学习的 Makefile**：以标准格式描述如何从其他数据和代码构建数据或模型制品。现在您可以使用 Git 对数据流水线进行版本控制。\n#. 本地**实验跟踪**：将您的机器变成一个机器学习实验管理平台，并利用现有的 Git 托管服务（如 GitHub、GitLab 等）与他人协作。\n\nGit 通常用于存储和版本化代码（包括作为数据占位符的 DVC 元文件）。\nDVC `无缝地将数据和模型文件 \u003Chttps:\u002F\u002Fdvc.org\u002Fdoc\u002Fstart\u002Fdata-management>`_ 存储在 Git 外部的缓存中，同时几乎保持与文件位于仓库内相同的用户体验。\n为了共享和备份 *数据缓存*，DVC 支持多种远程存储平台——无论是云存储（S3、Azure、Google Cloud 等）还是本地网络存储（例如通过 SSH）。\n\n|流程图|\n\n`DVC 流水线 \u003Chttps:\u002F\u002Fdvc.org\u002Fdoc\u002Fstart\u002Fdata-management\u002Fdata-pipelines>`_（计算图）将代码和数据连接在一起。\n它们指定了生成模型所需的所有步骤：输入依赖项（包括代码、数据、要执行的命令）以及需要保存的输出信息。\n\n最后，但同样重要的是，`DVC 实验版本控制 \u003Chttps:\u002F\u002Fdvc.org\u002Fdoc\u002Fstart\u002Fexperiments>`_ 让您可以准备和运行大量实验。\n其结果可以根据超参数和指标进行筛选和比较，并通过多种图表进行可视化。\n\n.. _`VS Code Extension`:\n\nVS Code 扩展\n=================\n\n|VS Code|\n\n要直接在 VS Code IDE 中以图形界面使用 DVC，请从市场安装 `DVC 扩展 \u003Chttps:\u002F\u002Fmarketplace.visualstudio.com\u002Fitems?itemName=Iterative.dvc>`_。\n目前它支持实验跟踪和数据管理，更多功能（如数据流水线支持等）也将很快推出！\n\n|VS Code 扩展概览|\n\n    注意：您需要单独在系统上安装核心 DVC（如下所述）。如有需要，扩展会为您提供指导。\n\n安装\n============\n\n安装 DVC 有多种方式：在 VS Code 中；使用 ``snap``、``choco``、``brew``、``conda``、``pip``；或者通过特定操作系统的软件包管理器。\n完整说明 `在此处 \u003Chttps:\u002F\u002Fdvc.org\u002Fdoc\u002Fget-started\u002Finstall>`_ 可用。\n\nSnapcraft（Linux）\n-----------------\n\n|Snap|\n\n.. code-block:: bash\n\n   snap install dvc --classic\n\n这对应于最新的标记版本。添加 ``--beta`` 可以获取最新的候选版本，而使用 ``--edge`` 则会安装最新的 ``main`` 分支版本。\n\nChocolatey（Windows）\n--------------------\n\n|Choco|\n\n.. code-block:: bash\n\n   choco install dvc\n\nBrew（macOS）\n-------------\n\n|Brew|\n\n.. code-block:: bash\n\n   brew install dvc\n\nAnaconda（任意平台）\n-----------------------\n\n|Conda|\n\n.. code-block:: bash\n\n   conda install -c conda-forge mamba # 安装速度远超 conda\n   mamba install -c conda-forge dvc\n\n根据您计划用于存储和共享数据的远程存储类型，可能需要安装可选依赖项：`dvc-s3`、`dvc-azure`、`dvc-gdrive`、`dvc-gs`、`dvc-oss`、`dvc-ssh`。\n\nPyPI（Python）\n-------------\n\n|PyPI|\n\n.. code-block:: bash\n\n   pip install dvc\n\n根据您计划用于存储和共享数据的远程存储类型，可能需要指定其中一个可选依赖项：``s3``、``gs``、``azure``、``oss``、``ssh``。或者使用 ``all`` 来包含所有这些依赖项。命令应如下所示：``pip install 'dvc[s3]'``（在这种情况下，AWS S3 的依赖项如 ``boto3`` 将被自动安装）。\n\n要安装开发版本，请运行：\n\n.. code-block:: bash\n\n   pip install \"dvc @ git+https:\u002F\u002Fgithub.com\u002Ftreeverse\u002Fdvc\"\n\n软件包（特定平台）\n---------------------------\n\n|Packages|\n\n适用于 Linux、Windows 和 Mac 的自包含软件包现已提供。最新版本的软件包可在 GitHub 的 `发布页面 \u003Chttps:\u002F\u002Fgithub.com\u002Ftreeverse\u002Fdvc\u002Freleases>`_ 上找到。\n\nUbuntu \u002F Debian（deb）\n^^^^^^^^^^^^^^^^^^^^^\n.. code-block:: bash\n\n   sudo wget https:\u002F\u002Fdvc.org\u002Fdeb\u002Fdvc.list -O \u002Fetc\u002Fapt\u002Fsources.list.d\u002Fdvc.list\n   wget -qO - https:\u002F\u002Fdvc.org\u002Fdeb\u002Fiterative.asc | sudo apt-key add -\n   sudo apt update\n   sudo apt install dvc\n\nFedora \u002F CentOS（rpm）\n^^^^^^^^^^^^^^^^^^^^^\n.. code-block:: bash\n\n   sudo wget https:\u002F\u002Fdvc.org\u002Frpm\u002Fdvc.repo -O \u002Fetc\u002Fyum.repos.d\u002Fdvc.repo\n   sudo rpm --import https:\u002F\u002Fdvc.org\u002Frpm\u002Fiterative.asc\n   sudo yum update\n   sudo yum install dvc\n\n贡献\n====\n\n欢迎贡献！\n有关详细信息，请参阅我们的 `贡献指南 \u003Chttps:\u002F\u002Fdvc.org\u002Fdoc\u002Fuser-guide\u002Fcontributing\u002Fcore>`_。\n感谢所有贡献者！\n\n|Contribs|\n\n社区与支持\n==========\n\n* `Twitter \u003Chttps:\u002F\u002Ftwitter.com\u002FDVCorg>`_\n* `论坛 \u003Chttps:\u002F\u002Fdiscuss.dvc.org\u002F>`_\n* `Discord 聊天 \u003Chttps:\u002F\u002Fdvc.org\u002Fchat>`_\n* `电子邮件 \u003Cmailto:support@dvc.org>`_\n* `邮件列表 \u003Chttps:\u002F\u002Fdvc.org\u002Fcommunity#subscribe>`_\n\n版权\n====\n\n本项目采用 Apache 许可证 2.0 版本进行分发（请参阅项目根目录下的 LICENSE 文件）。\n\n通过向本项目提交拉取请求，即表示您同意将您的贡献以 Apache 许可证 2.0 版本授权给本项目。\n\n引用\n====\n\n|DOI|\n\nIterative, *DVC: 数据版本控制 - 面向数据与模型的 Git* (2020)\n`DOI:10.5281\u002Fzenodo.012345 \u003Chttps:\u002F\u002Fdoi.org\u002F10.5281\u002Fzenodo.3677553>`_。\n\nBarrak, A., Eghan, E.E. 和 Adams, B. `关于 ML 管道与源代码的协同进化 - DVC 项目的实证研究 \u003Chttps:\u002F\u002Fmcis.cs.queensu.ca\u002Fpublications\u002F2021\u002Fsaner.pdf>`_ ，载于第 28 届 IEEE 国际软件分析、演化与再工程会议论文集，SANER 2021。美国夏威夷。\n\n\n.. |Banner| image:: https:\u002F\u002Fdvc.org\u002Fimg\u002Flogo-github-readme.png\n   :target: https:\u002F\u002Fdvc.org\n   :alt: DVC 标志\n\n.. |VS Code 扩展概览| image:: https:\u002F\u002Fraw.githubusercontent.com\u002Ftreeverse\u002Fvscode-dvc\u002Fmain\u002Fextension\u002Fdocs\u002Foverview.gif\n   :alt: VS Code 的 DVC 扩展\n\n.. |CI| image:: https:\u002F\u002Fgithub.com\u002Ftreeverse\u002Fdvc\u002Factions\u002Fworkflows\u002Ftests.yaml\u002Fbadge.svg\n   :target: https:\u002F\u002Fgithub.com\u002Ftreeverse\u002Fdvc\u002Factions\u002Fworkflows\u002Ftests.yaml\n   :alt: GHA 测试\n\n.. |Python 版本| image:: https:\u002F\u002Fimg.shields.io\u002Fpypi\u002Fpyversions\u002Fdvc\n   :target: https:\u002F\u002Fpypi.org\u002Fproject\u002Fdvc\n   :alt: Python 版本\n\n.. |Coverage| image:: https:\u002F\u002Fcodecov.io\u002Fgh\u002Ftreeverse\u002Fdvc\u002Fbranch\u002Fmain\u002Fgraph\u002Fbadge.svg\n   :target: https:\u002F\u002Fcodecov.io\u002Fgh\u002Ftreeverse\u002Fdvc\n   :alt: Codecov\n\n.. |Snap| image:: https:\u002F\u002Fimg.shields.io\u002Fbadge\u002Fsnap-install-82BEA0.svg?logo=snapcraft\n   :target: https:\u002F\u002Fsnapcraft.io\u002Fdvc\n   :alt: Snapcraft\n\n.. |Choco| image:: https:\u002F\u002Fimg.shields.io\u002Fchocolatey\u002Fv\u002Fdvc?label=choco\n   :target: https:\u002F\u002Fchocolatey.org\u002Fpackages\u002Fdvc\n   :alt: Chocolatey\n\n.. |Brew| image:: https:\u002F\u002Fimg.shields.io\u002Fhomebrew\u002Fv\u002Fdvc?label=brew\n   :target: https:\u002F\u002Fformulae.brew.sh\u002Fformula\u002Fdvc\n   :alt: Homebrew\n\n.. |Conda| image:: https:\u002F\u002Fanaconda.org\u002Fconda-forge\u002Fdvc\u002Fbadges\u002Fversion.svg\n   :target: https:\u002F\u002Fanaconda.org\u002Fconda-forge\u002Fdvc\n   :alt: Conda-forge\n\n.. |PyPI| image:: https:\u002F\u002Fimg.shields.io\u002Fpypi\u002Fv\u002Fdvc.svg?label=pip&logo=PyPI&logoColor=white\n   :target: https:\u002F\u002Fpypi.org\u002Fproject\u002Fdvc\n   :alt: PyPI\n\n.. |PyPI 下载量| image:: https:\u002F\u002Fimg.shields.io\u002Fpypi\u002Fdm\u002Fdvc.svg?color=blue&label=下载量&logo=pypi&logoColor=gold\n   :target: https:\u002F\u002Fpypi.org\u002Fproject\u002Fdvc\n   :alt: PyPI 下载量\n\n.. |Packages| image:: https:\u002F\u002Fimg.shields.io\u002Fbadge\u002Fdeb|pkg|rpm|exe-blue\n   :target: https:\u002F\u002Fdvc.org\u002Fdoc\u002Finstall\n   :alt: deb|pkg|rpm|exe\n\n.. |DOI| image:: https:\u002F\u002Fimg.shields.io\u002Fbadge\u002FDOI-10.5281\u002Fzenodo.3677553-blue.svg\n   :target: https:\u002F\u002Fdoi.org\u002F10.5281\u002Fzenodo.3677553\n   :alt: DOI\n\n.. |流程图| image:: https:\u002F\u002Fdvc.org\u002Fimg\u002Fflow.gif\n   :target: https:\u002F\u002Fdvc.org\u002Fimg\u002Fflow.gif\n   :alt: how_dvc_works\n\n.. |Contribs| image:: https:\u002F\u002Fcontrib.rocks\u002Fimage?repo=treeverse\u002Fdvc\n   :target: https:\u002F\u002Fgithub.com\u002Ftreeverse\u002Fdvc\u002Fgraphs\u002Fcontributors\n   :alt: 贡献者\n\n.. |VS Code| image:: https:\u002F\u002Fimg.shields.io\u002Fvisual-studio-marketplace\u002Fv\u002FIterative.dvc?color=blue&label=VSCode&logo=visualstudiocode&logoColor=blue\n   :target: https:\u002F\u002Fmarketplace.visualstudio.com\u002Fitems?itemName=Iterative.dvc\n   :alt: VS Code 扩展","# DVC 快速上手指南\n\n**DVC (Data Version Control)** 是一个命令行工具和 VS Code 扩展，旨在帮助开发者构建可复现的机器学习项目。它让你能够像管理代码一样管理数据和模型，同时利用 Git 进行版本控制。\n\n## 环境准备\n\n*   **操作系统**: Linux, macOS, 或 Windows\n*   **前置依赖**:\n    *   **Git**: 必须已安装并配置好。\n    *   **Python**: 推荐 Python 3.8 及以上版本（如果使用 pip 或 conda 安装）。\n*   **存储后端 (可选)**: 如果需要将数据推送到云端，需准备好相应的云存储账号（如 AWS S3, Google Cloud, Azure Blob, OSS 等）或 SSH 服务器。\n\n## 安装步骤\n\n你可以选择以下任意一种方式安装 DVC。国内用户推荐使用 `pip` 配合国内镜像源，或使用 `conda`。\n\n### 方式一：使用 Pip (推荐)\n\n建议使用国内镜像源（如清华源或阿里源）加速安装。如果你计划使用特定的云存储（如 S3），请安装对应的额外依赖。\n\n```bash\n# 基础安装\npip install dvc -i https:\u002F\u002Fpypi.tuna.tsinghua.edu.cn\u002Fsimple\n\n# 如果需要使用 AWS S3，安装带 s3 支持的版本\npip install 'dvc[s3]' -i https:\u002F\u002Fpypi.tuna.tsinghua.edu.cn\u002Fsimple\n\n# 如果需要所有云存储支持\npip install 'dvc[all]' -i https:\u002F\u002Fpypi.tuna.tsinghua.edu.cn\u002Fsimple\n```\n\n### 方式二：使用 Conda\u002FMamba\n\n适用于已安装 Anaconda 或 Miniconda 的用户。\n\n```bash\n# 推荐使用 mamba 以获得更快的解析速度\nconda install -c conda-forge mamba\nmamba install -c conda-forge dvc\n```\n\n### 方式三：其他包管理器\n\n*   **macOS (Homebrew)**:\n    ```bash\n    brew install dvc\n    ```\n*   **Windows (Chocolatey)**:\n    ```bash\n    choco install dvc\n    ```\n*   **Linux (Snap)**:\n    ```bash\n    snap install dvc --classic\n    ```\n\n> **提示**: 安装完成后，运行 `dvc --version` 验证安装是否成功。\n\n## 基本使用\n\n以下是一个典型的工作流，展示如何追踪数据、构建流水线、运行实验并共享结果。\n\n### 1. 初始化与数据追踪\n\n在项目根目录初始化 DVC，并将大数据文件（如图片数据集）纳入版本控制。DVC 会将大文件存储在本地缓存中，并在 Git 中只记录一个轻量级的元数据文件 (`.dvc`)。\n\n```bash\n# 初始化 DVC (会在当前目录创建 .dvc 文件夹)\ndvc init\n\n# 将代码文件加入 Git\ngit add train.py params.yaml\n\n# 将数据目录加入 DVC 追踪 (例如 images\u002F 文件夹)\ndvc add images\u002F\n\n# 将生成的 .dvc 文件和 .gitignore 提交到 Git\ngit add images\u002F.dvc images\u002F.gitignore\ngit commit -m \"Add dataset\"\n```\n\n### 2. 构建数据处理流水线 (Pipeline)\n\n定义数据处理的步骤，连接代码、输入数据和输出结果。当输入发生变化时，DVC 会自动判断需要重新运行哪些步骤。\n\n```bash\n# 步骤 1: 特征工程 (输入: images\u002F, 输出: features\u002F)\ndvc stage add -n featurize -d images\u002F -o features\u002F python featurize.py\n\n# 步骤 2: 模型训练 (输入: features\u002F, train.py, 输出: model.p, metrics.json)\ndvc stage add -n train -d features\u002F -d train.py -o model.p -M metrics.json python train.py\n```\n\n### 3. 运行实验与迭代\n\n修改代码或参数后，运行实验并记录结果。DVC 可以在本地跟踪多次实验，无需额外服务器。\n\n```bash\n# 运行基准实验\ndvc exp run -n exp-baseline\n\n# 修改代码 (例如使用 vi 或编辑器修改 train.py)\nvi train.py\n\n# 运行新实验\ndvc exp run -n exp-code-change\n```\n\n### 4. 比较与选择实验\n\n查看不同实验的指标对比，并还原到某个特定的实验状态。\n\n```bash\n# 展示所有实验及其指标对比\ndvc exp show\n\n# 应用某个之前的实验结果到工作区\ndvc exp apply exp-baseline\n```\n\n### 5. 共享代码与数据\n\n将代码推送到 Git 仓库，将大型数据\u002F模型推送到远程存储（如 S3）。\n\n```bash\n# 配置远程存储 (例如 AWS S3)\ndvc remote add myremote -d s3:\u002F\u002Fmybucket\u002Fimage_cnn\n\n# 推送数据到远程存储\ndvc push\n\n# 提交并推送代码到 Git\ngit add .\ngit commit -m 'Update model and pipeline'\ngit push\n```\n\n其他人克隆项目后，只需运行 `dvc pull` 即可自动下载对应版本的数据和模型，完美复现你的实验环境。","某电商推荐算法团队正在迭代用户点击率预测模型，需频繁调整特征工程代码并对比不同数据集上的训练效果。\n\n### 没有 dvc 时\n- 大型图像和日志数据集直接存入 Git 导致仓库体积膨胀，克隆项目耗时极长甚至失败。\n- 手动记录每次实验对应的数据版本、代码提交号和超参数，Excel 表格混乱且极易出错，难以复现“上周效果最好的那个模型”。\n- 修改了特征提取脚本后，必须全量重新运行整个训练流程，浪费大量计算资源和等待时间。\n- 团队成员间共享实验结果时，常因本地数据路径不一致或依赖缺失，导致对方无法成功复现实验。\n\n### 使用 dvc 后\n- 数据与模型文件存储于云对象存储，Git 仅保留轻量级指针文件，仓库保持精简，新成员秒级克隆项目。\n- 通过 `dvc exp run` 自动追踪代码、数据、参数与指标的对应关系，随时用 `dvc exp show` 直观对比并一键回滚到任意历史实验状态。\n- 构建轻量化流水线，当仅修改特征代码时，dvc 智能识别依赖变化，只重跑受影响的步骤而非全流程。\n- 同事只需拉取 Git 代码并执行 `dvc pull`，即可自动从云端同步对应版本的数据与模型，无缝复现任何人的实验结果。\n\ndvc 将散乱的手工实验流程转化为可版本化、可复现的自动化工程体系，让算法团队专注于模型创新而非环境调试。","https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002Ftreeverse_dvc_a18d0228.png","treeverse","lakeFS by Treeverse","https:\u002F\u002Foss.gittoolsai.com\u002Favatars\u002Ftreeverse_861f7f89.png","",null,"hello@lakefs.io","lakeFS","https:\u002F\u002Flakefs.io\u002F","https:\u002F\u002Fgithub.com\u002Ftreeverse",[82,86],{"name":83,"color":84,"percentage":85},"Python","#3572A5",100,{"name":87,"color":88,"percentage":89},"Shell","#89e051",0,15507,1290,"2026-04-06T20:54:20","Apache-2.0",1,"Linux, macOS, Windows","未说明",{"notes":98,"python":99,"dependencies":100},"DVC 本身是命令行工具，核心功能不依赖 GPU。若需连接特定云存储（如 S3, Azure, Google Cloud 等），需安装对应的可选依赖包（例如 pip install 'dvc[s3]'）。可通过 snap, choco, brew, conda, pip 或系统安装包进行安装。","根据 PyPI badge 推断支持多种版本，具体需参考官方文档",[101,102,103,104,105],"boto3 (可选，用于 S3)","azure-storage-blob (可选，用于 Azure)","google-cloud-storage (可选，用于 GS)","oss2 (可选，用于 OSS)","paramiko (可选，用于 SSH)",[15,14,16,107,13],"其他",[109,110,111,112,113,114,115],"data-science","machine-learning","reproducibility","data-version-control","developer-tools","ai","unstructured-data","2026-03-27T02:49:30.150509","2026-04-07T11:35:30.202887",[119,124,129,134,139,143],{"id":120,"question_zh":121,"answer_zh":122,"source_url":123},21945,"如何安全地使用 `dvc gc` 清理缓存而不误删重要数据？","默认情况下，`dvc gc` 会收集当前分支的依赖和输出校验和，并删除其他所有内容，这可能导致历史变更被意外清除。为了更安全地操作：\n1. 建议先使用 `--dry-run` 标志预览将被删除的内容（注意：在某些版本中，干跑模式可能和非干跑一样慢，因为需要列出所有缓存）。\n2. 可以考虑结合交互模式（虽然目前不作为默认行为，以避免影响脚本自动化）。\n3. 未来的改进方向是默认获取 git 仓库中所有修订版的输出列表，仅删除不在该列表中的内容，但这在长历史仓库中可能较慢。","https:\u002F\u002Fgithub.com\u002Ftreeverse\u002Fdvc\u002Fissues\u002F2325",{"id":125,"question_zh":126,"answer_zh":127,"source_url":128},21946,"如何在同一分支的不同提交（commits）之间比较指标或管理实验数据，而不必为每次试验创建新分支？","DVC 现已支持通过实验命令在不同提交间查看数据，无需为每次参数调整创建新分支：\n1. 使用 `dvc exp show --rev HEAD -n 10` 可以查看最近 10 次提交的实验指标。\n2. 使用 `dvc exp diff` 可以比较不同实验之间的代码和指标差异。\n3. 如果需要在提交时自动同步数据，可以在 `.git\u002Fhooks\u002Fpre-commit` 中添加钩子脚本，例如：\n   ```bash\n   #!\u002Fbin\u002Fsh\n   git diff --cached --name-only --diff-filter=d | egrep \".dvc$\" | xargs --no-run-if-empty dvc push\n   ```\n   这会在每次提交时将更新的 .dvc 文件推送到远程，但会增加提交时间。","https:\u002F\u002Fgithub.com\u002Ftreeverse\u002Fdvc\u002Fissues\u002F1691",{"id":130,"question_zh":131,"answer_zh":132,"source_url":133},21947,"运行 `dvc add` 或 `dvc version` 时报错 \"Already unlocked\" 或 \"unexpected error\" 如何解决？","该错误通常与 `.dvc\u002Fcache` 目录缺失或锁文件状态异常有关。解决方法如下：\n1. 检查是否存在 `.dvc\\cache` 目录（Windows）或 `.dvc\u002Fcache`（Linux\u002FMac）。\n2. 如果目录不存在，请手动创建它：`mkdir .dvc\\cache`。\n3. 创建后重新运行命令（如 `dvc version` 或 `dvc add`）。\n4. 如果问题依旧，可能是文件系统锁机制问题，尝试使用基于 flock() 的锁机制（某些系统配置下有效），或联系系统管理员检查文件权限和锁状态。","https:\u002F\u002Fgithub.com\u002Ftreeverse\u002Fdvc\u002Fissues\u002F2831",{"id":135,"question_zh":136,"answer_zh":137,"source_url":138},21948,"DVC 如何处理超参数调优阶段的大量轻量级实验？是否需要为每次微调都创建 Git 提交？","不需要为每次超参数微调创建 Git 提交。DVC 提供了轻量级的实验管理功能：\n1. 使用 `dvc exp run` 运行实验，它会自动利用运行缓存（run-cache）。如果某个阶段的输出已缓存，则直接使用缓存结果，除非添加 `-f` 强制重新运行。\n2. 可以使用 `dvc exp show` 查看所有实验的指标表格，支持导出 CSV 用于自定义可视化。\n3. 使用 `dvc exp diff` 比较不同实验的代码和指标差异。\n4. 选择最佳实验后，可将其“提升”到工作区（应用配置和代码变更，无需重新训练），然后一次性提交到 Git。\n这样可以在不产生大量 Git 提交的情况下管理数十次实验。","https:\u002F\u002Fgithub.com\u002Ftreeverse\u002Fdvc\u002Fissues\u002F2799",{"id":140,"question_zh":141,"answer_zh":142,"source_url":123},21949,"`dvc gc` 命令执行时能否显示详细的清理报告，让用户知道哪些文件被收集、来自哪里？","是的，用户建议在运行 `dvc gc` 时提供详细报告，以便了解实际发生了什么。虽然目前默认不显示详细来源，但可以通过以下方式增强可见性：\n1. 使用 `--dry-run` 标志预览将被删除的文件列表（尽管在某些实现中这可能和实际删除一样慢）。\n2. 未来版本可能会增加更详细的报告功能，显示每个被收集文件的来源分支或提交。\n3. 目前用户需手动对比运行前后的缓存状态来确认变化，但社区已认识到此需求并正在研究更友好的输出格式。",{"id":144,"question_zh":145,"answer_zh":146,"source_url":123},21950,"为什么 `dvc gc --dry-run` 有时和普通运行一样慢？是否有优化方法？","`dvc gc --dry-run` 之所以慢，是因为无论是否真正删除，它都需要遍历并列出所有本地或远程缓存中的文件，以确定哪些文件可以被安全删除。这个列举过程是耗时瓶颈。\n目前暂无根本性优化方案，但用户可以：\n1. 限制扫描范围，例如只针对特定分支或最近 N 个提交（如果命令支持相关参数）。\n2. 接受干跑模式的耗时，将其作为必要的安全检查步骤。\n3. 关注后续版本更新，维护者正在研究更高效的算法来处理长历史仓库的垃圾回收。",[148,153,158,163,168,173,178,183,188,193,198,203,208,213,218,223,228,233,238,243],{"id":149,"version":150,"summary_zh":151,"released_at":152},132018,"3.67.1","\u003C!-- 使用 .github\u002Frelease.yml 中的配置生成的发布说明 -->\n\n## 变更内容\n* 由 c-w-feldmann 在 https:\u002F\u002Fgithub.com\u002Ftreeverse\u002Fdvc\u002Fpull\u002F11016 中修复了 `PyparsingDeprecationWarning: enablePackrat setParseAction parseString` 问题。\n* 新特性（gc）：允许使用 `num` 参数处理所有分支，由 shcheklein 在 https:\u002F\u002Fgithub.com\u002Ftreeverse\u002Fdvc\u002Fpull\u002F11013 中实现。\n* 修复（ls）：支持 tabulate 0.10.0 的 `preserve_whitespace` 选项，由 skshetry 在 https:\u002F\u002Fgithub.com\u002Ftreeverse\u002Fdvc\u002Fpull\u002F11021 中完成。\n\n## 新贡献者\n* @c-w-feldmann 在 https:\u002F\u002Fgithub.com\u002Ftreeverse\u002Fdvc\u002Fpull\u002F11016 中完成了首次贡献。\n\n**完整变更日志**：https:\u002F\u002Fgithub.com\u002Ftreeverse\u002Fdvc\u002Fcompare\u002F3.67.0...3.67.1","2026-03-31T05:06:44",{"id":154,"version":155,"summary_zh":156,"released_at":157},132019,"3.67.0","\u003C!-- 发布说明由 .github\u002Frelease.yml 中的配置生成，分支为 main -->\n\n## 变更内容\n\n* 支持 pathspec v1，由 @cpburnz 在 https:\u002F\u002Fgithub.com\u002Ftreeverse\u002Fdvc\u002Fpull\u002F10951 中实现\n* 修复：在 interpolate.py 中将已弃用的 parseAll 替换为 parse_all，由 @ritoban23 在 https:\u002F\u002Fgithub.com\u002Ftreeverse\u002Fdvc\u002Fpull\u002F10971 中完成\n* 将 dvc-data 版本更新至 3.18.2，由 @skshetry 在 https:\u002F\u002Fgithub.com\u002Ftreeverse\u002Fdvc\u002Fpull\u002F10962 中完成\n\n## 新贡献者\n* @ChillarAnand 在 https:\u002F\u002Fgithub.com\u002Ftreeverse\u002Fdvc\u002Fpull\u002F10963 中完成了首次贡献\n* @ritoban23 在 https:\u002F\u002Fgithub.com\u002Ftreeverse\u002Fdvc\u002Fpull\u002F10971 中完成了首次贡献\n* @cpburnz 在 https:\u002F\u002Fgithub.com\u002Ftreeverse\u002Fdvc\u002Fpull\u002F10951 中完成了首次贡献\n\n**完整变更日志**：https:\u002F\u002Fgithub.com\u002Ftreeverse\u002Fdvc\u002Fcompare\u002F3.66.1...3.67.0","2026-03-14T17:13:20",{"id":159,"version":160,"summary_zh":161,"released_at":162},132020,"3.66.1","\u003C!-- 发布说明由 .github\u002Frelease.yml 中的配置在 main 分支上生成 -->\n\n## 变更内容\n### 其他变更\n* @weiji14 在 https:\u002F\u002Fgithub.com\u002Ftreeverse\u002Fdvc\u002Fpull\u002F10953 中修复了 flatten-dict 依赖中的拼写错误。\n* gc：@GreenHatHG 在 https:\u002F\u002Fgithub.com\u002Ftreeverse\u002Fdvc\u002Fpull\u002F10937 中实现了在试运行垃圾回收时记录路径的功能。\n\n## 新贡献者\n* @weiji14 在 https:\u002F\u002Fgithub.com\u002Ftreeverse\u002Fdvc\u002Fpull\u002F10953 中完成了首次贡献。\n\n**完整变更日志**：https:\u002F\u002Fgithub.com\u002Ftreeverse\u002Fdvc\u002Fcompare\u002F3.66.0...3.66.1","2026-01-08T15:28:51",{"id":164,"version":165,"summary_zh":166,"released_at":167},132021,"3.66.0","\u003C!-- 发布说明由 .github\u002Frelease.yml 中的配置生成，分支为 main -->\n\n## 变更内容\n\n* 限制 `pathspec` 为 `\u003C1`，由 @vorj 在 https:\u002F\u002Fgithub.com\u002Ftreeverse\u002Fdvc\u002Fpull\u002F10948 中提出\n\n### 🚀 新功能与改进\n* 添加 `--collapse-foreach-matrix` 选项，用于将 foreach\u002Fmatrix 阶段合并为单个节点，由 @fhausmann 在 https:\u002F\u002Fgithub.com\u002Ftreeverse\u002Fdvc\u002Fpull\u002F10945 中提出\n\n### 🔨 维护\n* build(deps): 将 flufl-lock 的依赖版本从 `\u003C9,>=8.1.0` 更新为 `>=8.1.0,\u003C10`，由 @dependabot[bot] 在 https:\u002F\u002Fgithub.com\u002Ftreeverse\u002Fdvc\u002Fpull\u002F10947 中完成\n\n## 新贡献者\n* @vorj 在 https:\u002F\u002Fgithub.com\u002Ftreeverse\u002Fdvc\u002Fpull\u002F10948 中完成了首次贡献\n* @fhausmann 在 https:\u002F\u002Fgithub.com\u002Ftreeverse\u002Fdvc\u002Fpull\u002F10945 中完成了首次贡献\n\n**完整变更日志**: https:\u002F\u002Fgithub.com\u002Ftreeverse\u002Fdvc\u002Fcompare\u002F3.65.0...3.66.0","2026-01-06T13:49:31",{"id":169,"version":170,"summary_zh":171,"released_at":172},132022,"3.65.0","\u003C!-- 发布说明由 .github\u002Frelease.yml 中的配置在 main 分支上生成 -->\n\n## 变更内容\n\n### 🚀 新功能与改进\n* 使用批量调用检查哪些条目不在远程仓库中，作者：@falko17，链接：https:\u002F\u002Fgithub.com\u002Ftreeverse\u002Fdvc\u002Fpull\u002F10923\n\n### 🔨 维护性更新\n* 移除 pytest-test-utils，作者：@skshetry，链接：https:\u002F\u002Fgithub.com\u002Ftreeverse\u002Fdvc\u002Fpull\u002F10934\n\n## 新贡献者\n* @falko17 在 https:\u002F\u002Fgithub.com\u002Ftreeverse\u002Fdvc\u002Fpull\u002F10923 中完成了首次贡献\n\n**完整变更日志**：https:\u002F\u002Fgithub.com\u002Ftreeverse\u002Fdvc\u002Fcompare\u002F3.64.2...3.65.0","2025-12-22T07:49:36",{"id":174,"version":175,"summary_zh":176,"released_at":177},132023,"3.64.2","\u003C!-- 发布说明由 .github\u002Frelease.yml 中的配置在 main 分支上生成 -->\n\n## 变更内容\n### 其他变更\n* 功能（WebDAV）：添加 `bearer_token_command`，用于动态获取令牌，由 @GreenHatHG 在 https:\u002F\u002Fgithub.com\u002Ftreeverse\u002Fdvc\u002Fpull\u002F10917 中实现\n\n## 新贡献者\n* @GreenHatHG 在 https:\u002F\u002Fgithub.com\u002Ftreeverse\u002Fdvc\u002Fpull\u002F10917 中完成了首次贡献\n\n**完整变更日志**：https:\u002F\u002Fgithub.com\u002Ftreeverse\u002Fdvc\u002Fcompare\u002F3.64.1...3.64.2","2025-12-06T05:10:17",{"id":179,"version":180,"summary_zh":181,"released_at":182},132024,"3.64.1","\u003C!-- 发布说明由 .github\u002Frelease.yml 中的配置在 main 分支上生成 -->\n\n## 变更内容\n### 功能增强\n* exp: 添加对 --no-hydra 标志的支持，由 @StaszekM 在 https:\u002F\u002Fgithub.com\u002Ftreeverse\u002Fdvc\u002Fpull\u002F10866 中实现\n\n## 新贡献者\n* @StaszekM 在 https:\u002F\u002Fgithub.com\u002Ftreeverse\u002Fdvc\u002Fpull\u002F10866 中完成了首次贡献\n\n**完整变更日志**: https:\u002F\u002Fgithub.com\u002Ftreeverse\u002Fdvc\u002Fcompare\u002F3.64.0...3.64.1","2025-12-02T10:49:50",{"id":184,"version":185,"summary_zh":186,"released_at":187},132025,"3.64.0","\u003C!-- 发布说明由 .github\u002Frelease.yml 中的配置在 main 分支上生成 -->\n\n## 变更内容\n### 🚀 新功能与改进\n* 支持 Python 3.14，由 @skshetry 在 https:\u002F\u002Fgithub.com\u002Fiterative\u002Fdvc\u002Fpull\u002F10896 中实现\n* move：支持从 import\u002Fimport-url 阶段移动输出文件，由 @skshetry 在 https:\u002F\u002Fgithub.com\u002Fiterative\u002Fdvc\u002Fpull\u002F10889 中实现\n* move：支持在保持元数据完整的情况下移动缺失文件，由 @skshetry 在 https:\u002F\u002Fgithub.com\u002Fiterative\u002Fdvc\u002Fpull\u002F10890 中实现\n* 补全：支持补全配置变量，由 @skshetry 在 https:\u002F\u002Fgithub.com\u002Fiterative\u002Fdvc\u002Fpull\u002F10864 中实现\n\n### 🐛 问题修复\n* exp：在移除临时引用时添加重试机制，以避免 FileLocked 错误，由 @skshetry 在 https:\u002F\u002Fgithub.com\u002Fiterative\u002Fdvc\u002Fpull\u002F10840 中实现\n* fix(data-status)：在浅克隆模式下，遍历\u002F展开索引直至跟踪目录，由 @skshetry 在 https:\u002F\u002Fgithub.com\u002Fiterative\u002Fdvc\u002Fpull\u002F10900 中实现\n* move：修复当目标阶段文件已存在时的错误信息，由 @skshetry 在 https:\u002F\u002Fgithub.com\u002Fiterative\u002Fdvc\u002Fpull\u002F10893 中实现\n\n\n**完整变更日志**：https:\u002F\u002Fgithub.com\u002Fiterative\u002Fdvc\u002Fcompare\u002F3.63.0...3.64.0","2025-11-13T08:31:59",{"id":189,"version":190,"summary_zh":191,"released_at":192},132026,"3.63.0","\u003C!-- 发布说明由 .github\u002Frelease.yml 配置在 main 分支上生成 -->\n\n## 变更内容\n### 行为变更（CLI）\n* 在 `dvc status --cloud` 中，`target` 现在支持指定数据集的路径。此前，将目录作为目标会导致 DVC 在该目录内查找 `.dvc` 和 `dvc.yaml` 文件，并根据这些文件中定义的数据集来检查其云\u002F远程状态，而不是将该目录本身视为一个数据集。\n虽然这在技术上属于破坏性变更，但我们认为之前的行为是一个错误，并且与其他 DVC 命令（包括普通的 `dvc status`）不一致。若需恢复旧有行为，请添加 `--recursive` 选项。\n\n  修复了 https:\u002F\u002Fgithub.com\u002Fiterative\u002Fdvc\u002Fissues\u002F9336。\n\n### 🚀 新功能与改进\n* 为 `dvc data status --not-in-remote` 添加了 `--remote` 选项，用于针对指定的远程仓库而非默认远程仓库来检查文件，由 @skshetry 在 https:\u002F\u002Fgithub.com\u002Fiterative\u002Fdvc\u002Fpull\u002F10843 中实现。\n\n\t```console\n\t# 检查 'my-s3' 远程仓库而非默认远程仓库\n\t$ dvc data status --not-in-remote --remote my-s3\n\t```\n\n* `exp show` 现在接受多个 `--keep` 和 `--drop` 参数，详见 https:\u002F\u002Fgithub.com\u002Fiterative\u002Fdvc\u002Fpull\u002F10857。\n\n\t```console\n    $ dvc exp show --keep 'featurize' --keep 'avg_prec' --drop '.*train' --drop '.*split'\n\t```\n\n* `dvc init` 支持在任意目录中初始化 DVC 仓库，详见 https:\u002F\u002Fgithub.com\u002Fiterative\u002Fdvc\u002Fpull\u002F10861。\n\n\t```console\n    $ dvc init \u002Fpath\u002Fto\u002Fdvc\u002Frepo\u002Fthat\u002FI\u002Fwant\u002Fto\u002Finitialize\n\t```\n\n* `checkout` 和 `pull` 现在会报告更细粒度的更改摘要，详见 https:\u002F\u002Fgithub.com\u002Fiterative\u002Fdvc\u002Fpull\u002F10842。\n以前，DVC 只会在 `checkout` 阶段报告受影响的数据集的相关统计信息。\n\n\t```console\n    $ dvc pull dataset\u002Ftrain\u002F4\n\tA       dataset\u002F\n\t1 个文件已添加，5843 个文件已获取\n\t```\n现在，它会报告操作影响的具体文件数量。\n\t```console\n    $ dvc pull dataset\u002Ftrain\u002F4\n\tA       dataset\u002F\n\t5842 个文件已添加，5843 个文件已获取\n\t```\n\n* `data status` 现默认检测文件移动\u002F重命名，详见 https:\u002F\u002Fgithub.com\u002Fiterative\u002Fdvc\u002Fpull\u002F10846。\n\n\t```console\n    $ dvc move foo bar\n    $ dvc data status\n\tDVC 已提交更改：\n\t  （请提交相应的 dvc 文件以更新仓库）\n\t        重命名：foo -> bar\n    ```\n\n* `dvcignore`：在 `check-ignore` 和 DVC 内部 API 之间共享实现代码，同时改进对取消忽略规则的支持（例如 `!data\u002F**` 规则），详见 https:\u002F\u002Fgithub.com\u002Fiterative\u002Fdvc\u002Fpull\u002F10856（修复了 https:\u002F\u002Fgithub.com\u002Fiterative\u002Fdvc\u002Fissues\u002F10722 和 https:\u002F\u002Fgithub.com\u002Fiterative\u002Fdvc\u002Fissues\u002F10122）。\n\n* 支持在 zsh\u002Fbash 中补全远程仓库名称，详见 https:\u002F\u002Fgithub.com\u002Fiterative\u002Fdvc\u002Fpull\u002F10858。\n\n\t```console\n\t$ dvc push --remote \u003CTAB>\n\tlocal my-s3\n\t```\n\n\n### ⚡ 优化\n* 如果目标是特定阶段的地址，则仅加载该阶段的 `.dvc` 文件，详见 https:\u002F\u002Fgithub.com\u002Fiterative\u002Fdvc\u002Fpull\u002F10838（修复了 https:\u002F\u002Fgithub.com\u002Fiterat","2025-09-02T13:34:43",{"id":194,"version":195,"summary_zh":196,"released_at":197},132027,"3.62.0","\u003C!-- 使用 .github\u002Frelease.yml 中的配置在 main 分支生成的发布说明 -->\n\n## 变更内容\n\n### 🚀 新功能与改进\n* exp：添加 `--hide-workspace` 标志到 `exp show` 命令，由 MirjalilovS 在 https:\u002F\u002Fgithub.com\u002Fiterative\u002Fdvc\u002Fpull\u002F10798 中实现。\n* queue：当日志缺失且实验失败时，显示提示信息，建议查看 Celery 日志，由 skshetry 在 https:\u002F\u002Fgithub.com\u002Fiterative\u002Fdvc\u002Fpull\u002F10814 中实现。\n* hashing：在 hashlib 调用中添加 `usedforsecurity=False` 参数，由 BJohnBraddock 在 https:\u002F\u002Fgithub.com\u002Fiterative\u002Fdvc\u002Fpull\u002F10826 中实现。\n\n### 🐛 问题修复\n* fix(data status)：处理缓存中缺少 `.dir` 文件的情况，用于 `not_in_remote` 检查，由 skshetry 在 https:\u002F\u002Fgithub.com\u002Fiterative\u002Fdvc\u002Fpull\u002F10822 中实现。\n* data status：修复远程检查进度条的问题，由 skshetry 在 https:\u002F\u002Fgithub.com\u002Fiterative\u002Fdvc\u002Fpull\u002F10804 中实现。\n* analytics：发送远程仓库类型及 Git 远程仓库路径的哈希值，由 skshetry 在 https:\u002F\u002Fgithub.com\u002Fiterative\u002Fdvc\u002Fpull\u002F10816 中实现。\n* cli：status：在使用 `--quiet` 选项时，返回整数而非布尔值，由 skshetry 在 https:\u002F\u002Fgithub.com\u002Fiterative\u002Fdvc\u002Fpull\u002F10820 中实现。\n* exp run：修复依赖项位于子模块内部时导致的失败问题，由 skshetry 在 https:\u002F\u002Fgithub.com\u002Fiterative\u002Fdvc\u002Fpull\u002F10831 中实现。\n* 尝试在设置日志级别后将其重置，由 skshetry 在 https:\u002F\u002Fgithub.com\u002Fiterative\u002Fdvc\u002Fpull\u002F10800 中实现。\n\n### 🔨 维护与优化\n* 在测试中停止使用 gitpython，由 skshetry 在 https:\u002F\u002Fgithub.com\u002Fiterative\u002Fdvc\u002Fpull\u002F10808 中实现。\n* 尝试修复使用新版 rich 的测试，由 skshetry 在 https:\u002F\u002Fgithub.com\u002Fiterative\u002Fdvc\u002Fpull\u002F10815 中实现。\n* 修复：从 NOUNS 和 ADJECTIVES 列表中移除包含撇号和连字符的单词，由 KoyoMatsuda-hacarus 在 https:\u002F\u002Fgithub.com\u002Fiterative\u002Fdvc\u002Fpull\u002F10833 中实现。\n\n## 新贡献者\n* @MirjalilovS 在 https:\u002F\u002Fgithub.com\u002Fiterative\u002Fdvc\u002Fpull\u002F10798 中完成了首次贡献。\n* @BJohnBraddock 在 https:\u002F\u002Fgithub.com\u002Fiterative\u002Fdvc\u002Fpull\u002F10826 中完成了首次贡献。\n* @KoyoMatsuda-hacarus 在 https:\u002F\u002Fgithub.com\u002Fiterative\u002Fdvc\u002Fpull\u002F10833 中完成了首次贡献。\n\n**完整变更日志**：https:\u002F\u002Fgithub.com\u002Fiterative\u002Fdvc\u002Fcompare\u002F3.61.0...3.62.0","2025-08-12T07:55:49",{"id":199,"version":200,"summary_zh":201,"released_at":202},132028,"3.61.0","\u003C!-- Release notes generated using configuration in .github\u002Frelease.yml at main -->\r\n\r\n## What's Changed\r\n### 🚀 New Features and Enhancements\r\n* data status: support targets to limit scope of command by @skshetry in https:\u002F\u002Fgithub.com\u002Fiterative\u002Fdvc\u002Fpull\u002F10789\r\n* feat: ignore files not in remote when push is false by @Northo in https:\u002F\u002Fgithub.com\u002Fiterative\u002Fdvc\u002Fpull\u002F10749\r\n* [cli,lock] Allow wait_for_lock by @Wheest in https:\u002F\u002Fgithub.com\u002Fiterative\u002Fdvc\u002Fpull\u002F10784\r\n\r\n### 🐛 Bug Fixes\r\n* fix(data status): show committed changes in a new Git repository by @skshetry in https:\u002F\u002Fgithub.com\u002Fiterative\u002Fdvc\u002Fpull\u002F10790\r\n* cache: use configured cache directory for fs cache path by @italosestilon in https:\u002F\u002Fgithub.com\u002Fiterative\u002Fdvc\u002Fpull\u002F10795\r\n\r\n## New Contributors\r\n* @Northo made their first contribution in https:\u002F\u002Fgithub.com\u002Fiterative\u002Fdvc\u002Fpull\u002F10749\r\n* @Wheest made their first contribution in https:\u002F\u002Fgithub.com\u002Fiterative\u002Fdvc\u002Fpull\u002F10784\r\n* @italosestilon made their first contribution in https:\u002F\u002Fgithub.com\u002Fiterative\u002Fdvc\u002Fpull\u002F10795\r\n\r\n**Full Changelog**: https:\u002F\u002Fgithub.com\u002Fiterative\u002Fdvc\u002Fcompare\u002F3.60.1...3.60.2","2025-07-07T11:23:15",{"id":204,"version":205,"summary_zh":206,"released_at":207},132029,"3.60.1","## What's Changed\r\n\r\n### Bugfixes\r\n* `site_cache_dir()` must return `DVC_SITE_CACHE_DIR` if it exists by @rgoya in https:\u002F\u002Fgithub.com\u002Fiterative\u002Fdvc\u002Fpull\u002F10776\r\n* `DVC_SITE_CACHE_DIR` environment variable should override `core.site_cache_dir` by @rgoya in https:\u002F\u002Fgithub.com\u002Fiterative\u002Fdvc\u002Fpull\u002F10778\r\n* bump dvc-s3 to >=3.2.1 to fix #10767 by @skshetry in https:\u002F\u002Fgithub.com\u002Fiterative\u002Fdvc\u002Fpull\u002F10771.\r\n\r\n**Full Changelog**: https:\u002F\u002Fgithub.com\u002Fiterative\u002Fdvc\u002Fcompare\u002F3.60.0...3.60.1","2025-06-12T08:54:00",{"id":209,"version":210,"summary_zh":211,"released_at":212},132030,"3.60.0","\u003C!-- Release notes generated using configuration in .github\u002Frelease.yml at main -->\r\n\r\n## What's Changed\r\n### 🚀 New Features and Enhancements\r\n* fix(dvcfs): rename argument `url` to `repo` by @skshetry in https:\u002F\u002Fgithub.com\u002Fiterative\u002Fdvc\u002Fpull\u002F10754\r\n* fs(gs): allow configuring anonymous login by @skshetry in https:\u002F\u002Fgithub.com\u002Fiterative\u002Fdvc\u002Fpull\u002F10756\r\n\r\n### Bugfixes\r\n* fix: treated S3 configpath as a relpath by @clouds56 in https:\u002F\u002Fgithub.com\u002Fiterative\u002Fdvc\u002Fpull\u002F10758\r\n\r\n### Other Changes\r\n* deps: bump minver version for dvc-gs to 3.0.2 by @skshetry in https:\u002F\u002Fgithub.com\u002Fiterative\u002Fdvc\u002Fpull\u002F10757\r\n* bench: check for dvc_bin.version instead of dvc_rev by @skshetry in https:\u002F\u002Fgithub.com\u002Fiterative\u002Fdvc\u002Fpull\u002F10764\r\n\r\n## New Contributors\r\n* @clouds56 made their first contribution in https:\u002F\u002Fgithub.com\u002Fiterative\u002Fdvc\u002Fpull\u002F10758\r\n\r\n**Full Changelog**: https:\u002F\u002Fgithub.com\u002Fiterative\u002Fdvc\u002Fcompare\u002F3.59.2...3.60.0","2025-06-06T06:54:35",{"id":214,"version":215,"summary_zh":216,"released_at":217},132031,"3.59.2","\u003C!-- Release notes generated using configuration in .github\u002Frelease.yml at main -->\r\n\r\n## What's Changed\r\n### Other Changes\r\n\r\n### 🚀 Enhancements\r\n\r\n* remote: show default when run \"dvc remote list\" by @RMCrean in https:\u002F\u002Fgithub.com\u002Fiterative\u002Fdvc\u002Fpull\u002F10711\r\n\r\n### 🐛 Bug Fixes\r\n\r\n* Forward args to _get_remote_config() and honour core\u002Fno_scm if present by @rgoya in https:\u002F\u002Fgithub.com\u002Fiterative\u002Fdvc\u002Fpull\u002F10719\r\n* repo: try to support opening uninitialized\u002Fbroken repositories by @skshetry in https:\u002F\u002Fgithub.com\u002Fiterative\u002Fdvc\u002Fpull\u002F10736\r\n\r\n### 🔨 Maintenance\r\n\r\n* Bring the banner back by @PythonFZ in https:\u002F\u002Fgithub.com\u002Fiterative\u002Fdvc\u002Fpull\u002F10728\r\n* pyproject: update license to PEP 639 format by @skshetry in https:\u002F\u002Fgithub.com\u002Fiterative\u002Fdvc\u002Fpull\u002F10709\r\n\r\n\r\n\r\n\r\n\r\n\r\n\r\n\r\n## New Contributors\r\n* @RMCrean made their first contribution in https:\u002F\u002Fgithub.com\u002Fiterative\u002Fdvc\u002Fpull\u002F10711\r\n* @rgoya made their first contribution in https:\u002F\u002Fgithub.com\u002Fiterative\u002Fdvc\u002Fpull\u002F10719\r\n\r\n**Full Changelog**: https:\u002F\u002Fgithub.com\u002Fiterative\u002Fdvc\u002Fcompare\u002F3.59.1...3.59.2","2025-05-06T10:58:00",{"id":219,"version":220,"summary_zh":221,"released_at":222},132032,"3.59.1","\u003C!-- Release notes generated using configuration in .github\u002Frelease.yml at main -->\r\n\r\n## What's Changed\r\n### Other Changes\r\n* import: fix broken progressbar when importing folder by @petrchmelar in https:\u002F\u002Fgithub.com\u002Fiterative\u002Fdvc\u002Fpull\u002F10678\r\n* ls\u002Fls-url: do not show size for entry with size\u003C=0 for a directory by @skshetry in https:\u002F\u002Fgithub.com\u002Fiterative\u002Fdvc\u002Fpull\u002F10687\r\n\r\n## New Contributors\r\n* @petrchmelar made their first contribution in https:\u002F\u002Fgithub.com\u002Fiterative\u002Fdvc\u002Fpull\u002F10678\r\n\r\n**Full Changelog**: https:\u002F\u002Fgithub.com\u002Fiterative\u002Fdvc\u002Fcompare\u002F3.59.0...3.59.1","2025-02-15T11:14:00",{"id":224,"version":225,"summary_zh":226,"released_at":227},132033,"3.59.0","\u003C!-- Release notes generated using configuration in .github\u002Frelease.yml at main -->\r\n\r\n### New Features\r\n\r\n#### `--tree` and `--level` support for `ls-url`\r\n\r\n`ls-url` has a new `--tree` flag to view files in a tree-like format. The `url` can be a local path or a path to a remote cloud (eg: `s3:\u002F\u002Fbucket\u002Fdata`).\r\n\r\n```console\r\n$ dvc ls-url --tree .\r\ndata\r\n├── .gitignore\r\n├── data.xml.dvc\r\n├── features\r\n│   ├── test.pkl\r\n│   └── train.pkl\r\n└── prepared\r\n    ├── test.tsv\r\n    └── train.tsv\r\n```\r\n\r\nTo control the depth of recursion, `--level=N` option was added. That works with both `--recursive` and `--tree` display options.\r\nAdded by @skshetry in https:\u002F\u002Fgithub.com\u002Fiterative\u002Fdvc\u002Fpull\u002F10664.\r\n\r\n#### 3.13 support\r\n\r\nDVC now officially supports Python 3.13. Added by @skshetry in https:\u002F\u002Fgithub.com\u002Fiterative\u002Fdvc\u002Fpull\u002F10665 and https:\u002F\u002Fgithub.com\u002Fiterative\u002Fdvc\u002Fpull\u002F10667.\r\n\r\n### Other Changes\r\n\r\n* chore(studio): Update Studio URL to new domain by @mjasion and @0x2b3bfa0 in https:\u002F\u002Fgithub.com\u002Fiterative\u002Fdvc\u002Fpull\u002F10538\r\n\r\n**Full Changelog**: https:\u002F\u002Fgithub.com\u002Fiterative\u002Fdvc\u002Fcompare\u002F3.58.0...3.59.0","2025-01-13T07:03:26",{"id":229,"version":230,"summary_zh":231,"released_at":232},132034,"3.58.0","\u003C!-- Release notes generated using configuration in .github\u002Frelease.yml at main -->\r\n\r\n## What's Changed\r\n* Add `--keep` option for dvc experiments remove by @rmic in https:\u002F\u002Fgithub.com\u002Fiterative\u002Fdvc\u002Fpull\u002F10633\r\n* Fix #10638 : makes remove return correct list when used with both `--queue` and `-A`  by @rmic in https:\u002F\u002Fgithub.com\u002Fiterative\u002Fdvc\u002Fpull\u002F10641\r\n\r\n### Other Changes\r\n* set DVC_NO_ANALYTICS on lint by @skshetry in https:\u002F\u002Fgithub.com\u002Fiterative\u002Fdvc\u002Fpull\u002F10640\r\n\r\n## New Contributors\r\n* @rmic made their first contribution in https:\u002F\u002Fgithub.com\u002Fiterative\u002Fdvc\u002Fpull\u002F10633\r\n\r\n**Full Changelog**: https:\u002F\u002Fgithub.com\u002Fiterative\u002Fdvc\u002Fcompare\u002F3.57.0...3.58.0","2024-12-01T16:53:05",{"id":234,"version":235,"summary_zh":236,"released_at":237},132035,"3.57.0","\u003C!-- Release notes generated using configuration in .github\u002Frelease.yml at main -->\r\n\r\n## What's Changed\r\n### 🔨 Maintenance\r\n* build(deps): update platformdirs requirement from \u003C4,>=3.1.1 to >=3.1.1,\u003C5 by @dependabot in https:\u002F\u002Fgithub.com\u002Fiterative\u002Fdvc\u002Fpull\u002F10603\r\n* Rename dvcx to DataChain in DVC \u003C> DataChain integration by @shcheklein in https:\u002F\u002Fgithub.com\u002Fiterative\u002Fdvc\u002Fpull\u002F10611\r\n* Update `pre-commit` to use pinned version of `dvc` and correct stage names by @mkdjr in https:\u002F\u002Fgithub.com\u002Fiterative\u002Fdvc\u002Fpull\u002F10621\r\n* deps: bump configobj minver to 5.0.9 by @skshetry in https:\u002F\u002Fgithub.com\u002Fiterative\u002Fdvc\u002Fpull\u002F10636\r\n\r\n## New Contributors\r\n* @mkdjr made their first contribution in https:\u002F\u002Fgithub.com\u002Fiterative\u002Fdvc\u002Fpull\u002F10621\r\n\r\n**Full Changelog**: https:\u002F\u002Fgithub.com\u002Fiterative\u002Fdvc\u002Fcompare\u002F3.56.0...3.57.0","2024-11-26T05:34:06",{"id":239,"version":240,"summary_zh":241,"released_at":242},132036,"3.56.0","\u003C!-- Release notes generated using configuration in .github\u002Frelease.yml at main -->\r\n\r\n## What's Changed\r\n### 🚀 New Features and Enhancements\r\n* Add option to show MD5 checksums in `dvc ls` by @petebachant in https:\u002F\u002Fgithub.com\u002Fiterative\u002Fdvc\u002Fpull\u002F10573\r\n* ls: implement --tree to show as a tree and --level to limit depth for recursion by @skshetry in https:\u002F\u002Fgithub.com\u002Fiterative\u002Fdvc\u002Fpull\u002F10598\r\n\r\n### ⚡ Optimizations\r\n* add\u002Fcommit: use hardlink to transfer files to the cache when `cache.type` is hardlink and on relink mode by @skshetry in https:\u002F\u002Fgithub.com\u002Fiterative\u002Fdvc\u002Fpull\u002F10557\r\n\r\n### 🐛 Bug Fixes\r\n* fix: directory creation on pulling data by @sssilvar in https:\u002F\u002Fgithub.com\u002Fiterative\u002Fdvc\u002Fpull\u002F10580\r\n* bump scmrepo version by @shcheklein in https:\u002F\u002Fgithub.com\u002Fiterative\u002Fdvc\u002Fpull\u002F10570\r\n* Update warning message gc.py by @5AIPAVAN in https:\u002F\u002Fgithub.com\u002Fiterative\u002Fdvc\u002Fpull\u002F10592\r\n\r\n\r\n## New Contributors\r\n* @sssilvar made their first contribution in https:\u002F\u002Fgithub.com\u002Fiterative\u002Fdvc\u002Fpull\u002F10580\r\n* @5AIPAVAN made their first contribution in https:\u002F\u002Fgithub.com\u002Fiterative\u002Fdvc\u002Fpull\u002F10592\r\n* @petebachant made their first contribution in https:\u002F\u002Fgithub.com\u002Fiterative\u002Fdvc\u002Fpull\u002F10573\r\n\r\n**Full Changelog**: https:\u002F\u002Fgithub.com\u002Fiterative\u002Fdvc\u002Fcompare\u002F3.55.2...3.56.0","2024-10-23T02:15:21",{"id":244,"version":245,"summary_zh":246,"released_at":247},132037,"3.55.2","\u003C!-- Release notes generated using configuration in .github\u002Frelease.yml at main -->\r\n\r\n## What's Changed\r\n### Other Changes\r\n* dvcfs.get: simplify and separate files into respective filesystems while walking by @skshetry in https:\u002F\u002Fgithub.com\u002Fiterative\u002Fdvc\u002Fpull\u002F10544\r\n* pyproject.toml: remove stale comment from dependency by @skshetry in https:\u002F\u002Fgithub.com\u002Fiterative\u002Fdvc\u002Fpull\u002F10546\r\n\r\n\r\n**Full Changelog**: https:\u002F\u002Fgithub.com\u002Fiterative\u002Fdvc\u002Fcompare\u002F3.55.1...3.55.2","2024-09-02T15:01:06"]