[{"data":1,"prerenderedAt":-1},["ShallowReactive",2],{"similar-microsoft--Semi-supervised-learning":3,"tool-microsoft--Semi-supervised-learning":64},[4,17,27,35,43,56],{"id":5,"name":6,"github_repo":7,"description_zh":8,"stars":9,"difficulty_score":10,"last_commit_at":11,"category_tags":12,"status":16},3808,"stable-diffusion-webui","AUTOMATIC1111\u002Fstable-diffusion-webui","stable-diffusion-webui 是一个基于 Gradio 构建的网页版操作界面，旨在让用户能够轻松地在本地运行和使用强大的 Stable Diffusion 图像生成模型。它解决了原始模型依赖命令行、操作门槛高且功能分散的痛点，将复杂的 AI 绘图流程整合进一个直观易用的图形化平台。\n\n无论是希望快速上手的普通创作者、需要精细控制画面细节的设计师，还是想要深入探索模型潜力的开发者与研究人员，都能从中获益。其核心亮点在于极高的功能丰富度：不仅支持文生图、图生图、局部重绘（Inpainting）和外绘（Outpainting）等基础模式，还独创了注意力机制调整、提示词矩阵、负向提示词以及“高清修复”等高级功能。此外，它内置了 GFPGAN 和 CodeFormer 等人脸修复工具，支持多种神经网络放大算法，并允许用户通过插件系统无限扩展能力。即使是显存有限的设备，stable-diffusion-webui 也提供了相应的优化选项，让高质量的 AI 艺术创作变得触手可及。",162132,3,"2026-04-05T11:01:52",[13,14,15],"开发框架","图像","Agent","ready",{"id":18,"name":19,"github_repo":20,"description_zh":21,"stars":22,"difficulty_score":23,"last_commit_at":24,"category_tags":25,"status":16},1381,"everything-claude-code","affaan-m\u002Feverything-claude-code","everything-claude-code 是一套专为 AI 编程助手（如 Claude Code、Codex、Cursor 等）打造的高性能优化系统。它不仅仅是一组配置文件，而是一个经过长期实战打磨的完整框架，旨在解决 AI 代理在实际开发中面临的效率低下、记忆丢失、安全隐患及缺乏持续学习能力等核心痛点。\n\n通过引入技能模块化、直觉增强、记忆持久化机制以及内置的安全扫描功能，everything-claude-code 能显著提升 AI 在复杂任务中的表现，帮助开发者构建更稳定、更智能的生产级 AI 代理。其独特的“研究优先”开发理念和针对 Token 消耗的优化策略，使得模型响应更快、成本更低，同时有效防御潜在的攻击向量。\n\n这套工具特别适合软件开发者、AI 研究人员以及希望深度定制 AI 工作流的技术团队使用。无论您是在构建大型代码库，还是需要 AI 协助进行安全审计与自动化测试，everything-claude-code 都能提供强大的底层支持。作为一个曾荣获 Anthropic 黑客大奖的开源项目，它融合了多语言支持与丰富的实战钩子（hooks），让 AI 真正成长为懂上",138956,2,"2026-04-05T11:33:21",[13,15,26],"语言模型",{"id":28,"name":29,"github_repo":30,"description_zh":31,"stars":32,"difficulty_score":23,"last_commit_at":33,"category_tags":34,"status":16},2271,"ComfyUI","Comfy-Org\u002FComfyUI","ComfyUI 是一款功能强大且高度模块化的视觉 AI 引擎，专为设计和执行复杂的 Stable Diffusion 图像生成流程而打造。它摒弃了传统的代码编写模式，采用直观的节点式流程图界面，让用户通过连接不同的功能模块即可构建个性化的生成管线。\n\n这一设计巧妙解决了高级 AI 绘图工作流配置复杂、灵活性不足的痛点。用户无需具备编程背景，也能自由组合模型、调整参数并实时预览效果，轻松实现从基础文生图到多步骤高清修复等各类复杂任务。ComfyUI 拥有极佳的兼容性，不仅支持 Windows、macOS 和 Linux 全平台，还广泛适配 NVIDIA、AMD、Intel 及苹果 Silicon 等多种硬件架构，并率先支持 SDXL、Flux、SD3 等前沿模型。\n\n无论是希望深入探索算法潜力的研究人员和开发者，还是追求极致创作自由度的设计师与资深 AI 绘画爱好者，ComfyUI 都能提供强大的支持。其独特的模块化架构允许社区不断扩展新功能，使其成为当前最灵活、生态最丰富的开源扩散模型工具之一，帮助用户将创意高效转化为现实。",107662,"2026-04-03T11:11:01",[13,14,15],{"id":36,"name":37,"github_repo":38,"description_zh":39,"stars":40,"difficulty_score":23,"last_commit_at":41,"category_tags":42,"status":16},3704,"NextChat","ChatGPTNextWeb\u002FNextChat","NextChat 是一款轻量且极速的 AI 助手，旨在为用户提供流畅、跨平台的大模型交互体验。它完美解决了用户在多设备间切换时难以保持对话连续性，以及面对众多 AI 模型不知如何统一管理的痛点。无论是日常办公、学习辅助还是创意激发，NextChat 都能让用户随时随地通过网页、iOS、Android、Windows、MacOS 或 Linux 端无缝接入智能服务。\n\n这款工具非常适合普通用户、学生、职场人士以及需要私有化部署的企业团队使用。对于开发者而言，它也提供了便捷的自托管方案，支持一键部署到 Vercel 或 Zeabur 等平台。\n\nNextChat 的核心亮点在于其广泛的模型兼容性，原生支持 Claude、DeepSeek、GPT-4 及 Gemini Pro 等主流大模型，让用户在一个界面即可自由切换不同 AI 能力。此外，它还率先支持 MCP（Model Context Protocol）协议，增强了上下文处理能力。针对企业用户，NextChat 提供专业版解决方案，具备品牌定制、细粒度权限控制、内部知识库整合及安全审计等功能，满足公司对数据隐私和个性化管理的高标准要求。",87618,"2026-04-05T07:20:52",[13,26],{"id":44,"name":45,"github_repo":46,"description_zh":47,"stars":48,"difficulty_score":23,"last_commit_at":49,"category_tags":50,"status":16},2268,"ML-For-Beginners","microsoft\u002FML-For-Beginners","ML-For-Beginners 是由微软推出的一套系统化机器学习入门课程，旨在帮助零基础用户轻松掌握经典机器学习知识。这套课程将学习路径规划为 12 周，包含 26 节精炼课程和 52 道配套测验，内容涵盖从基础概念到实际应用的完整流程，有效解决了初学者面对庞大知识体系时无从下手、缺乏结构化指导的痛点。\n\n无论是希望转型的开发者、需要补充算法背景的研究人员，还是对人工智能充满好奇的普通爱好者，都能从中受益。课程不仅提供了清晰的理论讲解，还强调动手实践，让用户在循序渐进中建立扎实的技能基础。其独特的亮点在于强大的多语言支持，通过自动化机制提供了包括简体中文在内的 50 多种语言版本，极大地降低了全球不同背景用户的学习门槛。此外，项目采用开源协作模式，社区活跃且内容持续更新，确保学习者能获取前沿且准确的技术资讯。如果你正寻找一条清晰、友好且专业的机器学习入门之路，ML-For-Beginners 将是理想的起点。",84991,"2026-04-05T10:45:23",[14,51,52,53,15,54,26,13,55],"数据工具","视频","插件","其他","音频",{"id":57,"name":58,"github_repo":59,"description_zh":60,"stars":61,"difficulty_score":10,"last_commit_at":62,"category_tags":63,"status":16},3128,"ragflow","infiniflow\u002Fragflow","RAGFlow 是一款领先的开源检索增强生成（RAG）引擎，旨在为大语言模型构建更精准、可靠的上下文层。它巧妙地将前沿的 RAG 技术与智能体（Agent）能力相结合，不仅支持从各类文档中高效提取知识，还能让模型基于这些知识进行逻辑推理和任务执行。\n\n在大模型应用中，幻觉问题和知识滞后是常见痛点。RAGFlow 通过深度解析复杂文档结构（如表格、图表及混合排版），显著提升了信息检索的准确度，从而有效减少模型“胡编乱造”的现象，确保回答既有据可依又具备时效性。其内置的智能体机制更进一步，使系统不仅能回答问题，还能自主规划步骤解决复杂问题。\n\n这款工具特别适合开发者、企业技术团队以及 AI 研究人员使用。无论是希望快速搭建私有知识库问答系统，还是致力于探索大模型在垂直领域落地的创新者，都能从中受益。RAGFlow 提供了可视化的工作流编排界面和灵活的 API 接口，既降低了非算法背景用户的上手门槛，也满足了专业开发者对系统深度定制的需求。作为基于 Apache 2.0 协议开源的项目，它正成为连接通用大模型与行业专有知识之间的重要桥梁。",77062,"2026-04-04T04:44:48",[15,14,13,26,54],{"id":65,"github_repo":66,"name":67,"description_en":68,"description_zh":69,"ai_summary_zh":70,"readme_en":71,"readme_zh":72,"quickstart_zh":73,"use_case_zh":74,"hero_image_url":75,"owner_login":76,"owner_name":77,"owner_avatar_url":78,"owner_bio":79,"owner_company":80,"owner_location":80,"owner_email":81,"owner_twitter":82,"owner_website":83,"owner_url":84,"languages":85,"stars":98,"forks":99,"last_commit_at":100,"license":101,"difficulty_score":10,"env_os":102,"env_gpu":103,"env_ram":104,"env_deps":105,"category_tags":114,"github_topics":115,"view_count":23,"oss_zip_url":80,"oss_zip_packed_at":80,"status":16,"created_at":127,"updated_at":128,"faqs":129,"releases":164},2647,"microsoft\u002FSemi-supervised-learning","Semi-supervised-learning","A Unified Semi-Supervised Learning Codebase (NeurIPS'22)","Semi-supervised-learning（又名 USB）是一个由微软推出的统一半监督学习代码库，旨在为计算机视觉、自然语言处理和音频分类领域提供标准化的基准测试平台。在半监督学习中，模型需要利用少量标注数据和大量未标注数据进行训练，但以往的研究往往因实验设置不统一、代码分散而难以公平对比不同算法的性能。USB 通过整合多种主流算法与数据集，解决了这一痛点，让研究人员能够在完全一致的环境下复现结果、评估新方法。\n\n该项目特别适合人工智能领域的研究人员和开发者使用。无论是希望快速验证新算法效果的学者，还是想要在实际应用中利用未标注数据提升模型性能的工程师，都能从中受益。其核心亮点在于“统一性”：它不仅封装了包括 FixMatch、DeFixMatch、EPASS 等在内的多种前沿算法，还提供了模块化的架构设计，支持用户轻松扩展新任务或自定义数据增强策略。此外，项目已正式融入 PyTorch 生态系统，并配套了详细的文档、Colab 演示及多语言博客教程，极大降低了上手门槛。如果你正在探索如何更高效地挖掘未标注数据的价值，Semi-supervised-learning 将是一个值得","Semi-supervised-learning（又名 USB）是一个由微软推出的统一半监督学习代码库，旨在为计算机视觉、自然语言处理和音频分类领域提供标准化的基准测试平台。在半监督学习中，模型需要利用少量标注数据和大量未标注数据进行训练，但以往的研究往往因实验设置不统一、代码分散而难以公平对比不同算法的性能。USB 通过整合多种主流算法与数据集，解决了这一痛点，让研究人员能够在完全一致的环境下复现结果、评估新方法。\n\n该项目特别适合人工智能领域的研究人员和开发者使用。无论是希望快速验证新算法效果的学者，还是想要在实际应用中利用未标注数据提升模型性能的工程师，都能从中受益。其核心亮点在于“统一性”：它不仅封装了包括 FixMatch、DeFixMatch、EPASS 等在内的多种前沿算法，还提供了模块化的架构设计，支持用户轻松扩展新任务或自定义数据增强策略。此外，项目已正式融入 PyTorch 生态系统，并配套了详细的文档、Colab 演示及多语言博客教程，极大降低了上手门槛。如果你正在探索如何更高效地挖掘未标注数据的价值，Semi-supervised-learning 将是一个值得信赖的起点。","\u003Cdiv id=\"top\">\u003C\u002Fdiv>\n\u003C!--\n*** Thanks for checking out the Best-README-Template. If you have a suggestion\n*** that would make this better, please fork the repo and create a pull request\n*** or simply open an issue with the tag \"enhancement\".\n*** Don't forget to give the project a star!\n*** Thanks again! Now go create something AMAZING! :D\n-->\n\n\u003C!-- PROJECT SHIELDS -->\n\n\u003C!--\n*** I'm using markdown \"reference style\" links for readability.\n*** Reference links are enclosed in brackets [ ] instead of parentheses ( ).\n*** See the bottom of this document for the declaration of the reference variables\n*** for contributors-url, forks-url, etc. This is an optional, concise syntax you may use.\n*** https:\u002F\u002Fwww.markdownguide.org\u002Fbasic-syntax\u002F#reference-style-links\n-->\n\n[![Contributors][contributors-shield]][contributors-url]\n[![Forks][forks-shield]][forks-url]\n[![Stargazers][stars-shield]][stars-url]\n[![Issues][issues-shield]][issues-url]\n\u003C!-- \n***[![MIT License][license-shield]][license-url]\n-->\n\n\u003C!-- PROJECT LOGO -->\n\n\u003Cbr \u002F>\n\u003Cdiv align=\"center\">\n  \u003Ca href=\"https:\u002F\u002Fgithub.com\u002Fmicrosoft\u002FSemi-supervised-learning\">\n    \u003Cimg src=\"https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002Fmicrosoft_Semi-supervised-learning_readme_270fb80ef164.png\" alt=\"Logo\" width=\"400\">\n  \u003C\u002Fa>\n\n\u003C!-- \u003Ch3 align=\"center\">USB\u003C\u002Fh3> -->\n\n\u003Cp align=\"center\">\n    \u003Cstrong>USB\u003C\u002Fstrong>: A Unified Semi-supervised learning Benchmark for CV, NLP, and Audio Classification\n    \u003C!-- \u003Cbr \u002F>\n    \u003Ca href=\"https:\u002F\u002Fgithub.com\u002Fmicrosoft\u002FSemi-supervised-learning\">\u003Cstrong>Explore the docs »\u003C\u002Fstrong>\u003C\u002Fa>\n    \u003Cbr \u002F> -->\n    \u003Cbr \u002F>\n    \u003Ca href=\"https:\u002F\u002Farxiv.org\u002Fabs\u002F2208.07204\">Paper\u003C\u002Fa>\n    ·\n    \u003Ca href=\"https:\u002F\u002Fgithub.com\u002Fmicrosoft\u002FSemi-supervised-learning\u002Ftree\u002Fmain\u002Fresults\">Benchmark\u003C\u002Fa>\n    ·\n    \u003Ca href=\"https:\u002F\u002Fcolab.research.google.com\u002Fdrive\u002F1lFygK31jWyTH88ktao6Ow-5nny5-B7v5\">Demo\u003C\u002Fa>\n    ·\n    \u003Ca href=\"https:\u002F\u002Fusb.readthedocs.io\u002Fen\u002Fmain\u002F\">Docs\u003C\u002Fa>\n    ·\n    \u003Ca href=\"https:\u002F\u002Fgithub.com\u002Fmicrosoft\u002FSemi-supervised-learning\u002Fissues\">Issue\u003C\u002Fa>\n    ·\n    \u003Ca href=\"https:\u002F\u002Fwww.microsoft.com\u002Fen-us\u002Fresearch\u002Flab\u002Fmicrosoft-research-asia\u002Farticles\u002Fpushing-the-limit-of-semi-supervised-learning-with-the-unified-semi-supervised-learning-benchmark\u002F\">Blog\u003C\u002Fa>\n    ·\n    \u003Ca href=\"https:\u002F\u002Fmedium.com\u002Fp\u002F849f42bbc32a\">Blog (Pytorch)\u003C\u002Fa>\n    ·\n    \u003Ca href=\"https:\u002F\u002Fzhuanlan.zhihu.com\u002Fp\u002F566055279\">Blog (Chinese)\u003C\u002Fa>\n    ·\n    \u003Ca href=\"https:\u002F\u002Fnips.cc\u002Fvirtual\u002F2022\u002Fposter\u002F55710\">Video\u003C\u002Fa>\n    ·\n    \u003Ca href=\"https:\u002F\u002Fwww.bilibili.com\u002Fvideo\u002Fav474982872\u002F\">Video (Chinese)\u003C\u002Fa>\n  \u003C\u002Fp>\n\u003C\u002Fdiv>\n\n\u003C!-- TABLE OF CONTENTS -->\n\n\u003Cdetails>\n  \u003Csummary>Table of Contents\u003C\u002Fsummary>\n  \u003Col>\n    \u003Cli>\u003Ca href=\"#news-and-updates\">News and Updates\u003C\u002Fa>\u003C\u002Fli>\n    \u003Cli>\u003Ca href=\"#intro\">Introduction\u003C\u002Fa>\u003C\u002Fli>\n    \u003Cli>\n      \u003Ca href=\"#getting-started\">Getting Started\u003C\u002Fa>\n      \u003Cul>\n        \u003Cli>\u003Ca href=\"#prerequisites\">Prerequisites\u003C\u002Fa>\u003C\u002Fli>\n        \u003Cli>\u003Ca href=\"#installation\">Installation\u003C\u002Fa>\u003C\u002Fli>\n      \u003C\u002Ful>\n    \u003C\u002Fli>\n    \u003Cli>\u003Ca href=\"#usage\">Usage\u003C\u002Fa>\u003C\u002Fli>\n    \u003Cli>\u003Ca href=\"#benchmark-results\">Benchmark Results\u003C\u002Fa>\u003C\u002Fli>\n    \u003Cli>\u003Ca href=\"#model-zoo\">Model Zoo\u003C\u002Fa>\u003C\u002Fli>\n    \u003Cli>\u003Ca href=\"#contributing\">Community\u003C\u002Fa>\u003C\u002Fli>\n    \u003Cli>\u003Ca href=\"#license\">License\u003C\u002Fa>\u003C\u002Fli>\n    \u003Cli>\u003Ca href=\"#acknowledgments\">Acknowledgments\u003C\u002Fa>\u003C\u002Fli>\n  \u003C\u002Fol>\n\u003C\u002Fdetails>\n\n\u003C!-- News and Updates -->\n\n## News and Updates\n\n- [03\u002F16\u002F2024] Add [EPASS](https:\u002F\u002Fopenaccess.thecvf.com\u002Fcontent\u002FWACV2024\u002Fhtml\u002FNguyen_Debiasing_Calibrating_and_Improving_Semi-Supervised_Learning_Performance_via_Simple_Ensemble_WACV_2024_paper), [SequenceMatch](https:\u002F\u002Fopenaccess.thecvf.com\u002Fcontent\u002FWACV2024\u002Fhtml\u002FNguyen_SequenceMatch_Revisiting_the_Design_of_Weak-Strong_Augmentations_for_Semi-Supervised_Learning_WACV_2024_paper), and [ReFixMatch](https:\u002F\u002Fopenaccess.thecvf.com\u002Fcontent\u002FICCV2023W\u002FLIMIT\u002Fhtml\u002FNguyen_Boosting_Semi-Supervised_Learning_by_Bridging_high_and_low-Confidence_Predictions_ICCVW_2023_paper). Fixed some typos. \n\n- [07\u002F07\u002F2023] Add [DeFixmatch](https:\u002F\u002Farxiv.org\u002Fabs\u002F2203.07512). Fixed some bugs. Release semilearn=0.3.1\u002F\n\n- [06\u002F01\u002F2023] USB has officially joined the Pytorch ecosystem! [[Pytorch blog](https:\u002F\u002Fmedium.com\u002Fp\u002F849f42bbc32a)]\n\n- [01\u002F30\u002F2023] Update semilearn==0.3.0. Add [FreeMatch](https:\u002F\u002Farxiv.org\u002Fabs\u002F2205.07246) and [SoftMatch](https:\u002F\u002Farxiv.org\u002Fabs\u002F2301.10921). Add imbalanced algorithms. Update results and add wandb support. Refer [CHANGE_LOG](CHANGE_LOG.md) for details. [[Results]](https:\u002F\u002Fgithub.com\u002Fmicrosoft\u002FSemi-supervised-learning\u002Ftree\u002Fmain\u002Fresults)[[Logs]](https:\u002F\u002Fdrive.google.com\u002Fdrive\u002Ffolders\u002F1bRSqrRyyuDafgOI3VAuqqiuzHG6CexHF?usp=sharing)[[Wandb]](https:\u002F\u002Fwandb.ai\u002Fusb). Older classic logs can be found here: [[TorchSSL Log]](https:\u002F\u002F1drv.ms\u002Fu\u002Fs!AlpW9hcyb0KvmyCfsCjGvhDXG5Nb?e=Xc6amH).\n\n- [10\u002F16\u002F2022] Dataset download link and process instructions released! [[Datasets](https:\u002F\u002Fgithub.com\u002Fmicrosoft\u002FSemi-supervised-learning\u002Ftree\u002Fmain\u002Fpreprocess)]\n\n- [10\u002F13\u002F2022] We have finished the camera ready version with updated [[Results](https:\u002F\u002Fgithub.com\u002Fmicrosoft\u002FSemi-supervised-learning\u002Ftree\u002Fmain\u002Fresults)]. [[Openreview](https:\u002F\u002Fopenreview.net\u002Fforum?id=QeuwINa96C)]\n\n- [10\u002F06\u002F2022] Training logs and results of USB has been updated! Available dataset will be uploaded soon. [[Logs](https:\u002F\u002Fdrive.google.com\u002Fdrive\u002Ffolders\u002F1fg3Fxem_UNWhfN5-4x2lRI3mluGxqD4N?usp=sharing)] [[Results](https:\u002F\u002Fgithub.com\u002Fmicrosoft\u002FSemi-supervised-learning\u002Ftree\u002Fmain\u002Fresults)]\n\n- [09\u002F17\u002F2022] The USB paper has been accepted by NeurIPS 2022 Dataset and Benchmark Track! [[Openreview](https:\u002F\u002Fopenreview.net\u002Fforum?id=QeuwINa96C)]\n\n- [08\u002F21\u002F2022] USB has been released!\n\n\u003C!-- Introduction -->\n\n## Introduction\n\n**USB** is a Pytorch-based Python package for Semi-Supervised Learning (SSL). It is easy-to-use\u002Fextend, *affordable* to small groups, and comprehensive for developing and evaluating SSL algorithms. USB provides the implementation of 14 SSL algorithms based on Consistency Regularization, and 15 tasks for evaluation from CV, NLP, and Audio domain.\n\n![Code Structure](https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002Fmicrosoft_Semi-supervised-learning_readme_fa2e66a07ec5.png)\n\n\n\u003Cp align=\"right\">(\u003Ca href=\"#top\">back to top\u003C\u002Fa>)\u003C\u002Fp>\n\n\u003C!-- GETTING STARTED -->\n\n## Getting Started\n\nThis is an example of how to set up USB locally.\nTo get a local copy up, running follow these simple example steps.\n\n### Prerequisites\n\nUSB is built on pytorch, with torchvision, torchaudio, and transformers.\n\nTo install the required packages, you can create a conda environment:\n\n```sh\nconda create --name usb python=3.8\n```\n\nthen use pip to install required packages:\n\n```sh\npip install -r requirements.txt\n```\n\nFrom now on, you can start use USB by typing \n\n```sh\npython train.py --c config\u002Fusb_cv\u002Ffixmatch\u002Ffixmatch_cifar100_200_0.yaml\n```\n\n### Installation\n\nWe provide a Python package *semilearn* of USB for users who want to start training\u002Ftesting the supported SSL algorithms on their data quickly:\n\n```sh\npip install semilearn\n```\n\n\u003Cp align=\"right\">(\u003Ca href=\"#top\">back to top\u003C\u002Fa>)\u003C\u002Fp>\n\n### Development\n\nYou can also develop your own SSL algorithm and evaluate it by cloning USB:\n\n```sh\ngit clone https:\u002F\u002Fgithub.com\u002Fmicrosoft\u002FSemi-supervised-learning.git\n```\n\n\u003Cp align=\"right\">(\u003Ca href=\"#top\">back to top\u003C\u002Fa>)\u003C\u002Fp>\n\n\n### Prepare Datasets\n\nThe detailed instructions for downloading and processing are shown in [Dataset Download](.\u002Fpreprocess\u002F). Please follow it to download datasets before running or developing algorithms.\n\n\u003Cp align=\"right\">(\u003Ca href=\"#top\">back to top\u003C\u002Fa>)\u003C\u002Fp>\n\n\n\u003C!-- USAGE EXAMPLES -->\n\n## Usage\n\nUSB is easy to use and extend. Going through the bellowing examples will help you familiar with USB for quick use, evaluate an existing SSL algorithm on your own dataset, or developing new SSL algorithms.\n\n### Quick Start with USB package\n\n\u003C!-- TODO: add quick start example and refer lighting notebook -->\n\nPlease see [Installation](#installation) to install USB first. We provide colab tutorials for:\n\n- [Beginning example](https:\u002F\u002Fcolab.research.google.com\u002Fdrive\u002F1lFygK31jWyTH88ktao6Ow-5nny5-B7v5)\n- [Customize datasets](https:\u002F\u002Fcolab.research.google.com\u002Fdrive\u002F1zbswPm1sM8j0fndUQOeqX2HADdYq-wOw)\n\n### Start with Docker\n\n**Step1: Check your environment**\n\nYou need to properly install Docker and nvidia driver first. To use GPU in a docker container\nYou also need to install nvidia-docker2 ([Installation Guide](https:\u002F\u002Fdocs.nvidia.com\u002Fdatacenter\u002Fcloud-native\u002Fcontainer-toolkit\u002Finstall-guide.html#docker)).\nThen, Please check your CUDA version via `nvidia-smi`\n\n**Step2: Clone the project**\n\n```shell\ngit clone https:\u002F\u002Fgithub.com\u002Fmicrosoft\u002FSemi-supervised-learning.git\n```\n\n**Step3: Build the Docker image**\n\nBefore building the image, you may modify the [Dockerfile](Dockerfile) according to your CUDA version.\nThe CUDA version we use is 11.6. You can change the base image tag according to [this site](https:\u002F\u002Fhub.docker.com\u002Fr\u002Fnvidia\u002Fcuda\u002Ftags).\nYou also need to change the `--extra-index-url` according to your CUDA version in order to install the correct version of Pytorch.\nYou can check the url through [Pytorch website](https:\u002F\u002Fpytorch.org).\n\nUse this command to build the image\n\n```shell\ncd Semi-supervised-learning && docker build -t semilearn .\n```\n\nJob done. You can use the image you just built for your own project. Don't forget to use the argument `--gpu` when you want\nto use GPU in a container.\n\n### Training\n\nHere is an example to train FixMatch on CIFAR-100 with 200 labels. Training other supported algorithms (on other datasets with different label settings) can be specified by a config file:\n\n```sh\npython train.py --c config\u002Fusb_cv\u002Ffixmatch\u002Ffixmatch_cifar100_200_0.yaml\n```\n\n### Evaluation\n\nAfter training, you can check the evaluation performance on training logs, or running evaluation script:\n\n```\npython eval.py --dataset cifar100 --num_classes 100 --load_path \u002FPATH\u002FTO\u002FCHECKPOINT\n```\n\n### Develop\n\nCheck the developing documentation for creating your own SSL algorithm!\n\n_For more examples, please refer to the [Documentation](https:\u002F\u002Fexample.com)_\n\n\u003Cp align=\"right\">(\u003Ca href=\"#top\">back to top\u003C\u002Fa>)\u003C\u002Fp>\n\n\u003C!-- BENCHMARK RESULTS -->\n\n## Benchmark Results\n\nPlease refer to [Results](.\u002Fresults) for benchmark results on different tasks.\n\n\u003Cp align=\"right\">(\u003Ca href=\"#top\">back to top\u003C\u002Fa>)\u003C\u002Fp>\n\n\u003C!-- MODEL ZOO -->\n\n## Model Zoo\n\nTODO: add pre-trained models.\n\n\u003Cp align=\"right\">(\u003Ca href=\"#top\">back to top\u003C\u002Fa>)\u003C\u002Fp>\n\n\u003C!-- ROADMAP -->\n\n## TODO\n\n- [ ] Finish Readme\n- [ ] Updating SUPPORT.MD with content about this project's support experience\n- [ ] Multi-language Support\n  - [ ] Chinese\n\nSee the [open issues](https:\u002F\u002Fgithub.com\u002Fmicrosoft\u002FSemi-supervised-learning\u002Fissues) for a full list of proposed features (and known issues).\n\n\u003Cp align=\"right\">(\u003Ca href=\"#top\">back to top\u003C\u002Fa>)\u003C\u002Fp>\n\n\u003C!-- CONTRIBUTING -->\n\n## Contributing\n\nThis project welcomes contributions and suggestions.  Most contributions require you to agree to a\nContributor License Agreement (CLA) declaring that you have the right to, and actually do, grant us\nthe rights to use your contribution. For details, visit https:\u002F\u002Fcla.opensource.microsoft.com.\n\nWhen you submit a pull request, a CLA bot will automatically determine whether you need to provide\na CLA and decorate the PR appropriately (e.g., status check, comment). Simply follow the instructions\nprovided by the bot. You will only need to do this once across all repos using our CLA.\n\nThis project has adopted the [Microsoft Open Source Code of Conduct](https:\u002F\u002Fopensource.microsoft.com\u002Fcodeofconduct\u002F).\nFor more information see the [Code of Conduct FAQ](https:\u002F\u002Fopensource.microsoft.com\u002Fcodeofconduct\u002Ffaq\u002F) or\ncontact [opencode@microsoft.com](mailto:opencode@microsoft.com) with any additional questions or comments.\n\nIf you have a suggestion that would make USB better, please fork the repo and create a pull request. You can also simply open an issue with the tag \"enhancement\".\nDon't forget to give the project a star! Thanks again!\n\n1. Fork the project\n2. Create your branch (`git checkout -b your_name\u002Fyour_branch`)\n3. Commit your changes (`git commit -m 'Add some features'`)\n4. Push to the branch (`git push origin your_name\u002Fyour_branch`)\n5. Open a Pull Request\n\n\u003Cp align=\"right\">(\u003Ca href=\"#top\">back to top\u003C\u002Fa>)\u003C\u002Fp>\n\n\u003C!-- TRADEMARKS -->\n\n## Trademarks\n\nThis project may contain trademarks or logos for projects, products, or services. Authorized use of Microsoft\ntrademarks or logos is subject to and must follow\n[Microsoft&#39;s Trademark &amp; Brand Guidelines](https:\u002F\u002Fwww.microsoft.com\u002Fen-us\u002Flegal\u002Fintellectualproperty\u002Ftrademarks\u002Fusage\u002Fgeneral).\nUse of Microsoft trademarks or logos in modified versions of this project must not cause confusion or imply Microsoft sponsorship.\nAny use of third-party trademarks or logos are subject to those third-party's policies.\n\n\u003C!-- LICENSE -->\n\n## License\n\nDistributed under the MIT License. See `LICENSE.txt` for more information.\n\n\u003Cp align=\"right\">(\u003Ca href=\"#top\">back to top\u003C\u002Fa>)\u003C\u002Fp>\n\n\u003C!-- CONTACT -->\n\n## Community and Contact\n\nThe USB community is maintained by:\n\n- Yidong Wang (yidongwang37@gmail.com), Tokyo Institute of Technology\n- Hao Chen (haoc3@andrew.cmu.edu), Carnegie Mellon University\n- Yue Fan (yfan@mpi-inf.mpg.de), Max Planck Institute for Informatics\n- Wenxin Hou (wenxinhou@microsoft.com), Microsoft STCA\n- Ran Tao (rant@andrew.cmu.edu), Carnegie Mellon University\n- Jindong Wang (jindwang@microsoft.com), Microsoft Research Asia\n\n\u003Cp align=\"right\">(\u003Ca href=\"#top\">back to top\u003C\u002Fa>)\u003C\u002Fp>\n\n\u003C!-- CITE -->\n\n## Citing USB\n\nPlease cite us if you fine this project helpful for your project\u002Fpaper:\n\n```\n@inproceedings{usb2022,\n  doi = {10.48550\u002FARXIV.2208.07204},\n  url = {https:\u002F\u002Farxiv.org\u002Fabs\u002F2208.07204},\n  author = {Wang, Yidong and Chen, Hao and Fan, Yue and Sun, Wang and Tao, Ran and Hou, Wenxin and Wang, Renjie and Yang, Linyi and Zhou, Zhi and Guo, Lan-Zhe and Qi, Heli and Wu, Zhen and Li, Yu-Feng and Nakamura, Satoshi and Ye, Wei and Savvides, Marios and Raj, Bhiksha and Shinozaki, Takahiro and Schiele, Bernt and Wang, Jindong and Xie, Xing and Zhang, Yue},\n  title = {USB: A Unified Semi-supervised Learning Benchmark for Classification},\n  booktitle = {Thirty-sixth Conference on Neural Information Processing Systems Datasets and Benchmarks Track},\n  year = {2022}\n}\n\n@article{wang2023freematch,\n  title={FreeMatch: Self-adaptive Thresholding for Semi-supervised Learning},\n  author={Wang, Yidong and Chen, Hao and Heng, Qiang and Hou, Wenxin and Fan, Yue and and Wu, Zhen and Wang, Jindong and Savvides, Marios and Shinozaki, Takahiro and Raj, Bhiksha and Schiele, Bernt and Xie, Xing},\n  booktitle={International Conference on Learning Representations (ICLR)},\n  year={2023}\n}\n\n@article{chen2023softmatch,\n  title={SoftMatch: Addressing the Quantity-Quality Trade-off in Semi-supervised Learning},\n  author={Chen, Hao and Tao, Ran and Fan, Yue and Wang, Yidong and Wang, Jindong and Schiele, Bernt and Xie, Xing and Raj, Bhiksha and Savvides, Marios},\n  booktitle={International Conference on Learning Representations (ICLR)},\n  year={2023}\n}\n\n@article{zhang2021flexmatch,\n  title={FlexMatch: Boosting Semi-supervised Learning with Curriculum Pseudo Labeling},\n  author={Zhang, Bowen and Wang, Yidong and Hou, Wenxin and Wu, Hao and Wang, Jindong and Okumura, Manabu and Shinozaki, Takahiro},\n  booktitle={Neural Information Processing Systems (NeurIPS)},\n  year={2021}\n}\n```\n\n\u003C!-- ACKNOWLEDGMENTS -->\n\n## Acknowledgments\n\nWe thanks the following projects for reference of creating USB:\n\n- [TorchSSL](https:\u002F\u002Fgithub.com\u002FTorchSSL\u002FTorchSSL)\n- [FixMatch](https:\u002F\u002Fgithub.com\u002Fgoogle-research\u002Ffixmatch)\n- [CoMatch](https:\u002F\u002Fgithub.com\u002Fsalesforce\u002FCoMatch)\n- [SimMatch](https:\u002F\u002Fgithub.com\u002FKyleZheng1997\u002Fsimmatch)\n- [HuggingFace](https:\u002F\u002Fhuggingface.co\u002Fdocs\u002Ftransformers\u002Findex)\n- [Pytorch Lighting](https:\u002F\u002Fgithub.com\u002FLightning-AI\u002Flightning)\n- [README Template](https:\u002F\u002Fgithub.com\u002Fothneildrew\u002FBest-README-Template)\n\n\u003Cp align=\"right\">(\u003Ca href=\"#top\">back to top\u003C\u002Fa>)\u003C\u002Fp>\n\n\u003C!-- MARKDOWN LINKS & IMAGES -->\n\n\u003C!-- https:\u002F\u002Fwww.markdownguide.org\u002Fbasic-syntax\u002F#reference-style-links -->\n\n[contributors-shield]: https:\u002F\u002Fimg.shields.io\u002Fgithub\u002Fcontributors\u002Fmicrosoft\u002FSemi-supervised-learning.svg?style=for-the-badge\n[contributors-url]: https:\u002F\u002Fgithub.com\u002Fmicrosoft\u002FSemi-supervised-learning\u002Fgraphs\u002Fcontributors\n[forks-shield]: https:\u002F\u002Fimg.shields.io\u002Fgithub\u002Fforks\u002Fmicrosoft\u002FSemi-supervised-learning.svg?style=for-the-badge\n[forks-url]: https:\u002F\u002Fgithub.com\u002Fmicrosoft\u002FSemi-supervised-learning\u002Fnetwork\u002Fmembers\n[stars-shield]: https:\u002F\u002Fimg.shields.io\u002Fgithub\u002Fstars\u002Fmicrosoft\u002FSemi-supervised-learning.svg?style=for-the-badge\n[stars-url]: https:\u002F\u002Fgithub.com\u002Fmicrosoft\u002FSemi-supervised-learning\u002Fstargazers\n[issues-shield]: https:\u002F\u002Fimg.shields.io\u002Fgithub\u002Fissues\u002Fmicrosoft\u002FSemi-supervised-learning.svg?style=for-the-badge\n[issues-url]: https:\u002F\u002Fgithub.com\u002Fmicrosoft\u002FSemi-supervised-learning\u002Fissues\n[license-shield]: https:\u002F\u002Fimg.shields.io\u002Fgithub\u002Flicense\u002Fmicrosoft\u002FSemi-supervised-learning.svg?style=for-the-badge\n[license-url]: https:\u002F\u002Fgithub.com\u002Fmicrosoft\u002FSemi-supervised-learning\u002Fblob\u002Fmain\u002FLICENSE.txt\n","\u003Cdiv id=\"top\">\u003C\u002Fdiv>\n\u003C!--\n*** 感谢您查看最佳 README 模板。如果您有任何改进建议，请 fork 该仓库并提交 pull request，\n*** 或者直接开一个带有“enhancement”标签的问题。\n*** 别忘了给该项目点个 star！\n*** 再次感谢！现在就去创造一些了不起的东西吧：D\n-->\n\n\u003C!-- 项目盾牌 -->\n\n\u003C!--\n*** 我使用 Markdown 的“引用风格”链接以提高可读性。\n*** 引用链接用方括号 [ ] 而不是圆括号 ( ) 表示。\n*** 文档底部有贡献者 URL、forks URL 等引用变量的声明，这是一种可选的简洁语法。\n*** https:\u002F\u002Fwww.markdownguide.org\u002Fbasic-syntax\u002F#reference-style-links\n-->\n\n[![贡献者][contributors-shield]][contributors-url]\n[![Forks][forks-shield]][forks-url]\n[![星标][stars-shield]][stars-url]\n[![问题][issues-shield]][issues-url]\n\u003C!-- \n***[![MIT 许可证][license-shield]][license-url]\n-->\n\n\u003C!-- 项目Logo -->\n\n\u003Cbr \u002F>\n\u003Cdiv align=\"center\">\n  \u003Ca href=\"https:\u002F\u002Fgithub.com\u002Fmicrosoft\u002FSemi-supervised-learning\">\n    \u003Cimg src=\"https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002Fmicrosoft_Semi-supervised-learning_readme_270fb80ef164.png\" alt=\"Logo\" width=\"400\">\n  \u003C\u002Fa>\n\n\u003C!-- \u003Ch3 align=\"center\">USB\u003C\u002Fh3> -->\n\n\u003Cp align=\"center\">\n    \u003Cstrong>USB\u003C\u002Fstrong>: 一种用于计算机视觉、自然语言处理和音频分类的统一半监督学习基准\n    \u003C!-- \u003Cbr \u002F>\n    \u003Ca href=\"https:\u002F\u002Fgithub.com\u002Fmicrosoft\u002FSemi-supervised-learning\">\u003Cstrong>探索文档 »\u003C\u002Fstrong>\u003C\u002Fa>\n    \u003Cbr \u002F> -->\n    \u003Cbr \u002F>\n    \u003Ca href=\"https:\u002F\u002Farxiv.org\u002Fabs\u002F2208.07204\">论文\u003C\u002Fa>\n    ·\n    \u003Ca href=\"https:\u002F\u002Fgithub.com\u002Fmicrosoft\u002FSemi-supervised-learning\u002Ftree\u002Fmain\u002Fresults\">基准测试结果\u003C\u002Fa>\n    ·\n    \u003Ca href=\"https:\u002F\u002Fcolab.research.google.com\u002Fdrive\u002F1lFygK31jWyTH88ktao6Ow-5nny5-B7v5\">演示\u003C\u002Fa>\n    ·\n    \u003Ca href=\"https:\u002F\u002Fusb.readthedocs.io\u002Fen\u002Fmain\u002F\">文档\u003C\u002Fa>\n    ·\n    \u003Ca href=\"https:\u002F\u002Fgithub.com\u002Fmicrosoft\u002FSemi-supervised-learning\u002Fissues\">问题\u003C\u002Fa>\n    ·\n    \u003Ca href=\"https:\u002F\u002Fwww.microsoft.com\u002Fen-us\u002Fresearch\u002Flab\u002Fmicrosoft-research-asia\u002Farticles\u002Fpushing-the-limit-of-semi-supervised-learning-with-the-unified-semi-supervised-learning-benchmark\u002F\">博客\u003C\u002Fa>\n    ·\n    \u003Ca href=\"https:\u002F\u002Fmedium.com\u002Fp\u002F849f42bbc32a\">博客（PyTorch）\u003C\u002Fa>\n    ·\n    \u003Ca href=\"https:\u002F\u002Fzhuanlan.zhihu.com\u002Fp\u002F566055279\">博客（中文）\u003C\u002Fa>\n    ·\n    \u003Ca href=\"https:\u002F\u002Fnips.cc\u002Fvirtual\u002F2022\u002Fposter\u002F55710\">视频\u003C\u002Fa>\n    ·\n    \u003Ca href=\"https:\u002F\u002Fwww.bilibili.com\u002Fvideo\u002Fav474982872\u002F\">视频（中文）\u003C\u002Fa>\n  \u003C\u002Fp>\n\u003C\u002Fdiv>\n\n\u003C!-- 目录 -->\n\n\u003Cdetails>\n  \u003Csummary>目录\u003C\u002Fsummary>\n  \u003Col>\n    \u003Cli>\u003Ca href=\"#news-and-updates\">新闻与更新\u003C\u002Fa>\u003C\u002Fli>\n    \u003Cli>\u003Ca href=\"#intro\">简介\u003C\u002Fa>\u003C\u002Fli>\n    \u003Cli>\n      \u003Ca href=\"#getting-started\">开始使用\u003C\u002Fa>\n      \u003Cul>\n        \u003Cli>\u003Ca href=\"#prerequisites\">先决条件\u003C\u002Fa>\u003C\u002Fli>\n        \u003Cli>\u003Ca href=\"#installation\">安装\u003C\u002Fa>\u003C\u002Fli>\n      \u003C\u002Ful>\n    \u003C\u002Fli>\n    \u003Cli>\u003Ca href=\"#usage\">使用\u003C\u002Fa>\u003C\u002Fli>\n    \u003Cli>\u003Ca href=\"#benchmark-results\">基准测试结果\u003C\u002Fa>\u003C\u002Fli>\n    \u003Cli>\u003Ca href=\"#model-zoo\">模型库\u003C\u002Fa>\u003C\u002Fli>\n    \u003Cli>\u003Ca href=\"#contributing\">社区\u003C\u002Fa>\u003C\u002Fli>\n    \u003Cli>\u003Ca href=\"#license\">许可证\u003C\u002Fa>\u003C\u002Fli>\n    \u003Cli>\u003Ca href=\"#acknowledgments\">致谢\u003C\u002Fa>\u003C\u002Fli>\n  \u003C\u002Fol>\n\u003C\u002Fdetails>\n\n\u003C!-- 新闻与更新 -->\n\n## 新闻与更新\n\n- [2024年3月16日] 添加 [EPASS](https:\u002F\u002Fopenaccess.thecvf.com\u002Fcontent\u002FWACV2024\u002Fhtml\u002FNguyen_Debiasing_Calibrating_and_Improving_Semi-Supervised_Learning_Performance_via_Simple_Ensemble_WACV_2024_paper)、[SequenceMatch](https:\u002F\u002Fopenaccess.thecvf.com\u002Fcontent\u002FWACV2024\u002Fhtml\u002FNguyen_SequenceMatch_Revisiting_the_Design_of_Weak-Strong_Augmentations_for_Semi-Supervised_Learning_WACV_2024_paper) 和 [ReFixMatch](https:\u002F\u002Fopenaccess.thecvf.com\u002Fcontent\u002FICCV2023W\u002FLIMIT\u002Fhtml\u002FNguyen_Boosting_Semi-Supervised_Learning_by_Bridging_high_and_low-Confidence_Predictions_ICCVW_2023_paper)。修复了一些拼写错误。\n\n- [2023年7月7日] 添加 [DeFixmatch](https:\u002F\u002Farxiv.org\u002Fabs\u002F2203.07512)。修复了一些 bug。发布 semilearn=0.3.1\u002F\n\n- [2023年6月1日] USB 已正式加入 PyTorch 生态系统！[[Pytorch 博客](https:\u002F\u002Fmedium.com\u002Fp\u002F849f42bbc32a)]\n\n- [2023年1月30日] 更新 semilearn==0.3.0。添加 [FreeMatch](https:\u002F\u002Farxiv.org\u002Fabs\u002F2205.07246) 和 [SoftMatch](https:\u002F\u002Farxiv.org\u002Fabs\u002F2301.10921)。增加不平衡数据算法。更新结果并支持 wandb。详情请参阅 [CHANGE_LOG](CHANGE_LOG.md)。[[结果]](https:\u002F\u002Fgithub.com\u002Fmicrosoft\u002FSemi-supervised-learning\u002Ftree\u002Fmain\u002Fresults)[[日志]](https:\u002F\u002Fdrive.google.com\u002Fdrive\u002Ffolders\u002F1bRSqrRyyuDafgOI3VAuqqiuzHG6CexHF?usp=sharing)[[Wandb]](https:\u002F\u002Fwandb.ai\u002Fusb)。旧的经典日志可以在这里找到：[[TorchSSL 日志]](https:\u002F\u002F1drv.ms\u002Fu\u002Fs!AlpW9hcyb0KvmyCfsCjGvhDXG5Nb?e=Xc6amH)。\n\n- [2022年10月16日] 数据集下载链接和处理说明发布！[[数据集](https:\u002F\u002Fgithub.com\u002Fmicrosoft\u002FSemi-supervised-learning\u002Ftree\u002Fmain\u002Fpreprocess)]\n\n- [2022年10月13日] 我们已完成最终版本，并更新了 [[结果]](https:\u002F\u002Fgithub.com\u002Fmicrosoft\u002FSemi-supervised-learning\u002Ftree\u002Fmain\u002Fresults)。[[Openreview](https:\u002F\u002Fopenreview.net\u002Fforum?id=QeuwINa96C)]\n\n- [2022年10月6日] USB 的训练日志和结果已更新！可用的数据集将很快上传。[[日志]](https:\u002F\u002Fdrive.google.com\u002Fdrive\u002Ffolders\u002F1fg3Fxem_UNWhfN5-4x2lRI3mluGxqD4N?usp=sharing) [[结果]](https:\u002F\u002Fgithub.com\u002Fmicrosoft\u002FSemi-supervised-learning\u002Ftree\u002Fmain\u002Fresults)\n\n- [2022年9月17日] USB 论文已被 NeurIPS 2022 数据集与基准赛道接受！[[Openreview](https:\u002F\u002Fopenreview.net\u002Fforum?id=QeuwINa96C)]\n\n- [2022年8月21日] USB 正式发布！\n\n\u003C!-- 简介 -->\n\n## 简介\n\n**USB** 是一个基于 PyTorch 的 Python 包，用于半监督学习 (SSL)。它易于使用和扩展，对小型团队来说*经济实惠*，并且功能全面，适合开发和评估 SSL 算法。USB 提供了基于一致性正则化的 14 种 SSL 算法的实现，以及来自计算机视觉、自然语言处理和音频领域的 15 项评估任务。\n\n![代码结构](https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002Fmicrosoft_Semi-supervised-learning_readme_fa2e66a07ec5.png)\n\n\n\u003Cp align=\"right\">(\u003Ca href=\"#top\">返回顶部\u003C\u002Fa>)\u003C\u002Fp>\n\n\u003C!-- 开始使用 -->\n\n## 开始使用\n\n这是一个在本地设置 USB 的示例。\n要搭建一个本地副本，请按照以下简单步骤操作。\n\n### 先决条件\n\nUSB 基于 PyTorch 构建，依赖 torchvision、torchaudio 和 transformers。\n\n要安装所需的包，您可以创建一个 conda 环境：\n\n```sh\nconda create --name usb python=3.8\n```\n\n然后使用 pip 安装所需包：\n\n```sh\npip install -r requirements.txt\n```\n\n从现在开始，您可以通过输入以下命令来开始使用 USB：\n\n```sh\npython train.py --c config\u002Fusb_cv\u002Ffixmatch\u002Ffixmatch_cifar100_200_0.yaml\n```\n\n### 安装\n\n我们提供了一个名为 *semilearn* 的 USB Python 包，方便用户快速在其数据上训练和测试支持的 SSL 算法：\n\n```sh\npip install semilearn\n```\n\n\u003Cp align=\"right\">(\u003Ca href=\"#top\">返回顶部\u003C\u002Fa>)\u003C\u002Fp>\n\n### 开发\n\n你也可以开发自己的SSL算法，并通过克隆USB来评估它：\n\n```sh\ngit clone https:\u002F\u002Fgithub.com\u002Fmicrosoft\u002FSemi-supervised-learning.git\n```\n\n\u003Cp align=\"right\">(\u003Ca href=\"#top\">返回顶部\u003C\u002Fa>)\u003C\u002Fp>\n\n\n### 准备数据集\n\n详细的下载和处理说明请参见[数据集下载](.\u002Fpreprocess\u002F)。在运行或开发算法之前，请按照该说明下载数据集。\n\n\u003Cp align=\"right\">(\u003Ca href=\"#top\">返回顶部\u003C\u002Fa>)\u003C\u002Fp>\n\n\n\u003C!-- 使用示例 -->\n\n## 使用方法\n\nUSB易于使用且易于扩展。通过以下示例，你可以快速熟悉USB的使用方法，也可以在自己的数据集上评估现有的SSL算法，或者开发新的SSL算法。\n\n### 使用USB包快速入门\n\n\u003C!-- TODO: 添加快速入门示例并引用Lightning笔记本 -->\n\n请先参阅[安装](#installation)部分以安装USB。我们提供了以下Colab教程：\n\n- [入门示例](https:\u002F\u002Fcolab.research.google.com\u002Fdrive\u002F1lFygK31jWyTH88ktao6Ow-5nny5-B7v5)\n- [自定义数据集](https:\u002F\u002Fcolab.research.google.com\u002Fdrive\u002F1zbswPm1sM8j0fndUQOeqX2HADdYq-wOw)\n\n### 使用Docker开始\n\n**步骤1：检查你的环境**\n\n你需要先正确安装Docker和NVIDIA驱动程序。要在Docker容器中使用GPU，\n还需要安装nvidia-docker2（[安装指南](https:\u002F\u002Fdocs.nvidia.com\u002Fdatacenter\u002Fcloud-native\u002Fcontainer-toolkit\u002Finstall-guide.html#docker)）。\n然后，请通过`nvidia-smi`检查你的CUDA版本。\n\n**步骤2：克隆项目**\n\n```shell\ngit clone https:\u002F\u002Fgithub.com\u002Fmicrosoft\u002FSemi-supervised-learning.git\n```\n\n**步骤3：构建Docker镜像**\n\n在构建镜像之前，你可以根据自己的CUDA版本修改[Dockerfile](Dockerfile)。\n我们使用的CUDA版本是11.6。你可以根据[NVIDIA CUDA镜像标签页](https:\u002F\u002Fhub.docker.com\u002Fr\u002Fnvidia\u002Fcuda\u002Ftags)更改基础镜像标签。\n此外，你还需要根据自己的CUDA版本更改`--extra-index-url`，以便安装正确版本的PyTorch。\n可以通过[PyTorch官网](https:\u002F\u002Fpytorch.org)查看对应的URL。\n\n使用以下命令构建镜像：\n\n```shell\ncd Semi-supervised-learning && docker build -t semilearn .\n```\n\n完成！你可以将刚刚构建的镜像用于自己的项目。别忘了在需要使用GPU的容器中添加`--gpu`参数。\n\n### 训练\n\n以下是一个在CIFAR-100数据集上使用200个标签训练FixMatch的示例。训练其他支持的算法（在不同数据集上使用不同标签设置）可以通过配置文件指定：\n\n```sh\npython train.py --c config\u002Fusb_cv\u002Ffixmatch\u002Ffixmatch_cifar100_200_0.yaml\n```\n\n### 评估\n\n训练完成后，你可以通过训练日志查看评估性能，或者运行评估脚本：\n\n```\npython eval.py --dataset cifar100 --num_classes 100 --load_path \u002FPATH\u002FTO\u002FCHECKPOINT\n```\n\n### 开发\n\n请查阅开发文档，以创建你自己的SSL算法！\n\n_更多示例，请参阅[文档](https:\u002F\u002Fexample.com)_\n\n\u003Cp align=\"right\">(\u003Ca href=\"#top\">返回顶部\u003C\u002Fa>)\u003C\u002Fp>\n\n\u003C!-- 基准测试结果 -->\n\n## 基准测试结果\n\n有关不同任务的基准测试结果，请参阅[结果](.\u002Fresults)。\n\n\u003Cp align=\"right\">(\u003Ca href=\"#top\">返回顶部\u003C\u002Fa>)\u003C\u002Fp>\n\n\u003C!-- 模型库 -->\n\n## 模型库\n\nTODO：添加预训练模型。\n\n\u003Cp align=\"right\">(\u003Ca href=\"#top\">返回顶部\u003C\u002Fa>)\u003C\u002Fp>\n\n\u003C!-- 路线图 -->\n\n## 待办事项\n\n- [ ] 完成README\n- [ ] 更新SUPPORT.MD，加入关于该项目支持经验的内容\n- [ ] 多语言支持\n  - [ ] 中文\n\n完整的功能建议列表（以及已知问题）请参阅[GitHub上的开放问题](https:\u002F\u002Fgithub.com\u002Fmicrosoft\u002FSemi-supervised-learning\u002Fissues)。\n\n\u003Cp align=\"right\">(\u003Ca href=\"#top\">返回顶部\u003C\u002Fa>)\u003C\u002Fp>\n\n\u003C!-- 贡献 -->\n\n## 贡献\n\n本项目欢迎贡献和建议。大多数贡献都需要你同意贡献者许可协议（CLA），声明你有权并将实际授予我们使用你贡献的权利。详情请访问https:\u002F\u002Fcla.opensource.microsoft.com。\n\n当你提交拉取请求时，CLA机器人会自动判断你是否需要提供CLA，并相应地标记PR（例如状态检查、评论）。只需按照机器人提供的指示操作即可。对于所有使用我们CLA的仓库，你只需执行一次此操作。\n\n本项目采用了[微软开源行为准则](https:\u002F\u002Fopensource.microsoft.com\u002Fcodeofconduct\u002F)。更多信息请参阅[行为准则常见问题解答](https:\u002F\u002Fopensource.microsoft.com\u002Fcodeofconduct\u002Ffaq\u002F)，或如有任何其他疑问或意见，请联系[opencode@microsoft.com](mailto:opencode@microsoft.com)。\n\n如果你有使USB更好的建议，可以fork该项目并创建一个拉取请求。你也可以直接打开带有“enhancement”标签的问题。别忘了给项目点个赞！再次感谢！\n\n1. Fork项目\n2. 创建你的分支（`git checkout -b your_name\u002Fyour_branch`）\n3. 提交你的更改（`git commit -m '添加一些功能'`）\n4. 推送到分支（`git push origin your_name\u002Fyour_branch`）\n5. 打开拉取请求\n\n\u003Cp align=\"right\">(\u003Ca href=\"#top\">返回顶部\u003C\u002Fa>)\u003C\u002Fp>\n\n\u003C!-- 商标 -->\n\n## 商标\n\n本项目可能包含项目、产品或服务的商标或标志。对微软商标或标志的授权使用须遵守并遵循\n[微软商标与品牌指南](https:\u002F\u002Fwww.microsoft.com\u002Fen-us\u002Flegal\u002Fintellectualproperty\u002Ftrademarks\u002Fusage\u002Fgeneral)。\n在本项目的修改版本中使用微软商标或标志时，不得造成混淆或暗示微软的赞助关系。任何第三方商标或标志的使用均受其各自政策的约束。\n\n\u003C!-- 许可证 -->\n\n## 许可证\n\n根据MIT许可证分发。更多信息请参阅`LICENSE.txt`。\n\n\u003Cp align=\"right\">(\u003Ca href=\"#top\">返回顶部\u003C\u002Fa>)\u003C\u002Fp>\n\n\u003C!-- 社区与联系方式 -->\n\n## 社区与联系方式\n\nUSB社区由以下人员维护：\n\n- 王一东（yidongwang37@gmail.com），东京工业大学\n- 陈浩（haoc3@andrew.cmu.edu），卡内基梅隆大学\n- 范悦（yfan@mpi-inf.mpg.de），马克斯普朗克信息学研究所\n- 侯文欣（wenxinhou@microsoft.com），微软STCA\n- 陶然（rant@andrew.cmu.edu），卡内基梅隆大学\n- 王进东（jindwang@microsoft.com），微软亚洲研究院\n\n\u003Cp align=\"right\">(\u003Ca href=\"#top\">返回顶部\u003C\u002Fa>)\u003C\u002Fp>\n\n\u003C!-- 引用 -->\n\n## 引用 USB\n\n如果您觉得本项目对您的研究或论文有帮助，请引用我们：\n\n```\n@inproceedings{usb2022,\n  doi = {10.48550\u002FARXIV.2208.07204},\n  url = {https:\u002F\u002Farxiv.org\u002Fabs\u002F2208.07204},\n  author = {Wang, Yidong and Chen, Hao and Fan, Yue and Sun, Wang and Tao, Ran and Hou, Wenxin and Wang, Renjie and Yang, Linyi and Zhou, Zhi and Guo, Lan-Zhe and Qi, Heli and Wu, Zhen and Li, Yu-Feng and Nakamura, Satoshi and Ye, Wei and Savvides, Marios and Raj, Bhiksha and Shinozaki, Takahiro and Schiele, Bernt and Wang, Jindong and Xie, Xing and Zhang, Yue},\n  title = {USB: A Unified Semi-supervised Learning Benchmark for Classification},\n  booktitle = {Thirty-sixth Conference on Neural Information Processing Systems Datasets and Benchmarks Track},\n  year = {2022}\n}\n\n@article{wang2023freematch,\n  title={FreeMatch: Self-adaptive Thresholding for Semi-supervised Learning},\n  author={Wang, Yidong and Chen, Hao and Heng, Qiang and Hou, Wenxin and Fan, Yue and and Wu, Zhen and Wang, Jindong and Savvides, Marios and Shinozaki, Takahiro and Raj, Bhiksha and Schiele, Bernt and Xie, Xing},\n  booktitle={International Conference on Learning Representations (ICLR)},\n  year={2023}\n}\n\n@article{chen2023softmatch,\n  title={SoftMatch: Addressing the Quantity-Quality Trade-off in Semi-supervised Learning},\n  author={Chen, Hao and Tao, Ran and Fan, Yue and Wang, Yidong and Wang, Jindong and Schiele, Bernt and Xie, Xing and Raj, Bhiksha and Savvides, Marios},\n  booktitle={International Conference on Learning Representations (ICLR)},\n  year={2023}\n}\n\n@article{zhang2021flexmatch,\n  title={FlexMatch: Boosting Semi-supervised Learning with Curriculum Pseudo Labeling},\n  author={Zhang, Bowen and Wang, Yidong and Hou, Wenxin and Wu, Hao and Wang, Jindong and Okumura, Manabu and Shinozaki, Takahiro},\n  booktitle={Neural Information Processing Systems (NeurIPS)},\n  year={2021}\n}\n```\n\n\u003C!-- 致谢 -->\n\n## 致谢\n\n我们感谢以下项目在创建 USB 时提供的参考：\n\n- [TorchSSL](https:\u002F\u002Fgithub.com\u002FTorchSSL\u002FTorchSSL)\n- [FixMatch](https:\u002F\u002Fgithub.com\u002Fgoogle-research\u002Ffixmatch)\n- [CoMatch](https:\u002F\u002Fgithub.com\u002Fsalesforce\u002FCoMatch)\n- [SimMatch](https:\u002F\u002Fgithub.com\u002FKyleZheng1997\u002Fsimmatch)\n- [HuggingFace](https:\u002F\u002Fhuggingface.co\u002Fdocs\u002Ftransformers\u002Findex)\n- [Pytorch Lighting](https:\u002F\u002Fgithub.com\u002FLightning-AI\u002Flightning)\n- [README 模板](https:\u002F\u002Fgithub.com\u002Fothneildrew\u002FBest-README-Template)\n\n\u003Cp align=\"right\">(\u003Ca href=\"#top\">返回顶部\u003C\u002Fa>)\u003C\u002Fp>\n\n\u003C!-- Markdown 链接与图片 -->\n\n\u003C!-- https:\u002F\u002Fwww.markdownguide.org\u002Fbasic-syntax\u002F#reference-style-links -->\n\n[contributors-shield]: https:\u002F\u002Fimg.shields.io\u002Fgithub\u002Fcontributors\u002Fmicrosoft\u002FSemi-supervised-learning.svg?style=for-the-badge\n[contributors-url]: https:\u002F\u002Fgithub.com\u002Fmicrosoft\u002FSemi-supervised-learning\u002Fgraphs\u002Fcontributors\n[forks-shield]: https:\u002F\u002Fimg.shields.io\u002Fgithub\u002Fforks\u002Fmicrosoft\u002FSemi-supervised-learning.svg?style=for-the-badge\n[forks-url]: https:\u002F\u002Fgithub.com\u002Fmicrosoft\u002FSemi-supervised-learning\u002Fnetwork\u002Fmembers\n[stars-shield]: https:\u002F\u002Fimg.shields.io\u002Fgithub\u002Fstars\u002Fmicrosoft\u002FSemi-supervised-learning.svg?style=for-the-badge\n[stars-url]: https:\u002F\u002Fgithub.com\u002Fmicrosoft\u002FSemi-supervised-learning\u002Fstargazers\n[issues-shield]: https:\u002F\u002Fimg.shields.io\u002Fgithub\u002Fissues\u002Fmicrosoft\u002FSemi-supervised-learning.svg?style=for-the-badge\n[issues-url]: https:\u002F\u002Fgithub.com\u002Fmicrosoft\u002FSemi-supervised-learning\u002Fissues\n[license-shield]: https:\u002F\u002Fimg.shields.io\u002Fgithub\u002Flicense\u002Fmicrosoft\u002FSemi-supervised-learning.svg?style=for-the-badge\n[license-url]: https:\u002F\u002Fgithub.com\u002Fmicrosoft\u002FSemi-supervised-learning\u002Fblob\u002Fmain\u002FLICENSE.txt","# USB 半监督学习快速上手指南\n\n**USB** (Unified Semi-supervised learning Benchmark) 是一个基于 PyTorch 的开源工具包，旨在为计算机视觉 (CV)、自然语言处理 (NLP) 和音频分类领域提供统一、易用且高效的半监督学习 (SSL) 算法开发与评估框架。它内置了 14 种主流 SSL 算法（如 FixMatch, FreeMatch, SoftMatch 等）及 15 个基准任务。\n\n## 环境准备\n\n在开始之前，请确保您的系统满足以下要求：\n\n*   **操作系统**: Linux 或 macOS (Windows 需通过 WSL 或 Docker 运行)\n*   **Python 版本**: 推荐 Python 3.8\n*   **硬件**: 支持 CUDA 的 NVIDIA GPU (可选，但强烈推荐用于训练)\n*   **前置依赖**:\n    *   PyTorch\n    *   torchvision\n    *   torchaudio\n    *   transformers\n\n建议先安装 `conda` 来管理虚拟环境。\n\n## 安装步骤\n\n您可以选择直接安装发布包进行快速使用，或克隆源码进行二次开发。\n\n### 方式一：快速安装 (推荐新手)\n\n如果您只想快速运行现有的 SSL 算法，可以直接通过 pip 安装 `semilearn` 包：\n\n```bash\n# 创建并激活 conda 环境\nconda create --name usb python=3.8 -y\nconda activate usb\n\n# 安装核心依赖包\npip install semilearn\n```\n\n### 方式二：源码安装 (推荐开发者)\n\n如果您需要修改算法代码、添加新数据集或复现最新研究结果，请克隆官方仓库：\n\n```bash\n# 克隆项目\ngit clone https:\u002F\u002Fgithub.com\u002Fmicrosoft\u002FSemi-supervised-learning.git\ncd Semi-supervised-learning\n\n# 创建并激活 conda 环境\nconda create --name usb python=3.8 -y\nconda activate usb\n\n# 安装项目所需依赖\npip install -r requirements.txt\n```\n\n> **提示**：国内用户若下载依赖较慢，可添加清华源加速：\n> `pip install -r requirements.txt -i https:\u002F\u002Fpypi.tuna.tsinghua.edu.cn\u002Fsimple`\n\n### 数据准备\n\n在运行训练前，您需要下载并预处理数据集。详细的下载链接和处理脚本请参考项目内的 `preprocess` 目录：\n[数据集下载与处理指南](.\u002Fpreprocess\u002F)\n\n## 基本使用\n\n安装完成后，您可以通过配置文件轻松启动训练或评估。\n\n### 1. 开始训练\n\n以下示例展示如何使用 **FixMatch** 算法在 **CIFAR-100** 数据集上进行训练（设定标签数量为 200）：\n\n```bash\npython train.py --c config\u002Fusb_cv\u002Ffixmatch\u002Ffixmatch_cifar100_200_0.yaml\n```\n\n*   `--c`: 指定配置文件路径。\n*   您可以修改 `config\u002F` 目录下的 YAML 文件来切换算法、数据集或调整超参数。\n\n### 2. 模型评估\n\n训练完成后，使用以下命令加载检查点并进行评估：\n\n```bash\npython eval.py --dataset cifar100 --num_classes 100 --load_path \u002FPATH\u002FTO\u002FCHECKPOINT\n```\n\n请将 `\u002FPATH\u002FTO\u002FCHECKPOINT` 替换为您实际保存的模型权重文件路径。\n\n### 3. 在线体验 (Colab)\n\n如果您不想在本地配置环境，可以使用 Google Colab 快速体验：\n\n*   [基础示例教程](https:\u002F\u002Fcolab.research.google.com\u002Fdrive\u002F1lFygK31jWyTH88ktao6Ow-5nny5-B7v5)\n*   [自定义数据集教程](https:\u002F\u002Fcolab.research.google.com\u002Fdrive\u002F1zbswPm1sM8j0fndUQOeqX2HADdYq-wOw)\n\n### 4. 使用 Docker (可选)\n\n如果您希望环境完全隔离，可以使用 Docker 部署：\n\n```bash\n# 克隆项目\ngit clone https:\u002F\u002Fgithub.com\u002Fmicrosoft\u002FSemi-supervised-learning.git\ncd Semi-supervised-learning\n\n# 构建镜像 (注意：可能需要根据本地 CUDA 版本修改 Dockerfile)\ndocker build -t semilearn .\n\n# 运行容器 (需添加 --gpus all 参数以启用 GPU)\ndocker run --gpus all -it semilearn bash\n```","某医疗影像初创团队正致力于开发肺炎 X 光片自动筛查系统，但面临医院标注数据稀缺且昂贵的困境。\n\n### 没有 Semi-supervised-learning 时\n- **数据利用率极低**：团队仅能使用少量医生精标数据训练模型，大量未标注的临床影像被闲置浪费。\n- **模型泛化能力差**：由于训练样本不足，模型在面对不同设备拍摄或复杂病灶的图像时，误诊率居高不下。\n- **研发成本高昂**：为了提升准确率，团队不得不投入巨额预算聘请专家进行人工标注，严重拖慢产品迭代速度。\n- **算法验证困难**：缺乏统一基准，难以公平对比 FixMatch、FlexMatch 等不同半监督算法在医疗场景下的真实表现。\n\n### 使用 Semi-supervised-learning 后\n- **海量数据激活**：借助 USB 统一的代码框架，团队轻松将未标注影像纳入训练，通过一致性正则化挖掘数据潜在价值。\n- **准确率显著跃升**：在同等标注量下，模型利用半监督学习策略大幅提升了鲁棒性，对疑难杂症的识别精度接近全监督高水平。\n- **标注成本骤降**：仅需极少量种子数据即可启动训练，减少了对人工标注的依赖，使项目预算降低 70% 以上。\n- **高效算法选型**：直接调用内置的 Benchmark 模块，快速复现并对比多种 SOTA 算法，迅速锁定最适合医疗影像的最优方案。\n\nSemi-supervised-learning 通过统一基准与高效算法库，让企业在低标注成本下实现了医疗 AI 模型性能的突破性增长。","https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002Fmicrosoft_Semi-supervised-learning_c2418c53.png","microsoft","Microsoft","https:\u002F\u002Foss.gittoolsai.com\u002Favatars\u002Fmicrosoft_4900709c.png","Open source projects and samples from Microsoft",null,"opensource@microsoft.com","OpenAtMicrosoft","https:\u002F\u002Fopensource.microsoft.com","https:\u002F\u002Fgithub.com\u002Fmicrosoft",[86,90,94],{"name":87,"color":88,"percentage":89},"Python","#3572A5",86.3,{"name":91,"color":92,"percentage":93},"Jupyter Notebook","#DA5B0B",13.7,{"name":95,"color":96,"percentage":97},"Dockerfile","#384d54",0,1565,213,"2026-03-31T22:23:12","MIT","Linux","需要 NVIDIA GPU (Docker 部分明确提及)，需安装 nvidia-docker2。README 中提到的测试环境基于 CUDA 11.6，建议根据 PyTorch 版本匹配对应的 CUDA 版本。","未说明",{"notes":106,"python":107,"dependencies":108},"该项目名为 USB (Unified Semi-supervised learning Benchmark)，支持 CV、NLP 和音频分类任务。可以通过 pip 直接安装 'semilearn' 包使用，也可以克隆源码进行开发。如果使用 Docker，需根据本地 CUDA 版本修改 Dockerfile 中的基础镜像标签和 PyTorch 安装源。运行前需按照 preprocess 目录下的说明下载并处理数据集。","3.8",[109,110,111,112,113],"torch","torchvision","torchaudio","transformers","semilearn",[55,13,26,14],[116,117,118,119,120,121,122,123,124,125,126],"classification","semi-supervised-learning","transformer","computer-vision","deep-learning","machine-learning","natural-language-processing","pytorch","audio-classification","low-resource","semisupervised-learning","2026-03-27T02:49:30.150509","2026-04-06T05:16:18.042942",[130,135,140,145,149,154,159],{"id":131,"question_zh":132,"answer_zh":133,"source_url":134},12257,"为什么在论文中提到 CV 数据集没有提供验证集，但在复现 TissueMNIST 时却使用了验证集？","这是论文中的一个笔误。实际上 TissueMNIST 数据集是包含验证集的，因此在超参数选择时直接使用了该验证集，而不是从训练数据中划分出一小部分作为验证集。","https:\u002F\u002Fgithub.com\u002Fmicrosoft\u002FSemi-supervised-learning\u002Fissues\u002F82",{"id":136,"question_zh":137,"answer_zh":138,"source_url":139},12258,"运行初学者示例笔记本（Beginner_Example.ipynb）时，为什么经过多个 epoch 后性能没有任何提升？","这是一个已知的代码问题，导致模型无法正确学习。该问题已在 PR #135 中修复。请拉取最新的代码或应用该 PR 的更改来解决此问题。","https:\u002F\u002Fgithub.com\u002Fmicrosoft\u002FSemi-supervised-learning\u002Fissues\u002F74",{"id":141,"question_zh":142,"answer_zh":143,"source_url":144},12259,"如何配置单机多卡（分布式）训练？world_size 和 rank 参数需要修改吗？","对于单机多卡训练，通常不需要手动修改配置文件中的 world_size 和 rank 参数（默认 world_size=1, rank=0 即可），脚本会自动检测可用的 GPU 数量并启动相应数量的进程。如果日志只显示 'Use GPU: 0' 但 nvidia-smi 显示所有 GPU 都在工作，说明分布式训练已正常启动，日志可能仅由主进程输出。num_workers 用于控制数据加载进程数，适当增大可能加快数据读取，但需根据 CPU 核心数调整。","https:\u002F\u002Fgithub.com\u002Fmicrosoft\u002FSemi-supervised-learning\u002Fissues\u002F130",{"id":146,"question_zh":147,"answer_zh":148,"source_url":144},12260,"设置 seed（随机种子）为什么会显著降低训练速度？可以关闭吗？","设置 seed 会启用 CUDNN 的确定性模式（deterministic setting），这会禁止某些非确定性的加速算法，从而导致训练速度变慢。这是为了确保实验结果可复现。如果不需要严格复现结果或不在意微小的随机性差异，可以不设置 seed 或将其设为 None 以关闭确定性模式，从而提升训练速度。",{"id":150,"question_zh":151,"answer_zh":152,"source_url":153},12261,"为什么复现 FreeMatch 在 CIFAR-100 上的结果时，错误率高于论文报告的值？","检查训练日志中的超参数是否完全匹配。有用户发现日志中 `clip_thresh` 被设置为 False，而该参数可能未在某些配置文件中显式定义。确保使用的配置文件与论文或官方推荐的一致，并注意分布式训练与非分布式训练（multiprocessing_distributed: False）可能导致结果差异。如果问题依旧，建议检查是否遗漏了特定的梯度裁剪或其他隐含参数设置。","https:\u002F\u002Fgithub.com\u002Fmicrosoft\u002FSemi-supervised-learning\u002Fissues\u002F179",{"id":155,"question_zh":156,"answer_zh":157,"source_url":158},12262,"在分布式并行训练中，EMA 模型定义时的 batch size 显示是否正确？","在分布式训练模式下，代码逻辑可能会在定义 EMA 模型时将 batch size 减半（例如在 misc.py 第 52 行附近）。这是为了适应多卡环境下的显存分配或梯度同步机制。如果观察到显示的 batch size 与预期不符，请确认是否处于分布式模式，这通常是预期的行为而非错误。","https:\u002F\u002Fgithub.com\u002Fmicrosoft\u002FSemi-supervised-learning\u002Fissues\u002F41",{"id":160,"question_zh":161,"answer_zh":162,"source_url":163},12263,"运行 ReFixMatch 或 FreeMatch 时验证集准确率很低，可能是什么原因？","首先检查训练日志中的关键参数，如 `num_labels`（标签数量）、`batch_size`、`lr`（学习率）以及 `uratio` 是否与配置文件一致。有用户反馈在未修改代码的情况下准确率偏低，建议对比官方提供的完整训练日志，确认优化器设置（如 SGD, momentum, weight_decay）和数据增强策略是否被正确加载。如果是特定数据集（如 CIFAR-10），确保标签划分（split）与基准测试一致。","https:\u002F\u002Fgithub.com\u002Fmicrosoft\u002FSemi-supervised-learning\u002Fissues\u002F235",[165],{"id":166,"version":167,"summary_zh":168,"released_at":169},62642,"v.0.0.0","USB 中使用的预训练模型","2022-07-14T16:22:20"]