[{"data":1,"prerenderedAt":-1},["ShallowReactive",2],{"similar-SupeRuier--awesome-active-learning":3,"tool-SupeRuier--awesome-active-learning":64},[4,17,27,35,43,56],{"id":5,"name":6,"github_repo":7,"description_zh":8,"stars":9,"difficulty_score":10,"last_commit_at":11,"category_tags":12,"status":16},3808,"stable-diffusion-webui","AUTOMATIC1111\u002Fstable-diffusion-webui","stable-diffusion-webui 是一个基于 Gradio 构建的网页版操作界面，旨在让用户能够轻松地在本地运行和使用强大的 Stable Diffusion 图像生成模型。它解决了原始模型依赖命令行、操作门槛高且功能分散的痛点，将复杂的 AI 绘图流程整合进一个直观易用的图形化平台。\n\n无论是希望快速上手的普通创作者、需要精细控制画面细节的设计师，还是想要深入探索模型潜力的开发者与研究人员，都能从中获益。其核心亮点在于极高的功能丰富度：不仅支持文生图、图生图、局部重绘（Inpainting）和外绘（Outpainting）等基础模式，还独创了注意力机制调整、提示词矩阵、负向提示词以及“高清修复”等高级功能。此外，它内置了 GFPGAN 和 CodeFormer 等人脸修复工具，支持多种神经网络放大算法，并允许用户通过插件系统无限扩展能力。即使是显存有限的设备，stable-diffusion-webui 也提供了相应的优化选项，让高质量的 AI 艺术创作变得触手可及。",162132,3,"2026-04-05T11:01:52",[13,14,15],"开发框架","图像","Agent","ready",{"id":18,"name":19,"github_repo":20,"description_zh":21,"stars":22,"difficulty_score":23,"last_commit_at":24,"category_tags":25,"status":16},1381,"everything-claude-code","affaan-m\u002Feverything-claude-code","everything-claude-code 是一套专为 AI 编程助手（如 Claude Code、Codex、Cursor 等）打造的高性能优化系统。它不仅仅是一组配置文件，而是一个经过长期实战打磨的完整框架，旨在解决 AI 代理在实际开发中面临的效率低下、记忆丢失、安全隐患及缺乏持续学习能力等核心痛点。\n\n通过引入技能模块化、直觉增强、记忆持久化机制以及内置的安全扫描功能，everything-claude-code 能显著提升 AI 在复杂任务中的表现，帮助开发者构建更稳定、更智能的生产级 AI 代理。其独特的“研究优先”开发理念和针对 Token 消耗的优化策略，使得模型响应更快、成本更低，同时有效防御潜在的攻击向量。\n\n这套工具特别适合软件开发者、AI 研究人员以及希望深度定制 AI 工作流的技术团队使用。无论您是在构建大型代码库，还是需要 AI 协助进行安全审计与自动化测试，everything-claude-code 都能提供强大的底层支持。作为一个曾荣获 Anthropic 黑客大奖的开源项目，它融合了多语言支持与丰富的实战钩子（hooks），让 AI 真正成长为懂上",138956,2,"2026-04-05T11:33:21",[13,15,26],"语言模型",{"id":28,"name":29,"github_repo":30,"description_zh":31,"stars":32,"difficulty_score":23,"last_commit_at":33,"category_tags":34,"status":16},2271,"ComfyUI","Comfy-Org\u002FComfyUI","ComfyUI 是一款功能强大且高度模块化的视觉 AI 引擎，专为设计和执行复杂的 Stable Diffusion 图像生成流程而打造。它摒弃了传统的代码编写模式，采用直观的节点式流程图界面，让用户通过连接不同的功能模块即可构建个性化的生成管线。\n\n这一设计巧妙解决了高级 AI 绘图工作流配置复杂、灵活性不足的痛点。用户无需具备编程背景，也能自由组合模型、调整参数并实时预览效果，轻松实现从基础文生图到多步骤高清修复等各类复杂任务。ComfyUI 拥有极佳的兼容性，不仅支持 Windows、macOS 和 Linux 全平台，还广泛适配 NVIDIA、AMD、Intel 及苹果 Silicon 等多种硬件架构，并率先支持 SDXL、Flux、SD3 等前沿模型。\n\n无论是希望深入探索算法潜力的研究人员和开发者，还是追求极致创作自由度的设计师与资深 AI 绘画爱好者，ComfyUI 都能提供强大的支持。其独特的模块化架构允许社区不断扩展新功能，使其成为当前最灵活、生态最丰富的开源扩散模型工具之一，帮助用户将创意高效转化为现实。",107662,"2026-04-03T11:11:01",[13,14,15],{"id":36,"name":37,"github_repo":38,"description_zh":39,"stars":40,"difficulty_score":23,"last_commit_at":41,"category_tags":42,"status":16},3704,"NextChat","ChatGPTNextWeb\u002FNextChat","NextChat 是一款轻量且极速的 AI 助手，旨在为用户提供流畅、跨平台的大模型交互体验。它完美解决了用户在多设备间切换时难以保持对话连续性，以及面对众多 AI 模型不知如何统一管理的痛点。无论是日常办公、学习辅助还是创意激发，NextChat 都能让用户随时随地通过网页、iOS、Android、Windows、MacOS 或 Linux 端无缝接入智能服务。\n\n这款工具非常适合普通用户、学生、职场人士以及需要私有化部署的企业团队使用。对于开发者而言，它也提供了便捷的自托管方案，支持一键部署到 Vercel 或 Zeabur 等平台。\n\nNextChat 的核心亮点在于其广泛的模型兼容性，原生支持 Claude、DeepSeek、GPT-4 及 Gemini Pro 等主流大模型，让用户在一个界面即可自由切换不同 AI 能力。此外，它还率先支持 MCP（Model Context Protocol）协议，增强了上下文处理能力。针对企业用户，NextChat 提供专业版解决方案，具备品牌定制、细粒度权限控制、内部知识库整合及安全审计等功能，满足公司对数据隐私和个性化管理的高标准要求。",87618,"2026-04-05T07:20:52",[13,26],{"id":44,"name":45,"github_repo":46,"description_zh":47,"stars":48,"difficulty_score":23,"last_commit_at":49,"category_tags":50,"status":16},2268,"ML-For-Beginners","microsoft\u002FML-For-Beginners","ML-For-Beginners 是由微软推出的一套系统化机器学习入门课程，旨在帮助零基础用户轻松掌握经典机器学习知识。这套课程将学习路径规划为 12 周，包含 26 节精炼课程和 52 道配套测验，内容涵盖从基础概念到实际应用的完整流程，有效解决了初学者面对庞大知识体系时无从下手、缺乏结构化指导的痛点。\n\n无论是希望转型的开发者、需要补充算法背景的研究人员，还是对人工智能充满好奇的普通爱好者，都能从中受益。课程不仅提供了清晰的理论讲解，还强调动手实践，让用户在循序渐进中建立扎实的技能基础。其独特的亮点在于强大的多语言支持，通过自动化机制提供了包括简体中文在内的 50 多种语言版本，极大地降低了全球不同背景用户的学习门槛。此外，项目采用开源协作模式，社区活跃且内容持续更新，确保学习者能获取前沿且准确的技术资讯。如果你正寻找一条清晰、友好且专业的机器学习入门之路，ML-For-Beginners 将是理想的起点。",84991,"2026-04-05T10:45:23",[14,51,52,53,15,54,26,13,55],"数据工具","视频","插件","其他","音频",{"id":57,"name":58,"github_repo":59,"description_zh":60,"stars":61,"difficulty_score":10,"last_commit_at":62,"category_tags":63,"status":16},3128,"ragflow","infiniflow\u002Fragflow","RAGFlow 是一款领先的开源检索增强生成（RAG）引擎，旨在为大语言模型构建更精准、可靠的上下文层。它巧妙地将前沿的 RAG 技术与智能体（Agent）能力相结合，不仅支持从各类文档中高效提取知识，还能让模型基于这些知识进行逻辑推理和任务执行。\n\n在大模型应用中，幻觉问题和知识滞后是常见痛点。RAGFlow 通过深度解析复杂文档结构（如表格、图表及混合排版），显著提升了信息检索的准确度，从而有效减少模型“胡编乱造”的现象，确保回答既有据可依又具备时效性。其内置的智能体机制更进一步，使系统不仅能回答问题，还能自主规划步骤解决复杂问题。\n\n这款工具特别适合开发者、企业技术团队以及 AI 研究人员使用。无论是希望快速搭建私有知识库问答系统，还是致力于探索大模型在垂直领域落地的创新者，都能从中受益。RAGFlow 提供了可视化的工作流编排界面和灵活的 API 接口，既降低了非算法背景用户的上手门槛，也满足了专业开发者对系统深度定制的需求。作为基于 Apache 2.0 协议开源的项目，它正成为连接通用大模型与行业专有知识之间的重要桥梁。",77062,"2026-04-04T04:44:48",[15,14,13,26,54],{"id":65,"github_repo":66,"name":67,"description_en":68,"description_zh":69,"ai_summary_zh":70,"readme_en":71,"readme_zh":72,"quickstart_zh":73,"use_case_zh":74,"hero_image_url":75,"owner_login":76,"owner_name":77,"owner_avatar_url":78,"owner_bio":79,"owner_company":79,"owner_location":80,"owner_email":79,"owner_twitter":79,"owner_website":81,"owner_url":82,"languages":79,"stars":83,"forks":84,"last_commit_at":85,"license":79,"difficulty_score":86,"env_os":87,"env_gpu":88,"env_ram":88,"env_deps":89,"category_tags":92,"github_topics":93,"view_count":23,"oss_zip_url":79,"oss_zip_packed_at":79,"status":16,"created_at":101,"updated_at":102,"faqs":103,"releases":114},2542,"SupeRuier\u002Fawesome-active-learning","awesome-active-learning","Everything you need about Active Learning (AL).","awesome-active-learning 是一个专注于“主动学习”（Active Learning, AL）领域的开源知识资源库。它不仅仅是一份简单的文献清单，更是一个经过精心策划、结构严谨的学术与工程资料中心，旨在为使用者提供关于主动学习的一站式信息支持。\n\n在人工智能模型训练中，数据标注往往成本高昂且耗时。主动学习通过智能筛选最有价值的样本进行标注，从而用更少的数据实现更高的模型性能。awesome-active-learning 正是为了解决研究者在这一领域面临的信息碎片化问题而生。它将分散在各处的顶级会议论文、期刊文章、学位论文、开源代码库、理论综述以及实际应用案例进行了系统化的分类整理。无论是按 ICML、NeurIPS、CVPR 等顶尖学术会议分类，还是按具体的问题场景和理论支持划分，用户都能快速定位到所需的核心资源。\n\n该项目特别适合人工智能领域的研究人员、算法工程师以及高校学生使用。对于刚入门的新手，其中的教程和综述能帮助快速建立知识体系；对于资深研究者，按出处和内容细分的论文列表能极大提升文献调研的效率；对于开发者，收录的代码与工具包则能加速算法的原型验证与落地","awesome-active-learning 是一个专注于“主动学习”（Active Learning, AL）领域的开源知识资源库。它不仅仅是一份简单的文献清单，更是一个经过精心策划、结构严谨的学术与工程资料中心，旨在为使用者提供关于主动学习的一站式信息支持。\n\n在人工智能模型训练中，数据标注往往成本高昂且耗时。主动学习通过智能筛选最有价值的样本进行标注，从而用更少的数据实现更高的模型性能。awesome-active-learning 正是为了解决研究者在这一领域面临的信息碎片化问题而生。它将分散在各处的顶级会议论文、期刊文章、学位论文、开源代码库、理论综述以及实际应用案例进行了系统化的分类整理。无论是按 ICML、NeurIPS、CVPR 等顶尖学术会议分类，还是按具体的问题场景和理论支持划分，用户都能快速定位到所需的核心资源。\n\n该项目特别适合人工智能领域的研究人员、算法工程师以及高校学生使用。对于刚入门的新手，其中的教程和综述能帮助快速建立知识体系；对于资深研究者，按出处和内容细分的论文列表能极大提升文献调研的效率；对于开发者，收录的代码与工具包则能加速算法的原型验证与落地应用。\n\nawesome-active-learning 的主要亮点在于其高度的结构化与持续性更新。它打破了传统文献列表单一的维度，提供了从理论基础到工业界应用的全景视图，并保持了较高的社区活跃度。如果你正在探索如何用更低的数据成本训练出更强大的 AI 模型，这里将是你不可或缺的导航图。","[![Contributors][contributors-shield]][contributors-url]\n[![Forks][forks-shield]][forks-url]\n[![Stargazers][stars-shield]][stars-url] \n[![Issues][issues-shield]][issues-url]\n\n[contributors-shield]: https:\u002F\u002Fimg.shields.io\u002Fgithub\u002Fcontributors\u002FSupeRuier\u002Fawesome-active-learning.svg?style=for-the-badge\n[contributors-url]: https:\u002F\u002Fgithub.com\u002FSupeRuier\u002Fawesome-active-learning\u002Fgraphs\u002Fcontributors\n\n[forks-shield]: https:\u002F\u002Fimg.shields.io\u002Fgithub\u002Fforks\u002FSupeRuier\u002Fawesome-active-learning.svg?style=for-the-badge\n[forks-url]: https:\u002F\u002Fgithub.com\u002FSupeRuier\u002Fawesome-active-learning\u002Fnetwork\u002Fmembers\n\n[stars-shield]: https:\u002F\u002Fimg.shields.io\u002Fgithub\u002Fstars\u002FSupeRuier\u002Fawesome-active-learning.svg?style=for-the-badge\n[stars-url]: https:\u002F\u002Fgithub.com\u002FSupeRuier\u002Fawesome-active-learning\u002Fstargazers\n\n[issues-shield]: https:\u002F\u002Fimg.shields.io\u002Fgithub\u002Fissues\u002FSupeRuier\u002Fawesome-active-learning.svg?style=for-the-badge\n[issues-url]: https:\u002F\u002Fgithub.com\u002FSupeRuier\u002Fawesome-active-learning\u002Fissues\n\n[![Awesome](https:\u002F\u002Fawesome.re\u002Fbadge.svg)](https:\u002F\u002Fawesome.re)\n[![MIT License](https:\u002F\u002Fimg.shields.io\u002Fbadge\u002Flicense-MIT-green.svg)](https:\u002F\u002Fopensource.org\u002Flicenses\u002FMIT)\n\n\n\u003Ch1 align=\"center\">\n  Everything about Active Learning\n\u003C\u002Fh1>\n\n\u003Ch4 align=\"center\">Everything you need about Active Learning (AL).\u003C\u002Fh4>\n\u003Ch4 align=\"center\">Not only a curated list, but also a well-structured library.\u003C\u002Fh4>\n\u003C!-- \u003Ch4 align=\"center\">Usually updated twice a month.\u003C\u002Fh4> -->\n\u003Ch4 align=\"center\">关于主动学习你需要的一切.\u003C\u002Fh4>\n\u003Ch4 align=\"center\">不仅仅包含文献列表，更是一个结构化的资料库.\u003C\u002Fh4>\n\u003C!-- \u003Ch4 align=\"center\">通常每月两更新.\u003C\u002Fh4> -->\n\u003Ch4 align=\"center\">(The majority of contents are presented in English.)\u003C\u002Fh4>\n\n\u003C\u002Fp>\n\n\u003C!-- 一些超链接！！！ -->\n\u003Cp align=\"center\">\n  \u003Cstrong>\u003Ca href=\"#0-papers---当前论文\">Papers\u003C\u002Fa>\u003C\u002Fstrong> •\n  \u003Cstrong>\u003Ca href=\"#1-introduction-to-al---主动学习简介\">Introduction\u003C\u002Fa>\u003C\u002Fstrong> •\n  \u003Cstrong>\u003Ca href=\"#tutorials---教程\">Tutorials\u003C\u002Fa>\u003C\u002Fstrong> •\n  \u003Cstrong>\u003Ca href=\"#2-reviews--tutorials---相关综述及教程\">Survey\u003C\u002Fa>\u003C\u002Fstrong> •\n  \u003Cstrong>\u003Ca href=\"#3-problem-settings---问题场景\">Problem Settings\u003C\u002Fa>\u003C\u002Fstrong> •\n  \u003Cstrong>\u003Ca href=\"#4-theoretical-support---理论支持\">Theory\u003C\u002Fa>\u003C\u002Fstrong>\n\u003C\u002Fp>\n\u003Cp align=\"center\">\n  \u003Cstrong>\u003Ca href=\"#by-origin---按出处分类\">Dissertations\u003C\u002Fa>\u003C\u002Fstrong> •\n  \u003Cstrong>\u003Ca href=\"#7-codes--libraries---代码与工具包\">Code & Library\u003C\u002Fa>\u003C\u002Fstrong> •\n  \u003Cstrong>\u003Ca href=\"#8-scholars--groups---著名学者及团队\">Scholars\u003C\u002Fa>\u003C\u002Fstrong> •\n  \u003Cstrong>\u003Ca href=\"#6-real-world-applications---实际应用\">Applications\u003C\u002Fa>\u003C\u002Fstrong>\n\u003C\u002Fp>\n\n[](#tutorials---教程)\n\u003C!-- **Widely used by top conferences and journals:** å\n近期在多个顶尖会议与期刊中收录\n- Conferences: 每一年的 CCF-A\n- Journals: 每一年的 CCF-A -->\n\n\n**Contributing - 加入本项目** \n\nIf you find any valuable researches, please feel free to [pull request](https:\u002F\u002Fgithub.com\u002FSupeRuier\u002Fawesome-active-learning\u002Fpulls) or contact [ruihe.cs@gmail.com](ruihe.cs@gmail.com) to update this repository.\nComments and suggestions are also very welcome!\n\n\u003C!-- **Cite us - 引用我们:**\n\nIf you use our repository in your research or applications, please consider citing this website.\n如果您在您的科研以及应用中从此项目获得一些帮助，请考虑使用如下的方式引用我们的项目。\n```\n@Misc{https:\u002F\u002Fgithub.com\u002FSupeRuier\u002Fawesome-active-learning,\nhowpublished = {\\url{http:\u002F\u002Fgithub.com\u002FSupeRuier\u002Fawesome-active-learning}},   \ntitle = {Everything about Active Learning},  \nauthor = {Rui He}  \n}  \n``` -->\n\n\u003C!-- \nThe hierarchical structure of this repository is shown in the following figure, and **you can find the paper-list in the corresponding sub-pages**:\n\n![](https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002FSupeRuier_awesome-active-learning_readme_3f64ecbb4bfc.png)\n\n--- -->\n\n\n# 0. Papers - 当前论文\n\n## By Origin - 按出处分类\n\nBy conference - 按会议分类：[**ICML**](conference\u002FICML.md) \u002F [**NeurIPS**](conference\u002FNeurIPS.md) \u002F [**ICLR**](conference\u002FICLR.md) \u002F [**AAAI**](conference\u002FAAAI.md) \u002F [**IJCAI**](conference\u002FIJCAI.md) \u002F [**ACL**](conference\u002FACL.md) \u002F [**CVPR**](conference\u002FCVPR.md) \u002F [**ICCV**](conference\u002FICCV.md) \n\nBy journal - 按期刊分类：[**AI**](journal\u002FAI.md) \u002F [**TPAMI**](journal\u002FTPAMI.md) \u002F [**IJCV**](journal\u002FIJCV.md) \u002F [**JMLR**](journal\u002FJMLR.md)\n\nBy degree - 按学位论文分类：[**Master**](thesis\u002FMaster.md) \u002F [**PhD**](thesis\u002FPhD.md)\n\n## By Content - 按内容分类\n\nConstructed in a **problem-orientated** approach, which is easy for users to locate and track the problem.\n基于**以问题为导向**的分类方式，以方便读者准确定位以及跟踪相关问题。\n\n- [Taxonomy of Strategies - 主动学习技术分类](contents\u002Fpb_classification.md)\n- [AL Problem Settings - 问题场景](#3-problem-settings---问题场景)\n- [AL in other AI Fields - 其他人工智能领域中的主动学习](#33-al-in-ai-fields---人工智能背景中的主动学习)\n- [Deep AL - 深度主动学习](contents\u002Fdeep_AL.md)\n- [Practical Considerations - 运用主动学习时的实际考虑](#5-practical-considerations---运用-al-时的考虑) \n- [AL Applications (Scientific & Industrial) - 主动学习在科学及工业界的应用](contents\u002FAL_applications.md)\n\n## By Hot Discussions - 按热门讨论分类\n\n- [Intrinsic Issues in AL - 主动学习的内在问题](contents\u002Fintrinsic_issues.md)\n- [Criticism \u002F Discovery on Deep AL - 深度主动学习的批判和探索](contents\u002Fdeep_AL_criticism.md)\n\n# 1. Introduction to AL - 主动学习简介\n\n**Problem - 面向的问题:** \nHigh labeling cost is common in machine learning community. \nAcquiring a heavy number of annotations hindering the application of machine learning methods.\n\n**Essence \u002F Assumption - 本质 \u002F 基础假设:**\nNot all the instances are equally important to the desired task, so only labeling the more important instances might bring cost reduction.\n\n**When we talk about active learning, we talk about - 当我们在谈论主动学习时，我们指的是**:\n- an approach to reduce the annotation cost in machine learning.\n- the ways to select the most important instances for the corresponding tasks.\n- (in most cases) an interactive labeling manner between algorithms and oracles.\n- a machine learning setting where human experts could be involved.\n\n# 2. Reviews & Tutorials - 相关综述及教程\n\nThere have been several reviews \u002F surveys \u002F benchmarks for this topic.\n\n### **Reviews \u002F Surveys - 综述**:\n- [Active learning: theory and applications [2001]](https:\u002F\u002Fai.stanford.edu\u002F~koller\u002FPapers\u002FTong:2001.pdf.gz)\n- [Active Learning Literature Survey **(Recommend to read)** [2009]](https:\u002F\u002Fminds.wisconsin.edu\u002Fhandle\u002F1793\u002F60660)\n- [A survey on instance selection for active learning [2012]](https:\u002F\u002Flink.springer.com\u002Farticle\u002F10.1007\u002Fs10115-012-0507-8)\n- [Active Learning: A Survey [2014]](https:\u002F\u002Fwww.taylorfrancis.com\u002Fbooks\u002Fe\u002F9780429102639\u002Fchapters\u002F10.1201\u002Fb17320-27)\n- [Active Learning Query Strategies for Classification, Regression, and Clustering: A Survey [2020, Journal of Computer Science and Technology]](https:\u002F\u002Flink.springer.com\u002Farticle\u002F10.1007\u002Fs11390-020-9487-4)\n- [A Survey of Active Learning for Text Classification using Deep Neural Networks [2020]](https:\u002F\u002Farxiv.org\u002Fpdf\u002F2008.07267.pdf)\n- [A Survey of Deep Active Learning [2020]](https:\u002F\u002Farxiv.org\u002Fpdf\u002F2009.00236.pdf)\n- [Active Learning: Problem Settings and Recent Developments [2020]](https:\u002F\u002Farxiv.org\u002Fpdf\u002F2012.04225.pdf)\n- [From Model-driven to Data-driven: A Survey on Active Deep Learning [2021]](https:\u002F\u002Farxiv.org\u002Fpdf\u002F2101.09933.pdf)\n- [Understanding the Relationship between Interactions and Outcomes in Human-in-the-Loop Machine Learning [2021]](http:\u002F\u002Fharp.ri.cmu.edu\u002Fassets\u002Fpubs\u002Fhil_ml_survey_ijcai_2021.pdf): HIL, a wider framework.\n- [A Survey on Cost Types, Interaction Schemes, and Annotator Performance Models in Selection Algorithms for Active Learning in Classification [2021]](https:\u002F\u002Farxiv.org\u002Fpdf\u002F2109.11301.pdf)\n- [A Comparative Survey of Deep Active Learning [2022]](https:\u002F\u002Farxiv.org\u002Fpdf\u002F2203.13450.pdf)\n- [A survey on online active learning [2023]](https:\u002F\u002Farxiv.org\u002Fpdf\u002F2302.08893.pdf)\n- Human‐in‐the‐loop machine learning: a state of the art [2023, Artificial Intelligence Review]\n\n### **Benchmarks - 基线**:\n- [A Comparative Survey: Benchmarking for Pool-based Active Learning [2021, IJCAI]](https:\u002F\u002Fwww.ijcai.org\u002Fproceedings\u002F2021\u002F0634.pdf)\n- [A Framework and Benchmark for Deep Batch Active Learning for Regression [2022]](https:\u002F\u002Farxiv.org\u002Fpdf\u002F2203.09410.pdf)\n- [Re-Benchmarking Pool-Based Active Learning for Binary Classification [2023]](https:\u002F\u002Farxiv.org\u002Fpdf\u002F2306.08954.pdf)\n- [LabelBench: A Comprehensive Framework for Benchmarking Label-Efficient Learning [2023]](https:\u002F\u002Farxiv.org\u002Fpdf\u002F2306.09910.pdf)\n\n### **Tutorials - 教程**\n\n|  Lecture Topic                                                                                                  | Year |           Lecturer           | Occasion      |\n| --------------------------------------------------------------------------------------------------------------------- | ---- | :--------------------------: | ------------- |\n| [Active learning and transfer learning at scale with R and Python](https:\u002F\u002Fgithub.com\u002FAzure\u002Factive-learning-workshop) | 2018 |              -               | KDD           |\n| [Active Learning from Theory to Practice](https:\u002F\u002Fwww.youtube.com\u002Fwatch?v=_Ql5vfOPxZU)                                | 2019 | Robert Nowak & Steve Hanneke | ICML          |\n| [Overview of Active Learning for Deep Learning](https:\u002F\u002Fjacobgil.github.io\u002Fdeeplearning\u002Factivelearning)               | 2021 |       Jacob Gildenblat       | Personal Blog |\n\n\n# 3. Problem Settings - 问题场景\n\n## 3.1 Basic Scenarios - 基础问题场景\n\nAlmost all the AL studies are based on the following scenarios.\nThe difference lies in the different sources of the quired samples.\n**The details of these scenarios could see [**here**](contents\u002FAL_problem.md).**\n\n**Three scenarios and corresponding tasks:**\n- **pool-based - 基于数据池**: select from a pre-collected data pool\n  - [pool-based classification](contents\u002Fpb_classification.md)\n  - [pool-based regression](contents\u002Fpb_regression.md)\n- **stream-based - 基于数据流**: select from a steam of incoming data\n  - [stream-based classification](contents\u002Fsb_classification.md)\n  - [stream-based regression](contents\u002Fsb_regression.md)\n- **query synthesis - 基于数据生成**: generate query instead of selecting data\n  - [query synthesis](contents\u002Fquery-synthesis.md)\n\n\n## 3.2 Advanced Problem Settings - 复杂问题场景\n\nThere are many variants of machine learning problem settings with **more advanced tasks**.\nUnder these problem settings, AL could be further applied.\n\n**Related AL Fields:**\n- [Multi-class AL - 多分类主动学习](contents\u002FMCAL.md)\n- [Multi-label AL - 多标签主动学习](contents\u002FMLAL.md)\n- [Multi-task AL - 多任务主动学习](contents\u002FMTAL.md)\n- [Multi-domain AL - 多领域主动学习](contents\u002FMDAL.md):\n- [Multi-view\u002Fmodal AL - 多模态主动学习](contents\u002FMVAL.md)\n- [Multi-instance AL - 多样本主动学习](contents\u002FMIAL.md)\n\n## 3.3 AL in AI Fields - 人工智能背景中的主动学习\n\n**Use AL to reduce the cost of annotation in many other AI research fields**, where the tasks beyonds simple classification or regression.\nThey either acquire different types of outputs or assume a unusual learning process.\nSo AL algorithms should be revised\u002Fdeveloped for these problem settings.\n\n**Utilize AL in the following fields (hot topics)：** \n- [Computer Vision (CV)](contents\u002FAL_combinations.md#computer-vision-cv)\n- [Natural Language Processing (NLP)](contents\u002FAL_combinations.md#natural-language-processing-nlp)\n- [Domain adaptation \u002F Transfer learning](contents\u002FAL_combinations.md#domain-adaptationtransfer-learning)\n- [One \u002F Few \u002F Zero-shot learning or Meta-Learning](contents\u002FAL_combinations.md#onefewzero-shot-learning-or-meta-learning)\n- [Graph Processing](contents\u002FAL_combinations.md#graph-processing)\n- [Metric learning \u002F Pairwise comparison\u002FSimilarity learning](contents\u002FAL_combinations.md#metric-learningpairwise-comparisonsimilarity-learning)\n- [Recommendation](contents\u002FAL_combinations.md#recommendation)\n- [Reinforcement Learning](contents\u002FAL_combinations.md#reinforcement-learning)\n- [Robotics](contents\u002FAL_combinations.md#robotics)\n- [Model Interpretability](contents\u002FAL_combinations.md#model-interpretability)\n- [Clustering](contents\u002FAL_combinations.md#clustering)\n- (Full list of fields could see [**here**](contents\u002FAL_combinations.md))\n\n# 4. Theoretical Support - 理论支持\n\nThere have been many theoretical supports for AL.\nMost of them focus on finding a performance guarantee or the weakness of AL selection.\n\n(This section has not been finished yet. 本章节当前还未完成.)\n\n# 5. Practical Considerations - 运用 AL 时的考虑\n\nMany researches of AL are built on very idealized experimental setting.\nWhen AL is used to real life scenarios, the practical situations usually do not perfectly match the assumptions in the experiments.\nThese **changes of assumptions** lead issues which hinders the application of AL.\nIn this section, the practical considerations are reviewed under different assumptions.\n\n**The considerations of:**\n[data](contents\u002Fpractical_considerations.md#the-considerations-of-the-data) \u002F [oracle](contents\u002Fpractical_considerations.md#the-considerations-of-the-oracles) \u002F [scale](contents\u002Fpractical_considerations.md#the-considerations-of-the-scale) \u002F [workflow](contents\u002Fpractical_considerations.md#the-consideration-of-the-workflow) \u002F [model training cost](contents\u002Fpractical_considerations.md#the-considerations-of-the-model-training-cost) \u002F [query & feedback types](contents\u002Fpractical_considerations.md#the-consideration-of-queryfeedback-types) \u002F [performance metric](contents\u002Fpractical_considerations.md#the-consideration-of-the-performance-metric) \u002F [reliability](contents\u002Fpractical_considerations.md#the-consideration-of-the-reliability) \u002F [privacy](contents\u002Fpractical_considerations.md#the-consideration-of-the-privacy) \u002F [others](contents\u002Fpractical_considerations.md#the-considerations-of-more-assumptions)\n\n**The details and the full list could see [**here**](contents\u002Fpractical_considerations.md).**\n\n# 6. Real-World Applications - 实际应用\n\nAL has already been used in many [real-world applications](contents\u002FAL_applications.md).\nFor some reasons, the implementations in many companies are confidential.\nBut we can still find many applications from several published papers and websites.\n\nBasically, there are two types of applications: [**scientific applications**](contents\u002FAL_applications.md#scientific-applications-alphabetical-order) & [**industrial applications**](contents\u002FAL_applications.md#industrial-applications-alphabetical-order).\n\n# 7. Codes \u002F Libraries - 代码与工具包\n\n| Name                                                                                                               | Languages                        | Author                    | Notes                                            |\n| ------------------------------------------------------------------------------------------------------------------ | -------------------------------- | ------------------------- | ------------------------------------------------ |\n| [AL playground](https:\u002F\u002Fgithub.com\u002Fgoogle\u002Factive-learning)                                                         | Python(scikit-learn, keras)      | Google                    | Abandoned                                        |\n| [modAL](https:\u002F\u002Fgithub.com\u002FmodAL-python\u002FmodAL)                                                                     | Python(scikit-learn)             | Tivadar Danka             | Keep updating                                    |\n| [libact](https:\u002F\u002Fgithub.com\u002Fntucllab\u002Flibact)                                                                       | Python(scikit-learn)             | NTU(Hsuan-Tien Lin group) |                                                  |\n| [ALiPy](https:\u002F\u002Fgithub.com\u002FNUAA-AL\u002FALiPy)                                                                          | Python(scikit-learn)             | NUAA(Shengjun Huang)      | Include MLAL                                     |\n| [pytorch_active_learning](https:\u002F\u002Fgithub.com\u002Frmunro\u002Fpytorch_active_learning)                                       | Python(pytorch)                  | Robert Monarch            | Keep updating & include active transfer learning |\n| [DeepAL](https:\u002F\u002Fgithub.com\u002Fej0cl6\u002Fdeep-active-learning)                                                           | Python(scikit-learn, pytorch)    | Kuan-Hao Huang            | Keep updating & deep neural networks             |\n| [BaaL](https:\u002F\u002Fgithub.com\u002FElementAI\u002Fbaal\u002F)                                                                         | Python(scikit-learn, pytorch)    | ElementAI                 | Keep updating & bayesian active learning         |\n| [lrtc](https:\u002F\u002Fgithub.com\u002FIBM\u002Flow-resource-text-classification-framework)                                          | Python(scikit-learn, tensorflow) | IBM                       | Text classification                              |\n| [Small-text](https:\u002F\u002Fgithub.com\u002Fwebis-de\u002Fsmall-text)                                                               | Python(scikit-learn, pytorch)    | Christopher Schröder      | Text classification                              |\n| [DeepCore](https:\u002F\u002Fgithub.com\u002FPatrickZH\u002FDeepCore)                                                                  | Python(scikit-learn, pytorch)    | Guo et al.                | In the coreset selection formulation             |\n| [PyRelationAL: A Library for Active Learning Research and Development](https:\u002F\u002Fgithub.com\u002FRelationRx\u002Fpyrelational) | Python(scikit-learn, pytorch)    | Scherer et al.            |                                                  |\n| [DeepAL+](https:\u002F\u002Fgithub.com\u002FSineZHAN\u002FdeepALplus\u002F)                                                                 | Python(scikit-learn, pytorch)    | Zhan                      | An extension for DeepAL                          |\n| [ALaaS](https:\u002F\u002Fgithub.com\u002FMLSysOps\u002Falaas)                                                                         | Python(scikit-learn)             | A*STAR & NTU              | Use the stage-level parallellism for AL.         |\n\n# 8. Scholars \u002F Groups - 著名学者及团队\n\nWe also list several scholars who are currently heavily contributing to this research direction.\n\n1. [Hsuan-Tien Lin](https:\u002F\u002Fwww.csie.ntu.edu.tw\u002F~htlin\u002F)\n2. [Shengjun Huang](http:\u002F\u002Fparnec.nuaa.edu.cn\u002Fhuangsj\u002F) (NUAA)\n3. [Dongrui Wu](https:\u002F\u002Fsites.google.com\u002Fsite\u002FdrwuHUST\u002Fpublications\u002Fcompletepubs) (Active Learning for Regression)\n4. [Raymond Mooney](https:\u002F\u002Fwww.cs.utexas.edu\u002F~mooney\u002F)\n5. [Yuchen Guo](http:\u002F\u002Fise.thss.tsinghua.edu.cn\u002FMIG\u002Fgyc.html)\n6. [Steve Hanneke](https:\u002F\u002Fscholar.google.com\u002Fcitations?hl=zh-CN&user=fEhNO7YAAAAJ&view_op=list_works&sortby=pubdate)\n\nSeveral young researchers who provides valuable insights for AL:\n- Jamshid Sourati [University of Chicago]: Deep neural networks.\n- Stefano Teso [University of Trento]: Interactive learning & Human-in-the-loops.\n- Xueyin Zhan [City University of Hong Kong]: Provide several invaluable comparative surveys.\n- Katerina Margatina [University of Sheffield]: Provide several good insights, analysis and applications for AL.\n\n","[![贡献者][contributors-shield]][contributors-url]\n[![分支数][forks-shield]][forks-url]\n[![星标数][stars-shield]][stars-url] \n[![问题数][issues-shield]][issues-url]\n\n[contributors-shield]: https:\u002F\u002Fimg.shields.io\u002Fgithub\u002Fcontributors\u002FSupeRuier\u002Fawesome-active-learning.svg?style=for-the-badge\n[contributors-url]: https:\u002F\u002Fgithub.com\u002FSupeRuier\u002Fawesome-active-learning\u002Fgraphs\u002Fcontributors\n\n[forks-shield]: https:\u002F\u002Fimg.shields.io\u002Fgithub\u002Fforks\u002FSupeRuier\u002Fawesome-active-learning.svg?style=for-the-badge\n[forks-url]: https:\u002F\u002Fgithub.com\u002FSupeRuier\u002Fawesome-active-learning\u002Fnetwork\u002Fmembers\n\n[stars-shield]: https:\u002F\u002Fimg.shields.io\u002Fgithub\u002Fstars\u002FSupeRuier\u002Fawesome-active-learning.svg?style=for-the-badge\n[stars-url]: https:\u002F\u002Fgithub.com\u002FSupeRuier\u002Fawesome-active-learning\u002Fstargazers\n\n[issues-shield]: https:\u002F\u002Fimg.shields.io\u002Fgithub\u002Fissues\u002FSupeRuier\u002Fawesome-active-learning.svg?style=for-the-badge\n[issues-url]: https:\u002F\u002Fgithub.com\u002FSupeRuier\u002Fawesome-active-learning\u002Fissues\n\n[![Awesome](https:\u002F\u002Fawesome.re\u002Fbadge.svg)](https:\u002F\u002Fawesome.re)\n[![MIT 许可证](https:\u002F\u002Fimg.shields.io\u002Fbadge\u002Flicense-MIT-green.svg)](https:\u002F\u002Fopensource.org\u002Flicenses\u002FMIT)\n\n\n\u003Ch1 align=\"center\">\n  关于主动学习的一切\n\u003C\u002Fh1>\n\n\u003Ch4 align=\"center\">关于主动学习（AL）你需要的一切。\u003C\u002Fh4>\n\u003Ch4 align=\"center\">这不仅是一个精选的文献列表，更是一个结构化的资料库。\u003C\u002Fh4>\n\u003C!-- \u003Ch4 align=\"center\">通常每月两更新.\u003C\u002Fh4> -->\n\u003Ch4 align=\"center\">关于主动学习你需要的一切.\u003C\u002Fh4>\n\u003Ch4 align=\"center\">不仅仅包含文献列表，更是一个结构化的资料库.\u003C\u002Fh4>\n\u003C!-- \u003Ch4 align=\"center\">通常每月两更新.\u003C\u002Fh4> -->\n\u003Ch4 align=\"center\">(大部分内容以英文呈现。)\u003C\u002Fh4>\n\n\u003C\u002Fp>\n\n\u003C!-- 一些超链接！！！ -->\n\u003Cp align=\"center\">\n  \u003Cstrong>\u003Ca href=\"#0-papers---当前论文\">论文\u003C\u002Fa>\u003C\u002Fstrong> •\n  \u003Cstrong>\u003Ca href=\"#1-introduction-to-al---主动学习简介\">简介\u003C\u002Fa>\u003C\u002Fstrong> •\n  \u003Cstrong>\u003Ca href=\"#tutorials---教程\">教程\u003C\u002Fa>\u003C\u002Fstrong> •\n  \u003Cstrong>\u003Ca href=\"#2-reviews--tutorials---相关综述及教程\">综述\u003C\u002Fa>\u003C\u002Fstrong> •\n  \u003Cstrong>\u003Ca href=\"#3-problem-settings---问题场景\">问题场景\u003C\u002Fa>\u003C\u002Fstrong> •\n  \u003Cstrong>\u003Ca href=\"#4-theoretical-support---理论支持\">理论\u003C\u002Fa>\u003C\u002Fstrong>\n\u003C\u002Fp>\n\u003Cp align=\"center\">\n  \u003Cstrong>\u003Ca href=\"#by-origin---按出处分类\">学位论文\u003C\u002Fa>\u003C\u002Fstrong> •\n  \u003Cstrong>\u003Ca href=\"#7-codes--libraries---代码与工具包\">代码与工具\u003C\u002Fa>\u003C\u002Fstrong> •\n  \u003Cstrong>\u003Ca href=\"#8-scholars--groups---著名学者及团队\">学者\u003C\u002Fa>\u003C\u002Fstrong> •\n  \u003Cstrong>\u003Ca href=\"#6-real-world-applications---实际应用\">应用\u003C\u002Fa>\u003C\u002Fstrong>\n\u003C\u002Fp>\n\n[](#tutorials---教程)\n\u003C!-- **广泛被顶级会议和期刊采用：** å\n近期在多个顶尖会议与期刊中收录\n- 会议：每年的 CCF-A 类会议\n- 期刊：每年的 CCF-A 类期刊 -->\n\n\n**贡献 - 加入本项目** \n\n如果您发现了任何有价值的研究成果，请随时提交 [pull request](https:\u002F\u002Fgithub.com\u002FSupeRuier\u002Fawesome-active-learning\u002Fpulls) 或联系 [ruihe.cs@gmail.com](ruihe.cs@gmail.com) 来更新本仓库。您的评论和建议同样受到热烈欢迎！\n\n\u003C!-- **引用我们 - 引用我们:**\n\n如果您在研究或应用中使用了我们的仓库，请考虑引用本网站。\n如果您在您的科研以及应用中从此项目获得一些帮助，请考虑使用如下的方式引用我们的项目。\n```\n@Misc{https:\u002F\u002Fgithub.com\u002FSupeRuier\u002Fawesome-active-learning,\nhowpublished = {\\url{http:\u002F\u002Fgithub.com\u002FSupeRuier\u002Fawesome-active-learning}},   \ntitle = {Everything about Active Learning},  \nauthor = {Rui He}  \n}  \n``` -->\n\n\u003C!-- \n本仓库的层级结构如下图所示，**您可以在相应的子页面中找到论文列表**：\n\n![](https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002FSupeRuier_awesome-active-learning_readme_3f64ecbb4bfc.png)\n\n--- -->\n\n\n# 0. 论文 - 当前论文\n\n## 按出处分类\n\n按会议分类：[**ICML**](conference\u002FICML.md) \u002F [**NeurIPS**](conference\u002FNeurIPS.md) \u002F [**ICLR**](conference\u002FICLR.md) \u002F [**AAAI**](conference\u002FAAAI.md) \u002F [**IJCAI**](conference\u002FIJCAI.md) \u002F [**ACL**](conference\u002FACL.md) \u002F [**CVPR**](conference\u002FCVPR.md) \u002F [**ICCV**](conference\u002FICCV.md) \n\n按期刊分类：[**AI**](journal\u002FAI.md) \u002F [**TPAMI**](journal\u002FTPAMI.md) \u002F [**IJCV**](journal\u002FIJCV.md) \u002F [**JMLR**](journal\u002FJMLR.md)\n\n按学位论文分类：[**硕士**](thesis\u002FMaster.md) \u002F [**博士**](thesis\u002FPhD.md)\n\n## 按内容分类\n\n采用**以问题为导向**的分类方式，便于用户快速定位和追踪相关问题。\n\n- [主动学习技术分类](contents\u002Fpb_classification.md)\n- [主动学习的问题场景](#3-problem-settings---问题场景)\n- [其他人工智能领域中的主动学习](#33-al-in-ai-fields---人工智能背景中的主动学习)\n- [深度主动学习](contents\u002Fdeep_AL.md)\n- [运用主动学习时的实际考虑](#5-practical-considerations---运用-al-时的考虑) \n- [主动学习在科学及工业界的应用](contents\u002FAL_applications.md)\n\n## 按热门讨论分类\n\n- [主动学习的内在问题](contents\u002Fintrinsic_issues.md)\n- [深度主动学习的批判与探索](contents\u002Fdeep_AL_criticism.md)\n\n# 1. 主动学习简介\n\n**面临的问题:** \n机器学习领域普遍存在标注成本高昂的问题。大量标注数据的获取往往阻碍了机器学习方法的实际应用。\n\n**本质\u002F假设:** \n并非所有样本对目标任务都同等重要，因此只需标注那些更重要的样本，就能有效降低标注成本。\n\n**当我们谈论主动学习时，我们指的是：**\n- 一种旨在降低机器学习标注成本的方法。\n- 选择对特定任务最为重要的样本的方式。\n- （大多数情况下）算法与“预言家”之间的交互式标注过程。\n- 一种允许人类专家参与其中的机器学习设置。\n\n# 2. 相关综述与教程\n\n针对这一主题，已经有许多综述、调查和基准测试问世。\n\n### **综述 \u002F 调查**:\n- [主动学习：理论与应用 [2001]](https:\u002F\u002Fai.stanford.edu\u002F~koller\u002FPapers\u002FTong:2001.pdf.gz)\n- [主动学习文献综述 **（推荐阅读）** [2009]](https:\u002F\u002Fminds.wisconsin.edu\u002Fhandle\u002F1793\u002F60660)\n- [主动学习中实例选择的综述 [2012]](https:\u002F\u002Flink.springer.com\u002Farticle\u002F10.1007\u002Fs10115-012-0507-8)\n- [主动学习：综述 [2014]](https:\u002F\u002Fwww.taylorfrancis.com\u002Fbooks\u002Fe\u002F9780429102639\u002Fchapters\u002F10.1201\u002Fb17320-27)\n- [用于分类、回归和聚类的主动学习查询策略：综述 [2020，计算机科学与技术期刊]](https:\u002F\u002Flink.springer.com\u002Farticle\u002F10.1007\u002Fs11390-020-9487-4)\n- [基于深度神经网络的文本分类主动学习综述 [2020]](https:\u002F\u002Farxiv.org\u002Fpdf\u002F2008.07267.pdf)\n- [深度主动学习综述 [2020]](https:\u002F\u002Farxiv.org\u002Fpdf\u002F2009.00236.pdf)\n- [主动学习：问题设置与最新进展 [2020]](https:\u002F\u002Farxiv.org\u002Fpdf\u002F2012.04225.pdf)\n- [从模型驱动到数据驱动：主动深度学习综述 [2021]](https:\u002F\u002Farxiv.org\u002Fpdf\u002F2101.09933.pdf)\n- [理解人机协作机器学习中交互与结果之间的关系 [2021]](http:\u002F\u002Fharp.ri.cmu.edu\u002Fassets\u002Fpubs\u002Fhil_ml_survey_ijcai_2021.pdf)：HIL是一种更广泛的框架。\n- [关于分类任务中主动学习选择算法的成本类型、交互方案及标注者性能模型的综述 [2021]](https:\u002F\u002Farxiv.org\u002Fpdf\u002F2109.11301.pdf)\n- [深度主动学习比较综述 [2022]](https:\u002F\u002Farxiv.org\u002Fpdf\u002F2203.13450.pdf)\n- [在线主动学习综述 [2023]](https:\u002F\u002Farxiv.org\u002Fpdf\u002F2302.08893.pdf)\n- 人机协作机器学习：现状综述 [2023，人工智能评论]\n\n### **基准**:\n- [比较综述：基于池的主动学习基准测试 [2021，IJCAI]](https:\u002F\u002Fwww.ijcai.org\u002Fproceedings\u002F2021\u002F0634.pdf)\n- [用于回归的深度批量主动学习框架与基准测试 [2022]](https:\u002F\u002Farxiv.org\u002Fpdf\u002F2203.09410.pdf)\n- [二分类任务中基于池的主动学习再基准测试 [2023]](https:\u002F\u002Farxiv.org\u002Fpdf\u002F2306.08954.pdf)\n- [LabelBench：标签高效学习的综合基准测试框架 [2023]](https:\u002F\u002Farxiv.org\u002Fpdf\u002F2306.09910.pdf)\n\n### **教程**\n\n| 讲座主题                                                                                                  | 年份 |           讲师           | 场合      |\n| --------------------------------------------------------------------------------------------------------------------- | ---- | :--------------------------: | ------------- |\n| [使用R和Python进行大规模主动学习与迁移学习](https:\u002F\u002Fgithub.com\u002FAzure\u002Factive-learning-workshop) | 2018 |              -               | KDD           |\n| [主动学习：从理论到实践](https:\u002F\u002Fwww.youtube.com\u002Fwatch?v=_Ql5vfOPxZU)                                | 2019 | Robert Nowak & Steve Hanneke | ICML          |\n| [深度学习中的主动学习概述](https:\u002F\u002Fjacobgil.github.io\u002Fdeeplearning\u002Factivelearning)               | 2021 |       Jacob Gildenblat       | 个人博客 |\n\n\n# 3. 问题场景\n\n## 3.1 基础问题场景\n\n几乎所有的主动学习研究都基于以下几种场景。\n区别在于所请求样本的来源不同。\n**这些场景的详细信息可参见[**此处**](contents\u002FAL_problem.md)。**\n\n**三种场景及其对应的任务：**\n- **基于数据池**: 从预先收集的数据池中选择\n  - [基于数据池的分类](contents\u002Fpb_classification.md)\n  - [基于数据池的回归](contents\u002Fpb_regression.md)\n- **基于数据流**: 从不断流入的数据流中选择\n  - [基于数据流的分类](contents\u002Fsb_classification.md)\n  - [基于数据流的回归](contents\u002Fsb_regression.md)\n- **查询合成**: 不是选择数据，而是生成查询\n  - [查询合成](contents\u002Fquery-synthesis.md)\n\n\n## 3.2 复杂问题场景\n\n有许多变体的机器学习问题设置，包含**更高级的任务**。\n在这些问题设置下，主动学习可以进一步应用。\n\n**相关的主动学习领域：**\n- [多分类主动学习](contents\u002FMCAL.md)\n- [多标签主动学习](contents\u002FMLAL.md)\n- [多任务主动学习](contents\u002FMTAL.md)\n- [多领域主动学习](contents\u002FMDAL.md):\n- [多模态主动学习](contents\u002FMVAL.md)\n- [多样本主动学习](contents\u002FMIAL.md)\n\n## 3.3 人工智能背景下的主动学习\n\n**利用主动学习来降低许多其他人工智能研究领域的标注成本**，这些领域涉及的任务超出了简单的分类或回归。\n它们要么产生不同类型的结果，要么采用非常规的学习过程。\n因此，针对这些问题设置需要对主动学习算法进行修改或开发。\n\n**在以下领域（热门话题）中应用主动学习：** \n- [计算机视觉 (CV)](contents\u002FAL_combinations.md#computer-vision-cv)\n- [自然语言处理 (NLP)](contents\u002FAL_combinations.md#natural-language-processing-nlp)\n- [领域适应 \u002F 迁移学习](contents\u002FAL_combinations.md#domain-adaptationtransfer-learning)\n- [一次\u002F少量\u002F零次学习或元学习](contents\u002FAL_combinations.md#onefewzero-shot-learning-or-meta-learning)\n- [图处理](contents\u002FAL_combinations.md#graph-processing)\n- [度量学习 \u002F 成对比较 \u002F 相似度学习](contents\u002FAL_combinations.md#metric-learningpairwise-comparisonsimilarity-learning)\n- [推荐系统](contents\u002FAL_combinations.md#recommendation)\n- [强化学习](contents\u002FAL_combinations.md#reinforcement-learning)\n- [机器人学](contents\u002FAL_combinations.md#robotics)\n- [模型可解释性](contents\u002FAL_combinations.md#model-interpretability)\n- [聚类](contents\u002FAL_combinations.md#clustering)\n- （完整领域列表可参见[**此处**](contents\u002FAL_combinations.md)）\n\n# 4. 理论支持\n\n针对主动学习已有许多理论支持。\n大多数理论都集中在寻找性能保证或识别主动学习选择方法的弱点上。\n\n（本章节目前尚未完成。）\n\n# 5. 实践考量 - 应用主动学习时的考虑\n\n许多关于主动学习的研究都建立在非常理想化的实验环境中。然而，当主动学习被应用于实际场景时，实际情况往往与实验中的假设并不完全吻合。这些**假设的变化**会引发一系列问题，从而阻碍主动学习的实际应用。在本节中，我们将根据不同假设来回顾相关的实践考量。\n\n**考量内容包括：**\n[数据](contents\u002Fpractical_considerations.md#the-considerations-of-the-data) \u002F [标注者](contents\u002Fpractical_considerations.md#the-considerations-of-the-oracles) \u002F [规模](contents\u002Fpractical_considerations.md#the-considerations-of-the-scale) \u002F [工作流程](contents\u002Fpractical_considerations.md#the-consideration-of-the-workflow) \u002F [模型训练成本](contents\u002Fpractical_considerations.md#the-considerations-of-the-model-training-cost) \u002F [查询与反馈类型](contents\u002Fpractical_considerations.md#the-consideration-of-queryfeedback-types) \u002F [性能指标](contents\u002Fpractical_considerations.md#the-consideration-of-the-performance-metric) \u002F [可靠性](contents\u002Fpractical_considerations.md#the-consideration-of-the-reliability) \u002F [隐私](contents\u002Fpractical_considerations.md#the-consideration-of-the-privacy) \u002F [其他](contents\u002Fpractical_considerations.md#the-considerations-of-more-assumptions)\n\n**详细内容及完整列表请参见[此处](contents\u002Fpractical_considerations.md)。**\n\n# 6. 现实世界的应用 - 实际应用\n\n主动学习已经被广泛应用于众多【现实世界的应用】(contents\u002FAL_applications.md)中。由于某些原因，许多公司的具体实现仍处于保密状态。不过，我们仍然可以从一些已发表的论文和公开的网站中找到相关应用案例。\n\n基本上，主动学习的应用可以分为两类：【科学应用】(contents\u002FAL_applications.md#scientific-applications-alphabetical-order) 和 【工业应用】(contents\u002FAL_applications.md#industrial-applications-alphabetical-order)。\n\n# 7. 代码与工具包 - 代码与工具包\n\n| 名称                                                                                                               | 编程语言                        | 作者                    | 备注                                            |\n| ------------------------------------------------------------------------------------------------------------------ | -------------------------------- | ------------------------- | ------------------------------------------------ |\n| [AL playground](https:\u002F\u002Fgithub.com\u002Fgoogle\u002Factive-learning)                                                         | Python(scikit-learn, keras)      | Google                    | 已停止维护                                        |\n| [modAL](https:\u002F\u002Fgithub.com\u002FmodAL-python\u002FmodAL)                                                                     | Python(scikit-learn)             | Tivadar Danka             | 持续更新                                    |\n| [libact](https:\u002F\u002Fgithub.com\u002Fntucllab\u002Flibact)                                                                       | Python(scikit-learn)             | NTU(Hsuan-Tien Lin小组) |                                                  |\n| [ALiPy](https:\u002F\u002Fgithub.com\u002FNUAA-AL\u002FALiPy)                                                                          | Python(scikit-learn)             | NUAA(Shengjun Huang)      | 包含MLAL                                     |\n| [pytorch_active_learning](https:\u002F\u002Fgithub.com\u002Frmunro\u002Fpytorch_active_learning)                                       | Python(pytorch)                  | Robert Monarch            | 持续更新且包含主动迁移学习                 |\n| [DeepAL](https:\u002F\u002Fgithub.com\u002Fej0cl6\u002Fdeep-active-learning)                                                           | Python(scikit-learn, pytorch)    | Kuan-Hao Huang            | 持续更新且支持深度神经网络             |\n| [BaaL](https:\u002F\u002Fgithub.com\u002FElementAI\u002Fbaal\u002F)                                                                         | Python(scikit-learn, pytorch)    | ElementAI                 | 持续更新且支持贝叶斯主动学习         |\n| [lrtc](https:\u002F\u002Fgithub.com\u002FIBM\u002Flow-resource-text-classification-framework)                                          | Python(scikit-learn, tensorflow) | IBM                       | 文本分类                              |\n| [Small-text](https:\u002F\u002Fgithub.com\u002Fwebis-de\u002Fsmall-text)                                                               | Python(scikit-learn, pytorch)    | Christopher Schröder      | 文本分类                              |\n| [DeepCore](https:\u002F\u002Fgithub.com\u002FPatrickZH\u002FDeepCore)                                                                  | Python(scikit-learn, pytorch)    | Guo等人                | 基于核心集选择的框架             |\n| [PyRelationAL: 主动学习研究与开发库](https:\u002F\u002Fgithub.com\u002FRelationRx\u002Fpyrelational)                           | Python(scikit-learn, pytorch)    | Scherer等人            |                                                  |\n| [DeepAL+](https:\u002F\u002Fgithub.com\u002FSineZHAN\u002FdeepALplus\u002F)                                                                 | Python(scikit-learn, pytorch)    | Zhan                      | DeepAL的扩展版本                          |\n| [ALaaS](https:\u002F\u002Fgithub.com\u002FMLSysOps\u002Falaas)                                                                         | Python(scikit-learn)             | A*STAR & NTU              | 利用阶段级并行化技术进行主动学习。         |\n\n# 8. 学者与研究团队 - 著名学者及团队\n\n我们还列出了几位目前在该研究领域做出重要贡献的学者。\n\n1. [Hsuan-Tien Lin](https:\u002F\u002Fwww.csie.ntu.edu.tw\u002F~htlin\u002F)\n2. [Shengjun Huang](http:\u002F\u002Fparnec.nuaa.edu.cn\u002Fhuangsj\u002F) (南京航空航天大学)\n3. [Dongrui Wu](https:\u002F\u002Fsites.google.com\u002Fsite\u002FdrwuHUST\u002Fpublications\u002Fcompletepubs) (回归任务中的主动学习)\n4. [Raymond Mooney](https:\u002F\u002Fwww.cs.utexas.edu\u002F~mooney\u002F)\n5. [Yuchen Guo](http:\u002F\u002Fise.thss.tsinghua.edu.cn\u002FMIG\u002Fgyc.html)\n6. [Steve Hanneke](https:\u002F\u002Fscholar.google.com\u002Fcitations?hl=zh-CN&user=fEhNO7YAAAAJ&view_op=list_works&sortby=pubdate)\n\n此外，还有一些为主动学习提供宝贵见解的年轻人：\n- Jamshid Sourati [芝加哥大学]：专注于深度神经网络。\n- Stefano Teso [特伦托大学]：研究交互式学习与人机协作。\n- Xueyin Zhan [香港城市大学]：提供了多篇极具价值的比较综述。\n- Katerina Margatina [谢菲尔德大学]：对主动学习的洞察、分析及应用颇具启发性。","# awesome-active-learning 快速上手指南\n\n**注意**：`awesome-active-learning` 是一个** curated list（精选资源列表）**和结构化资料库，而非一个可安装的 Python 包或软件工具。它旨在为研究人员和开发者提供主动学习（Active Learning, AL）领域的论文、教程、代码库和应用案例索引。\n\n因此，“使用”该工具的主要方式是**浏览、检索和引用**其中整理的资源。以下是如何高效利用该资源库的指南。\n\n## 环境准备\n\n由于这是一个基于 GitHub 的资源列表，你只需要具备以下基础环境即可访问和使用：\n\n*   **网络环境**：能够访问 GitHub 的网络连接。\n*   **浏览器**：现代 Web 浏览器（Chrome, Firefox, Edge 等），用于在线阅读 Markdown 文档。\n*   **可选 - Git**：如果你希望本地克隆仓库以便离线阅读或通过关键词搜索内容，建议安装 Git。\n*   **可选 - PDF 阅读器**：部分链接指向学术论文（PDF 格式），需要本地 PDF 阅读器。\n\n## 安装\u002F获取步骤\n\n你可以选择在线浏览或克隆到本地。\n\n### 方式一：在线浏览（推荐）\n\n直接访问 GitHub 仓库主页即可开始浏览：\n[https:\u002F\u002Fgithub.com\u002FSupeRuier\u002Fawesome-active-learning](https:\u002F\u002Fgithub.com\u002FSupeRuier\u002Fawesome-active-learning)\n\n### 方式二：本地克隆（适合深度研究）\n\n如果你希望在本地进行全文搜索或离线阅读，可以使用 Git 克隆仓库：\n\n```bash\ngit clone https:\u002F\u002Fgithub.com\u002FSupeRuier\u002Fawesome-active-learning.git\ncd awesome-active-learning\n```\n\n## 基本使用指南\n\n该仓库内容结构清晰，主要按**出处**、**内容主题**和**热门讨论**分类。以下是快速定位所需资源的路径：\n\n### 1. 入门与综述 (Introduction & Surveys)\n\n如果你是主动学习领域的新手，建议从以下部分开始：\n\n*   **简介**：查看 [Introduction to AL](#1-introduction-to-al---主动学习简介) 了解主动学习的核心概念（降低标注成本、实例选择、人机交互）。\n*   **必读综述**：在 [Reviews & Tutorials](#2-reviews--tutorials---相关综述及教程) 章节中，推荐阅读：\n    *   [Active Learning Literature Survey (2009)](https:\u002F\u002Fminds.wisconsin.edu\u002Fhandle\u002F1793\u002F60660) - 经典入门综述。\n    *   [A Survey of Deep Active Learning (2020)](https:\u002F\u002Farxiv.org\u002Fpdf\u002F2009.00236.pdf) - 针对深度学习的主动学习综述。\n\n### 2. 查找特定方向的论文 (Papers by Content)\n\n仓库采用**以问题为导向**的分类方式，你可以根据研究兴趣直接跳转到对应子页面：\n\n*   **按技术分类**：\n    *   [主动学习技术分类](contents\u002Fpb_classification.md)\n    *   [深度主动学习 (Deep AL)](contents\u002Fdeep_AL.md)\n*   **按应用场景**：\n    *   [计算机视觉 (CV)](contents\u002FAL_combinations.md#computer-vision-cv)\n    *   [自然语言处理 (NLP)](contents\u002FAL_combinations.md#natural-language-processing-nlp)\n    *   [推荐系统](contents\u002FAL_combinations.md#recommendation)\n    *   [强化学习](contents\u002FAL_combinations.md#reinforcement-learning)\n*   **按问题设置**：\n    *   [基于数据池 (Pool-based)](contents\u002Fpb_classification.md)\n    *   [基于数据流 (Stream-based)](contents\u002Fsb_classification.md)\n\n### 3. 查找代码与工具库 (Code & Libraries)\n\n虽然本仓库本身不是代码库，但它整理了现有的开源实现。请查看 [Code & Library](#7-codes--libraries---代码与工具包) 章节（注：具体链接需在仓库首页向下滚动找到第7节），那里列出了常用的主动学习框架和算法实现，例如：\n*   `libact`\n*   `modAL`\n*   `DeepAL` 等相关实现。\n\n### 4. 贡献与更新\n\n如果发现遗漏的重要论文或资源，可以通过以下方式贡献：\n*   提交 [Pull Request](https:\u002F\u002Fgithub.com\u002FSupeRuier\u002Fawesome-active-learning\u002Fpulls)\n*   联系作者：[ruihe.cs@gmail.com](mailto:ruihe.cs@gmail.com)\n\n---\n\n**提示**：仓库中大部分原始文献和详细描述为英文，但目录和分类说明已提供中文翻译，方便中文用户快速导航。","某医疗AI初创公司的算法工程师正致力于开发一款基于病理切片的癌症早期筛查模型，但面临标注数据极度稀缺且专家标注成本高昂的挑战，急需引入主动学习（Active Learning）策略来优化数据标注效率。\n\n### 没有 awesome-active-learning 时\n- **文献检索如大海捞针**：为了寻找适合医学图像的不确定性采样算法，工程师需要在 Google Scholar 和 arXiv 上手动筛选海量论文，难以区分哪些是过时的方法，哪些是 SOTA（当前最佳）成果。\n- **技术选型缺乏依据**：面对 Uncertainty Sampling、Query-by-Committee 等多种策略，缺乏系统的对比综述和理论支持，导致选型主要靠“猜”，容易陷入局部最优或实现复杂的无效方案。\n- **复现门槛极高**：找到论文后，往往发现官方代码缺失或依赖陈旧，需要从头编写算法逻辑，调试周期长，且难以保证实现的正确性，严重拖慢研发进度。\n- **应用场景匹配困难**：不清楚现有算法在类似医疗小样本场景下的实际表现，缺乏真实应用案例参考，导致在项目立项和预期评估时缺乏信心。\n\n### 使用 awesome-active-learning 后\n- **精准定位前沿成果**：通过按顶会（如 CVPR、MICCAI）和期刊分类的论文列表，工程师迅速锁定了近三年的高质量相关研究，直接跳过大量低价值文献，节省数周调研时间。\n- **系统化决策支持**：借助结构化的综述（Survey）和理论支持章节，快速理解不同算法的适用边界，结合“问题场景”分类，科学选择了适合医学图像分割的贝叶斯主动学习方法。\n- **开箱即用的代码资源**：在“Code & Library”板块直接找到了维护良好、文档齐全的开源库，避免了重复造轮子，将算法集成时间从数周缩短至几天。\n- **明确落地路径**：参考“实际应用”章节中的类似案例，预判了模型在冷启动阶段的表现，制定了更合理的分阶段标注计划，提升了项目管理的可控性。\n\nawesome-active-learning 将分散的主动学习知识体系化，帮助团队以最低的信息获取成本，实现了从理论选型到工程落地的高效闭环。","https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002FSupeRuier_awesome-active-learning_189ab19b.png","SupeRuier","Rui","https:\u002F\u002Foss.gittoolsai.com\u002Favatars\u002FSupeRuier_cdd795e7.jpg",null,"Shenzhen","www.superui.cc","https:\u002F\u002Fgithub.com\u002FSupeRuier",974,87,"2026-03-28T08:57:23",1,"","未说明",{"notes":90,"python":88,"dependencies":91},"该项目是一个关于主动学习（Active Learning）的 curated list（精选列表）和结构化资料库，主要包含论文、综述、教程和问题场景分类等文献资源，并非可执行的软件代码库或工具包，因此没有具体的运行环境、依赖库或硬件需求。",[],[13],[94,95,96,97,98,99,100],"active-learning","machine-learning","deep-learning","awesome-list","awesome","human-in-the-loop","crowdsourcing","2026-03-27T02:49:30.150509","2026-04-06T05:36:51.620973",[104,109],{"id":105,"question_zh":106,"answer_zh":107,"source_url":108},11742,"NeurIPS 的缩写中是否包含字母 \"a\"（即 NeuraIPS 还是 NeurIPS）？","NeurIPS 的正确缩写不包含字母 \"a\"。之前的 \"NeuraIPS\" 是拼写错误，现已在 README.md 中修正为 \"NeurIPS\"。","https:\u002F\u002Fgithub.com\u002FSupeRuier\u002Fawesome-active-learning\u002Fissues\u002F2",{"id":110,"question_zh":111,"answer_zh":112,"source_url":113},11743,"为什么《自然语言处理中的主动学习综述》（A Survey of Active Learning for Natural Language Processing）没有添加到家列表的主页？","该综述已添加到主动学习应用（AL applications）的子页面中，具体位置在“自然语言处理 (NLP)”部分：https:\u002F\u002Fgithub.com\u002FSupeRuier\u002Fawesome-active-learning\u002Fblob\u002Fmaster\u002Fcontents\u002FAL_combinations.md#natural-language-processing-nlp 。由于它专注于 NLP 这一特定领域，因此未直接添加至主页。","https:\u002F\u002Fgithub.com\u002FSupeRuier\u002Fawesome-active-learning\u002Fissues\u002F1",[]]