awesome-background-subtraction
awesome-background-subtraction 是一个专注于“背景减除”技术的精选资源库,旨在帮助开发者和研究人员高效地从视频序列中分离移动物体与静态背景。在智能监控、交通分析及无人机巡检等场景中,准确识别动态目标至关重要,但光照变化、动态背景(如摇曳的树叶)及摄像头抖动往往让传统算法难以应对。该资源库系统性地整理了从经典非深度学习方法到前沿深度学习、生成对抗网络(GAN)相关的学术论文、开源代码、数据集及行业项目,并按年份和技术路线清晰分类。
无论是希望快速复现最新算法的工程师,还是致力于探索变化检测新范式的研究学者,都能在这里找到极具价值的参考。其独特亮点在于不仅收录了 CVPR、IEEE TPAMI 等顶会顶刊的高质量论文,还特别关注了“场景独立性”这一难点,提供了大量无需针对特定场景重新训练即可通用的模型资源。通过汇聚全球顶尖学者的成果与实用工具,awesome-background-subtraction 极大地降低了进入该领域的门槛,是计算机视觉从业者不可或缺的知识导航站。
使用场景
某智慧交通团队正在研发一套能适配不同路口摄像头的车辆与行人检测系统,需解决复杂光影下的动态目标分割难题。
没有 awesome-background-subtraction 时
- 文献检索如大海捞针:工程师需手动在 Google Scholar 和 arXiv 上筛选关键词,耗时数周仍难以穷尽最新的深度学习或 GAN 相关论文。
- 技术选型缺乏依据:面对传统算法与前沿模型的抉择,因缺少系统的综述(Review papers)和对比数据,难以判断哪种方案更适合当前场景。
- 复现成本极高:找到论文后往往找不到开源代码或配套数据集,导致算法验证周期被无限拉长,甚至被迫放弃先进方案。
- 忽视场景独立性挑战:容易忽略“场景无关性”这一关键指标,导致模型在训练集表现良好,一旦部署到新路口就彻底失效。
使用 awesome-background-subtraction 后
- 资源获取一站式完成:直接查阅按年份和技术路线(如 Deep Learning、GAN)分类的清单,几分钟内即可锁定如 BSUV-Net 2.0 等 2021 年最新 SOTA 模型。
- 决策路径清晰明确:通过内置的综述论文和基准测试(如 MOR-UAV),快速评估各算法在未见视频中的泛化能力,科学选定技术路线。
- 落地效率显著提升:利用列表中提供的 Source Code 链接和专用数据集,团队在一周内就完成了核心算法的复现与微调。
- 规避常见研发陷阱:参考关于“场景依赖性”的实证研究,提前引入时空数据增强策略,确保模型在多变的真实路况下稳定运行。
awesome-background-subtraction 将原本数月的调研与试错过程压缩至数天,让研发团队能专注于核心业务逻辑而非基础资源搜集。
运行环境要求
未说明
未说明

快速开始
令人惊叹的背景减除
一份精心整理的背景减除论文及相关应用资源列表
计算机视觉会议即将到来的截止日期
- CVPR - 11月16日
目录
基于深度学习的论文
2021年论文, 2020年论文, 2019年论文, 2018年论文, 2017年论文, 2016年论文
2021年论文
- 2021年 - 深度学习框架在变化检测中的实证研究:模型设计、实验框架、挑战与研究需求 (IEEE智能交通系统汇刊)
- 2021年 - BSUV-Net 2.0:适用于视频无关监督背景减除的时空数据增强 (IEEE Access)
- 2021年 - 用于运动目标分割的多帧递归对抗网络 (CVPR-2021)
- 2021年 - 用于场景无关运动目标分割的深度对抗网络 (IEEE信号处理快报)
- 2021年 - 用于交通和监控应用的端到端递归生成对抗网络 (IEEE车辆技术汇刊)
2020年论文
- 2020年 - 图形运动目标分割 (2020年 - IEEE模式分析与机器智能汇刊) 源代码
- 2020年 - 场景独立性的重要性:基于CNN的变化检测中场景依赖与场景独立评估的实证研究 (2020年 - IEEE智能交通系统汇刊)
- 2020年 - 3DCD:一种场景无关的端到端时空特征学习框架,用于未见视频中的变化检测(2020年 - IEEE图像处理汇刊)
- 2020年 - MOR-UAV:无人机视频中运动目标识别的基准数据集及基线 (ACM-MM 2020)
- 2020年 - 用于运动目标分割的端到端边缘聚合网络 (CVPR-2020)
- 2020年 - MotionRec:统一的深度框架,用于运动目标识别 (WACV 2020) 源代码
- 2020年 - BSUV-Net:一种全卷积神经网络,用于未见视频的背景减除(WACV 2020)源代码
- 2020年 - 未见视频的半监督背景减除:图信号总变差的最小化 (ICIP 2020)
2019年论文
期刊论文
- 2019年 - 3DFR:一种用于场景无关变化检测的快速3D特征约简框架(2019年 - IEEE信号处理快报)
- 2019年 - vsEnDec:一种用于前景定位的改进型图像到图像CNN(2019年 - IEEE智能交通系统汇刊)
- 2019年 - 用于背景减除的深度神经网络方法:系统综述与对比评估(2019年 - 神经网络,爱思唯尔)
- 2019年 - 用于PTZ摄像机的全景背景图像生成(2019年 - IEEE图像处理汇刊)
- 2019年 - 基于图像位平面表示的无阈值运动目标检测(2019年 - IEEE智能交通系统汇刊)
- 2019年 - 适用于低成本道路交通监控系统的快速且鲁棒的背景建模技术(2019年 - IEEE智能交通系统汇刊)
- 2019年 - 基于多视角感受野和编码器-解码器DCNN的视频前景提取:面向交通与监控应用(2019年 - IEEE车载技术汇刊)
- 2019年 - 基于自适应三相背景模型的前景分割(2019年 - IEEE智能交通系统汇刊)
- 2019年 - 基于3D CNN-LSTM的图像到图像前景分割(2019年 - IEEE智能交通系统汇刊)
- 2019年 - 夜间恶劣天气条件下运动目标检测的显著特征(2019年 - IEEE视频技术电路与系统汇刊)
- 2019年 - 考虑光照的多任务GAN用于前景分割(2019年 - IEEE Access)
- 2019年 - 利用时空结构稀疏RPCA在复杂场景中检测运动目标(2019年 - IEEE图像处理汇刊)
- 2019年 - 利用一致的运动检测在恶劣天气下优化背景减除(2019年 - 电子成像杂志)
- 2019年 - DeepPBM:基于视频序列的深度概率背景模型估计(2019年 - Arxiv)
- 2019年 - 将背景减除算法与卷积神经网络结合(2019年 - 电子成像杂志)
会议论文
- 2019年 - 一种用于同时进行背景建模和减除的端到端深度学习方法(BMVC 2019)
- 2019年 - 用于弱监督背景减除网络的简单背景减除约束(AVSS 2019)
- 2019年 - 基于上下文信息分离的无监督运动目标检测(CVPR 2019)
- 2019年 - 学会如何在黑暗中看到运动物体(ICCV - 2019)
- 2019年 - 基于运动显著性的生成对抗网络用于水下运动目标分割(ICIP 2019)
- 2019年 - FgGAN:一种级联式非配对学习用于背景估计和前景分割(WACV 2019)
- 2019年 - 鲁棒的变化描述(CVPR-2019)
- 2019年 - 基于在线格拉斯曼鲁棒子空间估计的全景视频分离(ICCV 2019)
- 2019年 - 用于准确车辆检测的快速消除运动阴影技术(WACV 2019)
- 2019年 - 基于L1回归的在线和批量监督背景估计(WACV 2019)
- 2019年 - TU-VDN:特里普拉大学夜间在恶劣室外大气条件下用于运动目标检测的视频数据集(ICIP 2019)
- 2019年 - 使用LBSP和模糊灰度差直方图检测视频中的动态物体(FUZZ-2019)
- 2019年 - 利用张量低秩与不变稀疏分解在光照不连续变化下检测运动目标(CVPR - 2019)
2018年论文
期刊论文
- 2018年 - MSFgNet:一种用于运动目标检测的新型紧凑型端到端深度网络 (2019年 - IEEE智能交通系统汇刊)
- 2018年 - 基于多视角感受野的视频监控前景推理网络 (Arxiv-2018)
- 2018年 - 通过训练三元组网络进行运动特征提取的改变检测 (2018年 - IEEE视频技术电路与系统汇刊)
- 2018年 - 用于红外视频中前景目标检测的多尺度全卷积网络 (2018年 - IEEE地球科学与遥感快报)
- 2018年 - 使用三元组卷积神经网络进行多尺度特征编码的前景分割,源代码 (2018-Arxiv)
- 2018年 - 基于全卷积网络的深度背景建模 (2018年 - IEEE智能交通系统汇刊)
- 2018年 - 用于视频序列背景减除的深度卷积神经网络 (2018年 - Elsevier模式识别杂志)
- 2018年 - 使用卷积神经网络进行多尺度特征编码的前景分割 (2018年 - Elsevier模式识别快报)
- 2018年 - 用于背景减除的三维空洞卷积长短时记忆网络 (2018年 - IEEE Access)
- 2018年 - 一种用于背景减除和前景检测的新框架 (2018年 - Elsevier模式识别杂志)
- 2018年 - 学习用于前景分割的多尺度特征 (2018-Arxiv)
- 2018年 - MPNET:一种用于监控视频中目标检测的端到端深度神经网络 (2018年 - IEEE Access)
会议论文
- 2018年 - CANDID:鲁棒的动态变化检测与确定性更新策略用于动态背景减除 (ICPR-2018)
- 2018年 - 通过视频合成与多尺度循环网络学习背景减除 (ACCV-2018)
- 2018年 - 用于密集时间分类的多尺度循环编码解码网络 (ICPR-2018)
- 2018年 - MsEDNet:用于运动目标检测的多尺度深度显著性学习 (SMC-2018)
- 2018年 - BSCGAN:基于条件生成对抗网络的深度背景减除 (ICIP-2018)
- 2018年 - 使用全卷积语义网络在监控视频中检测前景 (ICIP-2018)
- 2018年 - 复杂场景下基于局部紧凑二值模式的背景减除 (ICPR-2018)
- 2018年 - 具有退化修正假设的共现背景模型,用于强背景变化下的目标检测 (ICPR-2018)
- 2018年 - 通过3D卷积神经网络进行背景减除 (ICPR-2018)
- 2018年 - ReMotENet:用于大规模家庭监控视频的有效相关运动事件检测 (WACV-2018)
2017年论文
- 2017年 - 使用3D卷积神经网络进行端到端视频背景减除
- 2017年 - 利用深度残差网络在监控视频中进行异常检测的前景分割,源代码
- 2017年 - 学习用于弱监督改变检测的深度结构化网络
- 2017年 - 用于背景减除的深度卷积神经网络
- 2017年 - 改变检测中深度神经网络的分析
- 2017年 - 基于生成式UNet的背景建模
- 2017年 - 使用编码解码结构卷积神经网络进行背景减除
- 2017年 - FusionSeg:学习结合运动与外观特征以实现视频中通用对象的全自动分割,源代码
- 2017年 - 用于分割运动物体的交互式深度学习方法,源代码
- 2017年 - 通过两阶段卷积神经网络实现背景重建与前景分割的联合处理
- 2017年 - 用于运动目标检测的像素级深度序列学习
- 2017年 - WiSARDrp用于视频序列中的改变检测 (ESANN-2017)
2016年论文
基于GAN的论文
2018年论文
非深度学习相关的论文
里程碑论文,2018年论文,2017年论文,2016年论文,2015年论文
背景减除领域的里程碑论文
- 2020年 - 场景独立性的重要性:基于CNN的变化检测中场景相关与场景无关评估的实证研究 (2020年 - IEEE智能交通系统汇刊)
- 2015年 - SuBSENSE:一种具有局部自适应灵敏度的通用变化检测方法
- 2012年 - PBAS:带反馈的背景分割——基于像素的自适应分割器
- 2011年 - ViBe:适用于视频序列的通用背景减除算法
- 2006年 - 基于纹理的方法用于背景建模和运动目标检测
- 1999年 - 用于实时跟踪的自适应背景混合模型
2018年的论文
- 2018年 - 一种利用以明度-红-绿-蓝颜色模型定义的缩放系数进行背景建模和前景检测的算法
- 2018年 - M4CD:一种用于智能视觉监控的鲁棒变化检测方法
- 2018年 - CANDID:用于动态背景减除的鲁棒变化动态与确定性更新策略
- 2018年 - ANTIC:用于医学图像检索和变化检测的反同构簇模式
- 2018年 - 用于密集时间分类的多尺度循环编码器-解码器网络
- 2018年 - 一种用于不同颜色空间下视频分析的新颖前景分割方法
- 2018年 - 基于3D卷积神经网络的背景减除
- 2018年 - 复杂场景下背景减除的局部紧凑二值模式
- 2018年 - 无监督深度上下文预测用于背景估计和前景分割
2017年的论文
综述/调查类论文
- 2021年 - 变化检测中深度学习框架的实证综述:模型设计、实验框架、挑战与研究需求 (IEEE智能交通系统汇刊)
- 2019年 - 实际应用中的背景减除:挑战、现有模型及未来方向
- 2018年 - 利用深度学习进行视频前景检测的新趋势
- 2014年 - 用于前景检测的背景建模的传统与最新方法:概述
数据集
- Change Detection Net (CDNet)
- Scene Back Modelling (SBMNet)
- SBI
- SBM-RGBD
- Wallflower
- fish4knowledge
- MARDCT
- MuHavi
- LASIESTA
杰出的研究人员
优秀的资源
项目
欢迎大家贡献!
如果您有任何建议(遗漏的论文、项目、源代码、新论文、关键研究人员、数据集等),请随时编辑并提交请求。(或者直接告诉我论文的标题)
相似工具推荐
stable-diffusion-webui
stable-diffusion-webui 是一个基于 Gradio 构建的网页版操作界面,旨在让用户能够轻松地在本地运行和使用强大的 Stable Diffusion 图像生成模型。它解决了原始模型依赖命令行、操作门槛高且功能分散的痛点,将复杂的 AI 绘图流程整合进一个直观易用的图形化平台。 无论是希望快速上手的普通创作者、需要精细控制画面细节的设计师,还是想要深入探索模型潜力的开发者与研究人员,都能从中获益。其核心亮点在于极高的功能丰富度:不仅支持文生图、图生图、局部重绘(Inpainting)和外绘(Outpainting)等基础模式,还独创了注意力机制调整、提示词矩阵、负向提示词以及“高清修复”等高级功能。此外,它内置了 GFPGAN 和 CodeFormer 等人脸修复工具,支持多种神经网络放大算法,并允许用户通过插件系统无限扩展能力。即使是显存有限的设备,stable-diffusion-webui 也提供了相应的优化选项,让高质量的 AI 艺术创作变得触手可及。
everything-claude-code
everything-claude-code 是一套专为 AI 编程助手(如 Claude Code、Codex、Cursor 等)打造的高性能优化系统。它不仅仅是一组配置文件,而是一个经过长期实战打磨的完整框架,旨在解决 AI 代理在实际开发中面临的效率低下、记忆丢失、安全隐患及缺乏持续学习能力等核心痛点。 通过引入技能模块化、直觉增强、记忆持久化机制以及内置的安全扫描功能,everything-claude-code 能显著提升 AI 在复杂任务中的表现,帮助开发者构建更稳定、更智能的生产级 AI 代理。其独特的“研究优先”开发理念和针对 Token 消耗的优化策略,使得模型响应更快、成本更低,同时有效防御潜在的攻击向量。 这套工具特别适合软件开发者、AI 研究人员以及希望深度定制 AI 工作流的技术团队使用。无论您是在构建大型代码库,还是需要 AI 协助进行安全审计与自动化测试,everything-claude-code 都能提供强大的底层支持。作为一个曾荣获 Anthropic 黑客大奖的开源项目,它融合了多语言支持与丰富的实战钩子(hooks),让 AI 真正成长为懂上
ComfyUI
ComfyUI 是一款功能强大且高度模块化的视觉 AI 引擎,专为设计和执行复杂的 Stable Diffusion 图像生成流程而打造。它摒弃了传统的代码编写模式,采用直观的节点式流程图界面,让用户通过连接不同的功能模块即可构建个性化的生成管线。 这一设计巧妙解决了高级 AI 绘图工作流配置复杂、灵活性不足的痛点。用户无需具备编程背景,也能自由组合模型、调整参数并实时预览效果,轻松实现从基础文生图到多步骤高清修复等各类复杂任务。ComfyUI 拥有极佳的兼容性,不仅支持 Windows、macOS 和 Linux 全平台,还广泛适配 NVIDIA、AMD、Intel 及苹果 Silicon 等多种硬件架构,并率先支持 SDXL、Flux、SD3 等前沿模型。 无论是希望深入探索算法潜力的研究人员和开发者,还是追求极致创作自由度的设计师与资深 AI 绘画爱好者,ComfyUI 都能提供强大的支持。其独特的模块化架构允许社区不断扩展新功能,使其成为当前最灵活、生态最丰富的开源扩散模型工具之一,帮助用户将创意高效转化为现实。
NextChat
NextChat 是一款轻量且极速的 AI 助手,旨在为用户提供流畅、跨平台的大模型交互体验。它完美解决了用户在多设备间切换时难以保持对话连续性,以及面对众多 AI 模型不知如何统一管理的痛点。无论是日常办公、学习辅助还是创意激发,NextChat 都能让用户随时随地通过网页、iOS、Android、Windows、MacOS 或 Linux 端无缝接入智能服务。 这款工具非常适合普通用户、学生、职场人士以及需要私有化部署的企业团队使用。对于开发者而言,它也提供了便捷的自托管方案,支持一键部署到 Vercel 或 Zeabur 等平台。 NextChat 的核心亮点在于其广泛的模型兼容性,原生支持 Claude、DeepSeek、GPT-4 及 Gemini Pro 等主流大模型,让用户在一个界面即可自由切换不同 AI 能力。此外,它还率先支持 MCP(Model Context Protocol)协议,增强了上下文处理能力。针对企业用户,NextChat 提供专业版解决方案,具备品牌定制、细粒度权限控制、内部知识库整合及安全审计等功能,满足公司对数据隐私和个性化管理的高标准要求。
ML-For-Beginners
ML-For-Beginners 是由微软推出的一套系统化机器学习入门课程,旨在帮助零基础用户轻松掌握经典机器学习知识。这套课程将学习路径规划为 12 周,包含 26 节精炼课程和 52 道配套测验,内容涵盖从基础概念到实际应用的完整流程,有效解决了初学者面对庞大知识体系时无从下手、缺乏结构化指导的痛点。 无论是希望转型的开发者、需要补充算法背景的研究人员,还是对人工智能充满好奇的普通爱好者,都能从中受益。课程不仅提供了清晰的理论讲解,还强调动手实践,让用户在循序渐进中建立扎实的技能基础。其独特的亮点在于强大的多语言支持,通过自动化机制提供了包括简体中文在内的 50 多种语言版本,极大地降低了全球不同背景用户的学习门槛。此外,项目采用开源协作模式,社区活跃且内容持续更新,确保学习者能获取前沿且准确的技术资讯。如果你正寻找一条清晰、友好且专业的机器学习入门之路,ML-For-Beginners 将是理想的起点。
ragflow
RAGFlow 是一款领先的开源检索增强生成(RAG)引擎,旨在为大语言模型构建更精准、可靠的上下文层。它巧妙地将前沿的 RAG 技术与智能体(Agent)能力相结合,不仅支持从各类文档中高效提取知识,还能让模型基于这些知识进行逻辑推理和任务执行。 在大模型应用中,幻觉问题和知识滞后是常见痛点。RAGFlow 通过深度解析复杂文档结构(如表格、图表及混合排版),显著提升了信息检索的准确度,从而有效减少模型“胡编乱造”的现象,确保回答既有据可依又具备时效性。其内置的智能体机制更进一步,使系统不仅能回答问题,还能自主规划步骤解决复杂问题。 这款工具特别适合开发者、企业技术团队以及 AI 研究人员使用。无论是希望快速搭建私有知识库问答系统,还是致力于探索大模型在垂直领域落地的创新者,都能从中受益。RAGFlow 提供了可视化的工作流编排界面和灵活的 API 接口,既降低了非算法背景用户的上手门槛,也满足了专业开发者对系统深度定制的需求。作为基于 Apache 2.0 协议开源的项目,它正成为连接通用大模型与行业专有知识之间的重要桥梁。