SOD-CNNs-based-code-summary-

895 150 较难 1 次阅读今天图像

AI 解读由 AI 自动生成，仅供参考

SOD-CNNs-based-code-summary-是一个专注于深度学习显著性目标检测（SOD）的开源资源库，旨在为研究者和开发者提供该领域最新的论文与代码汇总。显著性目标检测致力于让计算机像人眼一样快速识别图像或视频中最引人注目的区域，但在技术快速迭代的背景下，追踪从传统 2D RGB 到复杂的 3D 深度、4D 光场及视频 SOD 等多模态进展颇具挑战。

该项目系统性地整理了涵盖上述所有主流方向的前沿成果，不仅提供了详细的论文列表，还附带了对应的开源代码链接，极大地降低了复现算法和对比实验的门槛。其独特亮点在于更新极为及时，近期已收录了包括 AAAI 2025、PAMI 等顶级会议期刊的最新研究，甚至涵盖了伪装目标检测等相关任务。此外，仓库还提供了数据集下载指引、评估指标说明以及性能排行榜，形成了一站式的学习与研究闭环。

无论是希望快速入门的学生、需要追踪最新技术动态的科研人员，还是正在寻找基线模型进行二次开发的工程师，都能从中获得极具价值的参考。通过这份持续维护的清单，用户可以高效地把握深度学习时代显著性检测技术的发展脉络，加速科研与创新进程。

使用场景

某计算机视觉实验室的研究团队正致力于开发一套适用于视障人士辅助眼镜的实时显著性检测系统，需要快速锁定并复现最适合移动端部署的最新算法。

没有 SOD-CNNs-based-code-summary- 时

文献检索如大海捞针：研究人员需在 arXiv、IEEE、CVPR 等多个分散平台手动搜索"Salient Object Detection"，难以区分哪些是纯理论综述，哪些包含可运行代码。
技术选型盲目低效：面对 2D RGB、3D RGB-D 及光场（Light Field）等多种输入模态，缺乏统一对比视角，容易选错不适合眼镜摄像头的算法架构。
复现成本极高：找到论文后常发现官方代码缺失或链接失效，尤其是针对“视障人群图像”等特定场景的算法，往往浪费数周时间清洗数据却跑不通基线。
前沿动态滞后：难以及时捕捉到如 AAAI'25 或 NeurIPS'24 上关于无监督学习或抗对抗攻击的最新突破，导致研发起点落后于业界水平。

使用 SOD-CNNs-based-code-summary- 后

一站式资源聚合：直接在该仓库中按模态（如 2D/3D/视频）筛选，瞬间获取包含论文与对应 GitHub 代码链接的完整清单，省去跨站搜索时间。
精准匹配应用场景：通过目录快速定位到"WACV 2024 关于视障人士拍摄的图像显著性检测”专题，直接复用经过验证的数据集和基准模型。
复现路径清晰通畅：利用整理好的代码链接和评估指标（Evaluation Metrics）说明，团队在两天内即可成功跑通基线模型并开始在自有数据上调优。
紧跟学术最前沿：借助持续更新的标记（如新增的 AAAI'25 论文），团队立即引入了最新的稀疏视图增强 Transformer 框架，显著提升了系统在复杂环境下的鲁棒性。

SOD-CNNs-based-code-summary- 将原本需要数周的文献调研与代码验证周期压缩至几天，让研发团队能专注于核心算法的创新而非基础资源的搜集。

运行环境要求

GPU

未说明

内存

未说明

依赖

notes该仓库是一个基于深度学习的显著性检测（SOD）论文和代码汇总列表，涵盖了 2D、3D、视频及光场等多个方向。它本身不是一个单一的独立软件工具，因此 README 中未提供统一的运行环境、依赖库或硬件需求。具体的环境配置需参考列表中各个独立项目（如 CamoDiffusion, 3SD, MINet 等）对应的代码仓库链接及其各自的 README 文件。

python未说明

快速开始

基于CNN的显著性检测论文列表

本仓库主要聚焦于基于深度学习的显著性检测方法（2D RGB、3D RGB-D/T、视频显著性检测及4D光场显著性检测），并提供相关代码和论文的汇总。我们希望这个仓库能够帮助您更好地理解深度学习时代的显著性检测技术。

:heavy_exclamation_mark: 2D SOD：新增两篇AAAI 2025论文，以及一篇PAMI论文。
:heavy_exclamation_mark: 3D SOD：新增两篇AAAI 2025论文，以及一篇ACM MM 2024论文。
:heavy_exclamation_mark: LF SOD：新增两篇IEEE TCSVT论文，以及一篇arXiv 2024预印本论文。
:heavy_exclamation_mark: 视频SOD：新增一篇NeurIPS 2024论文。

伪装目标检测是与显著性检测密切相关的任务，其论文摘要可参见此链接。

:running: 我们将持续更新本仓库。 :running:

总体

2D RGB显著性检测

2025

序号	发表期刊	标题	链接
:triangular_flag_on_post: 01	PAMI	用于伪装与显著目标检测的条件扩散模型	论文/代码
:triangular_flag_on_post: 02	AAAI	MSV-PCT：用于点云中显著目标检测的多稀疏视角增强Transformer框架	论文/代码
:triangular_flag_on_post: 03	AAAI	利用加法神经网络探索显著目标检测	论文/代码

2024

序号	会议/期刊	标题	链接
01	WACV	基于分割频率统计的无监督和半监督共显著目标检测	论文/代码
02	WACV	3SD：无需标签的自监督显著性检测	论文/代码
03	WACV	从注视点学习显著性	论文/代码
04	WACV	针对视障人士拍摄图像的显著目标检测	论文/代码
05	WACV	面向遥感显著目标检测的对抗云攻击防御	论文/代码
06	ICASSP	零样本共显著目标检测框架	论文/代码
07	CVPR	VSCode：基于2D提示学习的通用视觉显著与伪装目标检测	论文/代码
08	AAAI	WeakPCSOD：克服框标注偏差的弱监督点云显著目标检测	论文/代码
09	AAAI	SeqRank：显著对象的序列排序	论文/代码
10	AAAI	在连续尖峰流中寻找视觉显著性	论文/代码
11	CVPR	COSALPURE：从群体图像中学习概念以实现鲁棒的共显著性	论文/代码
12	IJCAI	基于知识迁移的统一无监督显著目标检测	论文/代码
13	TII	MINet：用于带钢表面缺陷实时显著目标检测的多尺度交互网络	论文/代码
14	ICML	尺寸不变性至关重要：重新思考不平衡多目标显著目标检测的指标与损失	论文/代码
15	ICML	Spider：面向上下文依赖概念分割的统一框架	论文/代码
16	ICML	潜入水下：Segment Anything Model引导下的水下显著实例分割及大规模数据集	论文/代码
17	CVPR	用于显著目标排序的领域分离图神经网络	论文/代码
18	CVPR	利用人眼注视推进显著性排序：数据集、模型与基准	论文/代码
19	CVPR	面向无示例类别增量学习的任务自适应显著性指导	论文/代码
20	CVPR	无监督显著实例检测	论文/代码
21	CVPR	DiffSal：面向扩散显著性预测的音视频联合学习	论文/代码
22	TMM	ADMNet：注意力引导的密集多尺度网络用于轻量级显著目标检测	论文/代码
23	ACMMM	多尺度且细节增强的Segment Anything Model用于显著目标检测	论文/代码
24	ACMMM	实例级全景视听显著性检测与排序	论文/代码
25	ECCV	CONDA：用于共显著目标检测的凝聚型深度关联学习	论文/代码
26	ECCV	基于多尺度特征对应关系的自监督共显著目标检测	论文/代码
27	ECCV	SHINE：面向组合式时序定位的显著性感知分层负采样排序	论文/代码
28	ECCV	DSMix：基于畸变诱导显著图的无参考图像质量评估预训练	论文/代码
29	ECCV	基于显著性的自适应掩码：重访标记动态以增强预训练	论文/代码
30	ECCV	基于潜在扩散的数据增强用于显著性预测	论文/代码
31	PAMI	分而治之：用于RGB-T显著目标检测的融合三流网络	论文/代码

2023

序号	会议/期刊	标题	链接
01	AAAI	LeNo：具有可学习噪声的对抗鲁棒显著性目标检测网络	论文/代码
02	AAAI	像素即一切：用于显著性目标检测的对抗轨迹集成主动学习	论文/代码
03	AAAI	用于协同显著性目标检测的记忆辅助对比一致性学习	论文/代码
04	TNNLS	用于360°全方位图像中显著性目标检测的多投影融合与精炼网络	论文/代码
05	IEEE TIP	提升更广的感受野以增强显著性目标检测	论文/代码
06	IEEE TPAMI	基于协同表示净化的协同显著性目标检测	论文/代码
07	CVPR	无监督显著性目标检测中的纹理引导显著性蒸馏	论文/代码
08	CVPR	用于协同显著性目标检测的判别式协同显著性和背景挖掘Transformer	论文/代码
09	CVPR	Sketch2Saliency：从人类草图中学习检测显著性目标	论文/代码
10	CVPR	通过基于显著性的无监督预训练提升低数据量实例分割性能	论文/代码
11	CVPR	像素、区域与物体：显著性目标检测的多重增强	论文/代码
12	CVPR	基于不确定性感知的群体交换掩码的协同显著性目标检测	论文/代码
13	CVPR	显著性目标检测模型的分布不确定性建模	论文/代码
14	ACM MM	用于高分辨率显著性目标检测的循环多尺度Transformer	论文/代码
15	TOMM	PAV-SOD：面向全景视听显著性检测的新任务	论文/代码
16	ICCV	基于反事实的显著性图：迈向神经网络的视觉对比解释	论文/代码
17	ACM MM	360°显著性目标检测中的畸变感知Transformer	论文/代码
18	ACM MM	基于自监督自顶向下上下文的端到端无监督显著性检测	论文/代码
19	ACM MM	基于密集金字塔Transformer的分区式显著性排序	论文/代码
20	ACM MM	基于语义级共识提取与分散的协同显著性目标检测	论文/代码
21	TMM	向完整且细节保留的显著性目标检测迈进	论文/代码
22	arXiv	基于适应性提示学习的统一模态显著性目标检测	论文/代码
23	arXiv	一体化：RGB、RGB-D和RGB-T显著性目标检测	论文/代码
24	NeurIPS	深度显著性模型学到了关于视觉注意的什么？	论文/代码
25	PAMI	CADC++：用于协同显著性目标检测的先进共识感知动态卷积	论文/代码
26	IEEE TIP	USOD10K：一个新的水下显著性目标检测基准数据集	论文/代码
27	IEEE TMM	基于光谱驱动的混合频率网络用于高光谱显著性目标检测	论文/代码
28	IEEE TIP	重新思考目标显著性排序：一种全新的全流程处理范式	论文/代码

2022

序号	会议/期刊	标题	链接
01	AAAI	基于不确定性感知伪标签学习的无监督域适应显著目标检测	论文/代码
02	AAAI	用于无监督显著目标检测的因果去偏框架	论文/代码
03	AAAI	基于能量模型的生成式协同显著性预测	论文/代码
04	AAAI	基于点监督的弱监督显著目标检测	论文/代码
05	AAAI	TRACER：极端注意力引导的显著目标追踪网络	论文/代码
06	AAAI	我能找到你！基于边界引导的分离注意力网络用于伪装目标检测	论文/代码
07	WACV	用于精确显著目标检测的递归轮廓-显著性融合网络	论文/代码
08	IEEE TPAMI	PoolNet+：探索池化在显著目标检测中的潜力	论文/代码
09	IEEE TPAMI	一种高效模型用于研究显著目标检测的语义	论文/代码
10	IEEE TGRS	基于特征相关性的光学遥感图像轻量级显著目标检测	论文/代码
11	TOMM	将显著性检测解耦为级联细节建模与主体填充	论文/代码
12	TMM	针对弱监督显著目标检测的噪声敏感对抗学习	论文/代码
13	ArXiv	显著目标检测、深度估计和轮廓提取的联合学习	论文/代码
14	ArXiv	用于分组分割的统一Transformer框架：共同分割、共同显著性检测和视频显著目标检测	论文/代码
15	IEEE TCyb	用于光学遥感图像中显著目标检测的邻近上下文协调网络	论文/代码
16	IEEE TCyb	用于光学遥感图像中显著目标检测的边缘引导循环定位网络	论文/代码
17	IEEE TCSVT	用于显著目标检测的渐进式双注意力残差网络	论文/代码
18	IEEE TCyb	用于共同显著性检测的全局与局部协同学习	论文/代码
19	ArXiv	用于生成式显著性检测的能量基先验	论文/代码
20	IEEE TIP	EDN：通过极低采样率网络进行显著目标检测	论文/代码
21	IEEE TPAMI	通过完整性学习进行显著目标检测	论文/代码
22	IEEE TCSVT	TCNet：通过Transformer与CNN并行交互进行共同显著性检测	论文/代码
23	ArXiv	激活到显著性：为无监督显著目标检测构建高质量标签	论文/代码
24	CVPR	放大与缩小：用于伪装目标检测的混合尺度三元组网络	论文/代码
25	CVPR	你能发现变色龙吗？针对共同显著性检测的对抗性伪装图像	论文/代码
26	CVPR	民主很重要：用于共同显著性检测的全面特征挖掘	论文/代码
27	CVPR	用于单阶段高分辨率显著性检测的金字塔嫁接网络	论文/代码
28	CVPR	用于减少视觉干扰的深度显著性先验	论文/代码
29	CVPR	用于深度无监督显著性检测的多源不确定性挖掘	论文/代码
30	CVPR	用于显著性排序的双向对象-上下文优先级学习	论文/代码
31	CVPR	文本是否会在电商图像上吸引注意力：一个新的显著性预测数据集和方法	论文/代码
32	CVPRW	用于显著性检测的金字塔式注意力	论文/代码
33	CVPRW	带有谱聚类投票的无监督显著目标检测	论文/代码
34	ECCV	KD-SCFNet：通过知识蒸馏实现更准确高效的显著目标检测	论文/代码
35	ECCV	点云中的显著目标检测	论文/代码
36	PR	BiconNet：一种保留边缘的连通性导向显著目标检测方法	论文/代码
37	IEEE TCyb	DNA：用于显著目标检测的深度监督非线性聚合	论文/代码
38	ACMM	合成数据监督下的显著目标检测	论文/代码
39	IEEE TCSVT	用于显著目标检测的混合标签弱监督学习框架	论文/代码
40	CVPRW	带有谱聚类投票的无监督显著目标检测	论文/代码
41	IEEE TMM	适用于360°全方位图像的视图感知显著目标检测	论文/代码
42	ACCV	重新审视图像金字塔结构以用于高分辨率显著目标检测	论文/代码
43	ECCV	通过生成式核进行显著性层次建模以用于显著目标检测	论文/代码
44	IEEE TIP	通过动态尺度路由进行显著目标检测	论文/代码
45	NeurIPS	MOVE：无监督可移动物体分割与检测	论文/代码
46	PR	BiconNet：一种保留边缘的连通性导向显著目标检测方法	论文/代码

2021

序号	会议/期刊	标题	链接
01	AAAI	基于局部显著性一致性的结构一致性弱监督显著目标检测	论文/代码
02	AAAI	用于显著目标检测的金字塔特征收缩	论文/代码
03	AAAI	全局定位，局部分割：一种带有知识回顾网络的渐进式架构用于显著目标检测	论文/代码
04	AAAI	多尺度图融合用于协同显著性检测	论文/代码
05	AAAI	通过读者感知的主题建模和显著性检测生成多样化评论	论文/代码
06	ICIP	多尺度IoU：一种用于评估具有精细结构的显著目标检测的指标	论文/代码
07	TCSVT	基于显著目标瞬间识别的弱监督显著性检测	论文/代码
08	TIP	SAMNet：用于轻量级显著目标检测的立体注意多尺度网络	论文/代码
09	IJCAI	C2FNet：用于伪装目标检测的上下文感知跨层融合网络	论文/代码
10	CVPR	铁路不是火车：将显著性作为伪像素监督用于弱监督语义分割	论文/代码
11	CVPR	用于人员搜索的原型引导显著性特征学习	论文/代码
12	CVPR	网格显著性：独立的感知度量还是图像显著性的衍生品？	论文/代码
13	CVPR	基于显著图像的类别无关学习的弱监督实例分割	论文/代码
14	CVPR	DeepACG：基于语义感知对比Gromov-Wasserstein距离的协同显著性检测	论文/代码
15	CVPR	基于显著性图的对象检测器黑盒解释	论文/代码
16	CVPR	从语义类别到注视点：一种新颖的弱监督视觉-听觉显著性检测方法	论文/代码
17	CVPR	CAMERAS：用于图像显著性检测的增强分辨率与保真度类激活映射	论文/代码
18	CVPR	显著性引导的图像转换	论文/代码
19	CVPR	用于协同显著目标检测的群体协作学习	论文/代码
20	CVPR	不确定性感知的显著目标与伪装目标联合检测	论文/代码
21	ACMM	Auto-MSFNet：用于显著目标检测的多尺度融合网络搜索	论文/代码
22	IEEE TIP	用于显著目标检测的分解与补全网络	论文/代码
23	ICCV	视觉显著性Transformer	论文/代码
24	ICCV	解耦高质量显著目标检测	论文/代码
25	ICCV	iNAS：面向设备的显著目标检测的整数型NAS	论文/代码
26	ICCV	场景上下文感知的显著目标检测	论文/代码
27	ICCV	MFNet：用于弱监督显著目标检测的多滤波器指令网络	论文/代码
28	ICCV	带位置保留注意力的显著对象排序	论文/代码
29	ICCV	总结与搜索：学习共识感知的动态卷积用于协同显著性检测	论文/代码
30	IEEE TIP	带净化机制和结构相似性损失的显著目标检测	论文/代码
31	ACMM	补充三边解码器用于快速准确的显著目标检测	论文/代码
32	NeurIPS	基于能量模型潜在空间的学习型生成视觉Transformer用于显著性预测	论文/代码
33	NeurIPS	为时空图神经网络发现动态显著区域	论文/代码
34	IEEE TIP	用于显著目标检测的渐进式自引导损失	论文/代码
35	IEEE TMM	密集注意力引导的级联网络用于带钢表面缺陷的显著目标检测	论文/代码
36	IEEE TIP	重新思考用于显著目标检测的U型结构	论文/代码

2020年

序号	会议/期刊	标题	链接
01	AAAI	用于显著性目标检测的渐进式特征精炼网络	论文/代码
02	AAAI	用于显著性目标检测的全局上下文感知渐进聚合网络	论文/代码
03	AAAI	F3Net：融合、反馈与聚焦用于显著性目标检测	论文/代码
04	AAAI	基于对抗域适应的多光谱显著性目标检测	论文/代码
05	AAAI	多类型自注意力引导的退化显著性检测	论文/代码
06	CVPR	基于涂鸦标注的弱监督显著性目标检测	论文/代码
07	CVPR	深入探讨协同显著性目标检测	论文/代码
08	CVPR	用于显著性目标检测的多尺度交互网络	论文/代码
09	CVPR	用于准确且快速显著性检测的交互式双流解码器	论文/代码
10	CVPR	显著性目标检测的标签解耦框架	论文/代码
11	CVPR	带有注意力图聚类的自适应图卷积网络用于协同显著性检测	论文/代码
12	ECCV	参数量仅为10万的高效显著性目标检测	论文/代码
13	ECCV	n参考迁移学习用于显著性预测	论文/代码
14	ECCV	梯度诱导的协同显著性检测	论文/代码
13	ECCV	基于交替反向传播从噪声标签中学习噪声感知编码器-解码器用于显著性检测	论文/代码
15	ECCV	抑制与平衡：一种用于显著性目标检测的简单门控网络	论文/代码
16	IEEE TIP	用于同时检测显著性目标、边缘和骨架的动态特征集成	论文/代码
17	IEEE TIP	CAGNet：面向显著性目标检测的内容感知引导	论文/代码
18	IEEE TCYB	基于层次化视觉感知学习的轻量级显著性目标检测	论文/代码
19	NeurIPS	CoADNet：用于协同显著性目标检测的协作式聚合与分发网络	论文/代码
20	NeurIPS	基于对抗式节奏学习的低成本显著性目标检测	论文/代码
21	NeurIPS	ICNet：用于协同显著性检测的内部显著性相关性网络	论文/代码

2019

序号	会议/期刊	标题	链接
01	CVPR	AFNet：面向边界感知显著目标检测的注意力反馈网络	论文/代码
02	CVPR	BASNet：边界感知显著目标检测	论文/代码
03	CVPR	CPD：用于准确快速显著目标检测的级联部分解码器	论文/代码
04	CVPR	多源弱监督下的显著性检测	论文/代码
05	CVPR	MLMSNet：一种基于交织多监督的显著目标检测互学习方法	论文/代码
06	CVPR	CapSal：利用字幕生成增强显著目标检测语义	论文/代码
07	CVPR	PoolNet：一种基于简单池化的实时显著目标检测设计	论文/代码
08	CVPR	用于显著目标检测的迭代式协同自顶向下与自底向上推理网络	论文/代码
09	CVPR	用于显著性检测的金字塔特征注意力网络	论文/代码
10	AAAI	用于显著目标检测的深度嵌入特征	论文/代码
11	ICIP	基于深度层次化上下文聚合与多层监督的显著目标检测	论文/代码
12	IEEE TCSVT	AADF-Net：用于显著目标检测的注意力扩张特征聚合	论文/代码
13	IEEE TCyb	ROSA：对抗攻击下的鲁棒显著目标检测	论文/代码
14	arXiv	DSAL-GAN：基于去噪的生成对抗网络显著性预测	论文/代码
15	arXiv	SAC-Net：用于显著目标检测的空间衰减上下文	论文/代码
16	arXiv	SE2Net：用于显著目标检测的双目边缘增强网络	论文/代码
17	arXiv	用于显著目标检测的区域细化网络	论文/代码
18	arXiv	轮廓损失：面向显著目标分割的边界感知学习	论文/代码
19	arXiv	OGNet：带有输出引导注意力模块的显著目标检测	论文/代码
20	arXiv	边缘引导的非局部全卷积网络用于显著目标检测	论文/代码
21	ICCV	FLoss：优化无阈值显著目标检测的F度量	论文/代码
22	ICCV	用于显著目标检测的堆叠交叉细化网络	论文/代码
23	ICCV	选择性还是不变性：边界感知显著目标检测	论文/代码
24	ICCV	HRSOD：迈向高分辨率显著目标检测	论文/代码
25	ICCV	EGNet：用于显著目标检测的边缘引导网络	论文/代码
26	ICCV	显著目标检测中联合深度特征与预测精炼的结构化建模	论文/代码
27	ICCV	利用深度部件-目标关系进行显著目标检测	论文/代码
28	NeurIPS	基于自监督的深度鲁棒无监督显著性预测	论文/代码
29	CVPR	基于金字塔注意力和显著边缘的显著目标检测	论文/代码

2018年

序号	发表会议/期刊	标题	链接
01	CVPR	用于显著性目标检测的双向消息传递模型	论文/代码
02	CVPR	PiCANet：学习像素级上下文注意力进行显著性检测	论文/代码
03	CVPR	PAGR：渐进式注意力引导循环网络用于显著性目标检测	论文/代码
04	CVPR	学习提升显著性检测器性能	论文/代码
05	CVPR	全局检测，局部精修：一种新颖的显著性检测方法	论文/代码
06	CVPR	基于注视点预测驱动的显著性目标检测	论文/代码
07	IJCAI	R3Net：用于显著性检测的递归残差精修网络	论文/代码
08	IJCAI	LFR：无损特征反射的显著性目标检测	论文/代码
09	ECCV	显著性目标检测中的轮廓知识迁移	论文/代码
10	ECCV	用于显著性目标检测的反向注意力	论文/代码
11	IEEE TIP	一种无监督的博弈论方法用于显著性检测	论文/代码
12	arXiv	敏捷护身符：基于上下文注意力的实时显著性目标检测	论文/代码
13	arXiv	HyperFusion-Net：用于显著性目标检测的密集反射融合	论文/代码
14	arXiv	(TBOS)一石三鸟：显著性目标分割、边缘检测和骨架提取的统一框架	论文/代码
15	CVPR	深度无监督显著性检测：多噪声标签视角	论文/代码

2017年

序号	发表会议/期刊	标题	链接
01	CVPR	DSS：具有短连接的深度监督显著性目标检测	论文/代码
02	CVPR	用于显著性目标检测的非局部深层特征	论文/代码
03	CVPR	在图像级别监督下学习检测显著性目标	论文/代码
04	CVPR	SalGAN：利用对抗网络进行视觉显著性预测	论文/代码
05	ICCV	用于检测图像中显著性目标的分阶段精修模型	论文/代码
06	ICCV	Amulet：聚合多层级卷积特征用于显著性目标检测	论文/代码
07	ICCV	学习不确定卷积特征以实现精确的显著性检测	论文/代码
08	ICCV	融合监督：迈向深度显著性目标检测器的无监督学习	论文/代码

2016年

序号	发表会议/期刊	标题	链接
01	CVPR	DHSNet：用于显著性目标检测的深度层次化显著性网络	论文/代码
02	CVPR	ELD：结合编码的低层距离图与高层特征的深度显著性	论文/代码
03	ECCV	RFCN：利用循环全卷积网络进行显著性检测	论文/代码

3D RGB-D/T 显著性检测

2025年

序号	发表会议/期刊	标题	链接
:triangular_flag_on_post: 01	AAAI	DiMSOD：基于扩散的多模态显著性目标检测框架	论文/代码
:triangular_flag_on_post: 02	AAAI	SMR-Net：语义引导的互增强网络用于跨模态图像融合和显著性目标检测	论文/代码

2024

序号	发表期刊/会议	标题	链接
01	ICASSP	基于显著性增强特征融合的多尺度RGB-D显著目标检测网络	论文/代码
02	IJCV	用于RGB-D显著目标检测的跨模态融合与渐进解码网络	论文/代码
03	TMM	UniTR：基于统一Transformer框架的共目标与多模态显著性检测	论文/代码
04	IEEE TIP	面向V-D-T显著目标检测的质量感知选择性融合网络	论文/代码
05	IEEE TCSVT	用于多模态显著目标检测的学习型自适应融合库	论文/代码
06	IEEE TMM	无对齐RGBT显著目标检测：语义引导的非对称相关网络及统一基准	论文/代码
07	ACMMM	基于RGB-热数据的双模态显著目标检测后门攻击	论文/代码
08	ECCV	CoLA：条件丢弃与语言驱动的鲁棒双模态显著目标检测	论文/代码

2023

序号	发表期刊/会议	标题	链接
01	TCSVT	HRTransNet：基于HRFormer的双模态显著目标检测	论文/代码
02	IEEE TIP	CAVER：用于双模态显著目标检测的跨模态视图混合Transformer	论文/代码
03	IEEE TIP	LSNet：用于RGB-热图像中显著目标检测的轻量级空间增强网络	论文/代码
04	ICME	手绘标注监督下的RGB-T显著目标检测	论文/代码
05	TCSVT	用于弱监督RGB-D显著目标检测的互信息正则化	论文/代码
06	Information Fusion	一种交互式强化范式的红外-可见光图像联合融合与显著目标检测	论文/代码
07	IEEE TMM	CATNet：用于RGB-D显著目标检测的级联聚合Transformer网络	论文/代码
08	ACM MM	用于RGB-D显著目标检测的点感知交互与CNN诱导精炼网络	论文/代码
09	IEEE TIP	用于RGBD显著目标检测的深度注入框架	论文/代码
10	ACM MM	模态特征——生成RGB-D显著目标检测训练集时需考虑的新关键因素	论文/代码
11	ACM MM	RGB-D和RGB-T显著目标检测的显著性原型	论文/代码
12	NeurIPS	DVSOD：RGB-D视频中的显著目标检测	论文/代码

2022

序号	期刊/会议	标题	链接
01	CVMJ	保持特异性的RGB-D显著性检测	论文/代码
02	AAAI	针对RGB-D显著目标检测的自监督预训练	论文/代码
03	IEEE TPAMI	MobileSal：极高效的RGB-D显著目标检测	论文/代码
04	IEEE TIP	利用未标注的RGB图像提升RGB-D显著性检测性能	论文/代码
05	IEEE TIP	学习用于RGB-D显著性检测的判别性跨模态特征	论文/代码
06	IEEE TIP	基于预测一致性训练和主动涂鸦增强的弱监督RGB-D显著目标检测	论文/代码
07	ICLR	从深度中促进显著性：深度无监督RGB-D显著性检测	论文/代码
08	ArXiv	DFTR：用于显著目标检测的深度监督分层特征融合Transformer	论文/代码
09	ArXiv	GroupTransNet：用于RGB-D显著目标检测的组变换网络	论文/代码
10	ArXiv	CAVER：用于双模态显著目标检测的跨模态视图混合Transformer	论文/代码
11	PR	具有多尺度聚合的编码器深度交织网络，用于RGB-D显著目标检测	论文/代码
12	CVPRW	用于显著性检测的金字塔注意力机制	论文/代码
13	TMM	用于RGB-D显著目标检测的深度诱导差距缩小网络：一种交互、引导与精炼方法	论文/代码
14	TMM	C2DFNet：用于RGB-D显著目标检测的交叉动态滤波器网络	论文/代码
15	ArXiv	基于双Swin Transformer的互交互网络，用于RGB-D显著目标检测	论文/代码
16	IEEE TCSVT	用于鲁棒RGB-热显著目标检测的跨协作融合编码器网络	论文/代码
17	IEEE TIP	使用Transformer学习隐式类别知识，用于RGB-D协同显著目标检测	论文/代码
18	ACMM	受深度启发的无监督RGB-D显著目标检测中的标签挖掘	论文/代码
19	3DV	用于显著性检测的鲁棒RGB-D融合	论文/代码
20	ArXiv	受深度质量启发的特征操作，用于高效RGB-D和视频显著目标检测	论文/代码
21	ECCV	SPSN：用于RGB-D显著目标检测的超像素原型采样网络	论文/代码
22	ECCV	MVSalNet：多视角增强用于RGB-D显著目标检测	论文/代码
23	IJCV	可学习的深度敏感注意力，结合多模态融合架构搜索，用于深度RGB-D显著性检测	论文/代码
24	IEEE TNNLS	用于RGB-D显著目标检测及更广泛应用的三维卷积神经网络	论文/代码
25	IEEE TIP	通过模态感知解码器改进RGB-D显著目标检测	论文/代码
26	IEEE TIP	CIR-Net：用于RGB-D显著目标检测的跨模态交互与精炼	论文/代码
27	IEEE TCSVT	HRTransNet：HRFormer驱动的双模态显著目标检测	论文/代码
28	IEEE TMM	热成像在RGB-T显著目标检测中真的总是重要吗？	论文/代码
29	IEEE TCSVT	用于RGB-D和RGB-T显著目标检测的模态诱导迁移融合网络	论文/代码
30	IEEE TIP	显著目标检测、深度估计和轮廓提取的联合学习	论文/代码
31	IJCV	深入研究校准深度以实现精确的RGB-D显著目标检测	论文/代码
32	IEEE TCSVT	MoADNet：用于实时轻量级RGB-D显著目标检测的移动非对称双流网络	论文/代码

2021年

序号	会议/期刊	标题	链接
01	CVPR	基于深度敏感注意力机制和自动多模态融合的深度RGB-D显著性检测	论文/代码
02	CVPR	校准型RGB-D显著目标检测	论文/代码
03	AAAI	基于3D卷积神经网络的RGB-D显著目标检测	论文/代码
04	IEEE TIP	用于RGB-D显著目标检测的层次化交替交互网络	论文/代码
05	IEEE TIP	CDNet：用于RGB-D显著目标检测的互补深度网络	论文/代码
06	IEEE TIP	具有普遍目标感知的RGB-D显著目标检测	论文/代码
07	ICME	BTS-Net：用于RGB-D显著目标检测的双向迁移与选择网络	论文/代码
08	ACMM	受深度质量启发的特征操控用于高效RGB-D显著目标检测	论文/代码
09	ACMM	TriTransNet RGB-D显著目标检测，采用三元Transformer嵌入网络	论文/代码
10	ICCV	基于级联互信息最小化的RGB-D显著性检测	论文/代码
11	ICCV	保留特异性的RGB-D显著性检测	论文/代码
12	ACMM	用于RGB-D显著目标检测的跨模态差异交互网络	论文/代码
13	IEEE TIP	用于RGB-D显著目标检测的动态选择网络	论文/代码
14	IJCV	基于CNN的RGB-D显著目标检测：学习、选择与融合	论文/代码
15	NeurIPS	用于弱监督RGB-D显著目标检测的联合语义挖掘	论文/代码
16	IEEE TMM	CCAFNet：用于检测RGB-D图像中显著目标的交叉流与跨尺度自适应融合网络	论文/代码
17	IEEE TETCI	APNet：用于全天候RGB-T显著目标检测的对抗学习辅助与感知重要性融合网络	论文/代码

2020年

序号	发表期刊/会议	标题	链接
01	IEEE TIP	ICNet：基于RGB-D的显著性目标检测信息转换网络	论文/代码
02	CVPR	JL-DCF：用于RGB-D显著性目标检测的联合学习与密集协作融合框架	论文/代码
03	CVPR	UC-Net：基于条件变分自编码器的不确定性启发式RGB-D显著性检测	论文/代码
04	CVPR	A2dele：用于高效RGB-D显著性目标检测的自适应注意力深度蒸馏器	论文/代码
05	CVPR	选择、补充与聚焦：面向RGB-D显著性检测的方法	论文/代码
06	CVPR	学习选择性自互注意机制用于RGB-D显著性检测	论文/代码
07	ECCV	基于协同学习的精确RGB-D显著性目标检测	论文/代码
08	ECCV	用于RGB-D显著性目标检测的跨模态加权网络	论文/代码
09	ECCV	BBS-Net：采用分叉骨干策略的RGB-D显著性目标检测网络	论文/代码
10	ECCV	用于RGB-D显著性目标检测的层次化动态滤波网络	论文/代码
11	ECCV	用于RGB-D显著性目标检测的渐进引导交替精炼网络	论文/代码
12	ECCV	基于跨模态调制与选择的RGB-D显著性目标检测	论文/代码
13	ECCV	用于RGB-D显著性目标检测的级联图神经网络	论文/代码
14	ECCV	用于鲁棒实时RGB-D显著性目标检测的单流网络	论文/代码
15	ECCV	用于精确RGB-D显著性检测的非对称双流架构	论文/代码
16	ACMM	显著性目标检测真的需要深度信息吗？	论文/代码
17	ACMM	MMNet：用于RGB-D显著性目标检测的多阶段多尺度融合网络	论文/代码
18	ACMM	差异化处理下的特征再整合：一种自顶向下且适应性的融合网络用于RGB-D显著性目标检测	论文/代码
19	IEEE TIP	基于解耦跨模态融合的RGBD显著性目标检测	论文/代码
20	IEEE TIP	利用两阶段深度估计和选择性深度融合提升RGB-D图像中的显著性检测	论文/代码
21	IEEE TIP	针对RGB-D显著性目标检测的深度潜力感知门控注意力网络	论文/代码
22	IEEE TNNLS	D3Net：重新思考RGB-D显著性目标检测——模型、数据集与大规模基准测试	论文/代码
23	IEEE TCSVT	再探RGB-T显著性目标检测中的特征融合	论文/代码

2019年

序号	发表期刊/会议	标题	链接
01	ICCV	DMRA：深度诱导的多尺度循环注意力网络用于显著性检测	论文/代码
02	CVPR	CPFP：对比先验与流体金字塔融合用于RGBD显著性目标检测	论文/代码
03	IEEE TIP	用于RGB-D显著性目标检测的三流注意力感知网络	论文/代码
04	IEEE PR	具有多尺度多路径及跨模态交互的多模态融合网络，用于RGB-D显著性目标检测	论文/代码
05	IEEE Access	AFNet：用于RGB-D显著性目标检测的适应性融合网络	论文/代码
06	IEEE TIP	通过融合多层CNN特征进行RGB-T显著性目标检测	论文/代码
07	IEEE TMM	通过协作图学习进行RGB-T图像显著性检测	论文/代码

2018年

序号	发表期刊/会议	标题	链接
01	CVPR	PCA：用于RGB-D显著性目标检测的渐进式互补感知融合网络	论文/代码
02	IEEE TIP	基于多约束特征匹配和跨标签传播的RGBD图像协同显著性检测	论文/代码
03	ICME	PDNet：先验模型引导的深度增强显著性目标检测网络	论文/代码

2017年

序号	发表期刊/会议	标题	链接
01	ICCV	利用背景包围、深度对比和自顶向下特征学习RGB-D显著性目标检测	论文/代码
02	IEEE TIP	DF：基于深度融合的RGB-D显著性目标检测	论文/代码
03	IEEE TCyb	CTMF：基于跨视图迁移和多视角融合的CNN驱动RGB-D显著性检测	论文/代码

传统方法

序号	发表期刊/会议	标题	链接
01	MTA	基于多核提升与融合的RGB-D协同显著性检测	论文/代码
02	ICCV17	基于中心暗通道先验的创新显著性目标检测	论文/代码
03	IEEE SPL	基于深度置信度分析和多线索融合的立体图像显著性检测	论文/代码
04	IEEE SPL	基于自助法聚类的RGB-D协同显著性检测	论文/代码
05	CVPR	利用全局先验进行RGB-D显著性检测	论文/代码

4D光场显著性检测

序号	发表期刊/会议	标题	链接
01	TOMM	MCA：基于多线索的光场显著性检测	论文/代码
02	IJCAI	DILF：深入探究光场的显著性检测	论文/代码
03	CVPR	WSC：用于显著性检测的加权稀疏编码框架	论文/代码
04	IEEE PAMI	光场上的显著性检测	论文/代码
05	ICCV	基于深度学习的光场显著性检测	论文/代码
06	NeurIPS	面向记忆的解码器用于光场显著目标检测	论文/代码
07	AAAI	利用与替换：一种非对称双流架构用于多功能光场显著性检测	论文/代码
08	IEEE TCSVT	用于光场显著目标检测的多任务协同网络	论文/代码
09	ArXiv	DUT-LFSaliency：多功能数据集及光场到RGB的显著性检测	论文/代码
10	ArXiv	学习协同注意力用于光场显著目标检测	论文/代码
11	ArXiv	CMA-Net：用于光场显著目标检测的级联互注意网络	论文/代码
12	IEEE TCyB	PANet：用于光场显著目标检测的补丁感知网络	论文/代码
13	ACMM21	用于光场显著目标检测的遮挡感知双向引导网络	论文/代码
14	ICCV21	基于双重局部图学习和互惠引导的光场显著性检测	论文/代码
15	CVPR22	从像素级噪声标签中学习：光场显著性检测的新视角	论文/代码
16	NC	MEANet：用于光场显著目标检测的多模态边缘感知网络	论文/代码
17	IEEE TIP	探索空间相关性用于光场显著性检测：从单视图扩展	论文/代码
18	IEEE TIP	基于图神经网络的光场几何辅助显著目标检测	论文/代码
19	ACMM	LFBCNet：用于显著目标检测的光场边界感知级联交互网络	论文/代码
20	IEEE TIP	光场上的弱监督显著目标检测	论文/代码
21	IEEE TPAMI	光场显著性检测的全面基准测试与新模型	论文/代码
22	ICME23	用于光场显著目标检测的引导焦点堆栈精炼网络	论文/代码
23	IEEE TCSVT	LFTransNet：通过可学习权重描述符进行光场显著目标检测	论文/代码
24	IEEE TCSVT	基于互补与判别交互网络的稀疏视图光场显著目标检测	论文/代码
:triangular_flag_on_post: 25	arXiv	LF Tracy：一种统一的单管道方法用于光场相机中的显著目标检测	论文/代码

视频显著目标检测

2024

序号	发表期刊/会议	标题	链接
:triangular_flag_on_post: 01	AAAI	一种运动感知的时空图用于视频显著目标排序	论文/代码

2023

序号	发表期刊/会议	标题	链接
01	AAAI	全景视频显著目标检测与Ambisonic音频引导	论文/代码

2022

序号	发表	标题	链接
01	AAAI	只推理一次：用于引用视频目标分割的跨模态元迁移学习	论文/代码
02	AAAI	基于交互式Transformer的孪生网络用于视频目标分割	论文/代码
03	AAAI	迭代选择一个简单的参考帧使无监督视频目标分割更容易	论文/代码
04	AAAI	用于视频目标分割的可靠传播-校正调制	论文/代码
05	WACV	基于对比特征和注意力模块的视频显著目标检测	论文/代码
06	ICIP	用于视频显著目标检测的深度协同三模态网络	论文/代码
07	ArXiv	从无标签视频中逐步学习视频显著目标检测	论文/代码
08	ArXiv	重新思考视频显著目标排序	论文/代码
09	ACMM	基于点监督的弱监督视频显著目标检测	论文/代码
10	ECCV	用于无监督视频目标分割的层次化特征对齐网络	论文/代码
11	ECCV	XMem：基于阿特金森-希夫林记忆模型的长期视频目标分割	论文/代码
12	ACMM	用于无监督视频目标分割的双向密集时空特征传播网络	论文/代码
13	NeurIPS	基于不确定性引导伪标签的半监督视频显著目标检测	论文/代码

2021

序号	发表	标题	链接
01	CVPR	弱监督视频显著目标检测	论文/代码
02	ArXiv	基于自适应局部-全局精炼的视频显著目标检测	论文/代码
03	ICIP	用于视频显著目标检测的引导与教学网络	论文/代码
04	ACMM	多源融合与自动预测器选择用于零样本视频目标分割	论文/代码
05	ICCV	用于视频显著目标检测的动态上下文敏感滤波网络	论文/代码
06	ICCV	用于视频目标分割的全双工策略	论文/代码
07	ICCV	用于无监督视频目标分割的深度传输网络	论文/代码
08	IEEE TIP	探索丰富高效的时空交互以实现实时视频显著目标检测	论文/代码

2020

序号	发表	标题	链接
01	CVPR	STAViS：时空音视显著性网络	论文/代码
02	ECCV	统一的图像和视频显著性建模	论文/代码
03	ECCV	测量视频显著性中时间特征的重要性	论文/代码
04	ECCV	TENet：用于视频显著目标检测的三重激励网络	论文/代码
05	IEEE TIP	学习视频显著目标检测中的长期结构依赖关系	论文/代码
06	IEEE Access	用于视频显著目标检测的交叉互补融合网络	论文/代码
07	AAAI	用于快速视频显著目标检测的金字塔约束自注意力网络	论文/代码

2019

序号	发表	标题	链接
01	ICCV	基于运动引导注意力的视频显著目标检测	论文/代码
02	ICCV	使用伪标签的半监督视频显著目标检测	论文/代码
03	ICCV	用于视频显著性检测的时序聚合空间编码器-解码器网络	论文/代码
04	ICCV	RANet：快速视频目标分割的排序注意力网络	论文/代码
05	CVPR	将更多注意力转向视频显著目标检测	论文/代码
06	CVPR	通过视觉注意力学习无监督视频目标分割	论文/代码
07	CVPR	看得更多，了解得更多：基于协同注意力暹罗网络的无监督视频目标分割	论文/代码
08	IEEE TIP	基于长期时空信息的鲁棒视频显著性检测改进	论文/代码

2018

序号	发表	标题	链接
01	ECCV	金字塔扩张深层CoonvLSTM用于视频显著目标检测	论文/代码
02	ECCV	DeepVS：一种基于深度学习的视频显著性预测方法	论文/代码
03	CVPR	重访视频显著性：大规模基准与新模型	论文/代码
04	CVPR	流引导循环神经网络编码器用于视频显著目标检测	论文/代码
05	IEEE TIP	基于全卷积网络的视频显著目标检测	论文/代码

2017

序号	发表	标题	链接
01	IEEE TIP	利用HEVC特征学习视频显著性检测	论文/代码

早期方法

序号	发表	标题	链接
01	IEEE TIP15	显著目标检测：一个基准	论文/代码
02	IEEE TCSVT18	综合信息下的视觉显著性检测综述	论文/代码
03	ACM TIST18	共同显著性检测算法综述：基础、应用与挑战	论文/代码
04	IEEE TSP18	显著及类别特定目标检测的先进深度学习技术：综述	论文/代码
05	IJCV18	注意力系统：综述	论文/项目
06	ECCV18	杂乱中的显著对象：将显著目标检测推向前沿	论文/代码
07	CVM18	显著目标检测：综述	论文/代码
08	IEEE TNNLS19	深度学习下的显著目标检测：综述	论文/代码
09	arXiv19	深度学习时代的显著目标检测——深入综述	论文/代码
10	CVM21	RGB-D显著目标检测：综述	论文/代码

本部分内容感谢 Deng-Ping Fan 和 Tao Zhou。

深度学习时代的显著目标检测：深入综述。论文链接。
这是另一位作者发布的论文列表。这里
RGB-D显著目标检测：综述。项目链接。

SOD数据集下载

2D SOD数据集下载1 或下载2, 下载3。
3D SOD数据集下载。
4D SOD数据集下载。
视频SOD数据集下载。

评估指标

显着性图评估。
此链接提供了显着目标检测的所有评估指标，包括 E-measure、S-measure、F-measure、MAE 分数以及 PR 曲线或柱状图指标。您可以在这里找到。
显着性数据集评估。
该仓库可以计算二值显着性数据集上目标区域和目标对比度的比率。该工具箱包含两个评估指标，分别是 obj(object).area 和 obj.contrast。
您可以在这里找到。

与最先进方法的比较

这里包含几乎所有 2D 显着目标检测算法的性能对比。
这里包含几乎所有 3D RGB-D 显着目标检测算法的性能对比。

AI会议截止日期

相关AI会议截止日期
 相关AI会议接受率

SOD-CNNs-based-code-summary 快速上手指南

本仓库是一个基于深度学习的显著性目标检测（Saliency Object Detection, SOD）资源汇总列表，涵盖 2D RGB、3D RGB-D/T、视频及光场显著性检测等方向。它主要提供相关论文的链接和代码库地址，旨在帮助开发者快速定位最新的研究成果和开源实现。

注意：本仓库本身不包含统一的推理代码或模型权重，而是指向各个独立论文项目的代码库。以下指南将指导您如何浏览列表并运行具体的算法代码。

环境准备

由于列表中包含了从 2023 年到 2025 年的多种不同架构（如 Transformer、Diffusion Models、CNNs 等），不同项目对环境的要求略有差异。建议准备以下通用基础环境：

操作系统: Linux (推荐 Ubuntu 18.04/20.04) 或 macOS
Python: 3.8 或更高版本
深度学习框架: PyTorch 1.9+ (绝大多数项目基于 PyTorch)
硬件要求: 支持 CUDA 的 NVIDIA GPU (显存建议 8GB 以上，部分大模型需 16GB+)
前置依赖:
- Git
- pip 或 conda (推荐使用 conda 管理虚拟环境)

安装步骤

由于这是一个资源索引库，您不需要安装"SOD-CNNs-based-code-summary"本身，而是需要克隆您感兴趣的具体项目代码。以下是通用的操作流程：

1. 克隆具体项目代码

在 README 的表格中找到您需要的论文（例如 2024 年 CVPR 的 3SD 或 2025 年 AAAI 的 MSV-PCT），点击 Code 链接进入其 GitHub 页面，然后执行：

git clone <目标项目的 GitHub 地址>
cd <目标项目文件夹名称>

2. 创建虚拟环境并安装依赖

大多数项目都提供了 requirements.txt 文件。建议使用以下命令安装依赖（国内用户可使用清华源加速）：

# 创建虚拟环境 (以 pytorch_sod 为例)
conda create -n pytorch_sod python=3.8 -y
conda activate pytorch_sod

# 安装 PyTorch (根据CUDA版本选择，此处为示例，请访问 pytorch.org 获取最新命令)
# 国内加速镜像示例 (清华源)
pip install torch torchvision torchaudio --index-url https://pypi.tuna.tsinghua.edu.cn/simple

# 安装项目特定依赖
pip install -r requirements.txt -i https://pypi.tuna.tsinghua.edu.cn/simple

3. 下载数据集

显著性检测任务通常需要特定的数据集（如 DUT-OMRON, ECSSD, PASCAL-S 等）。

查看具体项目 README 中的 "Data Preparation" 章节。
部分项目在 README 中提供了百度网盘或 Google Drive 链接，请下载后放置到项目指定的 data/ 或 dataset/ 目录下。

基本使用

每个项目的具体运行命令可能不同，但通常遵循“训练”和“测试/推理”两种模式。以下以典型的 SOD 项目结构为例：

1. 单张图片推理 (Testing/Inference)

大多数项目提供预训练模型用于直接测试。

# 典型命令格式 (请替换为具体项目的脚本名和参数)
python test.py --model_path checkpoints/best_model.pth --img_path data/test_images/example.jpg --save_dir results/

--model_path: 指向下载的预训练权重文件 (.pth)。
--img_path: 输入图片路径。
--save_dir: 生成的显著性图保存路径。

2. 模型训练 (Training)

如果您希望复现论文结果或在自定义数据上训练：

# 典型命令格式
python train.py --config configs/config.yaml --gpu_ids 0 --batch_size 16

--config: 配置文件，包含网络结构和超参数。
--gpu_ids: 指定使用的 GPU 编号。

3. 评估指标 (Evaluation)

生成预测图后，通常需要使用官方提供的评估脚本来计算 MAE, F-measure, S-measure 等指标：

python eval.py --pred_dir results/ --gt_dir data/gt_masks/

提示：对于列表中带有 :triangular_flag_on_post: 标记的最新论文（如 2025 年 AAAI/PAMI 文章），请优先查看其原仓库的 README.md，因为新提出的架构可能需要特殊的依赖或数据处理流程。

常见问题

显著性检测中的 max-F、F-measure 和 mean F-measure 有什么区别？应该对比哪个指标？

如何获取 3D (STEREO) 或 RGBD 数据集？原始尺寸图像在哪里下载？

论文中提到的 DF 数据集下载链接失效了怎么办？

新手入门显著性检测（SOD）领域应该如何阅读论文？需要关注代码吗？

不同训练集设置（如仅用 DUT 训练 vs 混合 NJU2K+NLPR+DUT 训练）下的 DUT 测试结果对比是否公平？

如何在汇总表中添加已发表的最新论文和代码？

找不到某篇特定论文（如 GCPANet）的 PDF 文件怎么办？

相似工具推荐

openclaw

OpenClaw 是一款专为个人打造的本地化 AI 助手，旨在让你在自己的设备上拥有完全可控的智能伙伴。它打破了传统 AI 助手局限于特定网页或应用的束缚，能够直接接入你日常使用的各类通讯渠道，包括微信、WhatsApp、Telegram、Discord、iMessage 等数十种平台。无论你在哪个聊天软件中发送消息，OpenClaw 都能即时响应，甚至支持在 macOS、iOS 和 Android 设备上进行语音交互，并提供实时的画布渲染功能供你操控。这款工具主要解决了用户对数据隐私、响应速度以及“始终在线”体验的需求。通过将 AI 部署在本地，用户无需依赖云端服务即可享受快速、私密的智能辅助，真正实现了“你的数据，你做主”。其独特的技术亮点在于强大的网关架构，将控制平面与核心助手分离，确保跨平台通信的流畅性与扩展性。 OpenClaw 非常适合希望构建个性化工作流的技术爱好者、开发者，以及注重隐私保护且不愿被单一生态绑定的普通用户。只要具备基础的终端操作能力（支持 macOS、Linux 及 Windows WSL2），即可通过简单的命令行引导完成部署。如果你渴望拥有一个懂你

★ 349.3k|★★★☆☆|5天前

Agent开发框架图像

stable-diffusion-webui

stable-diffusion-webui 是一个基于 Gradio 构建的网页版操作界面，旨在让用户能够轻松地在本地运行和使用强大的 Stable Diffusion 图像生成模型。它解决了原始模型依赖命令行、操作门槛高且功能分散的痛点，将复杂的 AI 绘图流程整合进一个直观易用的图形化平台。无论是希望快速上手的普通创作者、需要精细控制画面细节的设计师，还是想要深入探索模型潜力的开发者与研究人员，都能从中获益。其核心亮点在于极高的功能丰富度：不仅支持文生图、图生图、局部重绘（Inpainting）和外绘（Outpainting）等基础模式，还独创了注意力机制调整、提示词矩阵、负向提示词以及“高清修复”等高级功能。此外，它内置了 GFPGAN 和 CodeFormer 等人脸修复工具，支持多种神经网络放大算法，并允许用户通过插件系统无限扩展能力。即使是显存有限的设备，stable-diffusion-webui 也提供了相应的优化选项，让高质量的 AI 艺术创作变得触手可及。

★ 162.1k|★★★☆☆|5天前

开发框架图像Agent

ComfyUI

ComfyUI 是一款功能强大且高度模块化的视觉 AI 引擎，专为设计和执行复杂的 Stable Diffusion 图像生成流程而打造。它摒弃了传统的代码编写模式，采用直观的节点式流程图界面，让用户通过连接不同的功能模块即可构建个性化的生成管线。这一设计巧妙解决了高级 AI 绘图工作流配置复杂、灵活性不足的痛点。用户无需具备编程背景，也能自由组合模型、调整参数并实时预览效果，轻松实现从基础文生图到多步骤高清修复等各类复杂任务。ComfyUI 拥有极佳的兼容性，不仅支持 Windows、macOS 和 Linux 全平台，还广泛适配 NVIDIA、AMD、Intel 及苹果 Silicon 等多种硬件架构，并率先支持 SDXL、Flux、SD3 等前沿模型。无论是希望深入探索算法潜力的研究人员和开发者，还是追求极致创作自由度的设计师与资深 AI 绘画爱好者，ComfyUI 都能提供强大的支持。其独特的模块化架构允许社区不断扩展新功能，使其成为当前最灵活、生态最丰富的开源扩散模型工具之一，帮助用户将创意高效转化为现实。

★ 108.3k|★★☆☆☆|今天

开发框架图像Agent

gemini-cli

gemini-cli 是一款由谷歌推出的开源 AI 命令行工具，它将强大的 Gemini 大模型能力直接集成到用户的终端环境中。对于习惯在命令行工作的开发者而言，它提供了一条从输入提示词到获取模型响应的最短路径，无需切换窗口即可享受智能辅助。这款工具主要解决了开发过程中频繁上下文切换的痛点，让用户能在熟悉的终端界面内直接完成代码理解、生成、调试以及自动化运维任务。无论是查询大型代码库、根据草图生成应用，还是执行复杂的 Git 操作，gemini-cli 都能通过自然语言指令高效处理。它特别适合广大软件工程师、DevOps 人员及技术研究人员使用。其核心亮点包括支持高达 100 万 token 的超长上下文窗口，具备出色的逻辑推理能力；内置 Google 搜索、文件操作及 Shell 命令执行等实用工具；更独特的是，它支持 MCP（模型上下文协议），允许用户灵活扩展自定义集成，连接如图像生成等外部能力。此外，个人谷歌账号即可享受免费的额度支持，且项目基于 Apache 2.0 协议完全开源，是提升终端工作效率的理想助手。

★ 100.8k|★★☆☆☆|昨天

插件Agent图像

LLMs-from-scratch

LLMs-from-scratch 是一个基于 PyTorch 的开源教育项目，旨在引导用户从零开始一步步构建一个类似 ChatGPT 的大型语言模型（LLM）。它不仅是同名技术著作的官方代码库，更提供了一套完整的实践方案，涵盖模型开发、预训练及微调的全过程。该项目主要解决了大模型领域“黑盒化”的学习痛点。许多开发者虽能调用现成模型，却难以深入理解其内部架构与训练机制。通过亲手编写每一行核心代码，用户能够透彻掌握 Transformer 架构、注意力机制等关键原理，从而真正理解大模型是如何“思考”的。此外，项目还包含了加载大型预训练权重进行微调的代码，帮助用户将理论知识延伸至实际应用。 LLMs-from-scratch 特别适合希望深入底层原理的 AI 开发者、研究人员以及计算机专业的学生。对于不满足于仅使用 API，而是渴望探究模型构建细节的技术人员而言，这是极佳的学习资源。其独特的技术亮点在于“循序渐进”的教学设计：将复杂的系统工程拆解为清晰的步骤，配合详细的图表与示例，让构建一个虽小但功能完备的大模型变得触手可及。无论你是想夯实理论基础，还是为未来研发更大规模的模型做准备

★ 90.1k|★★★☆☆|4天前

语言模型图像Agent

Deep-Live-Cam

Deep-Live-Cam 是一款专注于实时换脸与视频生成的开源工具，用户仅需一张静态照片，即可通过“一键操作”实现摄像头画面的即时变脸或制作深度伪造视频。它有效解决了传统换脸技术流程繁琐、对硬件配置要求极高以及难以实时预览的痛点，让高质量的数字内容创作变得触手可及。这款工具不仅适合开发者和技术研究人员探索算法边界，更因其极简的操作逻辑（仅需三步：选脸、选摄像头、启动），广泛适用于普通用户、内容创作者、设计师及直播主播。无论是为了动画角色定制、服装展示模特替换，还是制作趣味短视频和直播互动，Deep-Live-Cam 都能提供流畅的支持。其核心技术亮点在于强大的实时处理能力，支持口型遮罩（Mouth Mask）以保留使用者原始的嘴部动作，确保表情自然精准；同时具备“人脸映射”功能，可同时对画面中的多个主体应用不同面孔。此外，项目内置了严格的内容安全过滤机制，自动拦截涉及裸露、暴力等不当素材，并倡导用户在获得授权及明确标注的前提下合规使用，体现了技术发展与伦理责任的平衡。

★ 88.9k|★★★☆☆|5天前

开发框架图像Agent