SOD-CNNs-based-code-summary-

GitHub
895 150 较难 1 次阅读 今天图像
AI 解读 由 AI 自动生成,仅供参考

SOD-CNNs-based-code-summary-是一个专注于深度学习显著性目标检测(SOD)的开源资源库,旨在为研究者和开发者提供该领域最新的论文与代码汇总。显著性目标检测致力于让计算机像人眼一样快速识别图像或视频中最引人注目的区域,但在技术快速迭代的背景下,追踪从传统 2D RGB 到复杂的 3D 深度、4D 光场及视频 SOD 等多模态进展颇具挑战。

该项目系统性地整理了涵盖上述所有主流方向的前沿成果,不仅提供了详细的论文列表,还附带了对应的开源代码链接,极大地降低了复现算法和对比实验的门槛。其独特亮点在于更新极为及时,近期已收录了包括 AAAI 2025、PAMI 等顶级会议期刊的最新研究,甚至涵盖了伪装目标检测等相关任务。此外,仓库还提供了数据集下载指引、评估指标说明以及性能排行榜,形成了一站式的学习与研究闭环。

无论是希望快速入门的学生、需要追踪最新技术动态的科研人员,还是正在寻找基线模型进行二次开发的工程师,都能从中获得极具价值的参考。通过这份持续维护的清单,用户可以高效地把握深度学习时代显著性检测技术的发展脉络,加速科研与创新进程。

使用场景

某计算机视觉实验室的研究团队正致力于开发一套适用于视障人士辅助眼镜的实时显著性检测系统,需要快速锁定并复现最适合移动端部署的最新算法。

没有 SOD-CNNs-based-code-summary- 时

  • 文献检索如大海捞针:研究人员需在 arXiv、IEEE、CVPR 等多个分散平台手动搜索"Salient Object Detection",难以区分哪些是纯理论综述,哪些包含可运行代码。
  • 技术选型盲目低效:面对 2D RGB、3D RGB-D 及光场(Light Field)等多种输入模态,缺乏统一对比视角,容易选错不适合眼镜摄像头的算法架构。
  • 复现成本极高:找到论文后常发现官方代码缺失或链接失效,尤其是针对“视障人群图像”等特定场景的算法,往往浪费数周时间清洗数据却跑不通基线。
  • 前沿动态滞后:难以及时捕捉到如 AAAI'25 或 NeurIPS'24 上关于无监督学习或抗对抗攻击的最新突破,导致研发起点落后于业界水平。

使用 SOD-CNNs-based-code-summary- 后

  • 一站式资源聚合:直接在该仓库中按模态(如 2D/3D/视频)筛选,瞬间获取包含论文与对应 GitHub 代码链接的完整清单,省去跨站搜索时间。
  • 精准匹配应用场景:通过目录快速定位到"WACV 2024 关于视障人士拍摄的图像显著性检测”专题,直接复用经过验证的数据集和基准模型。
  • 复现路径清晰通畅:利用整理好的代码链接和评估指标(Evaluation Metrics)说明,团队在两天内即可成功跑通基线模型并开始在自有数据上调优。
  • 紧跟学术最前沿:借助持续更新的标记(如新增的 AAAI'25 论文),团队立即引入了最新的稀疏视图增强 Transformer 框架,显著提升了系统在复杂环境下的鲁棒性。

SOD-CNNs-based-code-summary- 将原本需要数周的文献调研与代码验证周期压缩至几天,让研发团队能专注于核心算法的创新而非基础资源的搜集。

运行环境要求

GPU

未说明

内存

未说明

依赖
notes该仓库是一个基于深度学习的显著性检测(SOD)论文和代码汇总列表,涵盖了 2D、3D、视频及光场等多个方向。它本身不是一个单一的独立软件工具,因此 README 中未提供统一的运行环境、依赖库或硬件需求。具体的环境配置需参考列表中各个独立项目(如 CamoDiffusion, 3SD, MINet 等)对应的代码仓库链接及其各自的 README 文件。
python未说明
SOD-CNNs-based-code-summary- hero image

快速开始

基于CNN的显著性检测论文列表

本仓库主要聚焦于基于深度学习的显著性检测方法(2D RGB、3D RGB-D/T、视频显著性检测及4D光场显著性检测),并提供相关代码和论文的汇总。我们希望这个仓库能够帮助您更好地理解深度学习时代的显著性检测技术。


:heavy_exclamation_mark: 2D SOD:新增两篇AAAI 2025论文,以及一篇PAMI论文。
:heavy_exclamation_mark: 3D SOD:新增两篇AAAI 2025论文,以及一篇ACM MM 2024论文。
:heavy_exclamation_mark: LF SOD:新增两篇IEEE TCSVT论文,以及一篇arXiv 2024预印本论文。
:heavy_exclamation_mark: 视频SOD:新增一篇NeurIPS 2024论文。

伪装目标检测 是与显著性检测密切相关的任务,其论文摘要可参见此链接

:running: 我们将持续更新本仓库。 :running:


内容:

  1. 论文列表概览
  2. 2D RGB显著性检测
  3. 3D RGB-D/T显著性检测
  4. 4D光场显著性检测
  5. 视频显著性检测
  6. 综述及早期方法
  7. SOD数据集下载
  8. 评估指标
  9. SOD排行榜

总体

头像

2D RGB显著性检测

2025

序号 发表期刊 标题 链接
:triangular_flag_on_post: 01 PAMI 用于伪装与显著目标检测的条件扩散模型 论文/代码
:triangular_flag_on_post: 02 AAAI MSV-PCT:用于点云中显著目标检测的多稀疏视角增强Transformer框架 论文/代码
:triangular_flag_on_post: 03 AAAI 利用加法神经网络探索显著目标检测 论文/代码

2024

序号 会议/期刊 标题 链接
01 WACV 基于分割频率统计的无监督和半监督共显著目标检测 论文/代码
02 WACV 3SD:无需标签的自监督显著性检测 论文/代码
03 WACV 从注视点学习显著性 论文/代码
04 WACV 针对视障人士拍摄图像的显著目标检测 论文/代码
05 WACV 面向遥感显著目标检测的对抗云攻击防御 论文/代码
06 ICASSP 零样本共显著目标检测框架 论文/代码
07 CVPR VSCode:基于2D提示学习的通用视觉显著与伪装目标检测 论文/代码
08 AAAI WeakPCSOD:克服框标注偏差的弱监督点云显著目标检测 论文/代码
09 AAAI SeqRank:显著对象的序列排序 论文/代码
10 AAAI 在连续尖峰流中寻找视觉显著性 论文/代码
11 CVPR COSALPURE:从群体图像中学习概念以实现鲁棒的共显著性 论文/代码
12 IJCAI 基于知识迁移的统一无监督显著目标检测 论文/代码
13 TII MINet:用于带钢表面缺陷实时显著目标检测的多尺度交互网络 论文/代码
14 ICML 尺寸不变性至关重要:重新思考不平衡多目标显著目标检测的指标与损失 论文/代码
15 ICML Spider:面向上下文依赖概念分割的统一框架 论文/代码
16 ICML 潜入水下:Segment Anything Model引导下的水下显著实例分割及大规模数据集 论文/代码
17 CVPR 用于显著目标排序的领域分离图神经网络 论文/代码
18 CVPR 利用人眼注视推进显著性排序:数据集、模型与基准 论文/代码
19 CVPR 面向无示例类别增量学习的任务自适应显著性指导 论文/代码
20 CVPR 无监督显著实例检测 论文/代码
21 CVPR DiffSal:面向扩散显著性预测的音视频联合学习 论文/代码
22 TMM ADMNet:注意力引导的密集多尺度网络用于轻量级显著目标检测 论文/代码
23 ACMMM 多尺度且细节增强的Segment Anything Model用于显著目标检测 论文/代码
24 ACMMM 实例级全景视听显著性检测与排序 论文/代码
25 ECCV CONDA:用于共显著目标检测的凝聚型深度关联学习 论文/代码
26 ECCV 基于多尺度特征对应关系的自监督共显著目标检测 论文/代码
27 ECCV SHINE:面向组合式时序定位的显著性感知分层负采样排序 论文/代码
28 ECCV DSMix:基于畸变诱导显著图的无参考图像质量评估预训练 论文/代码
29 ECCV 基于显著性的自适应掩码:重访标记动态以增强预训练 论文/代码
30 ECCV 基于潜在扩散的数据增强用于显著性预测 论文/代码
31 PAMI 分而治之:用于RGB-T显著目标检测的融合三流网络 论文/代码

2023

序号 会议/期刊 标题 链接
01 AAAI LeNo:具有可学习噪声的对抗鲁棒显著性目标检测网络 论文/代码
02 AAAI 像素即一切:用于显著性目标检测的对抗轨迹集成主动学习 论文/代码
03 AAAI 用于协同显著性目标检测的记忆辅助对比一致性学习 论文/代码
04 TNNLS 用于360°全方位图像中显著性目标检测的多投影融合与精炼网络 论文/代码
05 IEEE TIP 提升更广的感受野以增强显著性目标检测 论文/代码
06 IEEE TPAMI 基于协同表示净化的协同显著性目标检测 论文/代码
07 CVPR 无监督显著性目标检测中的纹理引导显著性蒸馏 论文/代码
08 CVPR 用于协同显著性目标检测的判别式协同显著性和背景挖掘Transformer 论文/代码
09 CVPR Sketch2Saliency:从人类草图中学习检测显著性目标 论文/代码
10 CVPR 通过基于显著性的无监督预训练提升低数据量实例分割性能 论文/代码
11 CVPR 像素、区域与物体:显著性目标检测的多重增强 论文/代码
12 CVPR 基于不确定性感知的群体交换掩码的协同显著性目标检测 论文/代码
13 CVPR 显著性目标检测模型的分布不确定性建模 论文/代码
14 ACM MM 用于高分辨率显著性目标检测的循环多尺度Transformer 论文/代码
15 TOMM PAV-SOD:面向全景视听显著性检测的新任务 论文/代码
16 ICCV 基于反事实的显著性图:迈向神经网络的视觉对比解释 论文/代码
17 ACM MM 360°显著性目标检测中的畸变感知Transformer 论文/代码
18 ACM MM 基于自监督自顶向下上下文的端到端无监督显著性检测 论文/代码
19 ACM MM 基于密集金字塔Transformer的分区式显著性排序 论文/代码
20 ACM MM 基于语义级共识提取与分散的协同显著性目标检测 论文/代码
21 TMM 向完整且细节保留的显著性目标检测迈进 论文/代码
22 arXiv 基于适应性提示学习的统一模态显著性目标检测 论文/代码
23 arXiv 一体化:RGB、RGB-D和RGB-T显著性目标检测 论文/代码
24 NeurIPS 深度显著性模型学到了关于视觉注意的什么? 论文/代码
25 PAMI CADC++:用于协同显著性目标检测的先进共识感知动态卷积 论文/代码
26 IEEE TIP USOD10K:一个新的水下显著性目标检测基准数据集 论文/代码
27 IEEE TMM 基于光谱驱动的混合频率网络用于高光谱显著性目标检测 论文/代码
28 IEEE TIP 重新思考目标显著性排序:一种全新的全流程处理范式 论文/代码

2022

序号 会议/期刊 标题 链接
01 AAAI 基于不确定性感知伪标签学习的无监督域适应显著目标检测 论文/代码
02 AAAI 用于无监督显著目标检测的因果去偏框架 论文/代码
03 AAAI 基于能量模型的生成式协同显著性预测 论文/代码
04 AAAI 基于点监督的弱监督显著目标检测 论文/代码
05 AAAI TRACER:极端注意力引导的显著目标追踪网络 论文/代码
06 AAAI 我能找到你!基于边界引导的分离注意力网络用于伪装目标检测 论文/代码
07 WACV 用于精确显著目标检测的递归轮廓-显著性融合网络 论文/代码
08 IEEE TPAMI PoolNet+:探索池化在显著目标检测中的潜力 论文/代码
09 IEEE TPAMI 一种高效模型用于研究显著目标检测的语义 论文/代码
10 IEEE TGRS 基于特征相关性的光学遥感图像轻量级显著目标检测 论文/代码
11 TOMM 将显著性检测解耦为级联细节建模与主体填充 论文/代码
12 TMM 针对弱监督显著目标检测的噪声敏感对抗学习 论文/代码
13 ArXiv 显著目标检测、深度估计和轮廓提取的联合学习 论文/代码
14 ArXiv 用于分组分割的统一Transformer框架:共同分割、共同显著性检测和视频显著目标检测 论文/代码
15 IEEE TCyb 用于光学遥感图像中显著目标检测的邻近上下文协调网络 论文/代码
16 IEEE TCyb 用于光学遥感图像中显著目标检测的边缘引导循环定位网络 论文/代码
17 IEEE TCSVT 用于显著目标检测的渐进式双注意力残差网络 论文/代码
18 IEEE TCyb 用于共同显著性检测的全局与局部协同学习 论文/代码
19 ArXiv 用于生成式显著性检测的能量基先验 论文/代码
20 IEEE TIP EDN:通过极低采样率网络进行显著目标检测 论文/代码
21 IEEE TPAMI 通过完整性学习进行显著目标检测 论文/代码
22 IEEE TCSVT TCNet:通过Transformer与CNN并行交互进行共同显著性检测 论文/代码
23 ArXiv 激活到显著性:为无监督显著目标检测构建高质量标签 论文/代码
24 CVPR 放大与缩小:用于伪装目标检测的混合尺度三元组网络 论文/代码
25 CVPR 你能发现变色龙吗?针对共同显著性检测的对抗性伪装图像 论文/代码
26 CVPR 民主很重要:用于共同显著性检测的全面特征挖掘 论文/代码
27 CVPR 用于单阶段高分辨率显著性检测的金字塔嫁接网络 论文/代码
28 CVPR 用于减少视觉干扰的深度显著性先验 论文/代码
29 CVPR 用于深度无监督显著性检测的多源不确定性挖掘 论文/代码
30 CVPR 用于显著性排序的双向对象-上下文优先级学习 论文/代码
31 CVPR 文本是否会在电商图像上吸引注意力:一个新的显著性预测数据集和方法 论文/代码
32 CVPRW 用于显著性检测的金字塔式注意力 论文/代码
33 CVPRW 带有谱聚类投票的无监督显著目标检测 论文/代码
34 ECCV KD-SCFNet:通过知识蒸馏实现更准确高效的显著目标检测 论文/代码
35 ECCV 点云中的显著目标检测 论文/代码
36 PR BiconNet:一种保留边缘的连通性导向显著目标检测方法 论文/代码
37 IEEE TCyb DNA:用于显著目标检测的深度监督非线性聚合 论文/代码
38 ACMM 合成数据监督下的显著目标检测 论文/代码
39 IEEE TCSVT 用于显著目标检测的混合标签弱监督学习框架 论文/代码
40 CVPRW 带有谱聚类投票的无监督显著目标检测 论文/代码
41 IEEE TMM 适用于360°全方位图像的视图感知显著目标检测 论文/代码
42 ACCV 重新审视图像金字塔结构以用于高分辨率显著目标检测 论文/代码
43 ECCV 通过生成式核进行显著性层次建模以用于显著目标检测 论文/代码
44 IEEE TIP 通过动态尺度路由进行显著目标检测 论文/代码
45 NeurIPS MOVE:无监督可移动物体分割与检测 论文/代码
46 PR BiconNet:一种保留边缘的连通性导向显著目标检测方法 论文/代码

2021

序号 会议/期刊 标题 链接
01 AAAI 基于局部显著性一致性的结构一致性弱监督显著目标检测 论文/代码
02 AAAI 用于显著目标检测的金字塔特征收缩 论文/代码
03 AAAI 全局定位,局部分割:一种带有知识回顾网络的渐进式架构用于显著目标检测 论文/代码
04 AAAI 多尺度图融合用于协同显著性检测 论文/代码
05 AAAI 通过读者感知的主题建模和显著性检测生成多样化评论 论文/代码
06 ICIP 多尺度IoU:一种用于评估具有精细结构的显著目标检测的指标 论文/代码
07 TCSVT 基于显著目标瞬间识别的弱监督显著性检测 论文/代码
08 TIP SAMNet:用于轻量级显著目标检测的立体注意多尺度网络 论文/代码
09 IJCAI C2FNet:用于伪装目标检测的上下文感知跨层融合网络 论文/代码
10 CVPR 铁路不是火车:将显著性作为伪像素监督用于弱监督语义分割 论文/代码
11 CVPR 用于人员搜索的原型引导显著性特征学习 论文/代码
12 CVPR 网格显著性:独立的感知度量还是图像显著性的衍生品? 论文/代码
13 CVPR 基于显著图像的类别无关学习的弱监督实例分割 论文/代码
14 CVPR DeepACG:基于语义感知对比Gromov-Wasserstein距离的协同显著性检测 论文/代码
15 CVPR 基于显著性图的对象检测器黑盒解释 论文/代码
16 CVPR 从语义类别到注视点:一种新颖的弱监督视觉-听觉显著性检测方法 论文/代码
17 CVPR CAMERAS:用于图像显著性检测的增强分辨率与保真度类激活映射 论文/代码
18 CVPR 显著性引导的图像转换 论文/代码
19 CVPR 用于协同显著目标检测的群体协作学习 论文/代码
20 CVPR 不确定性感知的显著目标与伪装目标联合检测 论文/代码
21 ACMM Auto-MSFNet:用于显著目标检测的多尺度融合网络搜索 论文/代码
22 IEEE TIP 用于显著目标检测的分解与补全网络 论文/代码
23 ICCV 视觉显著性Transformer 论文/代码
24 ICCV 解耦高质量显著目标检测 论文/代码
25 ICCV iNAS:面向设备的显著目标检测的整数型NAS 论文/代码
26 ICCV 场景上下文感知的显著目标检测 论文/代码
27 ICCV MFNet:用于弱监督显著目标检测的多滤波器指令网络 论文/代码
28 ICCV 带位置保留注意力的显著对象排序 论文/代码
29 ICCV 总结与搜索:学习共识感知的动态卷积用于协同显著性检测 论文/代码
30 IEEE TIP 带净化机制和结构相似性损失的显著目标检测 论文/代码
31 ACMM 补充三边解码器用于快速准确的显著目标检测 论文/代码
32 NeurIPS 基于能量模型潜在空间的学习型生成视觉Transformer用于显著性预测 论文/代码
33 NeurIPS 为时空图神经网络发现动态显著区域 论文/代码
34 IEEE TIP 用于显著目标检测的渐进式自引导损失 论文/代码
35 IEEE TMM 密集注意力引导的级联网络用于带钢表面缺陷的显著目标检测 论文/代码
36 IEEE TIP 重新思考用于显著目标检测的U型结构 论文/代码

2020年

序号 会议/期刊 标题 链接
01 AAAI 用于显著性目标检测的渐进式特征精炼网络 论文/代码
02 AAAI 用于显著性目标检测的全局上下文感知渐进聚合网络 论文/代码
03 AAAI F3Net:融合、反馈与聚焦用于显著性目标检测 论文/代码
04 AAAI 基于对抗域适应的多光谱显著性目标检测 论文/代码
05 AAAI 多类型自注意力引导的退化显著性检测 论文/代码
06 CVPR 基于涂鸦标注的弱监督显著性目标检测 论文/代码
07 CVPR 深入探讨协同显著性目标检测 论文/代码
08 CVPR 用于显著性目标检测的多尺度交互网络 论文/代码
09 CVPR 用于准确且快速显著性检测的交互式双流解码器 论文/代码
10 CVPR 显著性目标检测的标签解耦框架 论文/代码
11 CVPR 带有注意力图聚类的自适应图卷积网络用于协同显著性检测 论文/代码
12 ECCV 参数量仅为10万的高效显著性目标检测 论文/代码
13 ECCV n参考迁移学习用于显著性预测 论文/代码
14 ECCV 梯度诱导的协同显著性检测 论文/代码
13 ECCV 基于交替反向传播从噪声标签中学习噪声感知编码器-解码器用于显著性检测 论文/代码
15 ECCV 抑制与平衡:一种用于显著性目标检测的简单门控网络 论文/代码
16 IEEE TIP 用于同时检测显著性目标、边缘和骨架的动态特征集成 论文/代码
17 IEEE TIP CAGNet:面向显著性目标检测的内容感知引导 论文/代码
18 IEEE TCYB 基于层次化视觉感知学习的轻量级显著性目标检测 论文/代码
19 NeurIPS CoADNet:用于协同显著性目标检测的协作式聚合与分发网络 论文/代码
20 NeurIPS 基于对抗式节奏学习的低成本显著性目标检测 论文/代码
21 NeurIPS ICNet:用于协同显著性检测的内部显著性相关性网络 论文/代码

2019

序号 会议/期刊 标题 链接
01 CVPR AFNet:面向边界感知显著目标检测的注意力反馈网络 论文/代码
02 CVPR BASNet:边界感知显著目标检测 论文/代码
03 CVPR CPD:用于准确快速显著目标检测的级联部分解码器 论文/代码
04 CVPR 多源弱监督下的显著性检测 论文/代码
05 CVPR MLMSNet:一种基于交织多监督的显著目标检测互学习方法 论文/代码
06 CVPR CapSal:利用字幕生成增强显著目标检测语义 论文/代码
07 CVPR PoolNet:一种基于简单池化的实时显著目标检测设计 论文/代码
08 CVPR 用于显著目标检测的迭代式协同自顶向下与自底向上推理网络 论文/代码
09 CVPR 用于显著性检测的金字塔特征注意力网络 论文/代码
10 AAAI 用于显著目标检测的深度嵌入特征 论文/代码
11 ICIP 基于深度层次化上下文聚合与多层监督的显著目标检测 论文/代码
12 IEEE TCSVT AADF-Net:用于显著目标检测的注意力扩张特征聚合 论文/代码
13 IEEE TCyb ROSA:对抗攻击下的鲁棒显著目标检测 论文/代码
14 arXiv DSAL-GAN:基于去噪的生成对抗网络显著性预测 论文/代码
15 arXiv SAC-Net:用于显著目标检测的空间衰减上下文 论文/代码
16 arXiv SE2Net:用于显著目标检测的双目边缘增强网络 论文/代码
17 arXiv 用于显著目标检测的区域细化网络 论文/代码
18 arXiv 轮廓损失:面向显著目标分割的边界感知学习 论文/代码
19 arXiv OGNet:带有输出引导注意力模块的显著目标检测 论文/代码
20 arXiv 边缘引导的非局部全卷积网络用于显著目标检测 论文/代码
21 ICCV FLoss:优化无阈值显著目标检测的F度量 论文/代码
22 ICCV 用于显著目标检测的堆叠交叉细化网络 论文/代码
23 ICCV 选择性还是不变性:边界感知显著目标检测 论文/代码
24 ICCV HRSOD:迈向高分辨率显著目标检测 论文/代码
25 ICCV EGNet:用于显著目标检测的边缘引导网络 论文/代码
26 ICCV 显著目标检测中联合深度特征与预测精炼的结构化建模 论文/代码
27 ICCV 利用深度部件-目标关系进行显著目标检测 论文/代码
28 NeurIPS 基于自监督的深度鲁棒无监督显著性预测 论文/代码
29 CVPR 基于金字塔注意力和显著边缘的显著目标检测 论文/代码

2018年

序号 发表会议/期刊 标题 链接
01 CVPR 用于显著性目标检测的双向消息传递模型 论文/代码
02 CVPR PiCANet:学习像素级上下文注意力进行显著性检测 论文/代码
03 CVPR PAGR:渐进式注意力引导循环网络用于显著性目标检测 论文/代码
04 CVPR 学习提升显著性检测器性能 论文/代码
05 CVPR 全局检测,局部精修:一种新颖的显著性检测方法 论文/代码
06 CVPR 基于注视点预测驱动的显著性目标检测 论文/代码
07 IJCAI R3Net:用于显著性检测的递归残差精修网络 论文/代码
08 IJCAI LFR:无损特征反射的显著性目标检测 论文/代码
09 ECCV 显著性目标检测中的轮廓知识迁移 论文/代码
10 ECCV 用于显著性目标检测的反向注意力 论文/代码
11 IEEE TIP 一种无监督的博弈论方法用于显著性检测 论文/代码
12 arXiv 敏捷护身符:基于上下文注意力的实时显著性目标检测 论文/代码
13 arXiv HyperFusion-Net:用于显著性目标检测的密集反射融合 论文/代码
14 arXiv (TBOS)一石三鸟:显著性目标分割、边缘检测和骨架提取的统一框架 论文/代码
15 CVPR 深度无监督显著性检测:多噪声标签视角 论文/代码

2017年

序号 发表会议/期刊 标题 链接
01 CVPR DSS:具有短连接的深度监督显著性目标检测 论文/代码
02 CVPR 用于显著性目标检测的非局部深层特征 论文/代码
03 CVPR 在图像级别监督下学习检测显著性目标 论文/代码
04 CVPR SalGAN:利用对抗网络进行视觉显著性预测 论文/代码
05 ICCV 用于检测图像中显著性目标的分阶段精修模型 论文/代码
06 ICCV Amulet:聚合多层级卷积特征用于显著性目标检测 论文/代码
07 ICCV 学习不确定卷积特征以实现精确的显著性检测 论文/代码
08 ICCV 融合监督:迈向深度显著性目标检测器的无监督学习 论文/代码

2016年

序号 发表会议/期刊 标题 链接
01 CVPR DHSNet:用于显著性目标检测的深度层次化显著性网络 论文/代码
02 CVPR ELD:结合编码的低层距离图与高层特征的深度显著性 论文/代码
03 ECCV RFCN:利用循环全卷积网络进行显著性检测 论文/代码

3D RGB-D/T 显著性检测

2025年

序号 发表会议/期刊 标题 链接
:triangular_flag_on_post: 01 AAAI DiMSOD:基于扩散的多模态显著性目标检测框架 论文/代码
:triangular_flag_on_post: 02 AAAI SMR-Net:语义引导的互增强网络用于跨模态图像融合和显著性目标检测 论文/代码

2024

序号 发表期刊/会议 标题 链接
01 ICASSP 基于显著性增强特征融合的多尺度RGB-D显著目标检测网络 论文/代码
02 IJCV 用于RGB-D显著目标检测的跨模态融合与渐进解码网络 论文/代码
03 TMM UniTR:基于统一Transformer框架的共目标与多模态显著性检测 论文/代码
04 IEEE TIP 面向V-D-T显著目标检测的质量感知选择性融合网络 论文/代码
05 IEEE TCSVT 用于多模态显著目标检测的学习型自适应融合库 论文/代码
06 IEEE TMM 无对齐RGBT显著目标检测:语义引导的非对称相关网络及统一基准 论文/代码
07 ACMMM 基于RGB-热数据的双模态显著目标检测后门攻击 论文/代码
08 ECCV CoLA:条件丢弃与语言驱动的鲁棒双模态显著目标检测 论文/代码

2023

序号 发表期刊/会议 标题 链接
01 TCSVT HRTransNet:基于HRFormer的双模态显著目标检测 论文/代码
02 IEEE TIP CAVER:用于双模态显著目标检测的跨模态视图混合Transformer 论文/代码
03 IEEE TIP LSNet:用于RGB-热图像中显著目标检测的轻量级空间增强网络 论文/代码
04 ICME 手绘标注监督下的RGB-T显著目标检测 论文/代码
05 TCSVT 用于弱监督RGB-D显著目标检测的互信息正则化 论文/代码
06 Information Fusion 一种交互式强化范式的红外-可见光图像联合融合与显著目标检测 论文/代码
07 IEEE TMM CATNet:用于RGB-D显著目标检测的级联聚合Transformer网络 论文/代码
08 ACM MM 用于RGB-D显著目标检测的点感知交互与CNN诱导精炼网络 论文/代码
09 IEEE TIP 用于RGBD显著目标检测的深度注入框架 论文/代码
10 ACM MM 模态特征——生成RGB-D显著目标检测训练集时需考虑的新关键因素 论文/代码
11 ACM MM RGB-D和RGB-T显著目标检测的显著性原型 论文/代码
12 NeurIPS DVSOD:RGB-D视频中的显著目标检测 论文/代码

2022

序号 期刊/会议 标题 链接
01 CVMJ 保持特异性的RGB-D显著性检测 论文/代码
02 AAAI 针对RGB-D显著目标检测的自监督预训练 论文/代码
03 IEEE TPAMI MobileSal:极高效的RGB-D显著目标检测 论文/代码
04 IEEE TIP 利用未标注的RGB图像提升RGB-D显著性检测性能 论文/代码
05 IEEE TIP 学习用于RGB-D显著性检测的判别性跨模态特征 论文/代码
06 IEEE TIP 基于预测一致性训练和主动涂鸦增强的弱监督RGB-D显著目标检测 论文/代码
07 ICLR 从深度中促进显著性:深度无监督RGB-D显著性检测 论文/代码
08 ArXiv DFTR:用于显著目标检测的深度监督分层特征融合Transformer 论文/代码
09 ArXiv GroupTransNet:用于RGB-D显著目标检测的组变换网络 论文/代码
10 ArXiv CAVER:用于双模态显著目标检测的跨模态视图混合Transformer 论文/代码
11 PR 具有多尺度聚合的编码器深度交织网络,用于RGB-D显著目标检测 论文/代码
12 CVPRW 用于显著性检测的金字塔注意力机制 论文/代码
13 TMM 用于RGB-D显著目标检测的深度诱导差距缩小网络:一种交互、引导与精炼方法 论文/代码
14 TMM C2DFNet:用于RGB-D显著目标检测的交叉动态滤波器网络 论文/代码
15 ArXiv 基于双Swin Transformer的互交互网络,用于RGB-D显著目标检测 论文/代码
16 IEEE TCSVT 用于鲁棒RGB-热显著目标检测的跨协作融合编码器网络 论文/代码
17 IEEE TIP 使用Transformer学习隐式类别知识,用于RGB-D协同显著目标检测 论文/代码
18 ACMM 受深度启发的无监督RGB-D显著目标检测中的标签挖掘 论文/代码
19 3DV 用于显著性检测的鲁棒RGB-D融合 论文/代码
20 ArXiv 受深度质量启发的特征操作,用于高效RGB-D和视频显著目标检测 论文/代码
21 ECCV SPSN:用于RGB-D显著目标检测的超像素原型采样网络 论文/代码
22 ECCV MVSalNet:多视角增强用于RGB-D显著目标检测 论文/代码
23 IJCV 可学习的深度敏感注意力,结合多模态融合架构搜索,用于深度RGB-D显著性检测 论文/代码
24 IEEE TNNLS 用于RGB-D显著目标检测及更广泛应用的三维卷积神经网络 论文/代码
25 IEEE TIP 通过模态感知解码器改进RGB-D显著目标检测 论文/代码
26 IEEE TIP CIR-Net:用于RGB-D显著目标检测的跨模态交互与精炼 论文/代码
27 IEEE TCSVT HRTransNet:HRFormer驱动的双模态显著目标检测 论文/代码
28 IEEE TMM 热成像在RGB-T显著目标检测中真的总是重要吗? 论文/代码
29 IEEE TCSVT 用于RGB-D和RGB-T显著目标检测的模态诱导迁移融合网络 论文/代码
30 IEEE TIP 显著目标检测、深度估计和轮廓提取的联合学习 论文/代码
31 IJCV 深入研究校准深度以实现精确的RGB-D显著目标检测 论文/代码
32 IEEE TCSVT MoADNet:用于实时轻量级RGB-D显著目标检测的移动非对称双流网络 论文/代码

2021年

序号 会议/期刊 标题 链接
01 CVPR 基于深度敏感注意力机制和自动多模态融合的深度RGB-D显著性检测 论文/代码
02 CVPR 校准型RGB-D显著目标检测 论文/代码
03 AAAI 基于3D卷积神经网络的RGB-D显著目标检测 论文/代码
04 IEEE TIP 用于RGB-D显著目标检测的层次化交替交互网络 论文/代码
05 IEEE TIP CDNet:用于RGB-D显著目标检测的互补深度网络 论文/代码
06 IEEE TIP 具有普遍目标感知的RGB-D显著目标检测 论文/代码
07 ICME BTS-Net:用于RGB-D显著目标检测的双向迁移与选择网络 论文/代码
08 ACMM 受深度质量启发的特征操控用于高效RGB-D显著目标检测 论文/代码
09 ACMM TriTransNet RGB-D显著目标检测,采用三元Transformer嵌入网络 论文/代码
10 ICCV 基于级联互信息最小化的RGB-D显著性检测 论文/代码
11 ICCV 保留特异性的RGB-D显著性检测 论文/代码
12 ACMM 用于RGB-D显著目标检测的跨模态差异交互网络 论文/代码
13 IEEE TIP 用于RGB-D显著目标检测的动态选择网络 论文/代码
14 IJCV 基于CNN的RGB-D显著目标检测:学习、选择与融合 论文/代码
15 NeurIPS 用于弱监督RGB-D显著目标检测的联合语义挖掘 论文/代码
16 IEEE TMM CCAFNet:用于检测RGB-D图像中显著目标的交叉流与跨尺度自适应融合网络 论文/代码
17 IEEE TETCI APNet:用于全天候RGB-T显著目标检测的对抗学习辅助与感知重要性融合网络 论文/代码

2020年

序号 发表期刊/会议 标题 链接
01 IEEE TIP ICNet:基于RGB-D的显著性目标检测信息转换网络 论文/代码
02 CVPR JL-DCF:用于RGB-D显著性目标检测的联合学习与密集协作融合框架 论文/代码
03 CVPR UC-Net:基于条件变分自编码器的不确定性启发式RGB-D显著性检测 论文/代码
04 CVPR A2dele:用于高效RGB-D显著性目标检测的自适应注意力深度蒸馏器 论文/代码
05 CVPR 选择、补充与聚焦:面向RGB-D显著性检测的方法 论文/代码
06 CVPR 学习选择性自互注意机制用于RGB-D显著性检测 论文/代码
07 ECCV 基于协同学习的精确RGB-D显著性目标检测 论文/代码
08 ECCV 用于RGB-D显著性目标检测的跨模态加权网络 论文/代码
09 ECCV BBS-Net:采用分叉骨干策略的RGB-D显著性目标检测网络 论文/代码
10 ECCV 用于RGB-D显著性目标检测的层次化动态滤波网络 论文/代码
11 ECCV 用于RGB-D显著性目标检测的渐进引导交替精炼网络 论文/代码
12 ECCV 基于跨模态调制与选择的RGB-D显著性目标检测 论文/代码
13 ECCV 用于RGB-D显著性目标检测的级联图神经网络 论文/代码
14 ECCV 用于鲁棒实时RGB-D显著性目标检测的单流网络 论文/代码
15 ECCV 用于精确RGB-D显著性检测的非对称双流架构 论文/代码
16 ACMM 显著性目标检测真的需要深度信息吗? 论文/代码
17 ACMM MMNet:用于RGB-D显著性目标检测的多阶段多尺度融合网络 论文/代码
18 ACMM 差异化处理下的特征再整合:一种自顶向下且适应性的融合网络用于RGB-D显著性目标检测 论文/代码
19 IEEE TIP 基于解耦跨模态融合的RGBD显著性目标检测 论文/代码
20 IEEE TIP 利用两阶段深度估计和选择性深度融合提升RGB-D图像中的显著性检测 论文/代码
21 IEEE TIP 针对RGB-D显著性目标检测的深度潜力感知门控注意力网络 论文/代码
22 IEEE TNNLS D3Net:重新思考RGB-D显著性目标检测——模型、数据集与大规模基准测试 论文/代码
23 IEEE TCSVT 再探RGB-T显著性目标检测中的特征融合 论文/代码

2019年

序号 发表期刊/会议 标题 链接
01 ICCV DMRA:深度诱导的多尺度循环注意力网络用于显著性检测 论文/代码
02 CVPR CPFP:对比先验与流体金字塔融合用于RGBD显著性目标检测 论文/代码
03 IEEE TIP 用于RGB-D显著性目标检测的三流注意力感知网络 论文/代码
04 IEEE PR 具有多尺度多路径及跨模态交互的多模态融合网络,用于RGB-D显著性目标检测 论文/代码
05 IEEE Access AFNet:用于RGB-D显著性目标检测的适应性融合网络 论文/代码
06 IEEE TIP 通过融合多层CNN特征进行RGB-T显著性目标检测 论文/代码
07 IEEE TMM 通过协作图学习进行RGB-T图像显著性检测 论文/代码

2018年

序号 发表期刊/会议 标题 链接
01 CVPR PCA:用于RGB-D显著性目标检测的渐进式互补感知融合网络 论文/代码
02 IEEE TIP 基于多约束特征匹配和跨标签传播的RGBD图像协同显著性检测 论文/代码
03 ICME PDNet:先验模型引导的深度增强显著性目标检测网络 论文/代码

2017年

序号 发表期刊/会议 标题 链接
01 ICCV 利用背景包围、深度对比和自顶向下特征学习RGB-D显著性目标检测 论文/代码
02 IEEE TIP DF:基于深度融合的RGB-D显著性目标检测 论文/代码
03 IEEE TCyb CTMF:基于跨视图迁移和多视角融合的CNN驱动RGB-D显著性检测 论文/代码

传统方法

序号 发表期刊/会议 标题 链接
01 MTA 基于多核提升与融合的RGB-D协同显著性检测 论文/代码
02 ICCV17 基于中心暗通道先验的创新显著性目标检测 论文/代码
03 IEEE SPL 基于深度置信度分析和多线索融合的立体图像显著性检测 论文/代码
04 IEEE SPL 基于自助法聚类的RGB-D协同显著性检测 论文/代码
05 CVPR 利用全局先验进行RGB-D显著性检测 论文/代码

4D光场显著性检测

序号 发表期刊/会议 标题 链接
01 TOMM MCA:基于多线索的光场显著性检测 论文/代码
02 IJCAI DILF:深入探究光场的显著性检测 论文/代码
03 CVPR WSC:用于显著性检测的加权稀疏编码框架 论文/代码
04 IEEE PAMI 光场上的显著性检测 论文/代码
05 ICCV 基于深度学习的光场显著性检测 论文/代码
06 NeurIPS 面向记忆的解码器用于光场显著目标检测 论文/代码
07 AAAI 利用与替换:一种非对称双流架构用于多功能光场显著性检测 论文/代码
08 IEEE TCSVT 用于光场显著目标检测的多任务协同网络 论文/代码
09 ArXiv DUT-LFSaliency:多功能数据集及光场到RGB的显著性检测 论文/代码
10 ArXiv 学习协同注意力用于光场显著目标检测 论文/代码
11 ArXiv CMA-Net:用于光场显著目标检测的级联互注意网络 论文/代码
12 IEEE TCyB PANet:用于光场显著目标检测的补丁感知网络 论文/代码
13 ACMM21 用于光场显著目标检测的遮挡感知双向引导网络 论文/代码
14 ICCV21 基于双重局部图学习和互惠引导的光场显著性检测 论文/代码
15 CVPR22 从像素级噪声标签中学习:光场显著性检测的新视角 论文/代码
16 NC MEANet:用于光场显著目标检测的多模态边缘感知网络 论文/代码
17 IEEE TIP 探索空间相关性用于光场显著性检测:从单视图扩展 论文/代码
18 IEEE TIP 基于图神经网络的光场几何辅助显著目标检测 论文/代码
19 ACMM LFBCNet:用于显著目标检测的光场边界感知级联交互网络 论文/代码
20 IEEE TIP 光场上的弱监督显著目标检测 论文/代码
21 IEEE TPAMI 光场显著性检测的全面基准测试与新模型 论文/代码
22 ICME23 用于光场显著目标检测的引导焦点堆栈精炼网络 论文/代码
23 IEEE TCSVT LFTransNet:通过可学习权重描述符进行光场显著目标检测 论文/代码
24 IEEE TCSVT 基于互补与判别交互网络的稀疏视图光场显著目标检测 论文/代码
:triangular_flag_on_post: 25 arXiv LF Tracy:一种统一的单管道方法用于光场相机中的显著目标检测 论文/代码

视频显著目标检测

2024

序号 发表期刊/会议 标题 链接
:triangular_flag_on_post: 01 AAAI 一种运动感知的时空图用于视频显著目标排序 论文/代码

2023

序号 发表期刊/会议 标题 链接
01 AAAI 全景视频显著目标检测与Ambisonic音频引导 论文/代码

2022

序号 发表 标题 链接
01 AAAI 只推理一次:用于引用视频目标分割的跨模态元迁移学习 论文/代码
02 AAAI 基于交互式Transformer的孪生网络用于视频目标分割 论文/代码
03 AAAI 迭代选择一个简单的参考帧使无监督视频目标分割更容易 论文/代码
04 AAAI 用于视频目标分割的可靠传播-校正调制 论文/代码
05 WACV 基于对比特征和注意力模块的视频显著目标检测 论文/代码
06 ICIP 用于视频显著目标检测的深度协同三模态网络 论文/代码
07 ArXiv 从无标签视频中逐步学习视频显著目标检测 论文/代码
08 ArXiv 重新思考视频显著目标排序 论文/代码
09 ACMM 基于点监督的弱监督视频显著目标检测 论文/代码
10 ECCV 用于无监督视频目标分割的层次化特征对齐网络 论文/代码
11 ECCV XMem:基于阿特金森-希夫林记忆模型的长期视频目标分割 论文/代码
12 ACMM 用于无监督视频目标分割的双向密集时空特征传播网络 论文/代码
13 NeurIPS 基于不确定性引导伪标签的半监督视频显著目标检测 论文/代码

2021

序号 发表 标题 链接
01 CVPR 弱监督视频显著目标检测 论文/代码
02 ArXiv 基于自适应局部-全局精炼的视频显著目标检测 论文/代码
03 ICIP 用于视频显著目标检测的引导与教学网络 论文/代码
04 ACMM 多源融合与自动预测器选择用于零样本视频目标分割 论文/代码
05 ICCV 用于视频显著目标检测的动态上下文敏感滤波网络 论文/代码
06 ICCV 用于视频目标分割的全双工策略 论文/代码
07 ICCV 用于无监督视频目标分割的深度传输网络 论文/代码
08 IEEE TIP 探索丰富高效的时空交互以实现实时视频显著目标检测 论文/代码

2020

序号 发表 标题 链接
01 CVPR STAViS:时空音视显著性网络 论文/代码
02 ECCV 统一的图像和视频显著性建模 论文/代码
03 ECCV 测量视频显著性中时间特征的重要性 论文/代码
04 ECCV TENet:用于视频显著目标检测的三重激励网络 论文/代码
05 IEEE TIP 学习视频显著目标检测中的长期结构依赖关系 论文/代码
06 IEEE Access 用于视频显著目标检测的交叉互补融合网络 论文/代码
07 AAAI 用于快速视频显著目标检测的金字塔约束自注意力网络 论文/代码

2019

序号 发表 标题 链接
01 ICCV 基于运动引导注意力的视频显著目标检测 论文/代码
02 ICCV 使用伪标签的半监督视频显著目标检测 论文/代码
03 ICCV 用于视频显著性检测的时序聚合空间编码器-解码器网络 论文/代码
04 ICCV RANet:快速视频目标分割的排序注意力网络 论文/代码
05 CVPR 将更多注意力转向视频显著目标检测 论文/代码
06 CVPR 通过视觉注意力学习无监督视频目标分割 论文/代码
07 CVPR 看得更多,了解得更多:基于协同注意力暹罗网络的无监督视频目标分割 论文/代码
08 IEEE TIP 基于长期时空信息的鲁棒视频显著性检测改进 论文/代码

2018

序号 发表 标题 链接
01 ECCV 金字塔扩张深层CoonvLSTM用于视频显著目标检测 论文/代码
02 ECCV DeepVS:一种基于深度学习的视频显著性预测方法 论文/代码
03 CVPR 重访视频显著性:大规模基准与新模型 论文/代码
04 CVPR 流引导循环神经网络编码器用于视频显著目标检测 论文/代码
05 IEEE TIP 基于全卷积网络的视频显著目标检测 论文/代码

2017

序号 发表 标题 链接
01 IEEE TIP 利用HEVC特征学习视频显著性检测 论文/代码

早期方法

序号 发表 标题 链接
01 IEEE TIP15 显著目标检测:一个基准 论文/代码
02 IEEE TCSVT18 综合信息下的视觉显著性检测综述 论文/代码
03 ACM TIST18 共同显著性检测算法综述:基础、应用与挑战 论文/代码
04 IEEE TSP18 显著及类别特定目标检测的先进深度学习技术:综述 论文/代码
05 IJCV18 注意力系统:综述 论文/项目
06 ECCV18 杂乱中的显著对象:将显著目标检测推向前沿 论文/代码
07 CVM18 显著目标检测:综述 论文/代码
08 IEEE TNNLS19 深度学习下的显著目标检测:综述 论文/代码
09 arXiv19 深度学习时代的显著目标检测——深入综述 论文/代码
10 CVM21 RGB-D显著目标检测:综述 论文/代码

本部分内容感谢 Deng-Ping FanTao Zhou

  • 深度学习时代的显著目标检测:深入综述。论文链接
  • 这是另一位作者发布的论文列表。这里
  • RGB-D显著目标检测:综述。项目链接

SOD数据集下载

评估指标

  • 显着性图评估。
    此链接提供了显着目标检测的所有评估指标,包括 E-measure、S-measure、F-measure、MAE 分数以及 PR 曲线或柱状图指标。 您可以在 这里 找到。

  • 显着性数据集评估。
    该仓库可以计算二值显着性数据集上目标区域和目标对比度的比率。该工具箱包含两个评估指标,分别是 obj(object).area 和 obj.contrast。
    您可以在 这里 找到。

与最先进方法的比较

  • 这里 包含几乎所有 2D 显着目标检测算法的性能对比。
  • 这里 包含几乎所有 3D RGB-D 显着目标检测算法的性能对比。

AI会议截止日期

相关AI会议截止日期
相关AI会议接受率

常见问题

相似工具推荐

openclaw

OpenClaw 是一款专为个人打造的本地化 AI 助手,旨在让你在自己的设备上拥有完全可控的智能伙伴。它打破了传统 AI 助手局限于特定网页或应用的束缚,能够直接接入你日常使用的各类通讯渠道,包括微信、WhatsApp、Telegram、Discord、iMessage 等数十种平台。无论你在哪个聊天软件中发送消息,OpenClaw 都能即时响应,甚至支持在 macOS、iOS 和 Android 设备上进行语音交互,并提供实时的画布渲染功能供你操控。 这款工具主要解决了用户对数据隐私、响应速度以及“始终在线”体验的需求。通过将 AI 部署在本地,用户无需依赖云端服务即可享受快速、私密的智能辅助,真正实现了“你的数据,你做主”。其独特的技术亮点在于强大的网关架构,将控制平面与核心助手分离,确保跨平台通信的流畅性与扩展性。 OpenClaw 非常适合希望构建个性化工作流的技术爱好者、开发者,以及注重隐私保护且不愿被单一生态绑定的普通用户。只要具备基础的终端操作能力(支持 macOS、Linux 及 Windows WSL2),即可通过简单的命令行引导完成部署。如果你渴望拥有一个懂你

349.3k|★★★☆☆|5天前
Agent开发框架图像

stable-diffusion-webui

stable-diffusion-webui 是一个基于 Gradio 构建的网页版操作界面,旨在让用户能够轻松地在本地运行和使用强大的 Stable Diffusion 图像生成模型。它解决了原始模型依赖命令行、操作门槛高且功能分散的痛点,将复杂的 AI 绘图流程整合进一个直观易用的图形化平台。 无论是希望快速上手的普通创作者、需要精细控制画面细节的设计师,还是想要深入探索模型潜力的开发者与研究人员,都能从中获益。其核心亮点在于极高的功能丰富度:不仅支持文生图、图生图、局部重绘(Inpainting)和外绘(Outpainting)等基础模式,还独创了注意力机制调整、提示词矩阵、负向提示词以及“高清修复”等高级功能。此外,它内置了 GFPGAN 和 CodeFormer 等人脸修复工具,支持多种神经网络放大算法,并允许用户通过插件系统无限扩展能力。即使是显存有限的设备,stable-diffusion-webui 也提供了相应的优化选项,让高质量的 AI 艺术创作变得触手可及。

162.1k|★★★☆☆|5天前
开发框架图像Agent

ComfyUI

ComfyUI 是一款功能强大且高度模块化的视觉 AI 引擎,专为设计和执行复杂的 Stable Diffusion 图像生成流程而打造。它摒弃了传统的代码编写模式,采用直观的节点式流程图界面,让用户通过连接不同的功能模块即可构建个性化的生成管线。 这一设计巧妙解决了高级 AI 绘图工作流配置复杂、灵活性不足的痛点。用户无需具备编程背景,也能自由组合模型、调整参数并实时预览效果,轻松实现从基础文生图到多步骤高清修复等各类复杂任务。ComfyUI 拥有极佳的兼容性,不仅支持 Windows、macOS 和 Linux 全平台,还广泛适配 NVIDIA、AMD、Intel 及苹果 Silicon 等多种硬件架构,并率先支持 SDXL、Flux、SD3 等前沿模型。 无论是希望深入探索算法潜力的研究人员和开发者,还是追求极致创作自由度的设计师与资深 AI 绘画爱好者,ComfyUI 都能提供强大的支持。其独特的模块化架构允许社区不断扩展新功能,使其成为当前最灵活、生态最丰富的开源扩散模型工具之一,帮助用户将创意高效转化为现实。

108.3k|★★☆☆☆|今天
开发框架图像Agent

gemini-cli

gemini-cli 是一款由谷歌推出的开源 AI 命令行工具,它将强大的 Gemini 大模型能力直接集成到用户的终端环境中。对于习惯在命令行工作的开发者而言,它提供了一条从输入提示词到获取模型响应的最短路径,无需切换窗口即可享受智能辅助。 这款工具主要解决了开发过程中频繁上下文切换的痛点,让用户能在熟悉的终端界面内直接完成代码理解、生成、调试以及自动化运维任务。无论是查询大型代码库、根据草图生成应用,还是执行复杂的 Git 操作,gemini-cli 都能通过自然语言指令高效处理。 它特别适合广大软件工程师、DevOps 人员及技术研究人员使用。其核心亮点包括支持高达 100 万 token 的超长上下文窗口,具备出色的逻辑推理能力;内置 Google 搜索、文件操作及 Shell 命令执行等实用工具;更独特的是,它支持 MCP(模型上下文协议),允许用户灵活扩展自定义集成,连接如图像生成等外部能力。此外,个人谷歌账号即可享受免费的额度支持,且项目基于 Apache 2.0 协议完全开源,是提升终端工作效率的理想助手。

100.8k|★★☆☆☆|昨天
插件Agent图像

LLMs-from-scratch

LLMs-from-scratch 是一个基于 PyTorch 的开源教育项目,旨在引导用户从零开始一步步构建一个类似 ChatGPT 的大型语言模型(LLM)。它不仅是同名技术著作的官方代码库,更提供了一套完整的实践方案,涵盖模型开发、预训练及微调的全过程。 该项目主要解决了大模型领域“黑盒化”的学习痛点。许多开发者虽能调用现成模型,却难以深入理解其内部架构与训练机制。通过亲手编写每一行核心代码,用户能够透彻掌握 Transformer 架构、注意力机制等关键原理,从而真正理解大模型是如何“思考”的。此外,项目还包含了加载大型预训练权重进行微调的代码,帮助用户将理论知识延伸至实际应用。 LLMs-from-scratch 特别适合希望深入底层原理的 AI 开发者、研究人员以及计算机专业的学生。对于不满足于仅使用 API,而是渴望探究模型构建细节的技术人员而言,这是极佳的学习资源。其独特的技术亮点在于“循序渐进”的教学设计:将复杂的系统工程拆解为清晰的步骤,配合详细的图表与示例,让构建一个虽小但功能完备的大模型变得触手可及。无论你是想夯实理论基础,还是为未来研发更大规模的模型做准备

90.1k|★★★☆☆|4天前
语言模型图像Agent

Deep-Live-Cam

Deep-Live-Cam 是一款专注于实时换脸与视频生成的开源工具,用户仅需一张静态照片,即可通过“一键操作”实现摄像头画面的即时变脸或制作深度伪造视频。它有效解决了传统换脸技术流程繁琐、对硬件配置要求极高以及难以实时预览的痛点,让高质量的数字内容创作变得触手可及。 这款工具不仅适合开发者和技术研究人员探索算法边界,更因其极简的操作逻辑(仅需三步:选脸、选摄像头、启动),广泛适用于普通用户、内容创作者、设计师及直播主播。无论是为了动画角色定制、服装展示模特替换,还是制作趣味短视频和直播互动,Deep-Live-Cam 都能提供流畅的支持。 其核心技术亮点在于强大的实时处理能力,支持口型遮罩(Mouth Mask)以保留使用者原始的嘴部动作,确保表情自然精准;同时具备“人脸映射”功能,可同时对画面中的多个主体应用不同面孔。此外,项目内置了严格的内容安全过滤机制,自动拦截涉及裸露、暴力等不当素材,并倡导用户在获得授权及明确标注的前提下合规使用,体现了技术发展与伦理责任的平衡。

88.9k|★★★☆☆|5天前
开发框架图像Agent