[{"data":1,"prerenderedAt":-1},["ShallowReactive",2],{"similar-kuanhungchen--awesome-tiny-object-detection":3,"tool-kuanhungchen--awesome-tiny-object-detection":64},[4,17,26,40,48,56],{"id":5,"name":6,"github_repo":7,"description_zh":8,"stars":9,"difficulty_score":10,"last_commit_at":11,"category_tags":12,"status":16},3808,"stable-diffusion-webui","AUTOMATIC1111\u002Fstable-diffusion-webui","stable-diffusion-webui 是一个基于 Gradio 构建的网页版操作界面，旨在让用户能够轻松地在本地运行和使用强大的 Stable Diffusion 图像生成模型。它解决了原始模型依赖命令行、操作门槛高且功能分散的痛点，将复杂的 AI 绘图流程整合进一个直观易用的图形化平台。\n\n无论是希望快速上手的普通创作者、需要精细控制画面细节的设计师，还是想要深入探索模型潜力的开发者与研究人员，都能从中获益。其核心亮点在于极高的功能丰富度：不仅支持文生图、图生图、局部重绘（Inpainting）和外绘（Outpainting）等基础模式，还独创了注意力机制调整、提示词矩阵、负向提示词以及“高清修复”等高级功能。此外，它内置了 GFPGAN 和 CodeFormer 等人脸修复工具，支持多种神经网络放大算法，并允许用户通过插件系统无限扩展能力。即使是显存有限的设备，stable-diffusion-webui 也提供了相应的优化选项，让高质量的 AI 艺术创作变得触手可及。",162132,3,"2026-04-05T11:01:52",[13,14,15],"开发框架","图像","Agent","ready",{"id":18,"name":19,"github_repo":20,"description_zh":21,"stars":22,"difficulty_score":23,"last_commit_at":24,"category_tags":25,"status":16},2271,"ComfyUI","Comfy-Org\u002FComfyUI","ComfyUI 是一款功能强大且高度模块化的视觉 AI 引擎，专为设计和执行复杂的 Stable Diffusion 图像生成流程而打造。它摒弃了传统的代码编写模式，采用直观的节点式流程图界面，让用户通过连接不同的功能模块即可构建个性化的生成管线。\n\n这一设计巧妙解决了高级 AI 绘图工作流配置复杂、灵活性不足的痛点。用户无需具备编程背景，也能自由组合模型、调整参数并实时预览效果，轻松实现从基础文生图到多步骤高清修复等各类复杂任务。ComfyUI 拥有极佳的兼容性，不仅支持 Windows、macOS 和 Linux 全平台，还广泛适配 NVIDIA、AMD、Intel 及苹果 Silicon 等多种硬件架构，并率先支持 SDXL、Flux、SD3 等前沿模型。\n\n无论是希望深入探索算法潜力的研究人员和开发者，还是追求极致创作自由度的设计师与资深 AI 绘画爱好者，ComfyUI 都能提供强大的支持。其独特的模块化架构允许社区不断扩展新功能，使其成为当前最灵活、生态最丰富的开源扩散模型工具之一，帮助用户将创意高效转化为现实。",107662,2,"2026-04-03T11:11:01",[13,14,15],{"id":27,"name":28,"github_repo":29,"description_zh":30,"stars":31,"difficulty_score":23,"last_commit_at":32,"category_tags":33,"status":16},2268,"ML-For-Beginners","microsoft\u002FML-For-Beginners","ML-For-Beginners 是由微软推出的一套系统化机器学习入门课程，旨在帮助零基础用户轻松掌握经典机器学习知识。这套课程将学习路径规划为 12 周，包含 26 节精炼课程和 52 道配套测验，内容涵盖从基础概念到实际应用的完整流程，有效解决了初学者面对庞大知识体系时无从下手、缺乏结构化指导的痛点。\n\n无论是希望转型的开发者、需要补充算法背景的研究人员，还是对人工智能充满好奇的普通爱好者，都能从中受益。课程不仅提供了清晰的理论讲解，还强调动手实践，让用户在循序渐进中建立扎实的技能基础。其独特的亮点在于强大的多语言支持，通过自动化机制提供了包括简体中文在内的 50 多种语言版本，极大地降低了全球不同背景用户的学习门槛。此外，项目采用开源协作模式，社区活跃且内容持续更新，确保学习者能获取前沿且准确的技术资讯。如果你正寻找一条清晰、友好且专业的机器学习入门之路，ML-For-Beginners 将是理想的起点。",84991,"2026-04-05T10:45:23",[14,34,35,36,15,37,38,13,39],"数据工具","视频","插件","其他","语言模型","音频",{"id":41,"name":42,"github_repo":43,"description_zh":44,"stars":45,"difficulty_score":10,"last_commit_at":46,"category_tags":47,"status":16},3128,"ragflow","infiniflow\u002Fragflow","RAGFlow 是一款领先的开源检索增强生成（RAG）引擎，旨在为大语言模型构建更精准、可靠的上下文层。它巧妙地将前沿的 RAG 技术与智能体（Agent）能力相结合，不仅支持从各类文档中高效提取知识，还能让模型基于这些知识进行逻辑推理和任务执行。\n\n在大模型应用中，幻觉问题和知识滞后是常见痛点。RAGFlow 通过深度解析复杂文档结构（如表格、图表及混合排版），显著提升了信息检索的准确度，从而有效减少模型“胡编乱造”的现象，确保回答既有据可依又具备时效性。其内置的智能体机制更进一步，使系统不仅能回答问题，还能自主规划步骤解决复杂问题。\n\n这款工具特别适合开发者、企业技术团队以及 AI 研究人员使用。无论是希望快速搭建私有知识库问答系统，还是致力于探索大模型在垂直领域落地的创新者，都能从中受益。RAGFlow 提供了可视化的工作流编排界面和灵活的 API 接口，既降低了非算法背景用户的上手门槛，也满足了专业开发者对系统深度定制的需求。作为基于 Apache 2.0 协议开源的项目，它正成为连接通用大模型与行业专有知识之间的重要桥梁。",77062,"2026-04-04T04:44:48",[15,14,13,38,37],{"id":49,"name":50,"github_repo":51,"description_zh":52,"stars":53,"difficulty_score":10,"last_commit_at":54,"category_tags":55,"status":16},519,"PaddleOCR","PaddlePaddle\u002FPaddleOCR","PaddleOCR 是一款基于百度飞桨框架开发的高性能开源光学字符识别工具包。它的核心能力是将图片、PDF 等文档中的文字提取出来，转换成计算机可读取的结构化数据，让机器真正“看懂”图文内容。\n\n面对海量纸质或电子文档，PaddleOCR 解决了人工录入效率低、数字化成本高的问题。尤其在人工智能领域，它扮演着连接图像与大型语言模型（LLM）的桥梁角色，能将视觉信息直接转化为文本输入，助力智能问答、文档分析等应用场景落地。\n\nPaddleOCR 适合开发者、算法研究人员以及有文档自动化需求的普通用户。其技术优势十分明显：不仅支持全球 100 多种语言的识别，还能在 Windows、Linux、macOS 等多个系统上运行，并灵活适配 CPU、GPU、NPU 等各类硬件。作为一个轻量级且社区活跃的开源项目，PaddleOCR 既能满足快速集成的需求，也能支撑前沿的视觉语言研究，是处理文字识别任务的理想选择。",74939,"2026-04-05T23:16:38",[38,14,13,37],{"id":57,"name":58,"github_repo":59,"description_zh":60,"stars":61,"difficulty_score":23,"last_commit_at":62,"category_tags":63,"status":16},2471,"tesseract","tesseract-ocr\u002Ftesseract","Tesseract 是一款历史悠久且备受推崇的开源光学字符识别（OCR）引擎，最初由惠普实验室开发，后由 Google 维护，目前由全球社区共同贡献。它的核心功能是将图片中的文字转化为可编辑、可搜索的文本数据，有效解决了从扫描件、照片或 PDF 文档中提取文字信息的难题，是数字化归档和信息自动化的重要基础工具。\n\n在技术层面，Tesseract 展现了强大的适应能力。从版本 4 开始，它引入了基于长短期记忆网络（LSTM）的神经网络 OCR 引擎，显著提升了行识别的准确率；同时，为了兼顾旧有需求，它依然支持传统的字符模式识别引擎。Tesseract 原生支持 UTF-8 编码，开箱即用即可识别超过 100 种语言，并兼容 PNG、JPEG、TIFF 等多种常见图像格式。输出方面，它灵活支持纯文本、hOCR、PDF、TSV 等多种格式，方便后续数据处理。\n\nTesseract 主要面向开发者、研究人员以及需要构建文档处理流程的企业用户。由于它本身是一个命令行工具和库（libtesseract），不包含图形用户界面（GUI），因此最适合具备一定编程能力的技术人员集成到自动化脚本或应用程序中",73286,"2026-04-03T01:56:45",[13,14],{"id":65,"github_repo":66,"name":67,"description_en":68,"description_zh":69,"ai_summary_zh":69,"readme_en":70,"readme_zh":71,"quickstart_zh":72,"use_case_zh":73,"hero_image_url":74,"owner_login":75,"owner_name":76,"owner_avatar_url":77,"owner_bio":78,"owner_company":78,"owner_location":79,"owner_email":78,"owner_twitter":78,"owner_website":80,"owner_url":81,"languages":78,"stars":82,"forks":83,"last_commit_at":84,"license":78,"difficulty_score":85,"env_os":86,"env_gpu":87,"env_ram":87,"env_deps":88,"category_tags":91,"github_topics":92,"view_count":23,"oss_zip_url":78,"oss_zip_packed_at":78,"status":16,"created_at":98,"updated_at":99,"faqs":100,"releases":101},2336,"kuanhungchen\u002Fawesome-tiny-object-detection","awesome-tiny-object-detection","🕶 A curated list of Tiny Object Detection papers and related resources.","awesome-tiny-object-detection 是一个专注于“微小目标检测”领域的精选资源库，系统整理了相关的学术论文、开源代码、数据集及行业竞赛信息。在计算机视觉中，当目标物体在图像中占比极小（如航拍图中的车辆、远距离的人脸或鸟类）时，传统检测算法往往难以识别或漏检率极高。该资源库正是为了解决这一痛点而生，汇聚了从基础理论到前沿应用的各类解决方案。\n\n这里不仅收录了利用 Swin Transformer、高斯感受野标签分配（RFLA）以及切片辅助推理（Slicing Aided Hyper Inference）等创新技术来提升小目标识别率的最新论文，还涵盖了针对鸟类、行人等特定场景的检测挑战与基准测试。无论是希望快速了解领域动态的研究人员，还是正在寻找高效算法落地方案的开发者，都能在此找到极具价值的参考依据。通过整合 ECCV、CVPR、MVA 等顶级会议的成果，awesome-tiny-object-detection 为用户搭建了一座连接学术研究与工程实践的桥梁，帮助社区更高效地攻克微小目标检测难题。","# Awesome Tiny Object Detection\nA curated list of ```Tiny Object Detection``` papers and related resources.\n\n## Table of Contents\n\n* [Activities](#activities)\n* [Papers](#papers)\n    * [Tiny Object Detection](#tiny-object-detection)\n    * [Tiny Face Detection](#tiny-face-detection)\n    * [Tiny Pedestrian Detection](#tiny-pedestrian-detection)\n* [Datasets](#datasets)\n* [Surveys](#surveys)\n* [Articles](#articles)\n\n## Activities\n\n* **Challenge on Small Object Detection for Birds 2023** [[Project]](http:\u002F\u002Fwww.mva-org.jp\u002Fmva2023\u002Fchallenge) [[Code]](https:\u002F\u002Fgithub.com\u002FIIM-TTIJ\u002FMVA2023BirdDetection) \n    * ***MVA 2023***, July 23rd - 25th, 2023, ACT CITY Hamamatsu, Japan \n* **1st Tiny Object Detection (TOD) Challenge Real-world Recognition from Low-quality Inputs (RLQ)** [[Project]](https:\u002F\u002Frlq-tod.github.io\u002Findex.html)\n    * ***ECCV 2020***, August 23rd - 28th, 2020, SEC, GLASGOW\n\n## Papers\n\n### Tiny Object Detection\n\n* **Ensemble Fusion for Small Object Detection** [[Paper]](https:\u002F\u002Fieeexplore.ieee.org\u002Fdocument\u002F10215748) [[Code]](https:\u002F\u002Fgithub.com\u002Felsa-lab\u002FMVATeam1)\n    * Hao-Yu Hou, Mu-Yi Shen, Chia-Chi Hsu, En-Ming Huang, Yu-Chen Huang, Yu-Cheng Xia, Chien-Yao Wang, Chun-Yi Lee ***MVA 2023***\n* **Small Object Detection for Birds with Swin Transformer** [[Paper]](https:\u002F\u002Fwww.cs.is.i.nagoya-u.ac.jp\u002Fusers\u002Fide\u002Fres\u002Fpaper\u002FE23-conference-huod-1pub.pdf)\n    * Da Huo, Marc A. Kastner, TingWei Liu, Yasutomo Kawanishi, Takatsugu Hirayama, Takahiro Komamizu, Ichiro Ide ***MVA 2023***\n* **BandRe: Rethinking Band-Pass Filters for Scale-Wise Object Detection Evaluation** [[Paper]](https:\u002F\u002Farxiv.org\u002Fabs\u002F2307.11748) [[Code]](https:\u002F\u002Fgithub.com\u002Fshinya7y\u002FUniverseNet)\n    * Yosuke Shinya ***MVA 2023***\n* **Advancing Plain Vision Transformer Towards Remote Sensing Foundation Model** [[Paper]](https:\u002F\u002Farxiv.org\u002Fabs\u002F2208.03987) [[Code]](https:\u002F\u002Fgithub.com\u002FViTAE-Transformer\u002FRemote-Sensing-RVSA)\n    * Di Wang, Qiming Zhang, Yufei Xu, Jing Zhang, Bo Du, Dacheng Tao, Liangpei Zhang ***IEEE TGRS 2022***\n* **RFLA: Gaussian Receptive Field based Label Assignment for Tiny Object Detection** [[Paper]](https:\u002F\u002Farxiv.org\u002Fabs\u002F2208.08738) [[Code]](https:\u002F\u002Fgithub.com\u002FChasel-Tsui\u002Fmmdet-rfla)\n    * Chang Xu, Jinwang Wang, Wen Yang, Huai Yu, Lei Yu, Gui-Song Xia ***ECCV 2022***\n* **Slicing Aided Hyper Inference and Fine-tuning for Small Object Detection** [[Paper]](https:\u002F\u002Farxiv.org\u002Fabs\u002F2202.06934) [[Code]](https:\u002F\u002Fgithub.com\u002Fobss\u002Fsahi) [[Benchmark]](https:\u002F\u002Fgithub.com\u002Ffcakyon\u002Fsmall-object-detection-benchmark)\n    * Fatih Cagatay Akyon, Sinan Onur Altinuc, Alptekin Temizel ***ICIP 2022***\n* **Interactive Multi-Class Tiny-Object Detection** [[Paper]](https:\u002F\u002Farxiv.org\u002Fabs\u002F2203.15266) [[Code]](https:\u002F\u002Fgithub.com\u002FChungYi347\u002FInteractive-Multi-Class-Tiny-Object-Detection)\n    * Chunggi Lee, Seonwook Park, Heon Song, Jeongun Ryu, Sanghoon Kim, Haejoon Kim, Sérgio Pereira, Donggeun Yoo ***CVPR 2022***\n* **QueryDet: Cascaded Sparse Query for Accelerating High-Resolution Small Object Detection** [[Paper]](https:\u002F\u002Farxiv.org\u002Fabs\u002F2103.09136) [[Code]](https:\u002F\u002Fgithub.com\u002FChenhongyiYang\u002FQueryDet-PyTorch)\n    * Chenhongyi Yang, Zehao Huang, Naiyan Wang ***CVPR 2022***\n* **Object Detection in Aerial Images: A Large-Scale Benchmark and Challenges** [[Paper]](https:\u002F\u002Farxiv.org\u002Fabs\u002F2102.12219)\n    * Jian Ding, Nan Xue, Gui-Song Xia, Xiang Bai, Wen Yang, Micheal Ying Yang, Serge Belongie, Jiebo Luo, Mihai Datcu, Marcello Pelillo, Liangpei Zhang ***TPAMI 2021***\n* **MRDet: A Multi-Head Network for Accurate Oriented Object Detection in Aerial Images** [[Paper]](https:\u002F\u002Farxiv.org\u002Fabs\u002F2012.13135)\n    * Ran Qin, Qingjie Liu, Guangshuai Gao, Di Huang, Yunhong Wang ***TGRS 2021***\n* **Attentional Feature Refinement and Alignment Network for Aircraft Detection in SAR Imagery** [[Paper]](https:\u002F\u002Farxiv.org\u002Fabs\u002F2201.07124)\n    * Yan Zhao, Lingjun Zhao, Zhong Liu, Dewen Hu, Gangyao Kuang, Li Liu ***Submitted to TGRS***\n* **A Normalized Gaussian Wasserstein Distance for Tiny Object Detection** [[Paper]](https:\u002F\u002Farxiv.org\u002Fabs\u002F2110.13389)\n    * Jinwang Wang, Chang Xu, Wen Yang, Lei Yu ***arXiv 2021***\n* **Oriented Object Detection in Aerial Images with Box Boundary-Aware Vectors** [[Paper]](https:\u002F\u002Farxiv.org\u002Fabs\u002F2008.07043) [[Code]](https:\u002F\u002Fgithub.com\u002Fyijingru\u002FBBAVectors-Oriented-Object-Detection)\n    * Jingru Yi, Pengxiang Wu, Bo Liu, Qiaoying Huang, Hui Qu, Dimitris Metaxas ***WACV 2021*** \n* **TPH-YOLOv5: Improved YOLOv5 Based on Transformer Prediction Head for Object Detection on Drone-captured Scenarios** [[Paper]](https:\u002F\u002Farxiv.org\u002Fabs\u002F2108.11539)\n    * Xingkui Zhu, Shuchang Lyu, Xu Wang, Qi Zhao ***ICCV Workshop 2021***\n* **Oriented Bounding Boxes for Small and Freely Rotated Objects** [[Paper]](https:\u002F\u002Farxiv.org\u002Fabs\u002F2104.11854)\n    * Mohsen Zand, Ali Etemad, Michael Greenspan ***TGRS 2021***\n* **Learning Calibrated-Guidance for Object Detection in Aerial Images** [[Paper]](https:\u002F\u002Farxiv.org\u002Fabs\u002F2103.11399) [[Code]](https:\u002F\u002Fgithub.com\u002FWeiZongqi\u002FCG-Net)\n    * Dong Liang, Zongqi Wei, Dong Zhang, Qixiang Geng, Liyan Zhang, Han Sun, Huiyu Zhou, Mingqiang Wei, Pan Gao ***arXiv 2021***\n* **ReDet: A Rotation-equivariant Detector for Aerial Object Detection** [[Paper]](https:\u002F\u002Farxiv.org\u002Fabs\u002F2103.07733) [[Code]](https:\u002F\u002Fgithub.com\u002Fcsuhan\u002FReDet)\n    * Jiaming Han, Jian Ding, Nan Xue, Gui-Song Xia ***CVPR 2021***\n* **Object Detection in Aerial Images: A Large-Scale Benchmark and Challenges** [[Paper]](https:\u002F\u002Farxiv.org\u002Fabs\u002F2102.12219) [[Code]](https:\u002F\u002Fgithub.com\u002Fdingjiansw101\u002FAerialDetection)\n    * Jian Ding, Nan Xue, Gui-Song Xia, Xiang Bai, Wen Yang, Micheal Ying Yang, Serge Belongie, Jiebo Luo, Mihai Datcu, Marcello Pelillo, Liangpei Zhang ***arXiv 2021***\n* **Effective Fusion Factor in FPN for Tiny Object Detection** [[Paper]](https:\u002F\u002Farxiv.org\u002Fabs\u002F2011.02298)\n    * Yuqi Gong, Xuehui Yu, Yao Ding, Xiaoke Peng, Jian Zhao, Zhenjun Han ***WACV 2021***\n* **End-to-End Object Detection with Transformers** [[Paper]](https:\u002F\u002Farxiv.org\u002Fabs\u002F2005.12872) [[Code]](https:\u002F\u002Fgithub.com\u002Ffacebookresearch\u002Fdetr)\n    * Nicolas Carion, Francisco Massa, Gabriel Synnaeve, Nicolas Usunier, Alexander Kirillov, Sergey Zagoruyko ***ECCV 2020***\n* **Corner Proposal Network for Anchor-free, Two-stage Object Detection** [[Paper]](https:\u002F\u002Farxiv.org\u002Fabs\u002F2007.13816) [[Code]](https:\u002F\u002Fgithub.com\u002FDuankaiwen\u002FCPNDet)\n    * Kaiwen Duan, Lingxi Xie, Honggang Qi, Song Bai, Qingming Huang, Qi Tian ***ECCV 2020***\n* **HoughNet: Integrating near and long-range evidence for bottom-up object detection** [[Paper]](https:\u002F\u002Farxiv.org\u002Fabs\u002F2007.02355) [[Code]](https:\u002F\u002Fgithub.com\u002Fnerminsamet\u002Fhoughnet)\n    * Nermin Samet, Samet Hicsonmez, Emre Akbas ***ECCV 2020***\n* **EfficientDet: Scalable and Efficient Object Detection** [[Paper]](https:\u002F\u002Farxiv.org\u002Fabs\u002F1911.09070) [[Code]](https:\u002F\u002Fgithub.com\u002Fgoogle\u002Fautoml\u002Ftree\u002Fmaster\u002Fefficientdet) [[PyTorch]](https:\u002F\u002Fgithub.com\u002Fzylo117\u002FYet-Another-EfficientDet-Pytorch) [[PyTorch]](https:\u002F\u002Fgithub.com\u002Ftoandaominh1997\u002FEfficientDet.Pytorch) [[PyTorch]](https:\u002F\u002Fgithub.com\u002Frwightman\u002Fefficientdet-pytorch) [[TensorFlow]](https:\u002F\u002Fgithub.com\u002Fxuannianz\u002FEfficientDet)\n    * Mingxing Tan, Ruoming Pang, Quoc V. Le ***CVPR 2020***\n* **Efficient Object Detection in Large Images Using Deep Reinforcement Learning** [[Paper]](http:\u002F\u002Fopenaccess.thecvf.com\u002Fcontent_WACV_2020\u002Fpapers\u002FUzkent_Efficient_Object_Detection_in_Large_Images_Using_Deep_Reinforcement_Learning_WACV_2020_paper.pdf)\n    * Burak Uzkent, Christopher Yeh, Stefano Ermon ***WACV 2020***\n* **Scale Match for Tiny Person Detection** [[Paper]](https:\u002F\u002Farxiv.org\u002Fabs\u002F1912.10664) [[Benchmark]](https:\u002F\u002Fgithub.com\u002Fucas-vg\u002FTinyBenchmark)\n    * Xuehui Yu, Yuqi Gong, Nan Jiang, Qixiang Ye, Zhenjun Han ***WACV 2020***\n* **MultiResolution Attention Extractor for Small Object Detection** [[Paper]](https:\u002F\u002Farxiv.org\u002Fabs\u002F2006.05941v1)\n    * Fan Zhang, Licheng Jiao, Lingling Li, Fang Liu, Xu Liu ***arXiv 2020***\n* **Intrinsic Relationship Reasoning for Small Object Detection** [[Paper]](https:\u002F\u002Farxiv.org\u002Fabs\u002F2009.00833v1)\n    * Kui Fu, Jia Li, Lin Ma, Kai Mu, Yonghong Tian ***arXiv 2020***\n* **HRDNet: High-resolution Detection Network for Small Objects** [[Paper]](https:\u002F\u002Farxiv.org\u002Fabs\u002F2006.07607)\n    * Ziming Liu, Guangyu Gao, Lin Sun, Zhiyuan Fang ***arXiv 2020***\n* **Extended Feature Pyramid Network for Small Object Detection** [[Paper]](https:\u002F\u002Farxiv.org\u002Fabs\u002F2003.07021)\n    * Chunfang Deng, Mengmeng Wang, Liang Liu, and Yong Liu ***arXiv 2020***\n* **MatrixNets: A New Scale and Aspect Ratio Aware Architecture for Object Detection** [[Paper]](https:\u002F\u002Farxiv.org\u002Fabs\u002F2001.03194) [[Code]](https:\u002F\u002Fgithub.com\u002Farashwan\u002Fmatrixnet)\n    * Abdullah Rashwan, Rishav Agarwal, Agastya Kalra, Pascal Poupart ***arXiv 2020***\n* **Cross-dataset Training for Class Increasing Object Detection** [[Paper]](https:\u002F\u002Farxiv.org\u002Fabs\u002F2001.04621)\n    * Yongqiang Yao, Yan Wang, Yu Guo, Jiaojiao Lin, Hongwei Qin, Junjie Yan ***arXiv 2020***\n* **TBC-Net: A real-time detector for infrared small target detection using semantic constraint** [[Paper]](https:\u002F\u002Farxiv.org\u002Fabs\u002F2001.05852)\n    * Mingxin Zhao, Li Cheng, Xu Yang, Peng Feng, Liyuan Liu, Nanjian Wu ***arXiv 2020***\n* **RepPoints V2: Verification Meets Regression for Object Detection** [[Paper]](https:\u002F\u002Farxiv.org\u002Fabs\u002F2007.08508) [[Code]](https:\u002F\u002Fgithub.com\u002FScalsol\u002FRepPointsV2)\n    * Yihong Chen, Zheng Zhang, Yue Cao, Liwei Wang, Stephen Lin, Han Hu **arXiv 2020**\n* **M2Det: A Single-Shot Object Detector based on Multi-Level Feature Pyramid Network** [[Paper]](https:\u002F\u002Farxiv.org\u002Fabs\u002F1811.04533) [[Code]](https:\u002F\u002Fgithub.com\u002Fqijiezhao\u002FM2Det)\n    * Qijie Zhao, Tao Sheng, Yongtao Wang, Zhi Tang, Ying Chen, Ling Cai, Haibin Ling ***AAAI 2019***\n* **Better to Follow, Follow to Be Better: Towards Precise Supervision of Feature Super-Resolution for Small Object Detection** [[Paper]](http:\u002F\u002Fopenaccess.thecvf.com\u002Fcontent_ICCV_2019\u002Fpapers\u002FNoh_Better_to_Follow_Follow_to_Be_Better_Towards_Precise_Supervision_ICCV_2019_paper.pdf) [[Project]](http:\u002F\u002Fvision.snu.ac.kr\u002Fproject_pages\u002Ficcv19_noh\u002Fviews\u002F)\n    * Junhyug Noh, Wonho Bae, Wonhee Lee, Jinhwan Seo, Gunhee Kim ***ICCV 2019***\n* **Enriched Feature Guided Refinement Network for Object Detection** [[Paper]](http:\u002F\u002Fopenaccess.thecvf.com\u002Fcontent_ICCV_2019\u002Fpapers\u002FNie_Enriched_Feature_Guided_Refinement_Network_for_Object_Detection_ICCV_2019_paper.pdf) [[Code]](https:\u002F\u002Fgithub.com\u002FRanchentx\u002FEFGRNet)\n    * Jing Nie, Rao Muhammad Anwer, Hisham Cholakkal, Fahad Shahbaz Khan, Yanwei Pang, Ling Shao ***ICCV 2019***\n* **RepPoints: Point Set Representation for Object Detection** [[Paper]](https:\u002F\u002Farxiv.org\u002Fabs\u002F1904.11490) [[Code]](https:\u002F\u002Fgithub.com\u002Fmicrosoft\u002FRepPoints)\n    * Ze Yang, Shaohui Liu, Han Hu, Liwei Wang, Stephen Lin ***ICCV 2019***\n* **Scale-Aware Trident Networks for Object Detection** [[Paper]](https:\u002F\u002Farxiv.org\u002Fabs\u002F1901.01892) [[Code]](https:\u002F\u002Fgithub.com\u002FTuSimple\u002Fsimpledet\u002Ftree\u002Fmaster\u002Fmodels\u002Ftridentnet)\n    * Yanghao Li, Yuntao Chen, Naiyan Wang, Zhaoxiang Zhang ***ICCV 2019***\n* **SCRDet: Towards More Robust Detection for Small, Cluttered and Rotated Objects** [[Paper]](http:\u002F\u002Fopenaccess.thecvf.com\u002Fcontent_ICCV_2019\u002Fpapers\u002FYang_SCRDet_Towards_More_Robust_Detection_for_Small_Cluttered_and_Rotated_ICCV_2019_paper.pdf)\n    * Xue Yang, Jirui Yang, Junchi Yan, Yue Zhang, Tengfei Zhang, Zhi Guo, Xian Sun, Kun Fu ***ICCV 2019***\n* **Clustered Object Detection in Aerial Images** [[Paper]](http:\u002F\u002Fopenaccess.thecvf.com\u002Fcontent_ICCV_2019\u002Fpapers\u002FYang_Clustered_Object_Detection_in_Aerial_Images_ICCV_2019_paper.pdf)\n    * Fan Yang, Heng Fan, Peng Chu, Erik Blasch, Haibin Ling ***ICCV 2019***\n* **The Power of Tiling for Small Object Detection** [[Paper]](https:\u002F\u002Fopenaccess.thecvf.com\u002Fcontent_CVPRW_2019\u002Fpapers\u002FUAVision\u002FUnel_The_Power_of_Tiling_for_Small_Object_Detection_CVPRW_2019_paper.pdf)\n    * F. Ozge Unel, Burak O. Ozkalayci, Cevahir Cigla ***CVPR Workshop 2019***\n* **Learning Object-Wise Semantic Representation for Detection in Remote Sensing Imagery** [[Paper]](http:\u002F\u002Fopenaccess.thecvf.com\u002Fcontent_CVPRW_2019\u002Fpapers\u002FDOAI\u002FLi_Learning_Object-Wise_Semantic_Representation_for_Detection_in_Remote_Sensing_Imagery_CVPRW_2019_paper.pdf)\n    * Chengzheng Li, Chunyan Xu, Zhen Cui, Dan Wang, Zequn Jie, Tong Zhang, Jian Yang ***CVPR Workshop 2019***\n* **AugFPN: Improving Multi-scale Feature Learning for Object Detection** [[Paper]](https:\u002F\u002Farxiv.org\u002Fabs\u002F1912.05384)\n    * Chaoxu Guo, Bin Fan, Qian Zhang, Shiming Xiang, Chunhong Pan ***CoRR 2019, CVPR2020***\n* **R2-CNN: Fast Tiny Object Detection in Large-scale Remote Sensing Images** [[Paper]](https:\u002F\u002Farxiv.org\u002Fabs\u002F1902.06042v2)\n    * Jiangmiao Pang, Cong Li, Jianping Shi, Zhihai Xu, Huajun Feng ***TGRS 2019***\n* **R3Det: Refined Single-Stage Detector with Feature Refinement for Rotating Object** [[Paper]](https:\u002F\u002Farxiv.org\u002Fabs\u002F1908.05612) [[Code]](https:\u002F\u002Fgithub.com\u002FThinklab-SJTU\u002FR3Det_Tensorflow)\n    * Yang, Xue and Liu, Qingqing and Yan, Junchi and Li, Ang and Zhiqiang, Zhang and Gang, Yu ***AAAI 2021***\n* **SpineNet: Learning Scale-Permuted Backbone for Recognition and Localization** [[Paper]](https:\u002F\u002Farxiv.org\u002Fabs\u002F1912.05027)\n    * Xianzhi Du, Tsung-Yi Lin, Pengchong Jin, Golnaz Ghiasi, Mingxing Tan, Yin Cui, Quoc V. Le, Xiaodan Song ***arXiv 2019***\n* **Learning Spatial Fusion for Single-Shot Object Detection** [[Paper]](https:\u002F\u002Farxiv.org\u002Fabs\u002F1911.09516) [[Code]](https:\u002F\u002Fgithub.com\u002Fruinmessi\u002FASFF)\n    * Songtao Liu, Di Huang, Yunhong Wang ***arXiv 2019***\n* **Augmentation for small object detection** [[Paper]](https:\u002F\u002Farxiv.org\u002Fabs\u002F1902.07296) [[Code]](https:\u002F\u002Fgithub.com\u002Fgmayday1997\u002FSmallObjectAugmentation)\n    * Mate Kisantal, Zbigniew Wojna, Jakub Murawski, Jacek Naruniec, Kyunghyun Cho ***arXiv 2019***\n* **Small Object Detection using Context and Attention** [[Paper]](https:\u002F\u002Farxiv.org\u002Fabs\u002F1912.06319)\n    * Jeong-Seon Lim, Marcella Astrid, Hyun-Jin Yoon, Seung-Ik Lee ***arXiv 2019***\n* **Single-Shot Refinement Neural Network for Object Detection** [[Paper]](https:\u002F\u002Farxiv.org\u002Fabs\u002F1711.06897) [[Code]](https:\u002F\u002Fgithub.com\u002Fsfzhang15\u002FRefineDet) [[PyTorch]](https:\u002F\u002Fgithub.com\u002Fdd604\u002Frefinedet.pytorch)\n    * Shifeng Zhang, Longyin Wen, Xiao Bian, Zhen Lei, Stan Z. Li ***CVPR 2018***\n* **An Analysis of Scale Invariance in Object Detection - SNIP** [[Paper]](https:\u002F\u002Farxiv.org\u002Fabs\u002F1711.08189)\n    * Bharat Singh, Larry S. Davis ***CVPR 2018***\n* **Cascade R-CNN Delving into High Quality Object Detection** [[Paper]](https:\u002F\u002Farxiv.org\u002Fabs\u002F1712.00726) [[Code]](https:\u002F\u002Fgithub.com\u002Fzhaoweicai\u002Fcascade-rcnn)\n    * Zhaowei Cai, Nuno Vasconcelos ***CVPR 2018***\n* **Single-Shot Object Detection with Enriched Semantics** [[Paper]](https:\u002F\u002Farxiv.org\u002Fabs\u002F1712.00433)\n    * Zhishuai Zhang, Siyuan Qiao, Cihang Xie, Wei Shen, Bo Wang, Alan L. Yuille ***CVPR 2018***\n* **Scale-Transferrable Object Detection** [[Paper]](http:\u002F\u002Fopenaccess.thecvf.com\u002Fcontent_cvpr_2018\u002FCameraReady\u002F1376.pdf) [[Code]](https:\u002F\u002Fgithub.com\u002Farvention\u002FSTDN-PyTorch)\n    * Peng Zhou, Bingbing Ni, Cong Geng, Jianguo Hu, Yi Xu ***CVPR 2018***\n* **Deep Feature Pyramid Reconfiguration for Object Detection** [[Paper]](http:\u002F\u002Fopenaccess.thecvf.com\u002Fcontent_ECCV_2018\u002Fpapers\u002FTao_Kong_Deep_Feature_Pyramid_ECCV_2018_paper.pdf)\n    * Tao Kong, Fuchun Sun, Wenbing Huang, Huaping Liu ***ECCV 2018***\n* **DetNet: A Backbone network for Object Detection** [[Paper]](https:\u002F\u002Farxiv.org\u002Fabs\u002F1804.06215) [[Code]](https:\u002F\u002Fgithub.com\u002Fguoruoqian\u002FDetNet_pytorch)\n    * Zeming Li, Chao Peng, Gang Yu, Xiangyu Zhang, Yangdong Deng, Jian Sun ***ECCV 2018***\n* **SOD-MTGAN: Small Object Detection via Multi-Task Generative Adversarial Network** [[Paper]](http:\u002F\u002Fopenaccess.thecvf.com\u002Fcontent_ECCV_2018\u002Fpapers\u002FYongqiang_Zhang_SOD-MTGAN_Small_Object_ECCV_2018_paper.pdf)\n    * Yancheng Bai, Yongqiang Zhang, Mingli Ding, Bernard Ghanem ***ECCV 2018***\n* **SNIPER: Efficient Multi-Scale Training** [[Paper]](https:\u002F\u002Farxiv.org\u002Fabs\u002F1805.09300) [[Code]](https:\u002F\u002Fgithub.com\u002FMahyarNajibi\u002FSNIPER)\n    * Bharat Singh, Mahyar Najibi, Larry S. Davis ***NeurIPS 2018***\n* **YOLOv3: An Incremental Improvement** [[Paper]](https:\u002F\u002Farxiv.org\u002Fabs\u002F1804.02767) [[Project]](https:\u002F\u002Fpjreddie.com\u002Fdarknet\u002Fyolo\u002F) [[Code]](https:\u002F\u002Fgithub.com\u002Fayooshkathuria\u002Fpytorch-yolo-v3)\n    * Joseph Redmon, Ali Farhadi ***arXiv 2018***\n* **You Only Look Twice: Rapid Multi-Scale Object Detection In Satellite Imagery** [[Paper]](https:\u002F\u002Farxiv.org\u002Fabs\u002F1805.09512) [[Code]](https:\u002F\u002Fgithub.com\u002Favanetten\u002Fyolt)\n    * Adam Van Etten ***arXiv 2018***\n* **MSDNN: Multi-Scale Deep Neural Network for Salient Object Detection** [[Paper]](https:\u002F\u002Farxiv.org\u002Fabs\u002F1801.04187)\n    * Fen Xiao, Wenzheng Deng, Liangchan Peng, Chunhong Cao, Kai Hu, Xieping Gao ***arXiv 2018***\n* **MDSSD: Multi-scale Deconvolutional Single Shot Detector for Small Objects** [[Paper]](https:\u002F\u002Farxiv.org\u002Fabs\u002F1805.07009)\n    * Mingliang Xu, Lisha Cui, Pei Lv, Xiaoheng Jiang, Jianwei Niu, Bing Zhou, Meng Wang ***arXiv 2018***\n* **Perceptual Generative Adversarial Networks for Small Object Detection** [[Paper]](https:\u002F\u002Farxiv.org\u002Fabs\u002F1706.05274)\n    * Jianan Li, Xiaodan Liang, Yunchao Wei, Tingfa Xu, Jiashi Feng, Shuicheng Yan ***CVPR 2017***\n* **Feature Pyramid Networks for Object Detection** [[Paper]](https:\u002F\u002Farxiv.org\u002Fabs\u002F1612.03144)\n    * Tsung-Yi Lin, Piotr Dollár, Ross Girshick, Kaiming He, Bharath Hariharan, Serge Belongie ***CVPR 2017***\n* **DSSD : Deconvolutional Single Shot Detector** [[Paper]](https:\u002F\u002Farxiv.org\u002Fabs\u002F1701.06659) [[Code]](https:\u002F\u002Fgithub.com\u002Fchengyangfu\u002Fcaffe\u002Ftree\u002Fdssd)\n    * Cheng-Yang Fu, Wei Liu, Ananth Ranga, Ambrish Tyagi, Alexander C. Berg ***CVPR 2017***\n* **Accurate Single Stage Detector Using Recurrent Rolling Convolution** [[Paper]](https:\u002F\u002Farxiv.org\u002Fabs\u002F1704.05776) [[Code]](https:\u002F\u002Fgithub.com\u002FxiaohaoChen\u002Frrc_detection)\n    * Jimmy Ren, Xiaohao Chen, Jianbo Liu, Wenxiu Sun, Jiahao Pang, Qiong Yan, Yu-Wing Tai, Li Xu ***CVPR 2017***\n* **Focal Loss for Dense Object Detection** [[Paper]](https:\u002F\u002Farxiv.org\u002Fabs\u002F1708.02002) [[PyTorch]](https:\u002F\u002Fgithub.com\u002Fyhenon\u002Fpytorch-retinanet)\n    * Tsung-Yi Lin, Priya Goyal, Ross Girshick, Kaiming He, Piotr Dollár ***ICCV 2017***\n* **Deformable Convolutional Networks** [[Paper]](https:\u002F\u002Farxiv.org\u002Fabs\u002F1703.06211) [[Code]](https:\u002F\u002Fgithub.com\u002Fmsracver\u002FDeformable-ConvNets)\n    * Jifeng Dai, Haozhi Qi, Yuwen Xiong, Yi Li, Guodong Zhang, Han Hu, Yichen Wei ***ICCV 2017***\n* **Feature-Fused SSD: Fast Detection for Small Objects** [[Paper]](https:\u002F\u002Farxiv.org\u002Fabs\u002F1709.05054) [[Code]](https:\u002F\u002Fgithub.com\u002Fwnzhyee\u002FFeature-Fused-SSD)\n    * Guimei Cao, Xuemei Xie, Wenzhe Yang, Quan Liao, Guangming Shi, Jinjian Wu ***ICGIP 2017***\n* **FSSD: Feature Fusion Single Shot Multibox Detector** [[Paper]](https:\u002F\u002Farxiv.org\u002Fabs\u002F1712.00960) [[Code]](https:\u002F\u002Fgithub.com\u002Flzx1413\u002FCAFFE_SSD\u002Ftree\u002Ffssd)\n    * Zuoxin Li, Fuqiang Zhou ***arXiv 2017***\n* **Inside-Outside Net: Detecting Objects in Context with Skip Pooling and Recurrent Neural Networks** [[Paper]](https:\u002F\u002Farxiv.org\u002Fabs\u002F1512.04143)\n    * Sean Bell, C. Lawrence Zitnick, Kavita Bala, Ross Girshick ***CVPR 2016***\n\n### Tiny Face Detection\n\n* **TinaFace: Strong but Simple Baseline for Face Detection** [[Paper]](https:\u002F\u002Farxiv.org\u002Fabs\u002F2011.13183) [[Code]](https:\u002F\u002Fgithub.com\u002FMedia-Smart\u002Fvedadet)\n    * Yanjia Zhu, Hongxiang Cai, Shuhan Zhang, Chenhao Wang, Yichao Xiong ***arXiv 2020***\n* **Robust Face Detection via Learning Small Faces on Hard Images** [[Paper]](http:\u002F\u002Fopenaccess.thecvf.com\u002Fcontent_WACV_2020\u002Fpapers\u002FZhang_Robust_Face_Detection_via_Learning_Small_Faces_on_Hard_Images_WACV_2020_paper.pdf) [[Code]](https:\u002F\u002Fgithub.com\u002Fbairdzhang\u002Fsmallhardface)\n    * Zhishuai Zhang, Wei Shen, Siyuan Qiao, Yan Wang, Bo Wang, Alan Yuille ***WACV 2020***\n* **Finding Tiny Faces in the Wild with Generative Adversarial Network** [[Paper]](https:\u002F\u002Fivul.kaust.edu.sa\u002FDocuments\u002FPublications\u002F2018\u002FFinding%20Tiny%20Faces%20in%20the%20Wild%20with%20Generative%20Adversarial%20Network.pdf)\n    * Yancheng Bai, Yongqiang Zhang, Mingli Ding, Bernard Ghanem ***CVPR 2018***\n* **Seeing Small Faces from Robust Anchor’s Perspective** [[Paper]](https:\u002F\u002Farxiv.org\u002Fabs\u002F1802.09058)\n    * Chenchen Zhu, Ran Tao, Khoa Luu, Marios Savvides ***CVPR 2018***\n* **Face-MagNet: Magnifying Feature Maps to Detect Small Faces** [[Paper]](https:\u002F\u002Farxiv.org\u002Fabs\u002F1803.05258)\n    * Pouya Samangouei, Mahyar Najibi, Larry Davis, Rama Chellappa ***WACV 2018***\n* **Finding Tiny Faces** [[Paper]](https:\u002F\u002Farxiv.org\u002Fabs\u002F1612.04402) [[Project]](http:\u002F\u002Fwww.cs.cmu.edu\u002F~peiyunh\u002Ftiny\u002Findex.html) [[Code]](https:\u002F\u002Fgithub.com\u002Fpeiyunh\u002Ftiny)\n    * Peiyun Hu, Deva Ramanan ***CVPR 2017***\n* **S3FD: Single Shot Scale-invariant Face Detector** [[Paper]](http:\u002F\u002Fopenaccess.thecvf.com\u002Fcontent_ICCV_2017\u002Fpapers\u002FZhang_S3FD_Single_Shot_ICCV_2017_paper.pdf)\n    * Shifeng Zhang Xiangyu Zhu Zhen Lei∗ Hailin Shi Xiaobo Wang Stan Z. Li ***ICCV 2017***\n* **Detecting and counting tiny faces** [[Paper]](https:\u002F\u002Farxiv.org\u002Fabs\u002F1801.06504)\n    * Alexandre Attia, Sharone Dayan ***arXiv 2018***\n\n### Tiny Pedestrian Detection\n\n* **High-level Semantic Feature Detection: A New Perspective for Pedestrian Detection** [[Paper]](http:\u002F\u002Fopenaccess.thecvf.com\u002Fcontent_CVPR_2019\u002Fpapers\u002FLiu_High-Level_Semantic_Feature_Detection_A_New_Perspective_for_Pedestrian_Detection_CVPR_2019_paper.pdf) [[Code]](https:\u002F\u002Fgithub.com\u002Fliuwei16\u002FCSP)\n    * Wei Liu, ShengCai Liao, Weiqiang Ren, Weidong Hu, Yinan Yu ***CVPR 2019***\n* **Feature Selective Anchor-Free Module for Single-Shot Object Detection** [[Paper]](http:\u002F\u002Fopenaccess.thecvf.com\u002Fcontent_CVPR_2019\u002Fpapers\u002FZhu_Feature_Selective_Anchor-Free_Module_for_Single-Shot_Object_Detection_CVPR_2019_paper.pdf) [[PyTorch]](https:\u002F\u002Fgithub.com\u002Fhdjang\u002FFeature-Selective-Anchor-Free-Module-for-Single-Shot-Object-Detection) [[TensorFlow]](https:\u002F\u002Fgithub.com\u002Fxuannianz\u002FFSAF)\n    * Chenchen Zhu, Yihui He, Marios Savvides ***CVPR 2019***\n* **Seek and You Will Find: A New Optimized Framework for Efficient Detection of Pedestrian** [[Paper]](https:\u002F\u002Farxiv.org\u002Fabs\u002F1912.10241)\n    * Sudip Das, Partha Sarathi Mukherjee, Ujjwal Bhattacharya ***arXiv 2019***\n* **Small-scale Pedestrian Detection Based on Somatic Topology Localization and Temporal Feature Aggregation** [[Paper]](https:\u002F\u002Farxiv.org\u002Fabs\u002F1807.01438)\n    * Tao Song, Leiyu Sun, Di Xie, Haiming Sun, Shiliang Pu ***ECCV 2018***\n\n## Datasets\n\n* **MVA2023 Small Object Detection Challenge for Spotting Birds: Dataset, Methods, and Results** [[Paper]](https:\u002F\u002Farxiv.org\u002Fabs\u002F2307.09143) [[Project]](https:\u002F\u002Fmva-org.jp\u002Fmva2023\u002Fchallenge) [[Code]](https:\u002F\u002Fgithub.com\u002FIIM-TTIJ\u002FMVA2023SmallObjectDetection4SpottingBirds)\n    * Yuki Kondo, Norimichi Ukita, Takayuki Yamaguchi, Hao-Yu Hou, Mu-Yi Shen, Chia-Chi Hsu, En-Ming Huang, Yu-Chen Huang, Yu-Cheng Xia, Chien-Yao Wang, Chun-Yi Lee, Da Huo, Marc A. Kastner, Tingwei Liu, Yasutomo Kawanishi, Takatsugu Hirayama, Takahiro Komamizu, Ichiro Ide, Yosuke Shinya, Xinyao Liu, Guang Liang, Syusuke Yasui ***MVA 2023***\n* **Detection and Tracking Meet Drones Challenge** [[Paper]](https:\u002F\u002Farxiv.org\u002Fabs\u002F2001.06303) [[Project]](http:\u002F\u002Faiskyeye.com\u002F) [[Code]](https:\u002F\u002Fgithub.com\u002FVisDrone\u002FVisDrone-Dataset)\n    * Pengfei Zhu, Longyin Wen, Dawei Du, Xiao Bian, Heng Fan, Qinghua Hu, Haibin Ling ***TPAMI 2021***\n* **Tiny Object Detection in Aerial Images** [[Paper]](https:\u002F\u002Fdrive.google.com\u002Ffile\u002Fd\u002F1IiTp7gilwDCGr8QR_H9Covz8aVK7LXiI\u002Fview) [[Code]](https:\u002F\u002Fgithub.com\u002Fjwwangchn\u002FAI-TOD)\n    * Jinwang Wang, Wen Yang, Haowen Guo, Ruixiang Zhang, Gui-Song Xia ***ICPR 2021***\n* **iSAID: A Large-scale Dataset for Instance Segmentation in Aerial Images** [[Paper]](http:\u002F\u002Fopenaccess.thecvf.com\u002Fcontent_CVPRW_2019\u002Fpapers\u002FDOAI\u002FZamir_iSAID_A_Large-scale_Dataset_for_Instance_Segmentation_in_Aerial_Images_CVPRW_2019_paper.pdf) [[Project]](https:\u002F\u002Fcaptain-whu.github.io\u002FiSAID\u002Findex.html)\n    * Syed Waqas Zamir, Aditya Arora, Akshita Gupta, Salman Khan, Guolei Sun, Fahad Shahbaz Khan, Fan Zhu, Ling Shao, Gui-Song Xia, Xiang Bai ***CVPRW 2019***\n* **BIRDSAI: A Dataset for Detection and Tracking in Aerial Thermal Infrared Videos** [[Paper]](http:\u002F\u002Fopenaccess.thecvf.com\u002Fcontent_WACV_2020\u002Fpapers\u002FBondi_BIRDSAI_A_Dataset_for_Detection_and_Tracking_in_Aerial_Thermal_WACV_2020_paper.pdf) [[Project]](https:\u002F\u002Fsites.google.com\u002Fview\u002Felizabethbondi\u002Fdataset)\n    * Elizabeth Bondi, Raghav Jain, Palash Aggrawal, Saket Anand, Robert Hannaford, Ashish Kapoor, Jim Piavis, Shital Shah, Lucas Joppa, Bistra Dilkina, Milind Tambe ***WACV 2020***\n* **TinyPerson Dataset for Tiny Person Detection** [[Paper]](https:\u002F\u002Farxiv.org\u002Fabs\u002F1912.10664) [[Project]](http:\u002F\u002Fvision.ucas.ac.cn\u002Fresource.asp)\n    * Yu, Xuehui and Gong, Yuqi and Jiang, Nan and Ye, Qixiang and Han, Zhenjun ***WACV 2020***\n* **The EuroCity Persons Dataset: A Novel Benchmark for Object Detection** [[Paper]](https:\u002F\u002Fieeexplore.ieee.org\u002Fdocument\u002F8634919) [[Project]](https:\u002F\u002Feurocity-dataset.tudelft.nl\u002Feval\u002Foverview\u002Fhome)\n    * Braun, Markus and Krebs, Sebastian and Flohr, Fabian B. and Gavrila, Dariu M. ***TPAMI 2019***\n* **WiderPerson: A Diverse Dataset for Dense Pedestrian Detection in the Wild** [[Paper]](https:\u002F\u002Farxiv.org\u002Fabs\u002F1909.12118) [[Project]](http:\u002F\u002Fwww.cbsr.ia.ac.cn\u002Fusers\u002Fsfzhang\u002FWiderPerson\u002F)\n    * Shifeng Zhang, Yiliang Xie, Jun Wan, Hansheng Xia, Stan Z. Li, Guodong Guo ***TMM 2019***\n* **DOTA: A Large-scale Dataset for Object Detection in Aerial Images** [[Paper]](https:\u002F\u002Farxiv.org\u002Fabs\u002F1711.10398) [[Project]](https:\u002F\u002Fcaptain-whu.github.io\u002FDOTA\u002F)\n    * Gui-Song Xia, Xiang Bai, Jian Ding, Zhen Zhu, Serge Belongie, Jiebo Luo, Mihai Datcu, Marcello Pelillo, Liangpei Zhang ***CVPR 2018***\n* **NightOwls: A Pedestrians at Night Dataset** [[Paper]](http:\u002F\u002Fwww.robots.ox.ac.uk\u002F~vgg\u002Fpublications\u002F2018\u002FNeumann18b\u002Fneumann18b.pdf) [[Project]](https:\u002F\u002Fwww.nightowls-dataset.org)\n    * Lukáš Neumann, Michelle Karg, Shanshan Zhang, Christian Scharfenberger, Eric Piegert, Sarah Mistr, Olga Prokofyeva, Robert Thiel, Andrea Vedaldi, Andrew Zisserman, and Bernt Schiele ***ACCV 2018***\n* **DeepScores – A Dataset for Segmentation, Detection and Classification of Tiny Objects** [[Paper]](https:\u002F\u002Ftuggeluk.github.io\u002Fpapers\u002Fpreprint_deepscores.pdf) [[Project]](https:\u002F\u002Ftuggeluk.github.io\u002Fdeepscores\u002F) [[Code]](https:\u002F\u002Fgithub.com\u002Ftuggeluk\u002FDeepScoresExamples)\n    * Lukas Tuggener, Ismail Elezi, Jurgen Schmidhuber, Marcello Pelillo, Thilo Stadelmann ***ICPR 2018***\n* **Bosch Small Traffic Lights Dataset** [[Paper]](https:\u002F\u002Fieeexplore.ieee.org\u002Fdocument\u002F7989163) [[Project]](https:\u002F\u002Fhci.iwr.uni-heidelberg.de\u002Fnode\u002F6132) [[Code]](https:\u002F\u002Fgithub.com\u002Fbosch-ros-pkg\u002Fbstld)\n    * Karsten Behrendt, Libor Novak, Rami Botros ***ICRA 2017***\n* **CityPersons: A Diverse Dataset for Pedestrian Detection** [[Paper]](https:\u002F\u002Farxiv.org\u002Fabs\u002F1702.05693)\n    * Shanshan Zhang, Rodrigo Benenson, Bernt Schiele ***arXiv 2017***\n* **WIDER FACE: A Face Detection Benchmark** [[Paper]](https:\u002F\u002Farxiv.org\u002Fabs\u002F1511.06523) [[Project]](http:\u002F\u002Fshuoyang1213.me\u002FWIDERFACE\u002F)\n    * Shuo Yang, Ping Luo, Chen Change Loy, Xiaoou Tang ***CVPR 2016***\n* **Small Object Dataset** [[Paper]](http:\u002F\u002Fvisal.cs.cityu.edu.hk\u002Fstatic\u002Fpubs\u002Fconf\u002Fcvpr15-densdet.pdf) [[Project]](http:\u002F\u002Fvisal.cs.cityu.edu.hk\u002Fdownloads\u002Fsmallobjects\u002F)\n    * Zheng Ma, Lei Yu, Antoni B. Chan ***CVPR 2015***\n* **Caltech Pedestrian Detection Benchmark** [[Paper]](http:\u002F\u002Fwww.vision.caltech.edu\u002FImage_Datasets\u002FCaltechPedestrians\u002Ffiles\u002FCVPR09pedestrians.pdf) [[Paper]](http:\u002F\u002Fwww.vision.caltech.edu\u002FImage_Datasets\u002FCaltechPedestrians\u002Ffiles\u002FPAMI12pedestrians.pdf) [[Project]](http:\u002F\u002Fwww.vision.caltech.edu\u002FImage_Datasets\u002FCaltechPedestrians\u002F)\n    * Piotr Dollár, Christian Wojek, Bernt Schiele, Pietro Perona ***CVPR 2009, TPAMI 2012***\n* **Penn-Fudan Database for Pedestrian Detection and Segmentation** [[Paper]](https:\u002F\u002Fwww.seas.upenn.edu\u002F~jshi\u002Fpapers\u002Fobj_det_liming_accv07.pdf) [[Project]](https:\u002F\u002Fwww.cis.upenn.edu\u002F~jshi\u002Fped_html\u002F)\n    * Liming Wang, Jianbo Shi, Gang Song, I-fan Shen ***ACCV 2007***\n\n## Surveys\n\n* **Model Rubik's Cube: Twisting Resolution, Depth and Width for TinyNets** [[Paper]](https:\u002F\u002Farxiv.org\u002Fabs\u002F2010.14819) [[Code]](https:\u002F\u002Fgitee.com\u002Fmindspore\u002Fmindspore\u002Ftree\u002Fmaster\u002Fmodel_zoo\u002Fresearch\u002Fcv\u002Ftinynet)\n    * Kai Han, Yunhe Wang, Qiulin Zhang, Wei Zhang, Chunjing Xu, Tong Zhang ***NeurIPS 2020***\n* **A Survey of Deep Learning-based Object Detection** [[Paper]](https:\u002F\u002Farxiv.org\u002Fabs\u002F1907.09408)\n    * Licheng Jiao, Fan Zhang, Fang Liu, Shuyuan Yang, Lingling Li, Zhixi Feng, Rong Qu ***IEEE Access 2019***\n* **Recent Advances in Deep Learning for Object Detection** [[Paper]](https:\u002F\u002Farxiv.org\u002Fabs\u002F1908.03673)\n    * Xiongwei Wu, Doyen Sahoo, Steven C.H. Hoi ***CoRR 2019***\n* **Imbalance Problems in Object Detection: A Review** [[Paper]](https:\u002F\u002Farxiv.org\u002Fabs\u002F1909.00169) [[Project]](https:\u002F\u002Fgithub.com\u002Fkemaloksuz\u002FObjectDetectionImbalance)\n    * Kemal Oksuz, Baris Can Cam, Sinan Kalkan, Emre Akbas ***TPAMI 2020***\n* **Object Detection in 20 Years: A Survey** [[Paper]](https:\u002F\u002Farxiv.org\u002Fabs\u002F1905.05055)\n    * Zhengxia Zou, Zhenwei Shi, Yuhong Guo, Jieping Ye ***submitted to TPAMI 2019***\n* **Speed\u002Faccuracy trade-offs for modern convolutional object detectors** [[Paper]](https:\u002F\u002Farxiv.org\u002Fabs\u002F1611.10012)\n    * Jonathan Huang, Vivek Rathod, Chen Sun, Menglong Zhu, Anoop Korattikara, Alireza Fathi, Ian Fischer, Zbigniew Wojna, Yang Song, Sergio Guadarrama, Kevin Murphy ***CVPR 2017***\n\n## Articles\n\n* **[Tackling the Small Object Problem in Object Detection](https:\u002F\u002Fblog.roboflow.com\u002Fdetect-small-objects\u002F) ([Video](https:\u002F\u002Fwww.youtube.com\u002Fwatch?v=WeQcURbHA7U&ab_channel=Roboflow))**\n* **[Small objects detection problem - Medium](https:\u002F\u002Fmedium.datadriveninvestor.com\u002Fsmall-objects-detection-problem-c5b430996162)**\n* **[提升小目标检测的思路 - Zhihu](https:\u002F\u002Fzhuanlan.zhihu.com\u002Fp\u002F121666693?utm_source=ZHShareTargetIDMore&utm_medium=social&utm_oi=1108654922240958464)**\n* **[How do you do object detection using CNNs on small objects like ping pong balls? - Quora](https:\u002F\u002Fwww.quora.com\u002FHow-do-you-do-object-detection-using-CNNs-on-small-objects-like-ping-pong-balls)**\n* **[深度学习在 small object detection 有什么进展? - Zhihu](https:\u002F\u002Fwww.zhihu.com\u002Fquestion\u002F272322209)**\n* **[小目标检测问题中“小目标”如何定义？其主要技术难点在哪？有哪些比较好的传统的或深度学习方法？ - Zhihu](https:\u002F\u002Fwww.zhihu.com\u002Fquestion\u002F269877902)**\n","# 令人惊叹的小目标检测\n一份精心整理的```小目标检测```论文及相关资源列表。\n\n## 目录\n\n* [活动](#activities)\n* [论文](#papers)\n    * [小目标检测](#tiny-object-detection)\n    * [小人脸检测](#tiny-face-detection)\n    * [小行人检测](#tiny-pedestrian-detection)\n* [数据集](#datasets)\n* [综述](#surveys)\n* [文章](#articles)\n\n## Activities\n\n* **2023年鸟类小目标检测挑战赛** [[项目]](http:\u002F\u002Fwww.mva-org.jp\u002Fmva2023\u002Fchallenge) [[代码]](https:\u002F\u002Fgithub.com\u002FIIM-TTIJ\u002FMVA2023BirdDetection) \n    * ***MVA 2023***, 2023年7月23日至25日，日本滨松ACT CITY \n* **首届小目标检测（TOD）挑战赛：低质量输入下的真实世界识别（RLQ）** [[项目]](https:\u002F\u002Frlq-tod.github.io\u002Findex.html)\n    * ***ECCV 2020***, 2020年8月23日至28日，格拉斯哥SEC会议中心\n\n## Papers\n\n### 小目标检测\n\n* **用于小目标检测的集成融合** [[论文]](https:\u002F\u002Fieeexplore.ieee.org\u002Fdocument\u002F10215748) [[代码]](https:\u002F\u002Fgithub.com\u002Felsa-lab\u002FMVATeam1)\n    * 侯浩宇、沈牧毅、许家齐、黄恩明、黄昱辰、夏宇成、王建尧、李春义 ***MVA 2023***\n* **基于Swin Transformer的鸟类小目标检测** [[论文]](https:\u002F\u002Fwww.cs.is.i.nagoya-u.ac.jp\u002Fusers\u002Fide\u002Fres\u002Fpaper\u002FE23-conference-huod-1pub.pdf)\n    * 阮达、马克·A·卡斯特纳、刘廷伟、川西康友、平山隆次、驹水隆弘、井出一郎 ***MVA 2023***\n* **BandRe：重新思考带通滤波器在尺度感知目标检测评估中的应用** [[论文]](https:\u002F\u002Farxiv.org\u002Fabs\u002F2307.11748) [[代码]](https:\u002F\u002Fgithub.com\u002Fshinya7y\u002FUniverseNet)\n    * 真矢洋介 ***MVA 2023***\n* **推进普通视觉Transformer迈向遥感基础模型** [[论文]](https:\u002F\u002Farxiv.org\u002Fabs\u002F2208.03987) [[代码]](https:\u002F\u002Fgithub.com\u002FViTAE-Transformer\u002FRemote-Sensing-RVSA)\n    * 王迪、张启明、徐宇飞、张静、杜波、陶大程、张良培 ***IEEE TGRS 2022***\n* **RFLA：基于高斯感受野的小目标检测标签分配方法** [[论文]](https:\u002F\u002Farxiv.org\u002Fabs\u002F2208.08738) [[代码]](https:\u002F\u002Fgithub.com\u002FChasel-Tsui\u002Fmmdet-rfla)\n    * 徐畅、王金旺、杨文、于怀、于雷、夏桂松 ***ECCV 2022***\n* **切片辅助的超推理与微调在小目标检测中的应用** [[论文]](https:\u002F\u002Farxiv.org\u002Fabs\u002F2202.06934) [[代码]](https:\u002F\u002Fgithub.com\u002Fobss\u002Fsahi) [[基准测试]](https:\u002F\u002Fgithub.com\u002Ffcakyon\u002Fsmall-object-detection-benchmark)\n    * 法提赫·恰加泰·阿基永、希南·奥努尔·阿尔图努奇、阿尔普特金·特米泽尔 ***ICIP 2022***\n* **交互式多类别小目标检测** [[论文]](https:\u002F\u002Farxiv.org\u002Fabs\u002F2203.15266) [[代码]](https:\u002F\u002Fgithub.com\u002FChungYi347\u002FInteractive-Multi-Class-Tiny-Object-Detection)\n    * 李忠基、朴宣旭、宋宪、柳正云、金尚勋、金海俊、塞尔吉奥·佩雷拉、柳东根 ***CVPR 2022***\n* **QueryDet：级联稀疏查询加速高分辨率小目标检测** [[论文]](https:\u002F\u002Farxiv.org\u002Fabs\u002F2103.09136) [[代码]](https:\u002F\u002Fgithub.com\u002FChenhongyiYang\u002FQueryDet-PyTorch)\n    * 杨晨鸿毅、黄哲浩、王乃彦 ***CVPR 2022***\n* **航空影像中的目标检测：大规模基准与挑战** [[论文]](https:\u002F\u002Farxiv.org\u002Fabs\u002F2102.12219)\n    * 丁健、薛楠、夏桂松、白翔、杨文、杨英迈克尔、贝隆吉、罗杰博、达特库米哈伊、佩利洛马塞洛、张良培 ***TPAMI 2021***\n* **MRDet：用于航空影像中精确定向目标检测的多头网络** [[论文]](https:\u002F\u002Farxiv.org\u002Fabs\u002F2012.13135)\n    * 秦然、刘庆杰、高广帅、黄迪、王云宏 ***TGRS 2021***\n* **用于合成孔径雷达图像中飞机检测的注意力特征精炼与对齐网络** [[论文]](https:\u002F\u002Farxiv.org\u002Fabs\u002F2201.07124)\n    * 赵燕、赵玲君、刘忠、胡德文、匡刚耀、刘莉 ***已提交至TGRS***\n* **用于小目标检测的归一化高斯Wasserstein距离** [[论文]](https:\u002F\u002Farxiv.org\u002Fabs\u002F2110.13389)\n    * 王金旺、徐畅、杨文、于雷 ***arXiv 2021***\n* **基于边界感知向量的航空影像定向目标检测** [[论文]](https:\u002F\u002Farxiv.org\u002Fabs\u002F2008.07043) [[代码]](https:\u002F\u002Fgithub.com\u002Fyijingru\u002FBBAVectors-Oriented-Object-Detection)\n    * 易静如、吴鹏翔、刘博、黄巧英、曲辉、梅塔克萨斯 ***WACV 2021***\n* **TPH-YOLOv5：基于Transformer预测头改进的YOLOv5，适用于无人机拍摄场景下的目标检测** [[论文]](https:\u002F\u002Farxiv.org\u002Fabs\u002F2108.11539)\n    * 朱兴奎、吕书昌、王旭、赵琪 ***ICCV Workshop 2021***\n* **用于小型及自由旋转物体的定向边界框** [[论文]](https:\u002F\u002Farxiv.org\u002Fabs\u002F2104.11854)\n    * 扎德莫森、埃特马德阿里、格林斯潘迈克尔 ***TGRS 2021***\n* **学习校准引导用于航空影像中的目标检测** [[论文]](https:\u002F\u002Farxiv.org\u002Fabs\u002F2103.11399) [[代码]](https:\u002F\u002Fgithub.com\u002FWeiZongqi\u002FCG-Net)\n    * 梁东、魏宗琦、张栋、耿其祥、张丽艳、孙汉、周慧宇、魏明强、高攀 ***arXiv 2021***\n* **ReDet：一种旋转等变检测器，用于航空目标检测** [[论文]](https:\u002F\u002Farxiv.org\u002Fabs\u002F2103.07733) [[代码]](https:\u002F\u002Fgithub.com\u002Fcsuhan\u002FReDet)\n    * 韩佳明、丁健、薛楠、夏桂松 ***CVPR 2021***\n* **航空影像中的目标检测：大规模基准与挑战** [[论文]](https:\u002F\u002Farxiv.org\u002Fabs\u002F2102.12219) [[代码]](https:\u002F\u002Fgithub.com\u002Fdingjiansw101\u002FAerialDetection)\n    * 丁健、薛楠、夏桂松、白翔、杨文、杨英迈克尔、贝隆吉、罗杰博、达特库米哈伊、佩利洛马塞洛、张良培 ***arXiv 2021***\n* **FPN中用于小目标检测的有效融合因子** [[论文]](https:\u002F\u002Farxiv.org\u002Fabs\u002F2011.02298)\n    * 龚宇琪、于雪辉、丁瑶、彭晓科、赵建、韩振军 ***WACV 2021***\n* **基于Transformer的端到端目标检测** [[论文]](https:\u002F\u002Farxiv.org\u002Fabs\u002F2005.12872) [[代码]](https:\u002F\u002Fgithub.com\u002Ffacebookresearch\u002Fdetr)\n    * 卡里翁尼古拉斯、马萨弗朗西斯科、辛纳耶夫加布里埃尔、乌苏涅尔尼古拉斯、基里洛夫亚历山大、扎戈鲁伊科谢尔盖 ***ECCV 2020***\n* **无锚点两阶段目标检测的角点提案网络** [[论文]](https:\u002F\u002Farxiv.org\u002Fabs\u002F2007.13816) [[代码]](https:\u002F\u002Fgithub.com\u002FDuankaiwen\u002FCPNDet)\n    * 段凯文、谢凌溪、齐洪刚、白松、黄清明、田奇 ***ECCV 2020***\n* **HoughNet：整合近距与远距证据进行自底向上目标检测** [[论文]](https:\u002F\u002Farxiv.org\u002Fabs\u002F2007.02355) [[代码]](https:\u002F\u002Fgithub.com\u002Fnerminsamet\u002Fhoughnet)\n    * 萨梅特内尔敏、希乔恩梅兹萨梅特、阿克巴斯埃姆雷 ***ECCV 2020***\n* **高效检测：可扩展且高效的目标检测** [[论文]](https:\u002F\u002Farxiv.org\u002Fabs\u002F1911.09070) [[代码]](https:\u002F\u002Fgithub.com\u002Fgoogle\u002Fautoml\u002Ftree\u002Fmaster\u002Fefficientdet) [[PyTorch]](https:\u002F\u002Fgithub.com\u002Fzylo117\u002FYet-Another-EfficientDet-Pytorch) [[PyTorch]](https:\u002F\u002Fgithub.com\u002Ftoandaominh1997\u002FEfficientDet.Pytorch) [[PyTorch]](https:\u002F\u002Fgithub.com\u002Frwightman\u002Fefficientdet-pytorch) [[TensorFlow]](https:\u002F\u002Fgithub.com\u002Fxuannianz\u002FEfficientDet)\n    * 谭铭星、庞若明、黎国权 ***CVPR 2020***\n* **利用深度强化学习在大图像中高效目标检测** [[论文]](http:\u002F\u002Fopenaccess.thecvf.com\u002Fcontent_WACV_2020\u002Fpapers\u002FUzkent_Efficient_Object_Detection_in_Large_Images_Using_Deep_Reinforcement_Learning_WACV_2020_paper.pdf)\n    * 布拉克·乌兹肯特、克里斯托弗·叶、斯特凡诺·埃尔蒙 ***WACV 2020***\n* **小人检测的尺度匹配** [[论文]](https:\u002F\u002Farxiv.org\u002Fabs\u002F1912.10664) [[基准测试]](https:\u002F\u002Fgithub.com\u002Fucas-vg\u002FTinyBenchmark)\n    * 于雪辉、龚宇琪、江楠、叶其祥、韩振军 ***WACV 2020***\n* **用于小目标检测的多分辨率注意力提取器** [[论文]](https:\u002F\u002Farxiv.org\u002Fabs\u002F2006.05941v1)\n    * 张帆、焦立成、李玲玲、刘芳、刘旭 ***arXiv 2020***\n* **小目标检测中的内在关系推理** [[论文]](https:\u002F\u002Farxiv.org\u002Fabs\u002F2009.00833v1)\n    * 傅奎、李嘉、马林、穆凯、田永红 ***arXiv 2020***\n* **HRDNet：用于小对象的高分辨率检测网络** [[论文]](https:\u002F\u002Farxiv.org\u002Fabs\u002F2006.07607)\n    * 刘子明、高光宇、孙琳、方志远 ***arXiv 2020***\n* **用于小目标检测的扩展特征金字塔网络** [[论文]](https:\u002F\u002Farxiv.org\u002Fabs\u002F2003.07021)\n    * 邓春芳、王梦梦、刘亮和刘勇 ***arXiv 2020***\n* **MatrixNets：一种新的尺度与宽高比感知架构，用于目标检测** [[论文]](https:\u002F\u002Farxiv.org\u002Fabs\u002F2001.03194) [[代码]](https:\u002F\u002Fgithub.com\u002Farashwan\u002Fmatrixnet)\n    * 阿卜杜拉·拉什万、里沙夫·阿加瓦尔、阿加斯塔·卡尔拉、帕斯卡尔·普帕特 ***arXiv 2020***\n* **跨数据集训练以增加类别数量的目标检测** [[论文]](https:\u002F\u002Farxiv.org\u002Fabs\u002F2001.04621)\n    * 姚永强、王燕、郭宇、林娇娇、秦宏伟、严俊杰 ***arXiv 2020***\n* **TBC-Net：基于语义约束的红外小目标实时检测器** [[论文]](https:\u002F\u002Farxiv.org\u002Fabs\u002F2001.05852)\n    * 赵明鑫、程力、杨旭、冯鹏、刘丽媛、吴南健 ***arXiv 2020***\n* **RepPoints V2：验证与回归结合的目标检测** [[论文]](https:\u002F\u002Farxiv.org\u002Fabs\u002F2007.08508) [[代码]](https:\u002F\u002Fgithub.com\u002FScalsol\u002FRepPointsV2)\n    * 陈义宏、张正、曹悦、王立伟、林史蒂芬、胡汉 ***arXiv 2020***\n* **M2Det：基于多级特征金字塔网络的单阶段目标检测器** [[论文]](https:\u002F\u002Farxiv.org\u002Fabs\u002F1811.04533) [[代码]](https:\u002F\u002Fgithub.com\u002Fqijiezhao\u002FM2Det)\n    * 赵启杰、盛涛、王永涛、唐志、陈英、蔡玲、凌海斌 ***AAAI 2019***\n* **跟随以求更好：迈向小目标检测中特征超分辨率的精准监督** [[论文]](http:\u002F\u002Fopenaccess.thecvf.com\u002Fcontent_ICCV_2019\u002Fpapers\u002FNoh_Better_to_Follow_Follow_to_Be_Better_Towards_Precise_Supervision_ICCV_2019_paper.pdf) [[项目]](http:\u002F\u002Fvision.snu.ac.kr\u002Fproject_pages\u002Ficcv19_noh\u002Fviews\u002F)\n    * 卢俊亨、裴元浩、李元熙、徐仁焕、金根熙 ***ICCV 2019***\n* **丰富特征引导的精炼网络用于目标检测** [[论文]](http:\u002F\u002Fopenaccess.thecvf.com\u002Fcontent_ICCV_2019\u002Fpapers\u002FNie_Enriched_Feature_Guided_Refinement_Network_for_Object_Detection_ICCV_2019_paper.pdf) [[代码]](https:\u002F\u002Fgithub.com\u002FRanchentx\u002FEFGRNet)\n    * 倪晶、穆罕默德·安瓦尔、乔拉卡尔希沙姆、沙赫巴兹·法哈德、庞延伟、邵玲 ***ICCV 2019***\n* **RepPoints：用于目标检测的点集表示** [[论文]](https:\u002F\u002Farxiv.org\u002Fabs\u002F1904.11490) [[代码]](https:\u002F\u002Fgithub.com\u002Fmicrosoft\u002FRepPoints)\n    * 杨泽、刘绍辉、胡汉、王立伟、林史蒂芬 ***ICCV 2019***\n* **尺度感知三叉戟网络用于目标检测** [[论文]](https:\u002F\u002Farxiv.org\u002Fabs\u002F1901.01892) [[代码]](https:\u002F\u002Fgithub.com\u002FTuSimple\u002Fsimpledet\u002Ftree\u002Fmaster\u002Fmodels\u002Ftridentnet)\n    * 李阳浩、陈云涛、王乃彦、张兆祥 ***ICCV 2019***\n* **SCRDet：迈向更鲁棒的小型、杂乱及旋转物体检测** [[论文]](http:\u002F\u002Fopenaccess.thecvf.com\u002Fcontent_ICCV_2019\u002Fpapers\u002FYang_SCRDet_Towards_More_Robust_Detection_for_Small_Cluttered_and_Rotated_ICCV_2019_paper.pdf)\n    * 杨雪、杨继睿、严俊驰、张月、张腾飞、郭志、孙贤、傅坤 ***ICCV 2019***\n* **航空影像中的聚类目标检测** [[论文]](http:\u002F\u002Fopenaccess.thecvf.com\u002Fcontent_ICCV_2019\u002Fpapers\u002FYang_Clustered_Object_Detection_in_Aerial_Images_ICCV_2019_paper.pdf)\n    * 杨凡、恒凡、楚鹏、布拉施埃里克、凌海斌 ***ICCV 2019***\n* **拼贴技术在小目标检测中的力量** [[论文]](https:\u002F\u002Fopenaccess.thecvf.com\u002Fcontent_CVPRW_2019\u002Fpapers\u002FUAVision\u002FUnel_The_Power_of_Tiling_for_Small_Object_Detection_CVPRW_2019_paper.pdf)\n    * 乌内尔F·厄兹格、厄卡尔艾伊·布拉克、齐瓦希尔·齐格拉 ***CVPR Workshop 2019***\n* **学习对象级语义表示用于遥感影像中的检测** [[论文]](http:\u002F\u002Fopenaccess.thecvf.com\u002Fcontent_CVPRW_2019\u002Fpapers\u002FDOAI\u002FLi_Learning_Object-Wise_Semantic_Representation_for_Detection_in_Remote_Sensing_Imagery_CVPRW_2019_paper.pdf)\n    * 李成正、徐春燕、崔珍、王丹、解泽群、张同、杨建 ***CVPR Workshop 2019***\n* **AugFPN：改进多尺度特征学习用于目标检测** [[论文]](https:\u002F\u002Farxiv.org\u002Fabs\u002F1912.05384)\n    * 郭超旭、范彬、张茜、向士明、潘春红 ***CoRR 2019，CVPR2020***\n* **R2-CNN：快速检测大型遥感影像中的小型目标** [[论文]](https:\u002F\u002Farxiv.org\u002Fabs\u002F1902.06042v2)\n    * 庞江淼、李聪、石建平、徐志海、冯华军 ***TGRS 2019***\n* **R3Det：带有特征精炼的单阶段精炼检测器，用于旋转物体** [[论文]](https:\u002F\u002Farxiv.org\u002Fabs\u002F1908.05612) [[代码]](https:\u002F\u002Fgithub.com\u002FThinklab-SJTU\u002FR3Det_Tensorflow)\n    * 杨、薛和刘、青青以及严、俊驰、李、张志强、于刚 ***AAAI 2021***\n* **SpineNet：学习尺度置换主干网络，用于识别与定位** [[论文]](https:\u002F\u002Farxiv.org\u002Fabs\u002F1912.05027)\n    * 杜显志、林宗义、金鹏冲、吉亚斯戈尔娜兹、谭铭星、崔银、黎国权、宋晓丹 ***arXiv 2019***\n* **学习空间融合用于单阶段目标检测** [[论文]](https:\u002F\u002Farxiv.org\u002Fabs\u002F1911.09516) [[代码]](https:\u002F\u002Fgithub.com\u002Fruinmessi\u002FASFF)\n    * 刘松涛、黄迪、王云宏 ***arXiv 2019***\n* **用于小目标检测的数据增强** [[论文]](https:\u002F\u002Farxiv.org\u002Fabs\u002F1902.07296) [[代码]](https:\u002F\u002Fgithub.com\u002Fgmayday1997\u002FSmallObjectAugmentation)\n    * 基桑塔尔马特、沃伊纳兹比格涅夫、穆拉夫斯基雅库布、纳鲁涅茨雅切克、赵京贤 ***arXiv 2019***\n* **利用上下文与注意力进行小目标检测** [[论文]](https:\u002F\u002Farxiv.org\u002Fabs\u002F1912.06319)\n    * 林正善、阿斯特里德玛塞拉、尹贤珍、李承益 ***arXiv 2019***\n* **用于目标检测的单阶段精炼神经网络** [[论文]](https:\u002F\u002Farxiv.org\u002Fabs\u002F1711.06897) [[代码]](https:\u002F\u002Fgithub.com\u002Fsfzhang15\u002FRefineDet) [[PyTorch]](https:\u002F\u002Fgithub.com\u002Fdd604\u002Frefinedet.pytorch)\n    * 张世峰、温龙寅、边晓、雷震、李斯坦 ***CVPR 2018***\n* **目标检测中尺度不变性的分析——SNIP** [[论文]](https:\u002F\u002Farxiv.org\u002Fabs\u002F1711.08189)\n    * 辛格巴拉特、戴维斯拉里 ***CVPR 2018***\n* **深入高质量目标检测的级联R-CNN** [[论文]](https:\u002F\u002Farxiv.org\u002Fabs\u002F1712.00726) [[代码]](https:\u002F\u002Fgithub.com\u002Fzhaoweicai\u002Fcascade-rcnn)\n    * 蔡昭伟、瓦斯科塞洛斯努诺 ***CVPR 2018***\n* **具有丰富语义的单阶段目标检测** [[论文]](https:\u002F\u002Farxiv.org\u002Fabs\u002F1712.00433)\n    * 张志帅、乔思源、谢慈航、申威、王博、尤伊勒艾伦 ***CVPR 2018***\n* **尺度可迁移的目标检测** [[论文]](http:\u002F\u002Fopenaccess.thecvf.com\u002Fcontent_cvpr_2018\u002FCameraReady\u002F1376.pdf) [[代码]](https:\u002F\u002Fgithub.com\u002Farvention\u002FSTDN-PyTorch)\n    * 周鹏、倪冰冰、耿聪、胡建国、徐毅 ***CVPR 2018***\n* **用于目标检测的深层特征金字塔重配置** [[论文]](http:\u002F\u002Fopenaccess.thecvf.com\u002Fcontent_ECCV_2018\u002Fpapers\u002FTao_Kong_Deep_Feature_Pyramid_ECCV_2018_paper.pdf)\n    * 孔涛、孙富春、黄文兵、刘华萍 ***ECCV 2018***\n* **DetNet：用于目标检测的骨干网络** [[论文]](https:\u002F\u002Farxiv.org\u002Fabs\u002F1804.06215) [[代码]](https:\u002F\u002Fgithub.com\u002Fguoruoqian\u002FDetNet_pytorch)\n    * 李泽明、彭超、于刚、张翔宇、邓扬东、孙健 ***ECCV 2018***\n* **SOD-MTGAN：通过多任务生成对抗网络进行小目标检测** [[论文]](http:\u002F\u002Fopenaccess.thecvf.com\u002Fcontent_ECCV_2018\u002Fpapers\u002FYongqiang_Zhang_SOD-MTGAN_Small_Object_ECCV_2018_paper.pdf)\n    * 白燕城、张永强、丁明丽、加内姆伯纳德 ***ECCV 2018***\n* **SNIPER：高效多尺度训练** [[论文]](https:\u002F\u002Farxiv.org\u002Fabs\u002F1805.09300) [[代码]](https:\u002F\u002Fgithub.com\u002FMahyarNajibi\u002FSNIPER)\n    * 辛格巴拉特、纳吉比马赫亚尔、戴维斯拉里 ***NeurIPS 2018***\n* **YOLOv3：一次增量改进** [[论文]](https:\u002F\u002Farxiv.org\u002Fabs\u002F1804.02767) [[项目]](https:\u002F\u002Fpjreddie.com\u002Fdarknet\u002Fyolo\u002F) [[代码]](https:\u002F\u002Fgithub.com\u002Fayooshkathuria\u002Fpytorch-yolo-v3)\n    * 红蒙约瑟夫、法哈迪阿里 ***arXiv 2018***\n* **你只需看两次：卫星影像中快速多尺度目标检测** [[论文]](https:\u002F\u002Farxiv.org\u002Fabs\u002F1805.09512) [[代码]](https:\u002F\u002Fgithub.com\u002Favanetten\u002Fyolt)\n    * 亚当·范·埃滕 ***arXiv 2018***\n* **MSDNN：用于显著性目标检测的多尺度深度神经网络** [[论文]](https:\u002F\u002Farxiv.org\u002Fabs\u002F1801.04187)\n    * 肖芬、邓文政、彭梁灿、曹春红、胡凯、高谢平 ***arXiv 2018***\n* **MDSSD：用于小目标的多尺度反卷积单阶段检测器** [[论文]](https:\u002F\u002Farxiv.org\u002Fabs\u002F1805.07009)\n    * 许明亮、崔丽莎、吕沛、蒋晓恒、牛建伟、周炳、王孟 ***arXiv 2018***\n* **用于小目标检测的感知生成对抗网络** [[论文]](https:\u002F\u002Farxiv.org\u002Fabs\u002F1706.05274)\n    * 李建安、梁晓丹、魏云超、徐廷发、冯嘉仕、颜水成 ***CVPR 2017***\n* **用于目标检测的特征金字塔网络** [[论文]](https:\u002F\u002Farxiv.org\u002Fabs\u002F1612.03144)\n    * 林宗义、多拉尔皮奥特、吉尔希克罗斯、何凯明、哈里哈兰巴拉特、贝隆吉塞尔吉 ***CVPR 2017***\n* **DSSD：反卷积单阶段检测器** [[论文]](https:\u002F\u002Farxiv.org\u002Fabs\u002F1701.06659) [[代码]](https:\u002F\u002Fgithub.com\u002Fchengyangfu\u002Fcaffe\u002Ftree\u002Fdssd)\n    * 傅成阳、刘伟、兰加阿南特、泰吉阿姆布里什、贝尔亚历山大 ***CVPR 2017***\n* **使用循环滚动卷积的精确单阶段检测器** [[论文]](https:\u002F\u002Farxiv.org\u002Fabs\u002F1704.05776) [[代码]](https:\u002F\u002Fgithub.com\u002FxiaohaoChen\u002Frrc_detection)\n    * 任吉米、陈晓浩、刘建波、孙文秀、庞家豪、严琼、太玉宇、徐立 ***CVPR 2017***\n* **密集目标检测中的焦点损失** [[论文]](https:\u002F\u002Farxiv.org\u002Fabs\u002F1708.02002) [[PyTorch]](https:\u002F\u002Fgithub.com\u002Fyhenon\u002Fpytorch-retinanet)\n    * 林宗义、戈亚尔普里亚、吉尔希克罗斯、何凯明、多拉尔皮奥特 ***ICCV 2017***\n* **可变形卷积网络** [[论文]](https:\u002F\u002Farxiv.org\u002Fabs\u002F1703.06211) [[代码]](https:\u002F\u002Fgithub.com\u002Fmsracver\u002FDeformable-ConvNets)\n    * 戴继峰、齐浩志、熊宇文、李毅、张国栋、胡汉、魏一臣 ***ICCV 2017***\n* **特征融合SSD：快速检测小型物体** [[论文]](https:\u002F\u002Farxiv.org\u002Fabs\u002F1709.05054) [[代码]](https:\u002F\u002Fgithub.com\u002Fwnzhyee\u002FFeature-Fused-SSD)\n    * 曹桂梅、谢雪梅、杨文哲、廖全、石光明、吴金建 ***ICGIP 2017***\n* **FSSD：特征融合单阶段多框检测器** [[论文]](https:\u002F\u002Farxiv.org\u002Fabs\u002F1712.00960) [[代码]](https:\u002F\u002Fgithub.com\u002Flzx1413\u002FCAFFE_SSD\u002Ftree\u002Ffssd)\n    * 李作新、周富强 ***arXiv 2017***\n* **内外网：利用跳跃池和循环神经网络在上下文中检测物体** [[论文]](https:\u002F\u002Farxiv.org\u002Fabs\u002F1512.04143)\n    * 贝尔肖恩、齐特尼克C·劳伦斯、巴拉卡维塔、吉尔希克罗斯 ***CVPR 2016***\n\n### 微小人脸检测\n\n* **TinaFace：强大而简单的人脸检测基线** [[论文]](https:\u002F\u002Farxiv.org\u002Fabs\u002F2011.13183) [[代码]](https:\u002F\u002Fgithub.com\u002FMedia-Smart\u002Fvedadet)\n    * 樊佳 Zhu, Hongxiang Cai, Shuhan Zhang, Chenhao Wang, Yichao Xiong ***arXiv 2020***\n* **通过在困难图像上学习小人脸实现鲁棒的人脸检测** [[论文]](http:\u002F\u002Fopenaccess.thecvf.com\u002Fcontent_WACV_2020\u002Fpapers\u002FZhang_Robust_Face_Detection_via_Learning_Small_Faces_on_Hard_Images_WACV_2020_paper.pdf) [[代码]](https:\u002F\u002Fgithub.com\u002Fbairdzhang\u002Fsmallhardface)\n    * Zhishuai Zhang, Wei Shen, Siyuan Qiao, Yan Wang, Bo Wang, Alan Yuille ***WACV 2020***\n* **利用生成对抗网络在野外寻找微小人脸** [[论文]](https:\u002F\u002Fivul.kaust.edu.sa\u002FDocuments\u002FPublications\u002F2018\u002FFinding%20Tiny%20Faces%20in%20the%20Wild%20with%20Generative%20Adversarial%20Network.pdf)\n    * Yancheng Bai, Yongqiang Zhang, Mingli Ding, Bernard Ghanem ***CVPR 2018***\n* **从鲁棒锚框的角度看小人脸** [[论文]](https:\u002F\u002Farxiv.org\u002Fabs\u002F1802.09058)\n    * Chenchen Zhu, Ran Tao, Khoa Luu, Marios Savvides ***CVPR 2018***\n* **Face-MagNet：放大特征图以检测小人脸** [[论文]](https:\u002F\u002Farxiv.org\u002Fabs\u002F1803.05258)\n    * Pouya Samangouei, Mahyar Najibi, Larry Davis, Rama Chellappa ***WACV 2018***\n* **寻找微小人脸** [[论文]](https:\u002F\u002Farxiv.org\u002Fabs\u002F1612.04402) [[项目]](http:\u002F\u002Fwww.cs.cmu.edu\u002F~peiyunh\u002Ftiny\u002Findex.html) [[代码]](https:\u002F\u002Fgithub.com\u002Fpeiyunh\u002Ftiny)\n    * Peiyun Hu, Deva Ramanan ***CVPR 2017***\n* **S3FD：单次尺度不变人脸检测器** [[论文]](http:\u002F\u002Fopenaccess.thecvf.com\u002Fcontent_ICCV_2017\u002Fpapers\u002FZhang_S3FD_Single_Shot_ICCV_2017_paper.pdf)\n    * Shifeng Zhang Xiangyu Zhu Zhen Lei∗ Hailin Shi Xiaobo Wang Stan Z. Li ***ICCV 2017***\n* **检测并计数微小人脸** [[论文]](https:\u002F\u002Farxiv.org\u002Fabs\u002F1801.06504)\n    * Alexandre Attia, Sharone Dayan ***arXiv 2018***\n\n### 微小行人检测\n\n* **高层语义特征检测：行人检测的新视角** [[论文]](http:\u002F\u002Fopenaccess.thecvf.com\u002Fcontent_CVPR_2019\u002Fpapers\u002FLiu_High-Level_Semantic_Feature_Detection_A_New_Perspective_for_Pedestrian_Detection_CVPR_2019_paper.pdf) [[代码]](https:\u002F\u002Fgithub.com\u002Fliuwei16\u002FCSP)\n    * Wei Liu, ShengCai Liao, Weiqiang Ren, Weidong Hu, Yinan Yu ***CVPR 2019***\n* **用于单阶段目标检测的特征选择无锚模块** [[论文]](http:\u002F\u002Fopenaccess.thecvf.com\u002Fcontent_CVPR_2019\u002Fpapers\u002FZhu_Feature_Selective_Anchor-Free_Module_for_Single-Shot_Object_Detection_CVPR_2019_paper.pdf) [[PyTorch]](https:\u002F\u002Fgithub.com\u002Fhdjang\u002FFeature-Selective-Anchor-Free-Module-for-Single-Shot-Object-Detection) [[TensorFlow]](https:\u002F\u002Fgithub.com\u002Fxuannianz\u002FFSAF)\n    * Chenchen Zhu, Yihui He, Marios Savvides ***CVPR 2019***\n* **寻之则得：一种用于高效行人检测的新优化框架** [[论文]](https:\u002F\u002Farxiv.org\u002Fabs\u002F1912.10241)\n    * Sudip Das, Partha Sarathi Mukherjee, Ujjwal Bhattacharya ***arXiv 2019***\n* **基于体表拓扑定位与时间特征聚合的小尺度行人检测** [[论文]](https:\u002F\u002Farxiv.org\u002Fabs\u002F1807.01438)\n    * Tao Song, Leiyu Sun, Di Xie, Haiming Sun, Shiliang Pu ***ECCV 2018***\n\n## 数据集\n\n* **MVA2023 鸟类检测小型目标挑战：数据集、方法与结果** [[论文]](https:\u002F\u002Farxiv.org\u002Fabs\u002F2307.09143) [[项目]](https:\u002F\u002Fmva-org.jp\u002Fmva2023\u002Fchallenge) [[代码]](https:\u002F\u002Fgithub.com\u002FIIM-TTIJ\u002FMVA2023SmallObjectDetection4SpottingBirds)\n    * Yuki Kondo, Norimichi Ukita, Takayuki Yamaguchi, Hao-Yu Hou, Mu-Yi Shen, Chia-Chi Hsu, En-Ming Huang, Yu-Chen Huang, Yu-Cheng Xia, Chien-Yao Wang, Chun-Yi Lee, Da Huo, Marc A. Kastner, Tingwei Liu, Yasutomo Kawanishi, Takatsugu Hirayama, Takahiro Komamizu, Ichiro Ide, Yosuke Shinya, Xinyao Liu, Guang Liang, Syusuke Yasui ***MVA 2023***\n* **检测与跟踪无人机挑战** [[论文]](https:\u002F\u002Farxiv.org\u002Fabs\u002F2001.06303) [[项目]](http:\u002F\u002Faiskyeye.com\u002F) [[代码]](https:\u002F\u002Fgithub.com\u002FVisDrone\u002FVisDrone-Dataset)\n    * Pengfei Zhu, Longyin Wen, Dawei Du, Xiao Bian, Heng Fan, Qinghua Hu, Haibin Ling ***TPAMI 2021***\n* **航空影像中的微小目标检测** [[论文]](https:\u002F\u002Fdrive.google.com\u002Ffile\u002Fd\u002F1IiTp7gilwDCGr8QR_H9Covz8aVK7LXiI\u002Fview) [[代码]](https:\u002F\u002Fgithub.com\u002Fjwwangchn\u002FAI-TOD)\n    * Jinwang Wang, Wen Yang, Haowen Guo, Ruixiang Zhang, Gui-Song Xia ***ICPR 2021***\n* **iSAID：航空影像实例分割的大规模数据集** [[论文]](http:\u002F\u002Fopenaccess.thecvf.com\u002Fcontent_CVPRW_2019\u002Fpapers\u002FDOAI\u002FZamir_iSAID_A_Large-scale_Dataset_for_Instance_Segmentation_in_Aerial_Images_CVPRW_2019_paper.pdf) [[项目]](https:\u002F\u002Fcaptain-whu.github.io\u002FiSAID\u002Findex.html)\n    * Syed Waqas Zamir, Aditya Arora, Akshita Gupta, Salman Khan, Guolei Sun, Fahad Shahbaz Khan, Fan Zhu, Ling Shao, Gui-Song Xia, Xiang Bai ***CVPRW 2019***\n* **BIRDSAI：航空热红外视频中的检测与跟踪数据集** [[论文]](http:\u002F\u002Fopenaccess.thecvf.com\u002Fcontent_WACV_2020\u002Fpapers\u002FBondi_BIRDSAI_A_Dataset_for_Detection_and_Tracking_in_Aerial_Thermal_WACV_2020_paper.pdf) [[项目]](https:\u002F\u002Fsites.google.com\u002Fview\u002Felizabethbondi\u002Fdataset)\n    * Elizabeth Bondi, Raghav Jain, Palash Aggrawal, Saket Anand, Robert Hannaford, Ashish Kapoor, Jim Piavis, Shital Shah, Lucas Joppa, Bistra Dilkina, Milind Tambe ***WACV 2020***\n* **TinyPerson 数据集：用于微小人体检测** [[论文]](https:\u002F\u002Farxiv.org\u002Fabs\u002F1912.10664) [[项目]](http:\u002F\u002Fvision.ucas.ac.cn\u002Fresource.asp)\n    * Yu, Xuehui and Gong, Yuqi and Jiang, Nan and Ye, Qixiang and Han, Zhenjun ***WACV 2020***\n* **EuroCity Persons 数据集：目标检测的新基准** [[论文]](https:\u002F\u002Fieeexplore.ieee.org\u002Fdocument\u002F8634919) [[项目]](https:\u002F\u002Feurocity-dataset.tudelft.nl\u002Feval\u002Foverview\u002Fhome)\n    * Braun, Markus and Krebs, Sebastian and Flohr, Fabian B. and Gavrila, Dariu M. ***TPAMI 2019***\n* **WiderPerson：野外密集行人检测的多样化数据集** [[论文]](https:\u002F\u002Farxiv.org\u002Fabs\u002F1909.12118) [[项目]](http:\u002F\u002Fwww.cbsr.ia.ac.cn\u002Fusers\u002Fsfzhang\u002FWiderPerson\u002F)\n    * Shifeng Zhang, Yiliang Xie, Jun Wan, Hansheng Xia, Stan Z. Li, Guodong Guo ***TMM 2019***\n* **DOTA：航空影像目标检测的大规模数据集** [[论文]](https:\u002F\u002Farxiv.org\u002Fabs\u002F1711.10398) [[项目]](https:\u002F\u002Fcaptain-whu.github.io\u002FDOTA\u002F)\n    * Gui-Song Xia, Xiang Bai, Jian Ding, Zhen Zhu, Serge Belongie, Jiebo Luo, Mihai Datcu, Marcello Pelillo, Liangpei Zhang ***CVPR 2018***\n* **NightOwls：夜间行人数据集** [[论文]](http:\u002F\u002Fwww.robots.ox.ac.uk\u002F~vgg\u002Fpublications\u002F2018\u002FNeumann18b\u002Fneumann18b.pdf) [[项目]](https:\u002F\u002Fwww.nightowls-dataset.org)\n    * Lukáš Neumann, Michelle Karg, Shanshan Zhang, Christian Scharfenberger, Eric Piegert, Sarah Mistr, Olga Prokofyeva, Robert Thiel, Andrea Vedaldi, Andrew Zisserman, and Bernt Schiele ***ACCV 2018***\n* **DeepScores——微小目标分割、检测与分类的数据集** [[论文]](https:\u002F\u002Ftuggeluk.github.io\u002Fpapers\u002Fpreprint_deepscores.pdf) [[项目]](https:\u002F\u002Ftuggeluk.github.io\u002Fdeepscores\u002F) [[代码]](https:\u002F\u002Fgithub.com\u002Ftuggeluk\u002FDeepScoresExamples)\n    * Lukas Tuggener, Ismail Elezi, Jurgen Schmidhuber, Marcello Pelillo, Thilo Stadelmann ***ICPR 2018***\n* **博世小型交通信号灯数据集** [[论文]](https:\u002F\u002Fieeexplore.ieee.org\u002Fdocument\u002F7989163) [[项目]](https:\u002F\u002Fhci.iwr.uni-heidelberg.de\u002Fnode\u002F6132) [[代码]](https:\u002F\u002Fgithub.com\u002Fbosch-ros-pkg\u002Fbstld)\n    * Karsten Behrendt, Libor Novak, Rami Botros ***ICRA 2017***\n* **CityPersons：行人检测的多样化数据集** [[论文]](https:\u002F\u002Farxiv.org\u002Fabs\u002F1702.05693)\n    * Shanshan Zhang, Rodrigo Benenson, Bernt Schiele ***arXiv 2017***\n* **WIDER FACE：人脸检测基准** [[论文]](https:\u002F\u002Farxiv.org\u002Fabs\u002F1511.06523) [[项目]](http:\u002F\u002Fshuoyang1213.me\u002FWIDERFACE\u002F)\n    * Shuo Yang, Ping Luo, Chen Change Loy, Xiaoou Tang ***CVPR 2016***\n* **小型目标数据集** [[论文]](http:\u002F\u002Fvisal.cs.cityu.edu.hk\u002Fstatic\u002Fpubs\u002Fconf\u002Fcvpr15-densdet.pdf) [[项目]](http:\u002F\u002Fvisal.cs.cityu.edu.hk\u002Fdownloads\u002Fsmallobjects\u002F)\n    * Zheng Ma, Lei Yu, Antoni B. Chan ***CVPR 2015***\n* **加州理工学院行人检测基准** [[论文]](http:\u002F\u002Fwww.vision.caltech.edu\u002FImage_Datasets\u002FCaltechPedestrians\u002Ffiles\u002FCVPR09pedestrians.pdf) [[论文]](http:\u002F\u002Fwww.vision.caltech.edu\u002FImage_Datasets\u002FCaltechPedestrians\u002Ffiles\u002FPAMI12pedestrians.pdf) [[项目]](http:\u002F\u002Fwww.vision.caltech.edu\u002FImage_Datasets\u002FCaltechPedestrians\u002F)\n    * Piotr Dollár, Christian Wojek, Bernt Schiele, Pietro Perona ***CVPR 2009，TPAMI 2012***\n* **宾夕法尼亚大学-复旦大学行人检测与分割数据库** [[论文]](https:\u002F\u002Fwww.seas.upenn.edu\u002F~jshi\u002Fpapers\u002Fobj_det_liming_accv07.pdf) [[项目]](https:\u002F\u002Fwww.cis.upenn.edu\u002F~jshi\u002Fped_html\u002F)\n    * Liming Wang, Jianbo Shi, Gang Song, I-fan Shen ***ACCV 2007***\n\n## 调查研究\n\n* **模型魔方：为 TinyNet 调整分辨率、深度与宽度** [[论文]](https:\u002F\u002Farxiv.org\u002Fabs\u002F2010.14819) [[代码]](https:\u002F\u002Fgitee.com\u002Fmindspore\u002Fmindspore\u002Ftree\u002Fmaster\u002Fmodel_zoo\u002Fresearch\u002Fcv\u002Ftinynet)\n    * Kai Han, Yunhe Wang, Qiulin Zhang, Wei Zhang, Chunjing Xu, Tong Zhang ***NeurIPS 2020***\n* **基于深度学习的目标检测综述** [[论文]](https:\u002F\u002Farxiv.org\u002Fabs\u002F1907.09408)\n    * Licheng Jiao, Fan Zhang, Fang Liu, Shuyuan Yang, Lingling Li, Zhixi Feng, Rong Qu ***IEEE Access 2019***\n* **目标检测深度学习的最新进展** [[论文]](https:\u002F\u002Farxiv.org\u002Fabs\u002F1908.03673)\n    * Xiongwei Wu, Doyen Sahoo, Steven C.H. Hoi ***CoRR 2019***\n* **目标检测中的类别不平衡问题：综述** [[论文]](https:\u002F\u002Farxiv.org\u002Fabs\u002F1909.00169) [[项目]](https:\u002F\u002Fgithub.com\u002Fkemaloksuz\u002FObjectDetectionImbalance)\n    * Kemal Oksuz, Baris Can Cam, Sinan Kalkan, Emre Akbas ***TPAMI 2020***\n* **二十年来的目标检测：综述** [[论文]](https:\u002F\u002Farxiv.org\u002Fabs\u002F1905.05055)\n    * Zhengxia Zou, Zhenwei Shi, Yuhong Guo, Jieping Ye ***已提交至 TPAMI 2019***\n* **现代卷积神经网络目标检测器的速度与精度权衡** [[论文]](https:\u002F\u002Farxiv.org\u002Fabs\u002F1611.10012)\n    * Jonathan Huang, Vivek Rathod, Chen Sun, Menglong Zhu, Anoop Korattikara, Alireza Fathi, Ian Fischer, Zbigniew Wojna, Yang Song, Sergio Guadarrama, Kevin Murphy ***CVPR 2017***\n\n## 文章\n\n* **[解决目标检测中的小目标问题](https:\u002F\u002Fblog.roboflow.com\u002Fdetect-small-objects\u002F) ([视频](https:\u002F\u002Fwww.youtube.com\u002Fwatch?v=WeQcURbHA7U&ab_channel=Roboflow))**\n* **[小目标检测问题 - Medium](https:\u002F\u002Fmedium.datadriveninvestor.com\u002Fsmall-objects-detection-problem-c5b430996162)**\n* **[提升小目标检测的思路 - 知乎](https:\u002F\u002Fzhuanlan.zhihu.com\u002Fp\u002F121666693?utm_source=ZHShareTargetIDMore&utm_medium=social&utm_oi=1108654922240958464)**\n* **[如何使用 CNN 对乒乓球等小物体进行目标检测？ - Quora](https:\u002F\u002Fwww.quora.com\u002FHow-do-you-do-object-detection-using-CNNs-on-small-objects-like-ping-pong-balls)**\n* **[深度学习在小目标检测方面有哪些进展？ - 知乎](https:\u002F\u002Fwww.zhihu.com\u002Fquestion\u002F272322209)**\n* **[在小目标检测问题中，“小目标”如何定义？其主要技术难点在哪？有哪些比较好的传统的或深度学习方法？ - 知乎](https:\u002F\u002Fwww.zhihu.com\u002Fquestion\u002F269877902)**","# Awesome Tiny Object Detection 快速上手指南\n\n`awesome-tiny-object-detection` 并非一个单一的独立软件库，而是一个**精选资源列表**，汇集了针对“微小目标检测”（Tiny Object Detection）的论文、代码库、数据集和相关竞赛。\n\n要开始使用其中的技术，您需要根据具体需求选择列表中推荐的某个算法项目（如 `SAHI`, `QueryDet`, `ReDet` 等）进行部署。以下指南以列表中广泛适用且易于集成的 **SAHI (Slicing Aided Hyper Inference)** 为例，演示如何搭建微小目标检测环境并运行基础示例。\n\n## 环境准备\n\n在开始之前，请确保您的开发环境满足以下要求：\n\n*   **操作系统**: Linux (推荐 Ubuntu 18.04+), macOS, 或 Windows (WSL2 推荐)\n*   **Python 版本**: 3.7 - 3.9\n*   **硬件要求**: \n    *   推荐使用 NVIDIA GPU (CUDA 11.0+) 以加速推理。\n    *   若无 GPU，可在 CPU 上运行，但速度较慢。\n*   **前置依赖**:\n    *   PyTorch (深度学习框架)\n    *   torchvision\n    *   opencv-python\n\n## 安装步骤\n\n### 1. 创建虚拟环境（推荐）\n```bash\npython -m venv tiny-det-env\nsource tiny-det-env\u002Fbin\u002Factivate  # Windows 用户请使用: tiny-det-env\\Scripts\\activate\n```\n\n### 2. 安装 PyTorch\n访问 [PyTorch 官网](https:\u002F\u002Fpytorch.org\u002F) 获取适合您环境的命令。若需使用国内镜像加速，推荐以下命令（以 CUDA 11.8 为例）：\n```bash\npip install torch torchvision torchaudio --index-url https:\u002F\u002Fdownload.pytorch.org\u002Fwhl\u002Fcu118\n# 或使用清华镜像源\npip install torch torchvision torchaudio -i https:\u002F\u002Fpypi.tuna.tsinghua.edu.cn\u002Fsimple\n```\n\n### 3. 安装 SAHI 及相关依赖\nSAHI 是列表中专门用于提升小目标检测效果的推理工具，支持多种模型后端（Yolov5, MMDetection, Detectron2 等）。\n```bash\n# 使用 pip 直接安装\npip install sahi\n\n# 若需完整功能（包含可视化等），可安装额外依赖\npip install \"sahi[all]\"\n```\n\n> **提示**：如果您想尝试列表中的其他特定模型（如 `ReDet` 或 `QueryDet`），请前往其对应的 GitHub 仓库（见原文 Papers 部分链接）按照各自的 `requirements.txt` 进行安装。\n\n## 基本使用\n\n以下示例展示如何使用 SAHI 对一张包含微小目标的图片进行切片推理（这是解决小目标检测最通用的方法之一）。\n\n### 1. 准备预训练模型\n首先下载一个针对小目标优化过的模型权重（例如 YOLOv5 或 YOLOv8 的 nano\u002Fsmall 版本），或者使用列表中提到的高精度模型权重。此处以自动下载 YOLOv5 为例：\n\n```python\nfrom sahi import AutoDetectionModel\n\n# 加载检测模型\ndetection_model = AutoDetectionModel.from_pretrained(\n    model_type='yolov5',\n    model_path='yolov5n.pt',  # 可替换为本地路径或列表中的其他模型权重\n    confidence_threshold=0.25,\n    device=\"cuda\",  # 或 \"cpu\"\n)\n```\n\n### 2. 执行切片推理\n对于微小目标，直接全图推理效果往往不佳。SAHI 会将图像切割成重叠的小块分别检测，然后合并结果。\n\n```python\nfrom sahi.predict import get_sliced_prediction\nfrom sahi.utils.cv import read_image\n\n# 读取图像\nimage_path = \"tiny_objects.jpg\"  # 替换为您的图片路径\nimage = read_image(image_path)\n\n# 执行切片预测\nresult = get_sliced_prediction(\n    image,\n    detection_model,\n    slice_height=512,  # 切片高度\n    slice_width=512,   # 切片宽度\n    overlap_height_ratio=0.2, # 高度重叠率\n    overlap_width_ratio=0.2   # 宽度重叠率\n)\n\n# 导出结果\nresult.export_visuals(export_dir=\".\u002Foutput\")\nprint(f\"检测到 {len(result.object_prediction_list)} 个目标\")\n```\n\n### 3. 查看结果\n运行结束后，检查 `.\u002Foutput` 目录，您将看到带有检测框的图片以及预测结果的 JSON 文件。\n\n---\n**进阶指引**：\n若要探索 README 中列出的其他前沿算法（如基于 Transformer 的方法或遥感专用检测器），请访问原文 **Papers** 章节中对应论文的 `[Code]` 链接，克隆仓库后通常遵循 `pip install -r requirements.txt` 和 `python demo.py` 的标准流程即可运行。","某遥感科技公司正在开发一套基于无人机航拍图像的森林火灾早期预警系统，核心难点在于从高空视角精准识别极小的烟雾点和初期火苗。\n\n### 没有 awesome-tiny-object-detection 时\n- **技术选型盲目**：团队在海量论文中大海捞针，难以区分哪些算法是专门针对“微小目标”优化的，误用了通用检测模型导致漏报率极高。\n- **数据评估缺失**：缺乏针对低分辨率输入的专业评测基准，无法量化模型在远距离小目标上的真实性能，迭代方向模糊。\n- **复现成本高昂**：找不到经过验证的代码实现和配套数据集，工程师需从零复现前沿算法，耗费数周时间却因细节缺失而失败。\n- **场景适配困难**：面对航拍图像中密集且微小的火点，缺乏如切片推理（Slicing Aided）等特定策略指导，模型极易将背景噪声误判为火情。\n\n### 使用 awesome-tiny-object-detection 后\n- **精准锁定方案**：直接获取经筛选的 Tiny Object Detection 顶会论文列表，快速定位到适合航拍场景的 Swin Transformer 或 QueryDet 等 SOTA 模型。\n- **对标权威基准**：利用收录的 ECCV 和 MVA 挑战赛资源及 RLQ 基准，建立了符合实际低质输入环境的评估体系，明确优化指标。\n- **加速落地进程**：通过链接直接访问开源代码库（如 SAHI、RFLA）和专用数据集，将算法验证周期从数周缩短至几天。\n- **策略有的放矢**：参考列表中关于高倍率缩放、高斯接收场标签分配等具体技术文章，针对性解决了小目标特征丢失问题，显著降低误报。\n\nawesome-tiny-object-detection 将原本分散杂乱的学术资源转化为结构化的工程指南，帮助团队在微小目标检测难题上实现了从“盲目试错”到“精准打击”的跨越。","https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002Fkuanhungchen_awesome-tiny-object-detection_358fd505.png","kuanhungchen","Hank Chen","https:\u002F\u002Foss.gittoolsai.com\u002Favatars\u002Fkuanhungchen_6ab4353d.png",null,"Taipei, Taiwan","https:\u002F\u002Fkuanhungchen.com","https:\u002F\u002Fgithub.com\u002Fkuanhungchen",1621,209,"2026-04-01T13:04:30",5,"","未说明",{"notes":89,"python":87,"dependencies":90},"该仓库是一个论文和资源列表（Awesome List），并非一个可直接运行的单一软件工具。README 中列出的每个项目（如 SAHI, QueryDet, ReDet 等）都有各自独立的代码仓库和运行环境需求。用户需根据具体想复现的论文，前往其对应的代码链接查看具体的操作系统、GPU、Python 版本及依赖库要求。",[],[14],[93,94,95,96,97],"awesome-list","object-detection","face-detection","pedestrian-detection","small-object-detection","2026-03-27T02:49:30.150509","2026-04-06T09:46:10.886818",[],[]]