[{"data":1,"prerenderedAt":-1},["ShallowReactive",2],{"similar-bobo0810--PytorchNetHub":3,"tool-bobo0810--PytorchNetHub":61},[4,18,26,36,44,53],{"id":5,"name":6,"github_repo":7,"description_zh":8,"stars":9,"difficulty_score":10,"last_commit_at":11,"category_tags":12,"status":17},4358,"openclaw","openclaw\u002Fopenclaw","OpenClaw 是一款专为个人打造的本地化 AI 助手，旨在让你在自己的设备上拥有完全可控的智能伙伴。它打破了传统 AI 助手局限于特定网页或应用的束缚，能够直接接入你日常使用的各类通讯渠道，包括微信、WhatsApp、Telegram、Discord、iMessage 等数十种平台。无论你在哪个聊天软件中发送消息，OpenClaw 都能即时响应，甚至支持在 macOS、iOS 和 Android 设备上进行语音交互，并提供实时的画布渲染功能供你操控。\n\n这款工具主要解决了用户对数据隐私、响应速度以及“始终在线”体验的需求。通过将 AI 部署在本地，用户无需依赖云端服务即可享受快速、私密的智能辅助，真正实现了“你的数据，你做主”。其独特的技术亮点在于强大的网关架构，将控制平面与核心助手分离，确保跨平台通信的流畅性与扩展性。\n\nOpenClaw 非常适合希望构建个性化工作流的技术爱好者、开发者，以及注重隐私保护且不愿被单一生态绑定的普通用户。只要具备基础的终端操作能力（支持 macOS、Linux 及 Windows WSL2），即可通过简单的命令行引导完成部署。如果你渴望拥有一个懂你",349277,3,"2026-04-06T06:32:30",[13,14,15,16],"Agent","开发框架","图像","数据工具","ready",{"id":19,"name":20,"github_repo":21,"description_zh":22,"stars":23,"difficulty_score":10,"last_commit_at":24,"category_tags":25,"status":17},3808,"stable-diffusion-webui","AUTOMATIC1111\u002Fstable-diffusion-webui","stable-diffusion-webui 是一个基于 Gradio 构建的网页版操作界面，旨在让用户能够轻松地在本地运行和使用强大的 Stable Diffusion 图像生成模型。它解决了原始模型依赖命令行、操作门槛高且功能分散的痛点，将复杂的 AI 绘图流程整合进一个直观易用的图形化平台。\n\n无论是希望快速上手的普通创作者、需要精细控制画面细节的设计师，还是想要深入探索模型潜力的开发者与研究人员，都能从中获益。其核心亮点在于极高的功能丰富度：不仅支持文生图、图生图、局部重绘（Inpainting）和外绘（Outpainting）等基础模式，还独创了注意力机制调整、提示词矩阵、负向提示词以及“高清修复”等高级功能。此外，它内置了 GFPGAN 和 CodeFormer 等人脸修复工具，支持多种神经网络放大算法，并允许用户通过插件系统无限扩展能力。即使是显存有限的设备，stable-diffusion-webui 也提供了相应的优化选项，让高质量的 AI 艺术创作变得触手可及。",162132,"2026-04-05T11:01:52",[14,15,13],{"id":27,"name":28,"github_repo":29,"description_zh":30,"stars":31,"difficulty_score":32,"last_commit_at":33,"category_tags":34,"status":17},1381,"everything-claude-code","affaan-m\u002Feverything-claude-code","everything-claude-code 是一套专为 AI 编程助手（如 Claude Code、Codex、Cursor 等）打造的高性能优化系统。它不仅仅是一组配置文件，而是一个经过长期实战打磨的完整框架，旨在解决 AI 代理在实际开发中面临的效率低下、记忆丢失、安全隐患及缺乏持续学习能力等核心痛点。\n\n通过引入技能模块化、直觉增强、记忆持久化机制以及内置的安全扫描功能，everything-claude-code 能显著提升 AI 在复杂任务中的表现，帮助开发者构建更稳定、更智能的生产级 AI 代理。其独特的“研究优先”开发理念和针对 Token 消耗的优化策略，使得模型响应更快、成本更低，同时有效防御潜在的攻击向量。\n\n这套工具特别适合软件开发者、AI 研究人员以及希望深度定制 AI 工作流的技术团队使用。无论您是在构建大型代码库，还是需要 AI 协助进行安全审计与自动化测试，everything-claude-code 都能提供强大的底层支持。作为一个曾荣获 Anthropic 黑客大奖的开源项目，它融合了多语言支持与丰富的实战钩子（hooks），让 AI 真正成长为懂上",144730,2,"2026-04-07T23:26:32",[14,13,35],"语言模型",{"id":37,"name":38,"github_repo":39,"description_zh":40,"stars":41,"difficulty_score":32,"last_commit_at":42,"category_tags":43,"status":17},2271,"ComfyUI","Comfy-Org\u002FComfyUI","ComfyUI 是一款功能强大且高度模块化的视觉 AI 引擎，专为设计和执行复杂的 Stable Diffusion 图像生成流程而打造。它摒弃了传统的代码编写模式，采用直观的节点式流程图界面，让用户通过连接不同的功能模块即可构建个性化的生成管线。\n\n这一设计巧妙解决了高级 AI 绘图工作流配置复杂、灵活性不足的痛点。用户无需具备编程背景，也能自由组合模型、调整参数并实时预览效果，轻松实现从基础文生图到多步骤高清修复等各类复杂任务。ComfyUI 拥有极佳的兼容性，不仅支持 Windows、macOS 和 Linux 全平台，还广泛适配 NVIDIA、AMD、Intel 及苹果 Silicon 等多种硬件架构，并率先支持 SDXL、Flux、SD3 等前沿模型。\n\n无论是希望深入探索算法潜力的研究人员和开发者，还是追求极致创作自由度的设计师与资深 AI 绘画爱好者，ComfyUI 都能提供强大的支持。其独特的模块化架构允许社区不断扩展新功能，使其成为当前最灵活、生态最丰富的开源扩散模型工具之一，帮助用户将创意高效转化为现实。",107888,"2026-04-06T11:32:50",[14,15,13],{"id":45,"name":46,"github_repo":47,"description_zh":48,"stars":49,"difficulty_score":32,"last_commit_at":50,"category_tags":51,"status":17},4721,"markitdown","microsoft\u002Fmarkitdown","MarkItDown 是一款由微软 AutoGen 团队打造的轻量级 Python 工具，专为将各类文件高效转换为 Markdown 格式而设计。它支持 PDF、Word、Excel、PPT、图片（含 OCR）、音频（含语音转录）、HTML 乃至 YouTube 链接等多种格式的解析，能够精准提取文档中的标题、列表、表格和链接等关键结构信息。\n\n在人工智能应用日益普及的今天，大语言模型（LLM）虽擅长处理文本，却难以直接读取复杂的二进制办公文档。MarkItDown 恰好解决了这一痛点，它将非结构化或半结构化的文件转化为模型“原生理解”且 Token 效率极高的 Markdown 格式，成为连接本地文件与 AI 分析 pipeline 的理想桥梁。此外，它还提供了 MCP（模型上下文协议）服务器，可无缝集成到 Claude Desktop 等 LLM 应用中。\n\n这款工具特别适合开发者、数据科学家及 AI 研究人员使用，尤其是那些需要构建文档检索增强生成（RAG）系统、进行批量文本分析或希望让 AI 助手直接“阅读”本地文件的用户。虽然生成的内容也具备一定可读性，但其核心优势在于为机器",93400,"2026-04-06T19:52:38",[52,14],"插件",{"id":54,"name":55,"github_repo":56,"description_zh":57,"stars":58,"difficulty_score":10,"last_commit_at":59,"category_tags":60,"status":17},4487,"LLMs-from-scratch","rasbt\u002FLLMs-from-scratch","LLMs-from-scratch 是一个基于 PyTorch 的开源教育项目，旨在引导用户从零开始一步步构建一个类似 ChatGPT 的大型语言模型（LLM）。它不仅是同名技术著作的官方代码库，更提供了一套完整的实践方案，涵盖模型开发、预训练及微调的全过程。\n\n该项目主要解决了大模型领域“黑盒化”的学习痛点。许多开发者虽能调用现成模型，却难以深入理解其内部架构与训练机制。通过亲手编写每一行核心代码，用户能够透彻掌握 Transformer 架构、注意力机制等关键原理，从而真正理解大模型是如何“思考”的。此外，项目还包含了加载大型预训练权重进行微调的代码，帮助用户将理论知识延伸至实际应用。\n\nLLMs-from-scratch 特别适合希望深入底层原理的 AI 开发者、研究人员以及计算机专业的学生。对于不满足于仅使用 API，而是渴望探究模型构建细节的技术人员而言，这是极佳的学习资源。其独特的技术亮点在于“循序渐进”的教学设计：将复杂的系统工程拆解为清晰的步骤，配合详细的图表与示例，让构建一个虽小但功能完备的大模型变得触手可及。无论你是想夯实理论基础，还是为未来研发更大规模的模型做准备",90106,"2026-04-06T11:19:32",[35,15,13,14],{"id":62,"github_repo":63,"name":64,"description_en":65,"description_zh":66,"ai_summary_zh":67,"readme_en":68,"readme_zh":69,"quickstart_zh":70,"use_case_zh":71,"hero_image_url":72,"owner_login":73,"owner_name":74,"owner_avatar_url":75,"owner_bio":76,"owner_company":77,"owner_location":78,"owner_email":79,"owner_twitter":80,"owner_website":80,"owner_url":81,"languages":82,"stars":98,"forks":99,"last_commit_at":100,"license":101,"difficulty_score":32,"env_os":102,"env_gpu":103,"env_ram":102,"env_deps":104,"category_tags":116,"github_topics":117,"view_count":32,"oss_zip_url":80,"oss_zip_packed_at":80,"status":17,"created_at":136,"updated_at":137,"faqs":138,"releases":178},5404,"bobo0810\u002FPytorchNetHub","PytorchNetHub","项目注释+论文复现+算法竞赛+Pytorch实践+LeetCode+VLM预训练","PytorchNetHub 是一个面向深度学习实践者的综合性开源资源库，旨在通过“代码复现 + 详细注释”的方式，降低从理论论文到实际落地的门槛。它系统性地整理了计算机视觉与大模型领域的核心知识，涵盖从基础的 LeetCode 算法手撕、PyTorch 分布式训练（DDP\u002FAMP），到前沿的 VLM 预训练及多模态大模型（MLLM）评测框架。\n\n该项目主要解决了学习者面对复杂算法时“看懂论文却难以下手编码”的痛点，提供了包括目标检测、人脸识别、轻量级分类框架在内的多种任务模板，并分享了作者在顶级算法竞赛中的实战策略与高分方案。其独特亮点在于不仅提供可运行的源码，还深入解析了如 DeepSpeed、ColossalAI 等大模型高效训练工具的使用细节，以及模型部署（TensorRT\u002FNCNN）的全流程实践。\n\nPytorchNetHub 非常适合希望夯实基础的 AI 初学者、需要快速验证想法的算法工程师，以及从事大模型训练与微调的研究人员。无论你是想掌握 Transformer 底层原理，还是探索多模态技术的最新进展，这里都能提供清晰的路径指引和高质量的参考代码，帮助开发者将理论知识转化","PytorchNetHub 是一个面向深度学习实践者的综合性开源资源库，旨在通过“代码复现 + 详细注释”的方式，降低从理论论文到实际落地的门槛。它系统性地整理了计算机视觉与大模型领域的核心知识，涵盖从基础的 LeetCode 算法手撕、PyTorch 分布式训练（DDP\u002FAMP），到前沿的 VLM 预训练及多模态大模型（MLLM）评测框架。\n\n该项目主要解决了学习者面对复杂算法时“看懂论文却难以下手编码”的痛点，提供了包括目标检测、人脸识别、轻量级分类框架在内的多种任务模板，并分享了作者在顶级算法竞赛中的实战策略与高分方案。其独特亮点在于不仅提供可运行的源码，还深入解析了如 DeepSpeed、ColossalAI 等大模型高效训练工具的使用细节，以及模型部署（TensorRT\u002FNCNN）的全流程实践。\n\nPytorchNetHub 非常适合希望夯实基础的 AI 初学者、需要快速验证想法的算法工程师，以及从事大模型训练与微调的研究人员。无论你是想掌握 Transformer 底层原理，还是探索多模态技术的最新进展，这里都能提供清晰的路径指引和高质量的参考代码，帮助开发者将理论知识转化为真正的工程能力。","![linus](https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002Fbobo0810_PytorchNetHub_readme_a9fea3ce565f.jpg)\n\n# 目的\n\n- 论文复现\n- 算法竞赛\n- 源码注释\n  \n   > paper得来终觉浅，绝知此事要coding。\n\n\n\n# 工作\n\n### [LearnLeetCode⭐️⭐️⭐️](https:\u002F\u002Fgithub.com\u002Fbobo0810\u002FLearnLeetCode)\n\n> 八股基础：Transformer知识、位置编码等\n>\n> 手撕代码：梯度下降、SelfAttention、MultiHeadAttention等\n>\n> 刷题方法论：统一解题模板，简单清晰\n\n### [轻量级图像识别框架Classification](https:\u002F\u002Fgithub.com\u002Fbobo0810\u002FClassification)![Github stars](https:\u002F\u002Fimg.shields.io\u002Fgithub\u002Fstars\u002Fbobo0810\u002FClassification.svg)\n\n> 支持任务： 1. 图像分类   2. 度量学习\u002F特征对比\n>\n> 轻量级、模块化、高扩展、分布式、自动剪枝\n\n### [Pytorch最小实践](https:\u002F\u002Fgithub.com\u002Fbobo0810\u002FPytorchExample)![Github stars](https:\u002F\u002Fimg.shields.io\u002Fgithub\u002Fstars\u002Fbobo0810\u002FPytorchExample.svg)\n\n> 自动混合精度AMP\n> \n> 分布式数据并行DDP\n> \n> NCNN\u002FMNN部署\n> \n> TensorRT部署\n\n\n### 视觉任务\n\n> 目标检测：Faster rcnn、YOLO v1、YOLO v3、YOLO v4、SSD、CAM、S4ND\n>\n> 语义分割：U-Net \n>\n> 主干网络：FPN、SKNet、HS-ResNet、AFF-ResNet(并入官方库)、TargetDrop\n>\n> 激活函数：FunnelAct、DynamicReLU\n>\n> 知识蒸馏：RepDistiller\n\n### 人脸相关\n\n> 人脸检测：Yolov5-Face \u003Cu>主要贡献者\u003C\u002Fu>\n>\n> 人脸比对\n>\n> ​\t\t分类器：AMSoftmax|ArcFace|Circle-Loss|DiscFace|NPCFace\n>\n> ​\t\t训练策略：Semi-Siamese-Training|BroadFace\n\n### 算法竞赛\n\n> 雪浪制造AI挑战赛    排名: 32\u002F2403\n>\n> \"计图\"人工智能算法挑战赛-狗细分类  排名: 4\u002F430\n>\n> ACCV2022国际细粒度图像分析挑战赛-网络监督的细粒度识别  排名: 8\u002F133\n\n\n\n# 时间线\n\n\n\n## 2025\n\n| 自研                                                       | 备注                            | 更新   |\n| ---------------------------------------------------------- | ------------------------------- | ------ |\n| [LearnLeetCode](https:\u002F\u002Fgithub.com\u002Fbobo0810\u002FLearnLeetCode) | 八股基础+手撕代码+刷题方法论⭐️⭐️⭐️ | 2025.1 |\n| [MLLM-anything](https:\u002F\u002Fgithub.com\u002Fbobo0810\u002FMLLM-anything) | 关于MLLM的训练、评测、最新进展\u003Cbr>最新进展\u003Cbr>   1. Omni最新进展\u003Cbr>   2. VLM最新进展\u003Cbr>训练\u003Cbr>   1. Megatron大规模训练框架\u003Cbr>   2. Energon大规模数据加载库\u003Cbr>评测\u003Cbr>   1. OpenCompass文本评测库\u003Cbr>   2. VLMEvalKit多模评测库\u003Cbr>   3. UltraEval-Audio音频评测库 | 2025.3 |\n\n## 2024\n\n| 自研   | 备注                          | 更新   |\n| ------ | ----------------------------- | ------ |\n| [多模态大模型专栏](https:\u002F\u002Fwww.zhihu.com\u002Fcolumn\u002Fc_1801288994694258689) | 多模态VL系列之高质量数据（一）\u003Cbr>多模态VL系列之模型架构（二）\u003Cbr>多模态VL系列之训练策略（三）\u003Cbr> | 2024.4 |\n| [24卡+公开数据+4B 可以有多强？](https:\u002F\u002Fzhuanlan.zhihu.com\u002Fp\u002F714269886) | 勇闯OpenCompass榜单 | 2024.8 |\n\n\n\n\n## 2023\n\n| 自研                                                         | 备注                                                    | 更新   |\n| ------------------------------------------------------------ | ------------------------------------------------------- | ------ |\n| [LearnColossalAI](https:\u002F\u002Fgithub.com\u002Fbobo0810\u002FLearnColossalAI) | ColossalAI教程 & 示例注释 & 学习笔记 （大模型高效训练） | 2023.3 |\n| [OpenMM](https:\u002F\u002Fgithub.com\u002Fbobo0810\u002FOpenMM)                 | OpenMM系列最佳食用手册                                  | 2023.3 |\n| [LearnDeepSpeed](https:\u002F\u002Fgithub.com\u002Fbobo0810\u002FLearnDeepSpeed)![Github stars](https:\u002F\u002Fimg.shields.io\u002Fgithub\u002Fstars\u002Fbobo0810\u002FLearnDeepSpeed.svg) | DeepSpeed教程 & 示例注释 & 学习笔记 （大模型高效训练）  | 2023.8 |\n| [MiniGPT-4-DeepSpeed](https:\u002F\u002Fgithub.com\u002Fbobo0810\u002FMiniGPT-4-DeepSpeed) | MiniGPT-4基于DeepSpeed加速➕ 扩充模型规模 ➕ 实验分析     | 2023.9 |\n\n\n\n## 2022\n\n|                          官方库                          |                         |  更新  |\n| :------------------------------------------------------: | :-------------: | :----: |\n| [RepVGG(CVPR 2021)](https:\u002F\u002Fgithub.com\u002FDingXiaoH\u002FRepVGG) | VGG再次伟大  [解读+代码](.\u002FRepVGG\u002Freadme.md) | 2022.7 |\n| [G-Ghost(IJCV 2022)](https:\u002F\u002Fgithub.com\u002Fhuawei-noah\u002FEfficient-AI-Backbones) | 探索各级别的特征冗余   [解读+代码](.\u002FGhostNet\u002Freadme.md) | 2022.7 |\n| [BBN(CVPR2020)](https:\u002F\u002Fgithub.com\u002Fmegvii-research\u002FBBN) | 双边分支网络,以解决长尾分布问题   [解读+代码](.\u002FBBN\u002Freadme.md) | 2022.11 |\n| Vision Transformer(ICLR 2021) | Transformer首次应用到视觉领域    [解读+代码](https:\u002F\u002Fgithub.com\u002Fbobo0810\u002FLearnTransformer) | 2022.12 |\n| [MAE(CVPR2021)](https:\u002F\u002Fgithub.com\u002Ffacebookresearch\u002Fmae) | 自监督学习   [解读+代码](https:\u002F\u002Fgithub.com\u002Fbobo0810\u002FLearnTransformer) | 2022.12 |\n\n| 自研                                                         | 备注                                 | 更新    |\n| ------------------------------------------------------------ | ------------------------------------ | ------- |\n| [bobotools](https:\u002F\u002Fgithub.com\u002Fbobo0810\u002Fbotools)![Github stars](https:\u002F\u002Fimg.shields.io\u002Fgithub\u002Fstars\u002Fbobo0810\u002Fbotools.svg) | 工具库（已废弃，用GPT更顺手）        | 2022.2  |\n| [Classification](https:\u002F\u002Fgithub.com\u002Fbobo0810\u002FClassification)![Github stars](https:\u002F\u002Fimg.shields.io\u002Fgithub\u002Fstars\u002Fbobo0810\u002FClassification.svg) | 图像识别框架                         | 2022.2  |\n| [Pytorch最小实践](https:\u002F\u002Fgithub.com\u002Fbobo0810\u002FPytorchExample)![Github stars](https:\u002F\u002Fimg.shields.io\u002Fgithub\u002Fstars\u002Fbobo0810\u002FPytorchExample.svg) | Pytorch最小实践                      | 2022.6  |\n| [BossVision](https:\u002F\u002Fwww.yuque.com\u002Fbobo0810\u002Fboss_vision\u002Fguly2g) | 简单、模块化、高扩展的分布式训练框架 | 2022.7  |\n| [CUDA-Python](.\u002FCUDA_Python\u002Freadme.md)                       | Nvidia CUDA加速计算基础课程          | 2022.9  |\n| [DataHub](.\u002FDataHub\u002Freadme.md)                               | 公开数据集汇总                       | 2022.11 |\n\n## 2021\n\n|                              官方库                              |                         项目注释                          |       备注       |  更新  |\n| :--------------------------------------------------------------: | :-------------------------------------------------------: | :--------------: | :----: |\n| [SST(ECCV 2020)](https:\u002F\u002Fgithub.com\u002Fdituu\u002FSemi-Siamese-Training) | [注释](https:\u002F\u002Fgithub.com\u002Fbobo0810\u002FSemi-Siamese-Training) |   浅层人脸学习   | 2021.2 |\n|    [RepDistiller](https:\u002F\u002Fgithub.com\u002FHobbitLong\u002FRepDistiller)    |     [注释](https:\u002F\u002Fgithub.com\u002Fbobo0810\u002FRepDistiller)      | 知识蒸馏算法合集 | 2021.2 |\n\n|                             自研                             | 备注                                            | 更新    |\n| :----------------------------------------------------------: | ----------------------------------------------- | ------- |\n| [JittorDogsClass](https:\u002F\u002Fgithub.com\u002Fbobo0810\u002FJittorDogsClass)![Github stars](https:\u002F\u002Fimg.shields.io\u002Fgithub\u002Fstars\u002Fbobo0810\u002FJittorDogsClass.svg) | “计图”算法挑战赛-狗细分类 4\u002F430                 | 2021.4  |\n| [Yolov5-Face](https:\u002F\u002Fgithub.com\u002Fdeepcam-cn\u002Fyolov5-face)![Github stars](https:\u002F\u002Fimg.shields.io\u002Fgithub\u002Fstars\u002Fdeepcam-cn\u002Fyolov5-face.svg) | 人脸检测-支持纯TensorRT加速，成为**主要贡献者** | 2021.12 |\n\n\n\n## 2020\n\n|                                官方库                                |                    项目注释                     |     备注     |  更新  |\n| :------------------------------------------------------------------: | :---------------------------------------------: | :----------: | :----: |\n|   [DynamicReLU(ECCV 2020)](https:\u002F\u002Fgithub.com\u002FIslanna\u002FDynamicReLU)   | [注释](https:\u002F\u002Fgithub.com\u002Fbobo0810\u002FDynamicReLU) | 动态激活函数 | 2020.9 |\n|     [AMSoftmax](https:\u002F\u002Fgithub.com\u002Fcavalleria\u002Fcavaface.pytorch)      | [注释](https:\u002F\u002Fgithub.com\u002Fbobo0810\u002FFaceVerLoss) |  乘法角间隔  | 2020.9 |\n| [ArcFace(CVPR 2019)](https:\u002F\u002Fgithub.com\u002Fcavalleria\u002Fcavaface.pytorch) | [注释](https:\u002F\u002Fgithub.com\u002Fbobo0810\u002FFaceVerLoss) |  加法角间隔  | 2020.9 |\n| [CircleLoss(CVPR 2020)](https:\u002F\u002Fgithub.com\u002Fxialuxi\u002FCircleLoss_Face)  | [注释](https:\u002F\u002Fgithub.com\u002Fbobo0810\u002FFaceVerLoss) |  加权角间隔  | 2020.9 |\n\n|                                                                                      自研                                                                                      |                   备注                   | 更新    |\n| :----------------------------------------------------------------------------------------------------------------------------------------------------------------------------: | :--------------------------------------: | ------- |\n|           [FunnelRelu(ECCV 2020)](https:\u002F\u002Fgithub.com\u002Fbobo0810\u002FFunnelAct_Pytorch)![Github stars](https:\u002F\u002Fimg.shields.io\u002Fgithub\u002Fstars\u002Fbobo0810\u002FFunnelAct_Pytorch.svg)            |            新型激活函数-复现             | 2020.7  |\n|                       [AMP](https:\u002F\u002Fgithub.com\u002Fbobo0810\u002FPytorchExample) ![Github stars](https:\u002F\u002Fimg.shields.io\u002Fgithub\u002Fstars\u002Fbobo0810\u002FPytorchExample.svg)                       |            自动混合精度-示例             | 2020.10 |\n|                    [BroadFace(ECCV 2020)](https:\u002F\u002Fgithub.com\u002Fbobo0810\u002FBroadFace)![Github stars](https:\u002F\u002Fimg.shields.io\u002Fgithub\u002Fstars\u002Fbobo0810\u002FBroadFace.svg)                    |        人脸对比队列更新策略-复现         | 2020.10 |\n|                        [TargetDrop](https:\u002F\u002Fgithub.com\u002Fbobo0810\u002FTargetDrop)![Github stars](https:\u002F\u002Fimg.shields.io\u002Fgithub\u002Fstars\u002Fbobo0810\u002FTargetDrop.svg)                        |          注意力机制Dropout-复现          | 2020.10 |\n|                         [HS-ResNet](https:\u002F\u002Fgithub.com\u002Fbobo0810\u002FHS-ResNet)![Github stars](https:\u002F\u002Fimg.shields.io\u002Fgithub\u002Fstars\u002Fbobo0810\u002FHS-ResNet.svg)                          |            ResNet改进版-复现             | 2020.11 |\n| [AFF-ResNet(WACV 2021)](https:\u002F\u002Fgithub.com\u002FYimianDai\u002Fopen-aff\u002Fblob\u002Fmaster\u002Faff_pytorch\u002FREADME_CN.md)![Github stars](https:\u002F\u002Fimg.shields.io\u002Fgithub\u002Fstars\u002FYimianDai\u002Fopen-aff.svg) | 特征融合的统一方式- 复现，**并入官方库** | 2020.11 |\n|                       [DDP](https:\u002F\u002Fgithub.com\u002Fbobo0810\u002FPytorchExample) ![Github stars](https:\u002F\u002Fimg.shields.io\u002Fgithub\u002Fstars\u002Fbobo0810\u002FPytorchExample.svg)                       |           分布式数据并行-示例            | 2020.11 |\n|                  [DiscFace(ACCV 2020)](https:\u002F\u002Fgithub.com\u002Fbobo0810\u002FFaceVerLoss)![Github stars](https:\u002F\u002Fimg.shields.io\u002Fgithub\u002Fstars\u002Fbobo0810\u002FFaceVerLoss.svg)                   |            最小差异学习-复现             | 2020.12 |\n|                        [NPCFace](https:\u002F\u002Fgithub.com\u002Fbobo0810\u002FFaceVerLoss)![Github stars](https:\u002F\u002Fimg.shields.io\u002Fgithub\u002Fstars\u002Fbobo0810\u002FFaceVerLoss.svg)                         |            正负联合监督-复现             | 2020.12 |\n\n\n\n## 2017-2019\n|                                 官方库                                  |                                                                项目注释                                                                |       备注       |\n| :---------------------------------------------------------------------: | :------------------------------------------------------------------------------------------------------------------------------------: | :--------------: |\n|     [Fatser Rcnn(NIPS 2015)](https:\u002F\u002Fzhuanlan.zhihu.com\u002Fp\u002F32404424)     |                            [注释](https:\u002F\u002Fgithub.com\u002Fbobo0810\u002FPytorchNetHub\u002Ftree\u002Fmaster\u002FFasterRcnn_pytorch)                            |     目标检测     |\n|   [YOLO v1(CVPR 2016)](https:\u002F\u002Fgithub.com\u002Fxiongzihua\u002Fpytorch-YOLO-v1)   |                              [注释](https:\u002F\u002Fgithub.com\u002Fbobo0810\u002FPytorchNetHub\u002Ftree\u002Fmaster\u002FYolov1_pytorch)                              |     目标检测     |\n| [YOLO v3(ECCV 2016)](https:\u002F\u002Fgithub.com\u002Feriklindernoren\u002FPyTorch-YOLOv3) | [注释](https:\u002F\u002Fgithub.com\u002Fbobo0810\u002FPyTorch-YOLOv3-master) [重构](https:\u002F\u002Fgithub.com\u002Fbobo0810\u002FPytorchNetHub\u002Ftree\u002Fmaster\u002FYolov3_pytorch) |     目标检测     |\n|         [YOLO v4](https:\u002F\u002Fgithub.com\u002FTianxiaomo\u002Fpytorch-YOLOv4)         |                                           [注释](https:\u002F\u002Fgithub.com\u002Fbobo0810\u002FYOLOv4_Pytorch)                                           |     目标检测     |\n|             [SSD](https:\u002F\u002Fgithub.com\u002Famdegroot\u002Fssd.pytorch)             |       [注释](https:\u002F\u002Fgithub.com\u002Fbobo0810\u002FpytorchSSD)   [重构](https:\u002F\u002Fgithub.com\u002Fbobo0810\u002FPytorchNetHub\u002Ftree\u002Fmaster\u002FSSD_pytorch)       |     目标检测     |\n|         [CAM(CVPR 2016)](https:\u002F\u002Fgithub.com\u002Fjacobgil\u002Fkeras-cam)         |                               [注释](https:\u002F\u002Fgithub.com\u002Fbobo0810\u002FPytorchNetHub\u002Ftree\u002Fmaster\u002FCAM_pytorch)                                |    特征可视化    |\n|     [U-Net(MICCAI 2015)](https:\u002F\u002Fgithub.com\u002Fmilesial\u002FPytorch-UNet)      |                               [注释](https:\u002F\u002Fgithub.com\u002Fbobo0810\u002FPytorchNetHub\u002Ftree\u002Fmaster\u002FUNet_pytorch)                               | 医学影像语义分割 |\n|        [FPN(CVPR 2017)](https:\u002F\u002Fgithub.com\u002Fkuangliu\u002Fpytorch-fpn)        |                               [注释](https:\u002F\u002Fgithub.com\u002Fbobo0810\u002FPytorchNetHub\u002Ftree\u002Fmaster\u002FFPN_pytorch)                                |    特征金字塔    |\n\n|                                                                     自研                                                                     | 备注                                           |\n| :------------------------------------------------------------------------------------------------------------------------------------------: | ---------------------------------------------- |\n| [XueLangTianchi](https:\u002F\u002Fgithub.com\u002Fbobo0810\u002FXueLangTianchi)![Github stars](https:\u002F\u002Fimg.shields.io\u002Fgithub\u002Fstars\u002Fbobo0810\u002FXueLangTianchi.svg) | 雪浪制造AI挑战赛—视觉计算辅助良品检测 -32\u002F2403 |\n|       [S4ND](https:\u002F\u002Fgithub.com\u002Fbobo0810\u002FS4ND_Pytorch) ![Github stars](https:\u002F\u002Fimg.shields.io\u002Fgithub\u002Fstars\u002Fbobo0810\u002FS4ND_Pytorch.svg)        | 单次单尺度肺结节检测（MICCAI 2018）复现        |\n|    [3D SKconv](https:\u002F\u002Fgithub.com\u002Fbobo0810\u002FSKNet_Pytorch) ![Github stars](https:\u002F\u002Fimg.shields.io\u002Fgithub\u002Fstars\u002Fbobo0810\u002FSKNet_Pytorch.svg)    | 注意力机制SE模块、SK模块的3D实现               |\n\n\n> 注：猫狗分类、风格迁移、生成对抗等更多内容请访问[pytorch-book](https:\u002F\u002Fgithub.com\u002Fchenyuntc\u002Fpytorch-book)\n\n\n\n\n\n[![Star History Chart](https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002Fbobo0810_PytorchNetHub_readme_5d46fe64017f.png)](https:\u002F\u002Fstar-history.com\u002F#bobo0810\u002FPytorchNetHub&Date)\n","![linus](https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002Fbobo0810_PytorchNetHub_readme_a9fea3ce565f.jpg)\n\n# 目的\n\n- 论文复现\n- 算法竞赛\n- 源码注释\n  \n   > paper得来终觉浅，绝知此事要coding。\n\n\n\n# 工作\n\n### [LearnLeetCode⭐️⭐️⭐️](https:\u002F\u002Fgithub.com\u002Fbobo0810\u002FLearnLeetCode)\n\n> 八股基础：Transformer知识、位置编码等\n>\n> 手撕代码：梯度下降、SelfAttention、MultiHeadAttention等\n>\n> 刷题方法论：统一解题模板，简单清晰\n\n### [轻量级图像识别框架Classification](https:\u002F\u002Fgithub.com\u002Fbobo0810\u002FClassification)![Github stars](https:\u002F\u002Fimg.shields.io\u002Fgithub\u002Fstars\u002Fbobo0810\u002FClassification.svg)\n\n> 支持任务： 1. 图像分类   2. 度量学习\u002F特征对比\n>\n> 轻量级、模块化、高扩展、分布式、自动剪枝\n\n### [Pytorch最小实践](https:\u002F\u002Fgithub.com\u002Fbobo0810\u002FPytorchExample)![Github stars](https:\u002F\u002Fimg.shields.io\u002Fgithub\u002Fstars\u002Fbobo0810\u002FPytorchExample.svg)\n\n> 自动混合精度AMP\n> \n> 分布式数据并行DDP\n> \n> NCNN\u002FMNN部署\n> \n> TensorRT部署\n\n\n### 视觉任务\n\n> 目标检测：Faster rcnn、YOLO v1、YOLO v3、YOLO v4、SSD、CAM、S4ND\n>\n> 语义分割：U-Net \n>\n> 主干网络：FPN、SKNet、HS-ResNet、AFF-ResNet(并入官方库)、TargetDrop\n>\n> 激活函数：FunnelAct、DynamicReLU\n>\n> 知识蒸馏：RepDistiller\n\n### 人脸相关\n\n> 人脸检测：Yolov5-Face \u003Cu>主要贡献者\u003C\u002Fu>\n>\n> 人脸比对\n>\n> ​\t\t分类器：AMSoftmax|ArcFace|Circle-Loss|DiscFace|NPCFace\n>\n> ​\t\t训练策略：Semi-Siamese-Training|BroadFace\n\n### 算法竞赛\n\n> 雪浪制造AI挑战赛    排名: 32\u002F2403\n>\n> \"计图\"人工智能算法挑战赛-狗细分类  排名: 4\u002F430\n>\n> ACCV2022国际细粒度图像分析挑战赛-网络监督的细粒度识别  排名: 8\u002F133\n\n\n\n# 时间线\n\n\n\n## 2025\n\n| 自研                                                       | 备注                            | 更新   |\n| ---------------------------------------------------------- | ------------------------------- | ------ |\n| [LearnLeetCode](https:\u002F\u002Fgithub.com\u002Fbobo0810\u002FLearnLeetCode) | 八股基础+手撕代码+刷题方法论⭐️⭐️⭐️ | 2025.1 |\n| [MLLM-anything](https:\u002F\u002Fgithub.com\u002Fbobo0810\u002FMLLM-anything) | 关于MLLM的训练、评测、最新进展\u003Cbr>最新进展\u003Cbr>   1. Omni最新进展\u003Cbr>   2. VLM最新进展\u003Cbr>训练\u003Cbr>   1. Megatron大规模训练框架\u003Cbr>   2. Energon大规模数据加载库\u003Cbr>评测\u003Cbr>   1. OpenCompass文本评测库\u003Cbr>   2. VLMEvalKit多模评测库\u003Cbr>   3. UltraEval-Audio音频评测库 | 2025.3 |\n\n## 2024\n\n| 自研   | 备注                          | 更新   |\n| ------ | ----------------------------- | ------ |\n| [多模态大模型专栏](https:\u002F\u002Fwww.zhihu.com\u002Fcolumn\u002Fc_1801288994694258689) | 多模态VL系列之高质量数据（一）\u003Cbr>多模态VL系列之模型架构（二）\u003Cbr>多模态VL系列之训练策略（三）\u003Cbr> | 2024.4 |\n| [24卡+公开数据+4B 可以有多强？](https:\u002F\u002Fzhuanlan.zhihu.com\u002Fp\u002F714269886) | 勇闯OpenCompass榜单 | 2024.8 |\n\n\n\n\n## 2023\n\n| 自研                                                         | 备注                                                    | 更新   |\n| ------------------------------------------------------------ | ------------------------------------------------------- | ------ |\n| [LearnColossalAI](https:\u002F\u002Fgithub.com\u002Fbobo0810\u002FLearnColossalAI) | ColossalAI教程 & 示例注释 & 学习笔记 （大模型高效训练） | 2023.3 |\n| [OpenMM](https:\u002F\u002Fgithub.com\u002Fbobo0810\u002FOpenMM)                 | OpenMM系列最佳食用手册                                  | 2023.3 |\n| [LearnDeepSpeed](https:\u002F\u002Fgithub.com\u002Fbobo0810\u002FLearnDeepSpeed)![Github stars](https:\u002F\u002Fimg.shields.io\u002Fgithub\u002Fstars\u002Fbobo0810\u002FLearnDeepSpeed.svg) | DeepSpeed教程 & 示例注释 & 学习笔记 （大模型高效训练）  | 2023.8 |\n| [MiniGPT-4-DeepSpeed](https:\u002F\u002Fgithub.com\u002Fbobo0810\u002FMiniGPT-4-DeepSpeed) | MiniGPT-4基于DeepSpeed加速➕ 扩充模型规模 ➕ 实验分析     | 2023.9 |\n\n\n\n## 2022\n\n|                          官方库                          |                         |  更新  |\n| :------------------------------------------------------: | :-------------: | :----: |\n| [RepVGG(CVPR 2021)](https:\u002F\u002Fgithub.com\u002FDingXiaoH\u002FRepVGG) | VGG再次伟大  [解读+代码](.\u002FRepVGG\u002Freadme.md) | 2022.7 |\n| [G-Ghost(IJCV 2022)](https:\u002F\u002Fgithub.com\u002Fhuawei-noah\u002FEfficient-AI-Backbones) | 探索各级别的特征冗余   [解读+代码](.\u002FGhostNet\u002Freadme.md) | 2022.7 |\n| [BBN(CVPR2020)](https:\u002F\u002Fgithub.com\u002Fmegvii-research\u002FBBN) | 双边分支网络,以解决长尾分布问题   [解读+代码](.\u002FBBN\u002Freadme.md) | 2022.11 |\n| Vision Transformer(ICLR 2021) | Transformer首次应用到视觉领域    [解读+代码](https:\u002F\u002Fgithub.com\u002Fbobo0810\u002FLearnTransformer) | 2022.12 |\n| [MAE(CVPR2021)](https:\u002F\u002Fgithub.com\u002Ffacebookresearch\u002Fmae) | 自监督学习   [解读+代码](https:\u002F\u002Fgithub.com\u002Fbobo0810\u002FLearnTransformer) | 2022.12 |\n\n| 自研                                                         | 备注                                 | 更新    |\n| ------------------------------------------------------------ | ------------------------------------ | ------- |\n| [bobotools](https:\u002F\u002Fgithub.com\u002Fbobo0810\u002Fbotools)![Github stars](https:\u002F\u002Fimg.shields.io\u002Fgithub\u002Fstars\u002Fbobo0810\u002Fbotools.svg) | 工具库（已废弃，用GPT更顺手）        | 2022.2  |\n| [Classification](https:\u002F\u002Fgithub.com\u002Fbobo0810\u002FClassification)![Github stars](https:\u002F\u002Fimg.shields.io\u002Fgithub\u002Fstars\u002Fbobo0810\u002FClassification.svg) | 图像识别框架                         | 2022.2  |\n| [Pytorch最小实践](https:\u002F\u002Fgithub.com\u002Fbobo0810\u002FPytorchExample)![Github stars](https:\u002F\u002Fimg.shields.io\u002Fgithub\u002Fstars\u002Fbobo0810\u002FPytorchExample.svg) | Pytorch最小实践                      | 2022.6  |\n| [BossVision](https:\u002F\u002Fwww.yuque.com\u002Fbobo0810\u002Fboss_vision\u002Fguly2g) | 简单、模块化、高扩展的分布式训练框架 | 2022.7  |\n| [CUDA-Python](.\u002FCUDA_Python\u002Freadme.md)                       | Nvidia CUDA加速计算基础课程          | 2022.9  |\n| [DataHub](.\u002FDataHub\u002Freadme.md)                               | 公开数据集汇总                       | 2022.11 |\n\n## 2021\n\n|                              官方库                              |                         项目注释                          |       备注       |  更新  |\n| :--------------------------------------------------------------: | :-------------------------------------------------------: | :--------------: | :----: |\n| [SST(ECCV 2020)](https:\u002F\u002Fgithub.com\u002Fdituu\u002FSemi-Siamese-Training) | [注释](https:\u002F\u002Fgithub.com\u002Fbobo0810\u002FSemi-Siamese-Training) |   浅层人脸学习   | 2021.2 |\n|    [RepDistiller](https:\u002F\u002Fgithub.com\u002FHobbitLong\u002FRepDistiller)    |     [注释](https:\u002F\u002Fgithub.com\u002Fbobo0810\u002FRepDistiller)      | 知识蒸馏算法合集 | 2021.2 |\n\n|                             自研                             | 备注                                            | 更新    |\n| :----------------------------------------------------------: | ----------------------------------------------- | ------- |\n| [JittorDogsClass](https:\u002F\u002Fgithub.com\u002Fbobo0810\u002FJittorDogsClass)![Github stars](https:\u002F\u002Fimg.shields.io\u002Fgithub\u002Fstars\u002Fbobo0810\u002FJittorDogsClass.svg) | “计图”算法挑战赛-狗细分类 4\u002F430                 | 2021.4  |\n| [Yolov5-Face](https:\u002F\u002Fgithub.com\u002Fdeepcam-cn\u002Fyolov5-face)![Github stars](https:\u002F\u002Fimg.shields.io\u002Fgithub\u002Fstars\u002Fdeepcam-cn\u002Fyolov5-face.svg) | 人脸检测-支持纯TensorRT加速，成为**主要贡献者** | 2021.12 |\n\n## 2020年\n\n|                                官方库                                |                    项目注释                     |     备注     |  更新  |\n| :------------------------------------------------------------------: | :---------------------------------------------: | :----------: | :----: |\n|   [DynamicReLU(ECCV 2020)](https:\u002F\u002Fgithub.com\u002FIslanna\u002FDynamicReLU)   | [注释](https:\u002F\u002Fgithub.com\u002Fbobo0810\u002FDynamicReLU) | 动态激活函数 | 2020.9 |\n|     [AMSoftmax](https:\u002F\u002Fgithub.com\u002Fcavalleria\u002Fcavaface.pytorch)      | [注释](https:\u002F\u002Fgithub.com\u002Fbobo0810\u002FFaceVerLoss) |  乘法角间隔  | 2020.9 |\n| [ArcFace(CVPR 2019)](https:\u002F\u002Fgithub.com\u002Fcavalleria\u002Fcavaface.pytorch) | [注释](https:\u002F\u002Fgithub.com\u002Fbobo0810\u002FFaceVerLoss) |  加法角间隔  | 2020.9 |\n| [CircleLoss(CVPR 2020)](https:\u002F\u002Fgithub.com\u002Fxialuxi\u002FCircleLoss_Face)  | [注释](https:\u002F\u002Fgithub.com\u002Fbobo0810\u002FFaceVerLoss) |  加权角间隔  | 2020.9 |\n\n|                                                                                      自研                                                                                      |                   备注                   | 更新    |\n| :----------------------------------------------------------------------------------------------------------------------------------------------------------------------------: | :--------------------------------------: | ------- |\n|           [FunnelRelu(ECCV 2020)](https:\u002F\u002Fgithub.com\u002Fbobo0810\u002FFunnelAct_Pytorch)![Github stars](https:\u002F\u002Fimg.shields.io\u002Fgithub\u002Fstars\u002Fbobo0810\u002FFunnelAct_Pytorch.svg)            |            新型激活函数-复现             | 2020.7  |\n|                       [AMP](https:\u002F\u002Fgithub.com\u002Fbobo0810\u002FPytorchExample) ![Github stars](https:\u002F\u002Fimg.shields.io\u002Fgithub\u002Fstars\u002Fbobo0810\u002FPytorchExample.svg)                       |            自动混合精度-示例             | 2020.10 |\n|                    [BroadFace(ECCV 2020)](https:\u002F\u002Fgithub.com\u002Fbobo0810\u002FBroadFace)![Github stars](https:\u002F\u002Fimg.shields.io\u002Fgithub\u002Fstars\u002Fbobo0810\u002FBroadFace.svg)                    |        人脸对比队列更新策略-复现         | 2020.10 |\n|                        [TargetDrop](https:\u002F\u002Fgithub.com\u002Fbobo0810\u002FTargetDrop)![Github stars](https:\u002F\u002Fimg.shields.io\u002Fgithub\u002Fstars\u002Fbobo0810\u002FTargetDrop.svg)                        |          注意力机制Dropout-复现          | 2020.10 |\n|                         [HS-ResNet](https:\u002F\u002Fgithub.com\u002Fbobo0810\u002FHS-ResNet)![Github stars](https:\u002F\u002Fimg.shields.io\u002Fgithub\u002Fstars\u002Fbobo0810\u002FHS-ResNet.svg)                          |            ResNet改进版-复现             | 2020.11 |\n| [AFF-ResNet(WACV 2021)](https:\u002F\u002Fgithub.com\u002FYimianDai\u002Fopen-aff\u002Fblob\u002Fmaster\u002Faff_pytorch\u002FREADME_CN.md)![Github stars](https:\u002F\u002Fimg.shields.io\u002Fgithub\u002Fstars\u002FYimianDai\u002Fopen-aff.svg) | 特征融合的统一方式- 复现，**并入官方库** | 2020.11 |\n|                       [DDP](https:\u002F\u002Fgithub.com\u002Fbobo0810\u002FPytorchExample) ![Github stars](https:\u002F\u002Fimg.shields.io\u002Fgithub\u002Fstars\u002Fbobo0810\u002FPytorchExample.svg)                       |           分布式数据并行-示例            | 2020.11 |\n|                  [DiscFace(ACCV 2020)](https:\u002F\u002Fgithub.com\u002Fbobo0810\u002FFaceVerLoss)![Github stars](https:\u002F\u002Fimg.shields.io\u002Fgithub\u002Fstars\u002Fbobo0810\u002FFaceVerLoss.svg)                   |            最小差异学习-复现             | 2020.12 |\n|                        [NPCFace](https:\u002F\u002Fgithub.com\u002Fbobo0810\u002FFaceVerLoss)![Github stars](https:\u002F\u002Fimg.shields.io\u002Fgithub\u002Fstars\u002Fbobo0810\u002FFaceVerLoss.svg)                         |            正负联合监督-复现             | 2020.12 |\n\n\n\n## 2017-2019年\n|                                 官方库                                  |                                                                项目注释                                                                |       备注       |\n| :---------------------------------------------------------------------: | :------------------------------------------------------------------------------------------------------------------------------------: | :--------------: |\n|     [Fatser Rcnn(NIPS 2015)](https:\u002F\u002Fzhuanlan.zhihu.com\u002Fp\u002F32404424)     |                            [注释](https:\u002F\u002Fgithub.com\u002Fbobo0810\u002FPytorchNetHub\u002Ftree\u002Fmaster\u002FFasterRcnn_pytorch)                            |     目标检测     |\n|   [YOLO v1(CVPR 2016)](https:\u002F\u002Fgithub.com\u002Fxiongzihua\u002Fpytorch-YOLO-v1)   |                              [注释](https:\u002F\u002Fgithub.com\u002Fbobo0810\u002FPytorchNetHub\u002Ftree\u002Fmaster\u002FYolov1_pytorch)                              |     目标检测     |\n| [YOLO v3(ECCV 2016)](https:\u002F\u002Fgithub.com\u002Feriklindernoren\u002FPyTorch-YOLOv3) | [注释](https:\u002F\u002Fgithub.com\u002Fbobo0810\u002FPyTorch-YOLOv3-master) [重构](https:\u002F\u002Fgithub.com\u002Fbobo0810\u002FPytorchNetHub\u002Ftree\u002Fmaster\u002FYolov3_pytorch) |     目标检测     |\n|         [YOLO v4](https:\u002F\u002Fgithub.com\u002FTianxiaomo\u002Fpytorch-YOLOv4)         |                                           [注释](https:\u002F\u002Fgithub.com\u002Fbobo0810\u002FYOLOv4_Pytorch)                                           |     目标检测     |\n|             [SSD](https:\u002F\u002Fgithub.com\u002Famdegroot\u002Fssd.pytorch)             |       [注释](https:\u002F\u002Fgithub.com\u002Fbobo0810\u002FpytorchSSD)   [重构](https:\u002F\u002Fgithub.com\u002Fbobo0810\u002FPytorchNetHub\u002Ftree\u002Fmaster\u002FSSD_pytorch)       |     目标检测     |\n|         [CAM(CVPR 2016)](https:\u002F\u002Fgithub.com\u002Fjacobgil\u002Fkeras-cam)         |                               [注释](https:\u002F\u002Fgithub.com\u002Fbobo0810\u002FPytorchNetHub\u002Ftree\u002Fmaster\u002FCAM_pytorch)                                |    特征可视化    |\n|     [U-Net(MICCAI 2015)](https:\u002F\u002Fgithub.com\u002Fmilesial\u002FPytorch-UNet)      |                               [注释](https:\u002F\u002Fgithub.com\u002Fbobo0810\u002FPytorchNetHub\u002Ftree\u002Fmaster\u002FUNet_pytorch)                               | 医学影像语义分割 |\n|        [FPN(CVPR 2017)](https:\u002F\u002Fgithub.com\u002Fkuangliu\u002Fpytorch-fpn)        |                               [注释](https:\u002F\u002Fgithub.com\u002Fbobo0810\u002FPytorchNetHub\u002Ftree\u002Fmaster\u002FFPN_pytorch)                                |    特征金字塔    |\n\n|                                                                     自研                                                                     | 备注                                           |\n| :------------------------------------------------------------------------------------------------------------------------------------------: | ---------------------------------------------- |\n| [XueLangTianchi](https:\u002F\u002Fgithub.com\u002Fbobo0810\u002FXueLangTianchi)![Github stars](https:\u002F\u002Fimg.shields.io\u002Fgithub\u002Fstars\u002Fbobo0810\u002FXueLangTianchi.svg) | 雪浪制造AI挑战赛—视觉计算辅助良品检测 -32\u002F2403 |\n|       [S4ND](https:\u002F\u002Fgithub.com\u002Fbobo0810\u002FS4ND_Pytorch) ![Github stars](https:\u002F\u002Fimg.shields.io\u002Fgithub\u002Fstars\u002Fbobo0810\u002FS4ND_Pytorch.svg)        | 单次单尺度肺结节检测（MICCAI 2018）复现        |\n|    [3D SKconv](https:\u002F\u002Fgithub.com\u002Fbobo0810\u002FSKNet_Pytorch) ![Github stars](https:\u002F\u002Fimg.shields.io\u002Fgithub\u002Fstars\u002Fbobo0810\u002FSKNet_Pytorch.svg)    | 注意力机制SE模块、SK模块的3D实现               |\n\n\n> 注：猫狗分类、风格迁移、生成对抗等更多内容请访问[pytorch-book](https:\u002F\u002Fgithub.com\u002Fchenyuntc\u002Fpytorch-book)\n\n\n\n\n\n[![Star History Chart](https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002Fbobo0810_PytorchNetHub_readme_5d46fe64017f.png)](https:\u002F\u002Fstar-history.com\u002F#bobo0810\u002FPytorchNetHub&Date)","# PytorchNetHub 快速上手指南\n\nPytorchNetHub 是一个专注于深度学习论文复现、算法竞赛实战及源码深度注释的开源项目集合。涵盖从基础算子手撕、轻量级识别框架到大模型训练（LLM\u002FMLLM）的全栈内容。\n\n## 环境准备\n\n本项目基于 PyTorch 生态，建议在使用具体子项目前，先配置好基础的深度学习环境。\n\n### 系统要求\n- **操作系统**: Linux (推荐 Ubuntu 18.04+\u002F20.04+) 或 Windows (WSL2 推荐)\n- **GPU**: NVIDIA GPU (显存建议 ≥ 8GB，大模型训练需更高)\n- **Python**: 3.8 - 3.10\n\n### 前置依赖\n确保已安装 CUDA Toolkit 和 cuDNN，并匹配对应的 PyTorch 版本。\n\n```bash\n# 检查 NVIDIA 驱动和 CUDA 版本\nnvidia-smi\nnvcc --version\n```\n\n## 安装步骤\n\n由于 PytorchNetHub 是一个包含多个独立子项目的仓库集合，请根据需求选择对应的子项目进行克隆和安装。以下以通用的图像识别框架 `Classification` 和大模型学习项目 `LearnLeetCode` 为例。\n\n### 1. 克隆仓库\n推荐使用国内镜像加速克隆（如 Gitee 镜像或设置 git 代理），若直接访问 GitHub 较慢，可配置代理：\n\n```bash\n# 克隆主仓库（包含部分历史代码）\ngit clone https:\u002F\u002Fgithub.com\u002Fbobo0810\u002FPytorchNetHub.git\n\n# 或者单独克隆推荐的子项目（推荐方式）\n# 示例：克隆基础手撕代码与八股文项目\ngit clone https:\u002F\u002Fgithub.com\u002Fbobo0810\u002FLearnLeetCode.git\n\n# 示例：克隆轻量级图像识别框架\ngit clone https:\u002F\u002Fgithub.com\u002Fbobo0810\u002FClassification.git\n```\n\n### 2. 创建虚拟环境\n建议使用 Conda 管理依赖，避免冲突。\n\n```bash\nconda create -n pytorch_hub python=3.9\nconda activate pytorch_hub\n```\n\n### 3. 安装依赖\n进入具体子项目目录安装依赖。**强烈推荐使用国内镜像源（如清华源）加速 pip 安装**。\n\n```bash\n# 以 Classification 项目为例\ncd Classification\n\n# 使用清华源安装 requirements\npip install -r requirements.txt -i https:\u002F\u002Fpypi.tuna.tsinghua.edu.cn\u002Fsimple\n\n# 如果需要安装特定版本的 PyTorch (示例为 CUDA 11.8)\npip install torch torchvision torchaudio --index-url https:\u002F\u002Fdownload.pytorch.org\u002Fwhl\u002Fcu118\n```\n\n> **注意**：不同子项目（如 `LearnDeepSpeed`, `MiniGPT-4-DeepSpeed`）可能有特定的 `requirements.txt`，请务必进入对应文件夹查看并安装。\n\n## 基本使用\n\n本项目不同模块用途各异，以下提供两个典型场景的最简使用示例。\n\n### 场景一：手撕核心算法 (LearnLeetCode)\n用于理解 Transformer、注意力机制等底层原理。\n\n```python\n# 进入项目目录\ncd LearnLeetCode\n\n# 示例：运行 SelfAttention 的手撕实现测试\n# 具体文件名请参考该项目下的 examples 或 tests 目录\npython src\u002Fself_attention_demo.py\n```\n*在该模式下，你可以直接阅读 `src` 目录下带有详细中文注释的代码，验证梯度下降、MultiHeadAttention 等算子的实现。*\n\n### 场景二：训练图像分类模型 (Classification)\n用于快速启动一个支持分布式、自动剪枝的分类任务。\n\n```bash\n# 进入项目目录\ncd Classification\n\n# 单机单卡训练示例 (以 ResNet18 在 CIFAR10 为例)\npython train.py \\\n    --model resnet18 \\\n    --dataset cifar10 \\\n    --batch_size 64 \\\n    --epochs 100\n\n# 开启自动混合精度 (AMP) 训练\npython train.py \\\n    --model resnet18 \\\n    --amp True \\\n    --batch_size 128\n```\n\n### 场景三：大模型训练学习 (LearnDeepSpeed \u002F MLLM)\n针对 2023-2025 年更新的大模型相关项目，通常涉及 DeepSpeed 配置。\n\n```bash\n# 以 MiniGPT-4-DeepSpeed 为例\ncd MiniGPT-4-DeepSpeed\n\n# 运行单节点多卡训练脚本 (需修改 config 中的 deepspeed 配置)\ndeepspeed --num_gpus=4 train.py \\\n    --cfg_path eval_configs\u002Fminigpt4_eval.yaml \\\n    --options model.vis_processor.eval=\"blip2_image_eval\"\n```\n\n---\n**提示**：每个子项目的根目录下通常都有独立的 `README.md`，包含了该特定任务（如人脸检测、语义分割、大模型评测）更详细的参数说明和数据集准备指南。","某算法团队正备战“细粒度图像识别”国际挑战赛，需要在有限算力下快速复现前沿模型并优化训练策略。\n\n### 没有 PytorchNetHub 时\n- **复现效率低下**：队员需从零阅读晦涩的论文公式并手动编写代码，常因细节理解偏差导致模型无法收敛，浪费数周时间调试。\n- **工程落地困难**：缺乏统一的分布式训练（DDP）和自动混合精度（AMP）模板，多卡资源利用率低，训练速度缓慢且显存易爆。\n- **知识体系碎片化**：面对 Transformer、位置编码等基础理论及手撕代码需求，团队成员各自查找资料，缺乏系统性的解题模板和注释参考。\n- **竞赛策略缺失**：缺少经过验证的长尾分布处理（如 BBN）或知识蒸馏（RepDistiller）方案，只能盲目尝试，难以在排行榜上取得突破。\n\n### 使用 PytorchNetHub 后\n- **复现加速落地**：直接调用项目中已注释完善的 Faster RNN、YOLO 系列及 MAE 等源码，将论文复现周期从数周缩短至数天，确保基线模型快速跑通。\n- **训练性能跃升**：复用其模块化的轻量级分类框架，一键启用 DDP 分布式与 AMP 加速，显著降低显存占用并提升训练吞吐量，轻松应对大规模数据。\n- **基础能力夯实**：利用 LearnLeetCode 模块统一团队对梯度下降、SelfAttention 等核心算法的理解，通过标准化模板快速完成面试准备与代码实战。\n- **竞赛成绩突破**：借鉴其在“狗细分类”等赛事中排名前列的实战策略（如 Semi-Siamese 训练），针对性优化模型结构，显著提升最终排名。\n\nPytorchNetHub 通过将论文理论、工程最佳实践与竞赛实战经验深度融合，成为开发者从入门到夺冠的全链路加速器。","https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002Fbobo0810_PytorchNetHub_b76c667d.png","bobo0810","Mr.Li","https:\u002F\u002Foss.gittoolsai.com\u002Favatars\u002Fbobo0810_47925071.jpg","Always Be Curious","North University of China","Beijing","im.lipengbo@gmail.com",null,"https:\u002F\u002Fgithub.com\u002Fbobo0810",[83,87,91,95],{"name":84,"color":85,"percentage":86},"Jupyter Notebook","#DA5B0B",79.2,{"name":88,"color":89,"percentage":90},"Python","#3572A5",20.7,{"name":92,"color":93,"percentage":94},"Shell","#89e051",0,{"name":96,"color":97,"percentage":94},"Cython","#fedf5b",710,156,"2026-03-06T08:33:48","MIT","未说明","需要 NVIDIA GPU（提及 CUDA 加速、TensorRT 部署及分布式训练），具体型号和显存大小未说明",{"notes":105,"python":102,"dependencies":106},"该项目是一个综合性的 PyTorch 代码库，涵盖论文复现、算法竞赛及多种视觉任务（检测、分割、人脸识别）。支持自动混合精度 (AMP)、分布式数据并行 (DDP) 以及多卡大规模训练。部分子项目涉及 NCNN\u002FMNN\u002FTensorRT 端侧部署。由于包含多个独立子项目（如大模型训练、YOLO 系列、人脸比对等），具体环境需求可能因运行的特定子项目而异，README 中未提供统一的全局版本约束。",[107,108,109,110,111,112,113,114,115],"PyTorch","NCNN","MNN","TensorRT","DeepSpeed","ColossalAI","Megatron","OpenCompass","VLMEvalKit",[15,14],[118,119,120,121,122,123,124,125,126,127,128,129,130,131,132,133,134,135],"faster-rcnn","ssd","yolov3","cam","unet","s4nd","yolov4","dynamicrelu","broadface","hs-resnet","targetdrop","discface","npcface","sst","ghostnet","pytorch","repvgg","leetcode","2026-03-27T02:49:30.150509","2026-04-08T14:04:03.549476",[139,144,149,153,158,163,168,173],{"id":140,"question_zh":141,"answer_zh":142,"source_url":143},24516,"如何准备和放置自定义数据集（如 VOC 格式转 COCO 格式）？","项目默认使用 COCO 格式。如果您有 VOC 格式数据，请参照 `AnnotatedNetworkModelGit\u002FYolov3_pytorch\u002Fdata\u002Fget_coco_dataset.sh` 脚本。操作步骤如下：\n1. 阅读并理解该 shell 脚本如何处理数据集；\n2. 参照 VOC 数据的处理结果，编写类似的脚本将您的自定义数据集转换为项目所需的格式；\n3. 确保生成的图片和标注文件放置在配置文件中指定的目录（如 samples 文件夹）。","https:\u002F\u002Fgithub.com\u002Fbobo0810\u002FPytorchNetHub\u002Fissues\u002F6",{"id":145,"question_zh":146,"answer_zh":147,"source_url":148},24517,"训练时 CPU 占用率 100% 但 GPU 利用率很低怎么办？","这通常是因为数据加载或预处理瓶颈导致 GPU 等待。建议尝试以下方法提高 GPU 利用率：\n1. 增大 batch size（如果显存允许）；\n2. 如果使用多张显卡，考虑启用多 GPU 并行训练；\n3. 检查数据读取管道是否高效，避免在 CPU 端进行过于复杂的实时增强操作。","https:\u002F\u002Fgithub.com\u002Fbobo0810\u002FPytorchNetHub\u002Fissues\u002F2",{"id":150,"question_zh":151,"answer_zh":152,"source_url":148},24518,"YOLOv3 训练后检测结果是满屏框框或检测不到目标，原因是什么？","这种情况通常由以下原因导致：\n1. 标签格式错误：确认 label 格式是否为 [类，x, y, w, h] 且数值范围在 0-1 之间（归一化坐标）；\n2. 训练次数不足：模型尚未收敛；\n3. 数据集问题：自定义数据集的分布与原预训练模型差异过大，建议从头训练或增加迭代次数；\n4. 批次大小设置不当：过大的 batch size 可能导致显存报错或训练不稳定。",{"id":154,"question_zh":155,"answer_zh":156,"source_url":157},24519,"计算 IoU（交并比）时，为什么代码中坐标相减后要加 1？","代码中在计算宽度和高度时加 1（例如 `inter_rect_x2 - inter_rect_x1 + 1`）通常是为了包含像素边界（即闭区间计算），防止因取整导致的面积计算偏差，这是一种保险的做法。但在某些实现中如果不加 1 也能正常工作，具体取决于坐标系的定义（是像素索引还是连续坐标）。您可以参考其他未加 1 的实现进行对比测试。","https:\u002F\u002Fgithub.com\u002Fbobo0810\u002FPytorchNetHub\u002Fissues\u002F7",{"id":159,"question_zh":160,"answer_zh":161,"source_url":162},24520,"config.py 中的文件路径变量（如 file_root, test_img_dir）代表什么含义？","这些变量用于指定数据和处理结果的路径，需根据您本地的实际目录结构进行修改：\n- `file_root` \u002F `train_Annotations`：训练集图片和标注文件的根目录；\n- `test_root`：测试集图片的根目录；\n- `test_img_dir`：单张测试图片的具体路径；\n- `result_img_dir`：检测结果图片保存的路径。\n运行前请确保这些路径在您的电脑上真实存在，或者将其修改为您实际的数据存放位置。","https:\u002F\u002Fgithub.com\u002Fbobo0810\u002FPytorchNetHub\u002Fissues\u002F11",{"id":164,"question_zh":165,"answer_zh":166,"source_url":167},24521,"遇到 'RuntimeError: CUDA out of memory' 显存溢出错误如何解决？","显存溢出通常是因为显存不足。建议按以下步骤排查：\n1. 先运行测试脚本，确保环境和硬件配置基本正常；\n2. 减小 batch size 以降低单次迭代显存占用；\n3. 使用 debug 模式逐步调试代码，定位显存激增的具体位置；\n4. 清理显存缓存或关闭其他占用显存的程序。如果显存确实太小（如小于 2GB），可能需要更换硬件或使用更小的模型。","https:\u002F\u002Fgithub.com\u002Fbobo0810\u002FPytorchNetHub\u002Fissues\u002F10",{"id":169,"question_zh":170,"answer_zh":171,"source_url":172},24522,"如何使用非 COCO 类别的单类目标检测数据集进行训练？","可以使用自定义类别进行训练，关键点在于 Ground Truth 的格式必须正确。请确保：\n1. 标签格式采用归一化的 xywh 格式（数值范围 0-1）；\n2. 类别索引映射正确（如果是单类，通常设为 0）；\n3. 参考作者在其他比赛项目（如 XueLangTianchi）中的提交历史，确认数据处理流程无误。如果仍检测不出，请检查数据增强是否破坏了标注或学习率设置是否合适。","https:\u002F\u002Fgithub.com\u002Fbobo0810\u002FPytorchNetHub\u002Fissues\u002F5",{"id":174,"question_zh":175,"answer_zh":176,"source_url":177},24523,"在哪里可以查看 SSD 模型的召回率（Recall）和精度（Precision）等评价指标？","本项目主要关注模型的代码实现，并未对源码做修改以输出特定的评价指标。建议直接跳转至原作者的仓库查看相关文档或评估脚本，那里通常会有详细的性能测试数据和评价标准。","https:\u002F\u002Fgithub.com\u002Fbobo0810\u002FPytorchNetHub\u002Fissues\u002F9",[]]