[{"data":1,"prerenderedAt":-1},["ShallowReactive",2],{"similar-skumra--robotic-grasping":3,"tool-skumra--robotic-grasping":64},[4,17,27,35,43,56],{"id":5,"name":6,"github_repo":7,"description_zh":8,"stars":9,"difficulty_score":10,"last_commit_at":11,"category_tags":12,"status":16},3808,"stable-diffusion-webui","AUTOMATIC1111\u002Fstable-diffusion-webui","stable-diffusion-webui 是一个基于 Gradio 构建的网页版操作界面，旨在让用户能够轻松地在本地运行和使用强大的 Stable Diffusion 图像生成模型。它解决了原始模型依赖命令行、操作门槛高且功能分散的痛点，将复杂的 AI 绘图流程整合进一个直观易用的图形化平台。\n\n无论是希望快速上手的普通创作者、需要精细控制画面细节的设计师，还是想要深入探索模型潜力的开发者与研究人员，都能从中获益。其核心亮点在于极高的功能丰富度：不仅支持文生图、图生图、局部重绘（Inpainting）和外绘（Outpainting）等基础模式，还独创了注意力机制调整、提示词矩阵、负向提示词以及“高清修复”等高级功能。此外，它内置了 GFPGAN 和 CodeFormer 等人脸修复工具，支持多种神经网络放大算法，并允许用户通过插件系统无限扩展能力。即使是显存有限的设备，stable-diffusion-webui 也提供了相应的优化选项，让高质量的 AI 艺术创作变得触手可及。",162132,3,"2026-04-05T11:01:52",[13,14,15],"开发框架","图像","Agent","ready",{"id":18,"name":19,"github_repo":20,"description_zh":21,"stars":22,"difficulty_score":23,"last_commit_at":24,"category_tags":25,"status":16},1381,"everything-claude-code","affaan-m\u002Feverything-claude-code","everything-claude-code 是一套专为 AI 编程助手（如 Claude Code、Codex、Cursor 等）打造的高性能优化系统。它不仅仅是一组配置文件，而是一个经过长期实战打磨的完整框架，旨在解决 AI 代理在实际开发中面临的效率低下、记忆丢失、安全隐患及缺乏持续学习能力等核心痛点。\n\n通过引入技能模块化、直觉增强、记忆持久化机制以及内置的安全扫描功能，everything-claude-code 能显著提升 AI 在复杂任务中的表现，帮助开发者构建更稳定、更智能的生产级 AI 代理。其独特的“研究优先”开发理念和针对 Token 消耗的优化策略，使得模型响应更快、成本更低，同时有效防御潜在的攻击向量。\n\n这套工具特别适合软件开发者、AI 研究人员以及希望深度定制 AI 工作流的技术团队使用。无论您是在构建大型代码库，还是需要 AI 协助进行安全审计与自动化测试，everything-claude-code 都能提供强大的底层支持。作为一个曾荣获 Anthropic 黑客大奖的开源项目，它融合了多语言支持与丰富的实战钩子（hooks），让 AI 真正成长为懂上",140436,2,"2026-04-05T23:32:43",[13,15,26],"语言模型",{"id":28,"name":29,"github_repo":30,"description_zh":31,"stars":32,"difficulty_score":23,"last_commit_at":33,"category_tags":34,"status":16},2271,"ComfyUI","Comfy-Org\u002FComfyUI","ComfyUI 是一款功能强大且高度模块化的视觉 AI 引擎，专为设计和执行复杂的 Stable Diffusion 图像生成流程而打造。它摒弃了传统的代码编写模式，采用直观的节点式流程图界面，让用户通过连接不同的功能模块即可构建个性化的生成管线。\n\n这一设计巧妙解决了高级 AI 绘图工作流配置复杂、灵活性不足的痛点。用户无需具备编程背景，也能自由组合模型、调整参数并实时预览效果，轻松实现从基础文生图到多步骤高清修复等各类复杂任务。ComfyUI 拥有极佳的兼容性，不仅支持 Windows、macOS 和 Linux 全平台，还广泛适配 NVIDIA、AMD、Intel 及苹果 Silicon 等多种硬件架构，并率先支持 SDXL、Flux、SD3 等前沿模型。\n\n无论是希望深入探索算法潜力的研究人员和开发者，还是追求极致创作自由度的设计师与资深 AI 绘画爱好者，ComfyUI 都能提供强大的支持。其独特的模块化架构允许社区不断扩展新功能，使其成为当前最灵活、生态最丰富的开源扩散模型工具之一，帮助用户将创意高效转化为现实。",107662,"2026-04-03T11:11:01",[13,14,15],{"id":36,"name":37,"github_repo":38,"description_zh":39,"stars":40,"difficulty_score":23,"last_commit_at":41,"category_tags":42,"status":16},3704,"NextChat","ChatGPTNextWeb\u002FNextChat","NextChat 是一款轻量且极速的 AI 助手，旨在为用户提供流畅、跨平台的大模型交互体验。它完美解决了用户在多设备间切换时难以保持对话连续性，以及面对众多 AI 模型不知如何统一管理的痛点。无论是日常办公、学习辅助还是创意激发，NextChat 都能让用户随时随地通过网页、iOS、Android、Windows、MacOS 或 Linux 端无缝接入智能服务。\n\n这款工具非常适合普通用户、学生、职场人士以及需要私有化部署的企业团队使用。对于开发者而言，它也提供了便捷的自托管方案，支持一键部署到 Vercel 或 Zeabur 等平台。\n\nNextChat 的核心亮点在于其广泛的模型兼容性，原生支持 Claude、DeepSeek、GPT-4 及 Gemini Pro 等主流大模型，让用户在一个界面即可自由切换不同 AI 能力。此外，它还率先支持 MCP（Model Context Protocol）协议，增强了上下文处理能力。针对企业用户，NextChat 提供专业版解决方案，具备品牌定制、细粒度权限控制、内部知识库整合及安全审计等功能，满足公司对数据隐私和个性化管理的高标准要求。",87618,"2026-04-05T07:20:52",[13,26],{"id":44,"name":45,"github_repo":46,"description_zh":47,"stars":48,"difficulty_score":23,"last_commit_at":49,"category_tags":50,"status":16},2268,"ML-For-Beginners","microsoft\u002FML-For-Beginners","ML-For-Beginners 是由微软推出的一套系统化机器学习入门课程，旨在帮助零基础用户轻松掌握经典机器学习知识。这套课程将学习路径规划为 12 周，包含 26 节精炼课程和 52 道配套测验，内容涵盖从基础概念到实际应用的完整流程，有效解决了初学者面对庞大知识体系时无从下手、缺乏结构化指导的痛点。\n\n无论是希望转型的开发者、需要补充算法背景的研究人员，还是对人工智能充满好奇的普通爱好者，都能从中受益。课程不仅提供了清晰的理论讲解，还强调动手实践，让用户在循序渐进中建立扎实的技能基础。其独特的亮点在于强大的多语言支持，通过自动化机制提供了包括简体中文在内的 50 多种语言版本，极大地降低了全球不同背景用户的学习门槛。此外，项目采用开源协作模式，社区活跃且内容持续更新，确保学习者能获取前沿且准确的技术资讯。如果你正寻找一条清晰、友好且专业的机器学习入门之路，ML-For-Beginners 将是理想的起点。",84991,"2026-04-05T10:45:23",[14,51,52,53,15,54,26,13,55],"数据工具","视频","插件","其他","音频",{"id":57,"name":58,"github_repo":59,"description_zh":60,"stars":61,"difficulty_score":10,"last_commit_at":62,"category_tags":63,"status":16},3128,"ragflow","infiniflow\u002Fragflow","RAGFlow 是一款领先的开源检索增强生成（RAG）引擎，旨在为大语言模型构建更精准、可靠的上下文层。它巧妙地将前沿的 RAG 技术与智能体（Agent）能力相结合，不仅支持从各类文档中高效提取知识，还能让模型基于这些知识进行逻辑推理和任务执行。\n\n在大模型应用中，幻觉问题和知识滞后是常见痛点。RAGFlow 通过深度解析复杂文档结构（如表格、图表及混合排版），显著提升了信息检索的准确度，从而有效减少模型“胡编乱造”的现象，确保回答既有据可依又具备时效性。其内置的智能体机制更进一步，使系统不仅能回答问题，还能自主规划步骤解决复杂问题。\n\n这款工具特别适合开发者、企业技术团队以及 AI 研究人员使用。无论是希望快速搭建私有知识库问答系统，还是致力于探索大模型在垂直领域落地的创新者，都能从中受益。RAGFlow 提供了可视化的工作流编排界面和灵活的 API 接口，既降低了非算法背景用户的上手门槛，也满足了专业开发者对系统深度定制的需求。作为基于 Apache 2.0 协议开源的项目，它正成为连接通用大模型与行业专有知识之间的重要桥梁。",77062,"2026-04-04T04:44:48",[15,14,13,26,54],{"id":65,"github_repo":66,"name":67,"description_en":68,"description_zh":69,"ai_summary_zh":69,"readme_en":70,"readme_zh":71,"quickstart_zh":72,"use_case_zh":73,"hero_image_url":74,"owner_login":75,"owner_name":76,"owner_avatar_url":77,"owner_bio":78,"owner_company":78,"owner_location":79,"owner_email":78,"owner_twitter":78,"owner_website":78,"owner_url":80,"languages":81,"stars":90,"forks":91,"last_commit_at":92,"license":93,"difficulty_score":94,"env_os":95,"env_gpu":96,"env_ram":97,"env_deps":98,"category_tags":112,"github_topics":113,"view_count":23,"oss_zip_url":78,"oss_zip_packed_at":78,"status":16,"created_at":118,"updated_at":119,"faqs":120,"releases":155},2068,"skumra\u002Frobotic-grasping","robotic-grasping","Antipodal Robotic Grasping using GR-ConvNet. IROS 2020.","robotic-grasping 是一个基于深度学习的开源项目，旨在让机器人具备“看”懂物体并自主规划抓取动作的能力。它核心解决了机器人在面对未知物体时，如何精准识别位置并计算出最佳抓取姿态（特别是稳定的对向抓取）这一难题，无需为每个物体单独编程。\n\n该项目实现了发表于 IROS 2020 的 GR-ConvNet（生成式残差卷积神经网络）模型。其独特技术亮点在于采用了一种新颖的生成式架构，能够直接从相机图像中检测物体，并端到端地预测出合适的抓取配置，在经典的 Cornell 抓取数据集上表现优异。\n\n这套工具非常适合机器人领域的研究人员、算法工程师以及高校开发者使用。如果你正在探索智能机械臂控制、计算机视觉应用，或需要复现前沿的抓取算法论文，robotic-grasping 提供了完整的训练、评估及部署代码（支持 PyTorch 框架），并兼容 Cornell 和 Jacquard 等主流数据集。虽然它也包含了针对 Baxter 机器人的 ROS 实现示例，但使用者通常需要具备一定的深度学习基础和机器人开发环境配置能力，以便根据实际需求进行模型训练或二次开发。","# Antipodal Robotic Grasping\nWe present a novel generative residual convolutional neural network based model architecture which detects objects in the camera’s field of view and predicts a suitable antipodal grasp configuration for the objects in the image.\n\nThis repository contains the implementation of the Generative Residual Convolutional Neural Network (GR-ConvNet) from the paper:\n\n#### Antipodal Robotic Grasping using Generative Residual Convolutional Neural Network\n\nSulabh Kumra, Shirin Joshi, Ferat Sahin\n\n[arxiv](https:\u002F\u002Farxiv.org\u002Fabs\u002F1909.04810) | [video](https:\u002F\u002Fyoutu.be\u002FcwlEhdoxY4U)\n\n[![PWC](https:\u002F\u002Fimg.shields.io\u002Fendpoint.svg?url=https:\u002F\u002Fpaperswithcode.com\u002Fbadge\u002Fantipodal-robotic-grasping-using-generative\u002Frobotic-grasping-on-cornell-grasp-dataset)](https:\u002F\u002Fpaperswithcode.com\u002Fsota\u002Frobotic-grasping-on-cornell-grasp-dataset?p=antipodal-robotic-grasping-using-generative)\n\nIf you use this project in your research or wish to refer to the baseline results published in the paper, please use the following BibTeX entry:\n\n```\n@inproceedings{kumra2020antipodal,\n  author={Kumra, Sulabh and Joshi, Shirin and Sahin, Ferat},\n  booktitle={2020 IEEE\u002FRSJ International Conference on Intelligent Robots and Systems (IROS)}, \n  title={Antipodal Robotic Grasping using Generative Residual Convolutional Neural Network}, \n  year={2020},\n  pages={9626-9633},\n  doi={10.1109\u002FIROS45743.2020.9340777}}\n}\n```\n\n## Requirements\n\n- numpy\n- opencv-python\n- matplotlib\n- scikit-image\n- imageio\n- torch\n- torchvision\n- torchsummary\n- tensorboardX\n- pyrealsense2\n- Pillow\n\n## Installation\n- Checkout the robotic grasping package\n```bash\n$ git clone https:\u002F\u002Fgithub.com\u002Fskumra\u002Frobotic-grasping.git\n```\n\n- Create a virtual environment\n```bash\n$ python3.6 -m venv --system-site-packages venv\n```\n\n- Source the virtual environment\n```bash\n$ source venv\u002Fbin\u002Factivate\n```\n\n- Install the requirements\n```bash\n$ cd robotic-grasping\n$ pip install -r requirements.txt\n```\n\n## Datasets\n\nThis repository supports both the [Cornell Grasping Dataset](https:\u002F\u002Fwww.kaggle.com\u002Foneoneliu\u002Fcornell-grasp) and\n[Jacquard Dataset](https:\u002F\u002Fjacquard.liris.cnrs.fr\u002F).\n\n#### Cornell Grasping Dataset\n\n1. Download the and extract [Cornell Grasping Dataset](https:\u002F\u002Fwww.kaggle.com\u002Foneoneliu\u002Fcornell-grasp). \n2. Convert the PCD files to depth images by running `python -m utils.dataset_processing.generate_cornell_depth \u003CPath To Dataset>`\n\n#### Jacquard Dataset\n\n1. Download and extract the [Jacquard Dataset](https:\u002F\u002Fjacquard.liris.cnrs.fr\u002F).\n\n\n## Model Training\n\nA model can be trained using the `train_network.py` script.  Run `train_network.py --help` to see a full list of options.\n\nExample for Cornell dataset:\n\n```bash\npython train_network.py --dataset cornell --dataset-path \u003CPath To Dataset> --description training_cornell\n```\n\nExample for Jacquard dataset:\n\n```bash\npython train_network.py --dataset jacquard --dataset-path \u003CPath To Dataset> --description training_jacquard --use-dropout 0 --input-size 300\n```\n\n## Model Evaluation\n\nThe trained network can be evaluated using the `evaluate.py` script.  Run `evaluate.py --help` for a full set of options.\n\nExample for Cornell dataset:\n\n```bash\npython evaluate.py --network \u003CPath to Trained Network> --dataset cornell --dataset-path \u003CPath to Dataset> --iou-eval\n```\n\nExample for Jacquard dataset:\n\n```bash\npython evaluate.py --network \u003CPath to Trained Network> --dataset jacquard --dataset-path \u003CPath to Dataset> --iou-eval --use-dropout 0 --input-size 300\n```\n\n## Run Tasks\nA task can be executed using the relevant run script. All task scripts are named as `run_\u003Ctask name>.py`. For example, to run the grasp generator run:\n```bash\npython run_grasp_generator.py\n```\n\n## Run on a Robot\nTo run the grasp generator with a robot, please use our ROS implementation for Baxter robot. It is available at: https:\u002F\u002Fgithub.com\u002Fskumra\u002Fbaxter-pnp\n","# 对跖式机器人抓取\n我们提出了一种新颖的基于生成残差卷积神经网络的模型架构，该架构能够检测摄像头视野内的物体，并为图像中的物体预测合适的对跖式抓取姿态。\n\n本仓库包含了论文中提出的生成残差卷积神经网络（GR-ConvNet）的实现：\n\n#### 使用生成残差卷积神经网络的对跖式机器人抓取\n\nSulabh Kumra、Shirin Joshi、Ferat Sahin\n\n[arXiv](https:\u002F\u002Farxiv.org\u002Fabs\u002F1909.04810) | [视频](https:\u002F\u002Fyoutu.be\u002FcwlEhdoxY4U)\n\n[![PWC](https:\u002F\u002Fimg.shields.io\u002Fendpoint.svg?url=https:\u002F\u002Fpaperswithcode.com\u002Fbadge\u002Fantipodal-robotic-grasping-using-generative\u002Frobotic-grasping-on-cornell-grasp-dataset)](https:\u002F\u002Fpaperswithcode.com\u002Fsota\u002Frobotic-grasping-on-cornell-grasp-dataset?p=antipodal-robotic-grasping-using-generative)\n\n如果您在研究中使用了本项目，或希望引用论文中发布的基线结果，请使用以下 BibTeX 条目：\n\n```\n@inproceedings{kumra2020antipodal,\n  author={Kumra, Sulabh and Joshi, Shirin and Sahin, Ferat},\n  booktitle={2020 IEEE\u002FRSJ International Conference on Intelligent Robots and Systems (IROS)}, \n  title={Antipodal Robotic Grasping using Generative Residual Convolutional Neural Network}, \n  year={2020},\n  pages={9626-9633},\n  doi={10.1109\u002FIROS45743.2020.9340777}}\n}\n```\n\n## 需求\n- numpy\n- opencv-python\n- matplotlib\n- scikit-image\n- imageio\n- torch\n- torchvision\n- torchsummary\n- tensorboardX\n- pyrealsense2\n- Pillow\n\n## 安装\n- 克隆机器人抓取项目\n```bash\n$ git clone https:\u002F\u002Fgithub.com\u002Fskumra\u002Frobotic-grasping.git\n```\n\n- 创建虚拟环境\n```bash\n$ python3.6 -m venv --system-site-packages venv\n```\n\n- 激活虚拟环境\n```bash\n$ source venv\u002Fbin\u002Factivate\n```\n\n- 安装依赖\n```bash\n$ cd robotic-grasping\n$ pip install -r requirements.txt\n```\n\n## 数据集\n本仓库支持 [康奈尔抓取数据集](https:\u002F\u002Fwww.kaggle.com\u002Foneoneliu\u002Fcornell-grasp) 和 [Jacquard 数据集](https:\u002F\u002Fjacquard.liris.cnrs.fr\u002F)。\n\n#### 康奈尔抓取数据集\n\n1. 下载并解压 [康奈尔抓取数据集](https:\u002F\u002Fwww.kaggle.com\u002Foneoneliu\u002Fcornell-grasp)。\n2. 运行 `python -m utils.dataset_processing.generate_cornell_depth \u003C数据集路径>` 将 PCD 文件转换为深度图像。\n\n#### Jacquard 数据集\n\n1. 下载并解压 [Jacquard 数据集](https:\u002F\u002Fjacquard.liris.cnrs.fr\u002F)。\n\n## 模型训练\n可以使用 `train_network.py` 脚本训练模型。运行 `train_network.py --help` 可查看所有选项。\n\n康奈尔数据集示例：\n```bash\npython train_network.py --dataset cornell --dataset-path \u003C数据集路径> --description training_cornell\n```\n\nJacquard 数据集示例：\n```bash\npython train_network.py --dataset jacquard --dataset-path \u003C数据集路径> --description training_jacquard --use-dropout 0 --input-size 300\n```\n\n## 模型评估\n可以使用 `evaluate.py` 脚本评估训练好的网络。运行 `evaluate.py --help` 可查看所有选项。\n\n康奈尔数据集示例：\n```bash\npython evaluate.py --network \u003C训练好的网络路径> --dataset cornell --dataset-path \u003C数据集路径> --iou-eval\n```\n\nJacquard 数据集示例：\n```bash\npython evaluate.py --network \u003C训练好的网络路径> --dataset jacquard --dataset-path \u003C数据集路径> --iou-eval --use-dropout 0 --input-size 300\n```\n\n## 运行任务\n可以使用相应的运行脚本执行任务。所有任务脚本的命名格式为 `run_\u003C任务名称>.py`。例如，要运行抓取生成器：\n```bash\npython run_grasp_generator.py\n```\n\n## 在机器人上运行\n若要在机器人上运行抓取生成器，请使用我们针对 Baxter 机器人的 ROS 实现。地址为：https:\u002F\u002Fgithub.com\u002Fskumra\u002Fbaxter-pnp","# Robotic Grasping (GR-ConvNet) 快速上手指南\n\n本项目实现了基于生成式残差卷积神经网络（GR-ConvNet）的机器人抓取检测模型，能够识别摄像头视野中的物体并预测合适的对向抓取配置。\n\n## 环境准备\n\n### 系统要求\n- **Python 版本**：推荐 Python 3.6（官方示例基于此版本）\n- **操作系统**：Linux \u002F macOS (Windows 需自行调整虚拟环境命令)\n\n### 前置依赖\n确保系统已安装以下基础库，项目主要依赖 PyTorch 和 OpenCV：\n- numpy\n- opencv-python\n- torch & torchvision\n- pyrealsense2 (如需连接 RealSense 相机)\n- 其他见 `requirements.txt`\n\n> **国内加速建议**：\n> 在安装 Python 依赖时，建议使用清华或阿里镜像源以提升下载速度：\n> ```bash\n> pip install -r requirements.txt -i https:\u002F\u002Fpypi.tuna.tsinghua.edu.cn\u002Fsimple\n> ```\n\n## 安装步骤\n\n1. **克隆项目代码**\n   ```bash\n   git clone https:\u002F\u002Fgithub.com\u002Fskumra\u002Frobotic-grasping.git\n   cd robotic-grasping\n   ```\n\n2. **创建并激活虚拟环境**\n   ```bash\n   python3.6 -m venv --system-site-packages venv\n   source venv\u002Fbin\u002Factivate\n   ```\n\n3. **安装项目依赖**\n   ```bash\n   pip install -r requirements.txt\n   ```\n   *(若需国内加速，请参照上方“国内加速建议”添加 `-i` 参数)*\n\n## 基本使用\n\n### 1. 数据集准备\n本项目支持 **Cornell** 和 **Jacquard** 数据集。以 Cornell 为例：\n\n1. 下载并解压 [Cornell Grasping Dataset](https:\u002F\u002Fwww.kaggle.com\u002Foneoneliu\u002Fcornell-grasp)。\n2. 将 PCD 文件转换为深度图像：\n   ```bash\n   python -m utils.dataset_processing.generate_cornell_depth \u003CPath To Dataset>\n   ```\n\n### 2. 训练模型\n使用 `train_network.py` 脚本进行训练。\n\n**Cornell 数据集示例：**\n```bash\npython train_network.py --dataset cornell --dataset-path \u003CPath To Dataset> --description training_cornell\n```\n\n**Jacquard 数据集示例：**\n```bash\npython train_network.py --dataset jacquard --dataset-path \u003CPath To Dataset> --description training_jacquard --use-dropout 0 --input-size 300\n```\n\n### 3. 评估模型\n使用 `evaluate.py` 脚本评估训练好的网络。\n\n**示例命令：**\n```bash\npython evaluate.py --network \u003CPath to Trained Network> --dataset cornell --dataset-path \u003CPath To Dataset> --iou-eval\n```\n\n### 4. 运行抓取生成\n直接运行抓取生成器脚本：\n```bash\npython run_grasp_generator.py\n```\n\n> **注**：若需在真实机器人（如 Baxter）上运行，请参考其独立的 ROS 实现仓库：https:\u002F\u002Fgithub.com\u002Fskumra\u002Fbaxter-pnp","某智能仓储团队正在部署一台配备深度相机的机械臂，用于从杂乱传送带上自动抓取未知形状的包裹进行分拣。\n\n### 没有 robotic-grasping 时\n- **依赖人工示教**：面对新出现的包裹形状，工程师必须手动编程每一个抓取点，耗时费力且无法应对突发品类。\n- **抓取成功率低**：传统算法难以理解物体几何特征，经常抓空或只夹住物体边缘，导致包裹掉落损坏。\n- **缺乏适应性**：一旦光照变化或物体堆叠角度改变，预设规则立即失效，系统需频繁停机重新校准。\n- **开发周期漫长**：训练一个能泛化到多种物体的抓取模型需要从头构建复杂的视觉处理流水线，研发门槛极高。\n\n### 使用 robotic-grasping 后\n- **自动生成策略**：基于 GR-ConvNet 架构，系统能直接通过相机画面预测最佳“对径抓取”位姿，无需人工干预即可适应新物体。\n- **显著提升精度**：利用生成式残差卷积网络精准识别物体轮廓，即使在堆叠遮挡情况下也能找到稳固的抓取点，成功率大幅提升。\n- **实时动态调整**：模型具备强大的泛化能力，能实时处理不同光照和角度下的深度图像，确保持续稳定运行。\n- **快速落地部署**：借助现成的训练脚本和对 Cornell、Jacquard 数据集的支持，团队可在数小时内完成模型训练并部署到 Baxter 等机器人上。\n\nrobotic-grasping 将原本需要数周定制的抓取任务转化为端到端的自动化流程，让机器人真正具备了“看懂”并灵活抓取未知物体的智能。","https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002Fskumra_robotic-grasping_5723ee2c.png","skumra","Sulabh Kumra","https:\u002F\u002Foss.gittoolsai.com\u002Favatars\u002Fskumra_8f583e67.jpg",null,"San Francisco","https:\u002F\u002Fgithub.com\u002Fskumra",[82,86],{"name":83,"color":84,"percentage":85},"Python","#3572A5",99.3,{"name":87,"color":88,"percentage":89},"Shell","#89e051",0.7,640,146,"2026-04-04T13:26:25","NOASSERTION",4,"Linux","未说明（基于 PyTorch，通常建议使用支持 CUDA 的 NVIDIA GPU 以加速训练和推理）","未说明",{"notes":99,"python":100,"dependencies":101},"该项目明确演示了使用 Python 3.6 创建虚拟环境的步骤。依赖中包含 'pyrealsense2'，表明该工具设计用于配合 Intel RealSense 深度相机进行机器人抓取任务。若需在真实机器人（如 Baxter）上运行，需参考其独立的 ROS 实现仓库。数据集支持 Cornell Grasping Dataset 和 Jacquard Dataset，使用前需下载并处理（如将 PCD 文件转换为深度图像）。","3.6",[102,103,104,105,106,107,108,109,110,111],"numpy","opencv-python","matplotlib","scikit-image","imageio","torch","torchvision","torchsummary","tensorboardX","pyrealsense2",[54,13],[114,115,116,117],"robotics","grasping","deep-learning","robotic-manipulation","2026-03-27T02:49:30.150509","2026-04-06T10:25:02.196651",[121,126,131,136,141,146,151],{"id":122,"question_zh":123,"answer_zh":124,"source_url":125},9413,"为什么我无法复现论文中提到的准确率（如 97.8% 或 96.8%）？","默认参数是专门为 Cornell Grasping 数据集调整的。由于 Jacquard 数据集与 Cornell 数据集差异较大，直接使用默认参数无法在 Jacquard 上复现报告的高准确率。您需要针对特定数据集重新调整参数和设计选择。此外，训练时数据会进行随机增强，且如果使用 `ds-shuffle` 参数，数据集会在分割前按图像进行洗牌，否则可能按对象顺序读取。","https:\u002F\u002Fgithub.com\u002Fskumra\u002Frobotic-grasping\u002Fissues\u002F11",{"id":127,"question_zh":128,"answer_zh":129,"source_url":130},9414,"在 Jacquard 数据集上训练的模型，为什么在 Cornell 数据集上测试的准确率几乎为 0？","这是因为两个数据集之间存在巨大差异。Cornell 数据集基于真实物体图像，而 Jacquard 数据集主要包含模拟物体。在一个数据集上训练的模型通常无法直接泛化到另一个数据集上，因此会出现 IOU 极低的情况。建议在目标数据集上重新训练模型。","https:\u002F\u002Fgithub.com\u002Fskumra\u002Frobotic-grasping\u002Fissues\u002F22",{"id":132,"question_zh":133,"answer_zh":134,"source_url":135},9415,"运行 generate_cornell_depth 脚本时程序立即停止或无响应，如何解决？","这通常是由于文件路径匹配问题导致的。您可以尝试以下两种修改方法：\n1. 修改代码中的 glob 模式，去掉中间的通配符：将 `pcds = glob.glob(os.path.join(args.path, '*', 'pcd*[0-9].txt'))` 改为 `pcds = glob.glob(os.path.join(args.path, 'pcd*[0-9].txt'))`。\n2. 或者使用递归搜索所有子目录：`pcds = glob.glob(os.path.join(args.path, '**', 'pcd*[0-9].txt'), recursive=True)`。\n另外，请确保使用数据集的绝对路径运行命令。","https:\u002F\u002Fgithub.com\u002Fskumra\u002Frobotic-grasping\u002Fissues\u002F38",{"id":137,"question_zh":138,"answer_zh":139,"source_url":140},9416,"是否提供预训练模型？如果没有，自行训练需要多长时间？","项目暂未直接提供预训练模型下载。但由于 GR-ConvNet 模型轻量，您可以自行训练：\n- 使用不错的 Nvidia GPU：只需几个小时即可完成训练。\n- 仅使用深度数据（Depth only）训练：速度会更快。\n- 如果使用 CPU 训练：可能需要长达一天的时间。","https:\u002F\u002Fgithub.com\u002Fskumra\u002Frobotic-grasping\u002Fissues\u002F5",{"id":142,"question_zh":143,"answer_zh":144,"source_url":145},9417,"运行 evaluate.py 时报错 `'ResidualBlock' object has no attribute 'dropout'` 怎么办？","这是一个已知的代码版本问题。维护者已修复该错误。请拉取最新的 `master` 分支代码，或者下载并使用 `release v0.2.2` (或更高版本) 的代码包即可解决此问题。","https:\u002F\u002Fgithub.com\u002Fskumra\u002Frobotic-grasping\u002Fissues\u002F15",{"id":147,"question_zh":148,"answer_zh":149,"source_url":150},9418,"评估脚本在同时启用 RGB 和深度信息 (--use-rgb 1 --use-depth 1) 时报错，但单独使用深度信息正常，原因是什么？","这通常是因为您加载的预训练模型或自己训练的模型并不是基于 4 通道格式（RGB+D）训练的。如果模型是在仅深度数据或不同输入格式下训练的，强行传入 RGB 通道会导致维度不匹配或错误。请确认您的模型训练时使用的输入格式，并确保评估命令中的 `--use-rgb` 和 `--use-depth` 参数与模型训练时的配置一致。","https:\u002F\u002Fgithub.com\u002Fskumra\u002Frobotic-grasping\u002Fissues\u002F10",{"id":152,"question_zh":153,"answer_zh":154,"source_url":130},9419,"在 Jacquard 数据集上训练时，为什么训练速度比在 Cornell 数据集上慢很多？","这是因为 Jacquard 数据集的规模远大于 Cornell 数据集。Cornell 数据集大约包含 8,000 个抓取样本，而 Jacquard 数据集包含约 110 万个抓取样本。数据量的巨大差异导致在 Jacquard 上训练每个 epoch 的时间显著增加。",[156,161,166,171,176],{"id":157,"version":158,"summary_zh":159,"released_at":160},116512,"v0.3.0","Fixed bug introduced by adding quality in Grasp definition\r\nConfigurable IoU threshold\r\nConfigurable network input size\r\nAdded trained models for Jacquard dataset","2021-05-21T02:22:32",{"id":162,"version":163,"summary_zh":164,"released_at":165},116513,"v0.2.2","Bugfix in ResidualBlock\r\nUpdated default params","2020-11-21T01:13:16",{"id":167,"version":168,"summary_zh":169,"released_at":170},116514,"v0.2.1","Refactored models to reduce duplicate code\r\nAdded trained models","2020-07-15T23:46:56",{"id":172,"version":173,"summary_zh":174,"released_at":175},116515,"v0.2.0","Here are key updates in this release:\r\nConfigurable GR-ConvNets\r\nConfigurable IOU threshold in evaluation\r\nUpdated train\u002Fval split method to RandomSampler based method\r\nSupport for configurable optimizer\r\nUpdated logging to single directory\r\nSave training logs and args\r\nUpdated evaluate.py to support multiple networks","2020-07-13T22:33:44",{"id":177,"version":178,"summary_zh":179,"released_at":180},116516,"v0.1.0","Implementation of the Generative Residual Convolutional Neural Network (GR-ConvNet) from the paper:\r\nAntipodal Robotic Grasping using Generative Residual Convolutional Neural Network\r\n\r\nSupports:\r\nModel Training\r\nModel Evaluation\r\nCornell and Jacquard Datasets\r\nCalibration Task\r\nGrasp Generator Task","2020-05-31T00:54:01"]