awesome-robotic-tooling
awesome-robotic-tooling 是一份精心整理的开源工具清单,旨在为使用 C++ 和 Python 进行专业机器人开发的团队提供全方位支持。它特别涵盖了 ROS(机器人操作系统)、自动驾驶及航空航天领域的关键软件与硬件资源。
在机器人开发中,开发者常面临“重复造轮子”的困境,难以快速找到经过验证的高质量工具。awesome-robotic-tooling 通过系统化的分类,解决了这一痛点。它将工具细分为通信协调、架构设计、仿真模拟、传感器处理(如雷达、激光点云)、定位建图、规划控制以及底层操作系统等数十个类别,帮助开发者迅速定位所需资源,从代码构建、调试测试到数据可视化,覆盖研发全生命周期。
这份清单非常适合机器人软件工程师、算法研究人员以及系统架构师使用。无论是初创团队搭建技术栈,还是资深专家寻找特定领域的优化方案,都能从中获益。其独特亮点在于不仅罗列工具,更强调“专业性”与“生态互补”,将学术界的前沿算法与工业界的稳定框架相结合,并鼓励社区共同维护以确保内容的时效性与质量。对于希望提升开发效率、避免从零开始的机器人从业者而言,这是一份极具价值的导航图。
使用场景
某自动驾驶初创团队正在开发一款基于 C++ 和 ROS 的物流机器人,急需构建稳定的感知与控制模块。
没有 awesome-robotic-tooling 时
- 重复造轮子:工程师花费数周在 GitHub 上盲目搜索雷达点云处理和传感器校准工具,难以甄别项目质量,导致开发进度严重滞后。
- 环境配置混乱:缺乏统一的构建模板和依赖管理指南,不同成员的本地开发环境差异巨大,代码在各自机器上运行正常却无法集成。
- 测试与调试困难:缺少专业的仿真工具和链路追踪方案,团队只能在实车上反复试错,不仅效率低下,还增加了硬件损坏的安全风险。
- 技术栈碎片化:由于没有权威的架构设计参考,通信中间件、实时内核及数据可视化组件选型随意,系统后期维护成本极高。
使用 awesome-robotic-tooling 后
- 精准选型提效:直接利用列表中经过筛选的点云处理(如 PCL 扩展)和校准工具库,将感知模块的开发周期从数周缩短至几天。
- 标准化开发流:采纳推荐的 C++/Python 项目模板和 CI/CD 部署方案,统一了团队环境,实现了代码提交即自动构建与测试。
- 安全仿真验证:引入清单中成熟的仿真平台和调试追踪工具,在虚拟环境中完成了 90% 的极端场景测试,大幅降低实车调试风险。
- 系统化架构:参考其关于通信协调、实时内核及安全要求的分类指引,构建了高内聚低耦合的系统架构,确保了软件的专业性与可扩展性。
awesome-robotic-tooling 通过提供一站式的高质量工具索引,帮助团队避免了低效的重复探索,让开发者能专注于核心算法创新而非基础设施搭建。
运行环境要求
- Linux
- macOS
- Windows
未说明
未说明

快速开始
令人惊叹的机器人工具集 
一份精心整理的、用于专业机器人开发的工具列表,涵盖 C++ 和 Python,同时涉及 ROS、自动驾驶和航空航天领域
要避免重复造轮子,首先得了解“轮子”是什么。这份列表旨在展示软件和硬件开发中丰富多样的开源免费工具,这些工具在专业机器人开发中非常有用。
为了使这份列表保持活力、提升质量并不断扩展,您的贡献至关重要。您可以在贡献指南以及相关的博客文章中了解更多关于其起源及参与方式。所有新加入的项目条目都将由protontypes发布一条推文。
目录
- 通信与协调
- 文档与演示
- 需求与安全
- 架构与设计
- 框架与栈
- 开发环境
- 仿真
- 电子与机械
- 传感器处理
- 定位与状态估计
- 同步定位与地图构建
- 预测
- 行为与决策
- 规划与控制
- 用户交互
- 数据可视化与任务控制
- 操作系统
- 网络与中间件
- 安全性
- 数据集
通信与协调
- 敏捷开发 - 敏捷软件开发宣言。
- Gitflow - 通过将新开发与已完成工作隔离,使并行开发变得非常容易。
- DeepL - 一款在线翻译工具,性能超越 Google、Microsoft 和 Facebook。
- Taiga - 敏捷项目管理工具。
- Kanboard - 极简主义看板。
- kanban - 针对 GitLab 问题的免费、开源、自托管看板。
- Gitlab - 使用 Docker 搭建的简单自托管 GitLab 服务器。
- Gogs - 构建一个简单、稳定且可扩展的自托管 Git 服务,设置过程极为便捷。
- Wekan - 基于 Meteor 的看板。
- JIRA API - Jira REST API 的 Python 库。
- Taiga API - Taiga REST API 的 Python 库。
- Chronos-Timetracker - JIRA 的桌面客户端。轻松跟踪时间、上传工作日志。
- Grge - Grge 是一个守护进程和命令行工具,用于增强 GitLab 功能。
- gitlab-triage - 自动化处理 GitLab 的问题和合并请求分类。
- Helpy - 一款现代化、开源的帮助台客户支持应用。
- ONLYOFFICE - 一个免费的开源协作系统,用于在一个平台上管理文档、项目、客户关系和电子邮件往来。
- discourse - 社区讨论平台。免费、开放、简单。
- Gerrit - 一个基于 Git 的代码审查和项目管理工具。
- jitsi-meet - 安全、简单且可扩展的视频会议,可作为独立应用使用,也可嵌入到您的 Web 应用程序中。
- mattermost - 一款开源、私有云部署的 Slack 替代品。
- openproject - 领先的开源项目管理软件。
- leantime - Leantime 是面向创新者的精益项目管理系统。
- gitter - Gitter 是一个聊天和社交平台,通过消息、内容和发现功能帮助管理、发展和连接社区。
文档与演示
- Typora - 极简主义 Markdown 编辑器。
- Markor - 适用于 Android 设备的简单 Markdown 编辑器。
- Pandoc - 通用标记转换工具。
- Yaspeller - 命令行拼写检查工具。
- ReadtheDocs - 搭建本地 ReadtheDocs 服务器。
- Doxygen - Doxygen 是从带注释的 C++ 源代码生成文档的事实标准工具。
- Sphinx - 一款易于为 Python 项目创建智能且美观文档的工具。
- Word-to-Markdown - 一个 Ruby gem,用于从 Microsoft Word 文档中提取内容。
- paperless - 索引并归档所有扫描的纸质文档。
- carbon - 分享精美的源代码图片。
- undraw - 免费的专业商务 SVG 图形,易于自定义。
- asciinema - 可轻松录制终端会话,并在终端及网页浏览器中回放。
- inkscape - Inkscape 是适用于 Linux、Windows 和 macOS 的专业矢量图形编辑器。
- Reveal-Hugo - 一款基于 Reveal.js 的 Hugo 主题,使创作和定制变得轻而易举。借助它,您可以将任何格式正确的 Hugo 内容转换为 HTML 演示文稿。
- Hugo-Webslides - 这是一个使用 markdown 创建 WebSlides 演示文稿的 Hugo 模板。
- jupyter2slides - 基于 Jupyter Notebook + Reveal.js 的云原生演示文稿。
- patat - 使用 Pandoc 进行基于终端的演示。
- github-changelog-generator - 自动从 GitHub 上的标签、问题、标签和拉取请求生成变更日志。
- GitLab-Release-Note-Generator - 一款 GitLab 发布说明生成器,可基于最新标签生成发布说明。
- OCRmyPDF - 为扫描的 PDF 文件添加 OCR 文本层,使其可被搜索。
- papermill - 用于参数化、执行和分析 Jupyter Notebooks 的工具。
- docsy - 使用 Docsy Hugo 主题的示例文档网站。
- actions-hugo - 将基于 Hugo 的网站部署到 GitHub Pages。
- overleaf - 开源在线实时协作 LaTeX 编辑器。
- landslide - 从 markdown、ReST 或 textile 生成 HTML5 幻灯片。
- libreoffice-impress-templates - 免费授权的 LibreOffice Impress 模板。
- opensourcedesign - 免费设计与 Logo 创作的社区及资源。
- olive - 一款免费的非线性视频编辑器,旨在提供功能齐全的高端专业视频编辑软件替代方案。
- buku - 独立于浏览器的书签管理器。
- swiftlatex - 一款所见即所得的基于浏览器的 LaTeX 编辑器。
- ReLaXed - 允许使用 CSS 和 JavaScript 定义复杂的 PDF 布局,同时以接近 Markdown 或 LaTeX 的友好、极简语法编写内容。
- foam - Foam 是一款受 Roam Research 启发的个人知识管理和共享系统,基于 Visual Studio Code 和 GitHub 构建。
- CodiMD - 开源在线实时协作团队文档的 markdown 工具。
- jupyter-book - 从 Jupyter Notebooks 构建交互式、出版质量的文档。
- InvoiceNet - 用于从发票文档中提取智能信息的深度神经网络。
- tesseract - 开源 OCR 引擎。
- mkdocs - 一款快速、简单且美观的静态站点生成器,专为构建项目文档而设计。
- PlotNeuralNet - 用于报告和演示文稿绘制神经网络的 LaTeX 代码。
- Excalidraw - 用于绘制手绘风格图表的虚拟白板。
- SVGrepo - 下载可用于商业用途的免费 SVG 矢量图。
- gollum - 一款简单的 Git 驱动维基,具有友好的 API 和本地前端。
- GanttLab - 易于使用、功能完善的 Gantt 图表,适用于 GitLab 和 GitHub。
- Zotero - 一款免费、易于使用的工具,可帮助您收集、组织、引用和分享研究资料。
需求与安全
- awesome-safety-critical - 关于编写安全关键型软件的编程实践资源列表。
- open-autonomous-safety - OAS 是 Voyage 全开源的安全流程与测试规程库,旨在补充全球自动驾驶初创企业的现有安全体系。
- CarND-Functional-Safety-Project - 在这个 Udacity 项目中创建功能安全文档。
- Automated Valet Parking Safety Documents - 为支持在停车场内使用 StreetDrone 测试车辆安全测试自动代客泊车功能而创建。
- safe_numerics - 替代标准数值类型的库,在发生错误时会抛出异常。
- Air Vehicle C++ development coding standards - 为 C++ 程序员提供指导,帮助他们采用良好的编程风格和成熟的编程实践,从而编写出安全、可靠、可测试且易于维护的代码。
- AUTOSAR Coding Standard - 关于在关键及安全相关系统中使用 C++14 语言的指南。
- The W-Model and Lean Scaled Agility for Engineering - 福特采用了 Vector 提供的敏捷 V 模型方法,可用于安全相关的项目管理。
- doorstop - 使用版本控制进行需求管理。
- capella - 功能全面、可扩展且经过现场验证的 MBSE 工具与方法,用于成功设计系统架构。
- robmosys - RobMoSys 倡导一种集成式方法,基于当前以代码为中心的机器人平台,通过应用模型驱动的方法和工具来实现。
- Papyrus for Robotics - 一款符合 RobMoSys 方法论的图形化编辑工具,专用于机器人应用。
- fossology - 一个可在命令行运行许可证、版权及出口管制扫描的工具包。
- ScenarioArchitect - Scenario Architect 是一款基础 Python 工具,用于生成、导入和导出简短的场景快照。
架构与设计
- Guidelines - 如何构建基于 ROS 的系统架构。
- yEd - 一款功能强大的桌面应用程序,可用于快速高效地生成高质量的图表。
- yed_py - 生成可在 yEd 中打开的 graphML 文件。
- Plantuml - 一个 Web 应用程序,可在实时文档中动态生成 UML 图。
- rqt_graph - 提供用于可视化 ROS 计算图的 GUI 插件。
- rqt_launchtree - 一个用于层次化 launchfile 配置 introspection 的 RQT 插件。
- cpp-dependencies - 用于检查 C++ #include 依赖关系的工具(生成 .dot 格式的依赖关系图)。
- pydeps - 用于生成 Python 模块依赖关系图。
- aztarna - 一款用于机器人足迹分析的工具。
- draw.io - 一款免费的在线绘图软件,可用于制作流程图、过程图、组织结构图、UML、ER 及网络图。
- vscode-drawio - 此扩展将 Draw.io 集成到 VS Code 中。
- Architecture_Decision_Record - 一份记录重要架构决策及其背景和影响的文档。
框架与栈
- ROS - (机器人操作系统)提供库和工具,帮助软件开发者构建机器人应用。
- awesome-ros2 - 精选的优秀机器人操作系统版本2.0(ROS 2)资源和库列表。
- Autoware.Auto - Autoware.Auto 将一流的软件工程应用于自动驾驶领域。
- Autoware.ai - Autoware.AI 是全球首个面向自动驾驶技术的“一体化”开源软件。
- OpenPilot - 开源自适应巡航控制(ACC)和车道保持辅助系统(LKAS)。
- Apollo - 高性能、灵活的架构,可加速自动驾驶车辆的开发、测试和部署。
- PythonRobotics - 这是一个包含机器人算法的 Python 代码集合,尤其适用于自主导航。
- Stanford Self Driving Car Code - 斯坦福大学参与 DARPA 大挑战赛车辆的相关代码。
- astrobee - Astrobee 是一款自由飞行机器人,设计用于在国际空间站(ISS)内部作为有效载荷运行。
- CARMAPlatform - 支持协同式自动驾驶插件。
- Automotive Grade Linux - Automotive Grade Linux 是一个协作性的开源项目,汇聚汽车制造商、供应商和技术公司,以加速开发和采用面向互联汽车的完全开放的软件栈。
- PX4 - 用于无人机及其他无人飞行器的开源飞控软件。
- KubOS - 用于卫星的开源软件栈。
- mod_vehicle_dynamics_control - TUM Roborace 团队软件栈——路径跟踪控制、速度控制、曲率控制及状态估计。
- Aslan - 适用于低速环境的开源自动驾驶软件。
- open-source-rover - 基于 JPL 火星探测车的可自行组装六轮火星车。
- pybotics - 一个开源且经过同行评审的 Python 工具箱,用于机器人运动学和校准。
- makani - 包含可用的 Makani 飞行模拟器、控制器(自动驾驶仪)、可视化工具以及指挥中心飞行监控工具。
- mir_robot - 这是一个社区项目,旨在将 MiR 机器人与 ROS 集成使用。
- COMPAS - COMPAS 框架下的机器人制造包。
- JdeRobot Academy - JdeRobot Academy 是一套开源练习集,以实践方式学习机器人技术。
- clover - 基于 ROS 的框架及 RPi 镜像,用于控制搭载 PX4 的无人机。
- ArduPilot - 自主飞行器的开源控制软件——包括直升机、固定翼飞机、漫游车、船只和潜水器。
- F Prime - 一种基于组件的框架,支持航天及其他嵌入式软件应用的快速开发和部署。
开发环境
编写与运行
- Vim-ros - 用于 ROS 开发的 Vim 插件。
- Visual Studio Code - 用于编辑-构建-调试循环的代码编辑器。
- atom - 适合 21 世纪的可扩展文本编辑器。
- Teletype - 在 Atom 中与团队成员共享工作区,并实时协作编写代码。
- Sublime - 一款功能强大的文本编辑器,适用于代码、标记语言和散文。
- ade-cli - ADE 开发环境(ADE)利用 Docker 和 GitLab 来管理每个项目的开发工具环境及可选的数据卷镜像。
- recipe-wizard - 一个 Dockerfile 生成器,用于在远程无头服务器系统上通过 nvidia-docker2、CUDA、ROS 和 Gazebo 运行 OpenGL(GLX)应用程序。
- Jupyter ROS - 用于 ROS 机器人操作系统的 Jupyter 小部件助手。
- ros_rqt_plugin - 适用于 Python 的 ROS Qt Creator 插件。
- xeus-cling - C++ 编程语言的 Jupyter 内核。
- ROS IDEs - 此页面汇集了使用集成开发环境(IDE)与 ROS 相关的经验和建议。
- TabNine - 全语言自动补全工具。
- kite - 利用机器学习为 Python 提供有用的代码补全。
- jedi - 用于 Python 的自动补全和静态分析库。
- roslibpy - Python ROS Bridge 库允许使用 Python 和 IronPython 与开源机器人中间件 ROS 进行交互。
- pybind11 - 实现 C++11 与 Python 之间的无缝互操作。
- Sourcetrail - 免费且开源的跨平台源代码浏览器。
- rebound - 一个命令行工具,在抛出异常时即时检索 Stack Overflow 的相关结果。
- mybinder - 在可执行环境中打开开源笔记本,使您的代码随时随地可被他人复现。
- ROSOnWindows - 面向 Windows 的 ROS1 实验性发布版。
- live-share - 在您喜爱的工具中进行实时协作开发。
- cocalc - 云端协作计算平台。
- EasyClangComplete - 适用于 Sublime Text 3 的强大 C/C++ 代码补全工具。
- vscode-ros - 用于机器人操作系统(ROS)开发的 Visual Studio Code 扩展。
- awesome-hpp - 精选的优秀仅头文件 C++ 库列表。
- Gitpod - 一个开源开发者平台,可自动配置即刻可用的开发环境。
模板
- ROS - 用于C++中ROS节点标准化的模板。
- Launch - 关于如何为大型项目创建启动文件的模板。
- Bash - 结合最佳实践和多个实用函数的Bash脚本模板。
- URDF - 不同类型机器人统一机器人描述格式(URDF)的创建示例。
- Python - ROS Python代码编写应遵循的风格指南。
- Docker - minimal-ade项目中的Dockerfile展示了如何创建自定义基础镜像的最小示例。
- VS Code ROS2工作区模板 - 使用VSCode作为ROS2开发IDE的模板。
构建与部署
- qemu-user-static - 通过QEMU和binfmt_misc实现对不同多架构容器的执行支持。
- 在QNX上交叉编译ROS 2 - 介绍如何在QNX上交叉编译ROS 2。
- bloom - 一个发布自动化工具,使catkin包的发布更加容易。
- superflore - 针对机器人操作系统扩展的平台发布管理器。
- catkin_tools - 用于操作catkin的命令行工具。
- industrial_ci - 适用于ROS仓库的简易持续集成仓库。
- ros_gitlab_ci - 包含帮助脚本及如何在GitLab实例上托管的ROS项目中使用持续集成(CI)的说明。
- gitlab-runner - 运行测试并将结果发送到GitLab。
- colcon-core - 用于改进构建、测试和使用多个软件包的工作流程的命令行工具。
- gitlab-release - 一个简单的Python3脚本,用于将(CI生成的)文件上传到当前项目的发布(标签)中。
- clang - 这是C语言家族(C、C++、Objective-C和Objective-C++)的编译器前端,作为LLVM编译器基础设施项目的一部分构建。
- catkin_virtualenv - 通过virtualenv将Python依赖项打包到catkin包中。
- pyenv - 简单的Python版本管理工具。
- aptly - Debian仓库管理工具。
- cross_compile - 用于ROS2交叉编译的资源。
- docker_images - OSRF维护的ROS(2)和Gazebo官方Docker镜像。
- robot_upstart - 提供一套脚本来协助在Ubuntu Linux PC上启动后台ROS进程。
- robot_systemd - 用于管理roscore和roslaunch启动与关闭的单元。
- ryo-iso - 一个现代化的ISO构建工具,可通过yaml配置文件简化完整机器人操作系统的部署流程。
- network_autoconfig - 对大多数用例自动配置ROS网络,同时不影响需要手动配置的使用场景。
- rosbuild - ROS构建农场。
- cros - ROS框架的纯C单线程实现。
单元与集成测试
- setup-ros - 此Action为GitHub Actions设置ROS和ROS 2环境。
- UnitTesting - 该页面阐述了为ROS编写和运行单元测试及集成测试的理由、最佳实践和政策。
- googletest - Google的C++测试框架。
- pytest - pytest框架使得编写小型测试变得简单,同时也能扩展以支持复杂的功能测试。
- doctest - 最快且功能丰富的C++11/14/17/20单头文件测试框架,适用于单元测试和TDD。
- osrf_testing_tools_cpp - 包含C++测试工具,用于OSRF项目。
- code_coverage - 用于运行覆盖率测试的ROS包。
- action-ros-ci - 使用colcon构建和测试ROS 2包的GitHub Action。
代码检查与格式化
- action-ros-lint - 在ROS 2包上运行代码检查工具的GitHub Action。
- cppcheck - C/C++代码的静态分析工具。
- hadolint - Dockerfile代码检查工具,可验证内联Bash脚本,由Haskell编写。
- shellcheck - 用于Shell脚本的静态分析工具。
- catkin_lint - 检查ROS catkin构建系统的包配置。
- pylint - Pylint是一个Python静态代码分析工具,用于查找编程错误、强制执行编码标准、检测代码异味,并提供简单的重构建议。
- black - 无妥协的Python代码格式化工具。
- pydocstyle - 用于检查Python文档字符串规范是否符合要求的静态分析工具。
- haros - ROS应用代码的静态分析工具。
- pydantic - 使用Python类型提示进行数据解析和验证。
调试与追踪
- heaptrack - 追踪所有内存分配,并用堆栈跟踪为这些事件添加注释。
- ros2_tracing - 用于 ROS 2 的追踪工具。
- Linuxperf - 各种 Linux 性能相关资料。
- lptrace - 可以实时查看 Python 程序正在运行哪些函数。
- pyre-check - 高效的 Python 类型检查工具。
- FlameGraph - 可视化性能剖析结果。
- gpuvis - GPU 跟踪可视化工具。
- sanitizer - AddressSanitizer、ThreadSanitizer、MemorySanitizer。
- cppinsights - C++ Insights - 让你以编译器的视角查看源代码。
- inspect - inspect 模块提供了一系列函数,用于了解当前运行中的对象,包括模块、类、实例、函数和方法等。
- Roslaunch 节点在 Valgrind 或 GDB 中运行 - 当调试使用 roslaunch 启动的 roscpp 节点时,你可能希望将其在调试程序(如 gdb 或 valgrind)中启动。
- pyperformance - Python 性能基准测试套件。
- qira - QIRA 是 strace 和 gdb 的替代品。
- gdb-frontend - GDBFrontend 是一个简单、灵活且可扩展的 GUI 调试器。
- lttng - 开源软件工具包,可用于同时追踪 Linux 内核、用户应用程序和用户库。
- ros2-performance - 可以轻松创建任意 ROS2 系统,并对其性能进行测量。
- bcc - 基于 BPF 的 Linux IO 分析、网络监控等工具。
- tracy - 实时、纳秒级分辨率的游戏及其他应用远程遥测帧率分析工具。
- bpftrace - 面向 Linux eBPF 的高级追踪语言。
- pudb - Python 全屏控制台调试器。
- backward-cpp - 一款美观的 C++ 堆栈跟踪格式化打印工具。
- gdb-dashboard - GDB 控制面板是一个独立的 .gdbinit 文件,基于 Python API 编写,提供模块化的界面来显示被调试程序的相关信息。
- hotspot - 用于性能分析的 Linux perf GUI。
- memory_profiler - 用于监控进程内存消耗的 Python 模块,同时也支持对 Python 程序逐行分析内存使用情况。
- ros1_fuzzer - 该模糊测试工具旨在通过针对目标节点处理的话题执行模糊测试,帮助开发者和研究人员发现 ROS 节点中的漏洞和缺陷。
- vscode-debug-visualizer - 一个 Visual Studio Code 扩展,可在调试过程中可视化数据。
- action-tmate - 使用 tmate 通过 SSH 调试 GitHub Actions,从而直接访问运行器系统。
- libstatistics_collector - ROS 2 库,提供用于收集度量数据并计算统计信息的类。
- system_metrics_collector - 轻量级、实时的 ROS2 系统指标收集工具。
版本控制
- git-fuzzy - 一个高度依赖 fzf 的 Git 命令行界面。
- meld - Meld 是一个可视化的差异比较和合并工具,可以帮助你比较文件、目录以及版本控制项目。
- tig - Git 的文本模式界面。
- gitg - Git 的图形用户界面。
- git-cola - 浓缩咖啡般的 Git GUI。
- python-gitlab - 一个提供 GitLab 服务器 API 访问的 Python 包。
- bfg-repo-cleaner - 像 git-filter-branch 一样移除大型或有问题的 blob,但速度更快。
- nbdime - 用于 Jupyter 笔记本的差异比较和合并工具。
- semantic-release - 完全自动化的版本管理和包发布工具。
- go-semrel-gitab - 自动化 GitLab 的版本管理。
- Git-repo - Git-Repo 帮助管理多个 Git 仓库,执行到版本控制系统中的上传操作,并自动化部分开发工作流。
- dive - 用于探索 Docker 镜像每一层的工具。
- dvc - 数据集和机器学习模型的管理和版本控制工具。
- learnGitBranching - 一个 Git 仓库可视化工具、沙盒,以及一系列教育教程和挑战。
- gitfs - 可以将远程仓库的分支挂载到本地,之后对文件所做的任何更改都会自动提交到远程仓库。
- git-secret - 使用授权用户的公钥加密文件,允许受信任的用户使用 PGP 和他们的私钥访问加密数据。
- git-sweep - 一个命令行工具,帮助清理已合并到主分支的 Git 分支。
- lazygit - 一个简单的终端 UI,用于 Git 命令,使用 Go 语言和 gocui 库编写。
- glab - 一个开源的 GitLab 命令行工具。
模拟
- AI2-THOR - 基于Unity的Python框架,为家用机器人代理提供交互、导航和操作支持,包含200多个自定义场景、1500多个带标注的对象以及200多种动作。
- Drake - Drake旨在模拟包括非常复杂动力学在内的机器人系统。
- Webots - Webots是一款开源机器人仿真器,可与ROS及ROS2等兼容。
- lgsv - LG电子美国研发中心开发了一款基于HDRP Unity的多机器人仿真器,专为自动驾驶汽车开发者设计。
- carla - 用于自动驾驶研究的开源仿真平台。
- awesome-CARLA - 一个精选的CARLA教程、博客及相关项目的列表。
- ros-bridge - CARLA仿真器的ROS桥接工具。
- scenario_runner - 交通场景定义与执行引擎。
- deepdive - 面向自动驾驶汽车的端到端仿真平台。
- uuv_simulator - 用于水下机器人仿真的Gazebo/ROS软件包。
- AirSim - 基于虚幻引擎构建的自动驾驶车辆开源仿真平台。
- self-driving-car-sim - 使用Unity开发的自动驾驶汽车仿真器。
- ROSIntegration - 用于在虚幻引擎中实现ROS支持的插件。
- gym-gazebo - OpenAI Gym的一个扩展,名为gym-gazebo,用于使用Gazebo进行仿真。
- gym-pybullet-drones - 基于PyBullet的Gym环境,适用于单智能体和多智能体强化学习中的四旋翼无人机控制任务。
- safe-control-gym - 基于PyBullet的CartPole和四旋翼无人机环境,结合CasADi符号动力学与约束条件,用于安全且鲁棒的学习型控制。
- highway-env - 一系列用于自动驾驶和战术决策任务的环境集合。
- VREP Interface - VREP仿真器的ROS桥接工具。
- car_demo - 这是在Gazebo 9中对普锐斯进行的仿真,传感器数据通过ROS Kinetic发布。
- sumo - Eclipse SUMO是一个开源、高度便携、微观且连续的道路交通仿真软件包,专为处理大型路网而设计。
- open-simulation-interface - 用于虚拟场景中自动驾驶功能环境感知的通用接口。
- ESIM - 一款开源事件相机仿真器。
- Menge - 群体仿真框架。
- pedsim_ros - 基于社会力模型的行人仿真器,适用于Gazebo。
- opencrg - 开放的文件格式和开源工具,用于道路表面的详细描述、创建和评估。
- esmini - 一个基础的OpenSCENARIO播放器。
- OpenSceneGraph - 一款开源高性能3D图形工具包,被视觉仿真、游戏、虚拟现实、科学可视化和建模等领域的应用开发者广泛使用。
- morse - 一款基于Blender游戏引擎和Bullet物理引擎的学术机器人仿真器。
- ROSIntegrationVision - 在虚幻引擎项目中支持启用ROS的RGBD数据采集。
- fetch_gazebo - 包含Fetch Robotics Fetch和Freight Research Edition机器人的Gazebo仿真。
- rotors_simulator - 提供了一些多旋翼飞行器模型。
- flow - 一个用于交通微观仿真中深度强化学习和控制实验的计算框架。
- gnss-ins-sim - GNSS+惯性导航传感器融合仿真器。包含运动轨迹生成器、传感器模型和导航算法。
- Ignition Robotics - 可在安全性测试中试验控制策略,并在持续集成测试中利用仿真优势。
- simulation assets for the SubT - 该合集包含用于SubT挑战虚拟竞赛的Gazebo仿真资产。
- gazebo_ros_motors - 包含两个Gazebo电机插件,一个带有理想速度控制器,另一个不带控制器,用于模拟直流电机。
- map2gazebo - 一个从2D地图创建Gazebo环境的ROS软件包。
- sim_vehicle_dynamics - TUM Roborace团队的车辆动力学仿真软件。
- gym-carla - 一个用于CARLA仿真器的OpenAI Gym封装。
- simbody - 高性能C++多体动力学/物理库,用于模拟关节式生物力学和机械系统,如车辆、机器人和人体骨骼。
- gazebo_models - 该仓库存储了Gazebo模型数据库。
- pylot - 基于CARLA仿真器运行的自动驾驶平台。
- flightmare - Flightmare由两个主要组件构成:一个基于Unity的可配置渲染引擎,以及一个灵活的动力学仿真物理引擎。
- champ - 用于CHAMP四足机器人控制器的ROS软件包。
- rex-gym - 一个开源四足机器人(SpotMicro)的OpenAI Gym环境。
- Trick - 由NASA约翰逊航天中心开发,是一个强大的仿真开发框架,使用户能够为航天器开发的各个阶段构建应用程序。
- usv_sim_lsa - 在Gazebo中进行的无人水面艇仿真,考虑水流和风的影响。
- 42 - 用于航天器姿态控制系统分析与设计的仿真。
- Complete_Street_Rule - 一种面向场景的设计工具,旨在让用户能够在ArcGIS CityEngine中快速生成程序化生成的多模式街道。
- AutoCore simulation - 为Autoware提供测试环境,在早期开发阶段内容可能会随更新而变化。
- fields-ignition - 为Ignition Gazebo生成随机农田场景。
- Unity-Robotics-Hub - Unity中用于机器人仿真的工具、教程、资源和文档的中央存储库。
- BlueSky - BlueSky的目标是为所有希望可视化、分析或模拟空中交通的人提供工具,使其无需任何限制、许可证或约束即可完成这些任务。
- Cloe - 通过提供闭环仿真统一接口,赋能自动驾驶软件组件的开发者。
- Dynamic_logistics_Warehouse - Gazebo中仓库动态环境的仿真。
- OpenCDA - 一个基于CARLA+SUMO的通用框架,用于原型化全栈协同驾驶自动化应用。
电子与机械
- HRIM - 一种用于机器人硬件的信息模型。
- URDF - 统一机器人描述格式(URDF)解析代码的仓库。
- phobos - Blender 的一个插件,允许在所见即所得的环境中创建 URDF、SDF 和 SMURF 机器人模型。
- urdf-viz - 可视化 URDF/XACRO 文件,URDF 查看器支持 Windows/macOS/Linux。
- solidworks_urdf_exporter - SolidWorks 到 URDF 的导出工具。
- FreeCAD - 您自己的 3D 参数化建模软件。
- kicad - 跨平台且开源的电子设计自动化套件。
- PcbDraw - 将您的 KiCAD 电路板转换为适合引脚图的美观 2D 图纸。
- kicad-3rd-party-tools - 其他人开发的用于增强 KiCad PCB EDA 套件功能的工具。
- PandaPower - 一款易于使用、高度自动化的开源电力系统建模、分析和优化工具。
- LibrePCB - 一款强大、创新且直观的 EDA 工具,适合所有人使用。
- openscad - 一款用于创建实体 3D CAD 模型的软件。
- ngspice - 一款用于电气和电子电路的开源 SPICE 仿真器。
- GNSS-SDR - GNSS-SDR 提供了与多种射频前端及原始采样文件格式的接口,并以标准格式生成处理结果。
- riscv - 自由开放的 RISC 指令集架构。
- urdfpy - 一个简单易用的库,用于加载、操作、保存和可视化 URDF 文件。
- FMPy - 在 Python 中模拟功能模型单元(FMU)。
- FMIKit-Simulink - 使用 Simulink 导入和导出功能模型单元。
- oemof-solph - 一个模块化的开源框架,用于建模能源供应系统。
- NASA-3D-Resources - 这里收录了来自 NASA 内部不断增长的 3D 模型、纹理和图像资源。
- SUAVE - 飞机设计工具箱。
- opem - 开源 PEMFC 仿真工具(OPEM)是一款用于评估质子交换膜燃料电池性能的建模工具。
- pvlib-python - 一个社区支持的工具,提供一系列函数和类,用于模拟光伏能源系统的性能。
- WireViz - 一款用于轻松记录电缆、线束和连接器引脚分配的工具。
- Horizon - EDA 是一套电子设计自动化软件,支持印刷电路板设计的端到端集成工作流,包括元器件管理和原理图输入。
- tigl - TiGL 几何库可用于计算和处理存储在 CPACS 文件中的飞机几何形状。
- foxBMS - 一个免费、开放且灵活的电池管理系统开发环境。
- cadCAD - 一个 Python 包,通过仿真辅助复杂系统的设计、测试和验证过程,支持蒙特卡洛方法、A/B 测试和参数扫描。
- OpenMDAO - 一个用于高效多学科优化的开源框架。
- ODrive - 目标是使廉价无刷电机能够在高性能机器人项目中得到应用。
- OpenTirePython - 一个开源的数学轮胎建模库。
- Inkscape Ray Optics - Inkscape 的一个扩展,可更方便地绘制光学示意图。
- OpenAeroStruct - 一款轻量级工具,利用 OpenMDAO 进行气动结构优化。
传感器处理
标定与变换
- tf2 - 变换库,允许用户随时间跟踪多个坐标系。
- TriP - 用于串联机器人、并联机器人以及两者的混合型机器人的逆运动学库。
- lidar_align - 一种简单的方法,用于确定3D激光雷达与6自由度位姿传感器之间的外参标定。
- kalibr - Kalibr 视觉-惯性标定工具箱。
- Calibnet - 基于3D空间变换网络的自监督外参标定方法。
- lidar_camera_calibration - 一个ROS软件包,用于计算激光雷达与相机之间的刚体变换。
- ILCC - 基于反射强度辅助的3D激光雷达自动精确外参标定方法。
- easy_handeye - 一个简单直接的ROS库,用于手眼标定。
- imu_utils - 一个用于分析IMU性能的ROS工具包。
- kalibr_allan - 用于Kalibr和惯性卡尔曼滤波器的IMU Allan方差图。
- pyquaternion - 一个功能齐全的Python模块,用于表示和使用四元数。
- robot_calibration - 该软件包提供对机器人多项参数的标定,例如:3D相机内参、外参、关节角度偏移以及机器人基座偏移。
- multi_sensor_calibration - 包含用于标定由激光雷达、雷达和相机组成的传感器系统的工具。
- LiDARTag - 一种基于点云激光雷达数据的实时基准标记。
- multicam_calibration - 相机的内外参标定。
- ikpy - 一个以性能和模块化为目标的逆运动学库。
- livox_camera_lidar_calibration - 用于标定Livox激光雷达与相机之间的外参。
- lidar_camera_calibration - 使用ROS、OpenCV和PCL进行相机与激光雷达的标定。
- e2calib - 包含用于从事件数据重建视频以进行标定的代码。
感知流水线
- SARosPerceptionKitti - 用于KITTI视觉基准测试套件中感知(传感器处理、检测、跟踪和评估)的ROS软件包。
- multiple-object-tracking-lidar - 使用LIDAR扫描或点云检测、跟踪并分类多个目标的C++实现。
- cadrl_ros - 用于通过深度强化学习训练的地面机器人进行动态避障的ROS软件包。
- AugmentedAutoencoder - 基于RGB图像的目标检测和6D位姿估计流水线。
- jsk_recognition - JSK实验室使用的感知相关软件包集合。
- GibsonEnv - Gibson环境:面向具身智能体的真实世界感知。
- morefusion - 基于体积融合的多目标推理6D位姿估计算法。
- se(3)-TrackNet - 当物体的CAD模型可用时,用于动态目标6D位姿跟踪的软件包。
机器学习
- DLIB - 一个用于在 C++ 中构建实际机器学习和数据分析应用的工具包。
- fastai - fastai 库通过现代最佳实践简化了快速且准确的神经网络训练。
- tpot - 一个使用遗传编程优化机器学习流水线的 Python 自动化机器学习工具。
- deap - Python 中的分布式进化算法。
- gym - 用于开发和比较强化学习算法的工具包。
- tensorflow_ros_cpp - 一个 ROS 包,允许在 C++ 中进行 TensorFlow 推理,而无需自行编译 TensorFlow。
- Tensorflow Federated - TensorFlow Federated (TFF) 是一个用于去中心化数据上进行机器学习及其他计算的开源框架。
- finn - 在 FPGA 上实现快速、可扩展的量化神经网络推理。
- neuropod - Neuropod 是一个库,提供统一的接口,用于在 C++ 和 Python 中运行来自多个框架的深度学习模型。
- leela-zero - 这是对 Alpha Go Zero 论文《无需人类知识即可掌握围棋》中描述系统的相当忠实的重新实现。
- Trax - 一个专注于序列模型和强化学习的深度学习库。
- mlflow - 一个用于简化机器学习开发的平台,包括实验跟踪、将代码打包为可复现的运行以及共享和部署模型。
- Netron - 神经网络、深度学习和机器学习模型的可视化工具。
- MNN - 由阿里巴巴的关键业务场景实战检验过的超高速轻量级深度学习框架。
- Tensorforce - 一个开源的深度强化学习框架,强调模块化的灵活库设计和面向研究与实践的简单易用性。
- Dopamine - 一个用于快速原型化强化学习算法的研究框架。
- catalyst - 该框架专注于可重复性、快速实验以及代码和想法的复用。
- ray - 一个用于构建和运行分布式应用的快速简便框架。
- tf-agents - 一个可靠、可扩展且易于使用的 TensorFlow 库,适用于上下文多臂老虎机和强化学习。
- ReAgent - Facebook 开发并使用的开源端到端应用强化学习(RL)平台。
- Awesome-Mobile-Machine-Learning - 针对 iOS、Android 和边缘设备的精选移动机器学习资源列表。
- cnn-explainer - 通过交互式可视化学习卷积神经网络。
- modelzoo - 用于自动驾驶应用的机器学习模型集合。
- nnstreamer-ros - 一组 Gstreamer 插件和 ROS 示例,使 Gstreamer 开发人员能够轻松高效地采用神经网络模型,同时让神经网络开发者也能轻松高效地管理神经网络流水线及其滤波器。
并行处理
- dask - 基于任务调度的 Python 并行计算。
- cupy - 使用 CUDA 加速的类似 NumPy 的 API。
- Thrust - 一个类似于 C++ 标准库的并行编程库。
- ArrayFire - 一个通用 GPU 库。
- OpenMP - 一个支持多平台共享内存并行编程的应用程序接口,适用于 C、C++ 和 Fortran。
- VexCL - VexCL 是一个用于 OpenCL/CUDA/OpenMP 的 C++ 向量表达式模板库。
- PYNQ - Xilinx 的一个开源项目,使使用 Zynq 全可编程片上系统设计嵌入式系统变得更加容易。
- numba - 使用 LLVM 的 NumPy 感知动态 Python 编译器。
- TensorRT - 一个用于 NVIDIA GPU 和深度学习加速器上的高性能推理的 C++ 库。
- libcudacxx - 提供一种异构的 C++ 标准库实现,可在 CPU 和 GPU 代码中以及两者之间使用。
图像处理
- CV-pretrained-model - 计算机视觉预训练模型集合。
- image_pipeline - 弥补了从相机驱动获取原始图像到更高层次视觉处理之间的空白。
- gstreamer - 基于管道的多媒体框架,可将各种媒体处理系统连接起来,完成复杂的流程。
- ros2_openvino_toolkit - 提供经过ROS适配的神经网络运行时框架,用于快速部署视觉推理应用和解决方案。
- vision_visp - 将ViSP视觉伺服库提供的ViSP运动边缘跟踪器封装为ROS软件包。
- apriltag_ros - AprilTag 3视觉标记检测器的ROS封装。
- deep_object_pose - 深度对象姿态估计。
- DetectAndTrack - 检测与跟踪:高效姿态估计。
- SfMLearner - 用于深度和自运动估计的无监督学习框架。
- imgaug - 用于机器学习实验的图像增强工具。
- vision_opencv - 用于将ROS与OpenCV(实时计算机视觉编程函数库)对接的软件包。
- darknet_ros - YOLO ROS:面向ROS的实时目标检测。
- ros_ncnn - 在NCNN推理引擎上运行YOLACT / YOLO (以及其他模型) 的ROS实现。
- tf-pose-estimation - 使用TensorFlow和自定义架构实现的深度姿态估计,以支持快速推理。
- find-object - 简单的Qt界面,用于尝试OpenCV中SIFT、SURF、FAST、BRIEF等特征检测器和描述子的实现。
- yolact - 一种简单、全卷积的实时实例分割模型。
- Kimera-Semantics - 基于2D数据的实时3D语义重建。
- detectron2 - 新一代目标检测与分割研究平台。
- OpenVX - 实现性能与功耗优化的计算机视觉处理,尤其适用于嵌入式和实时应用场景。
- 3d-vehicle-tracking - 联合单目3D车辆检测与跟踪的官方实现。
- pysot - PySOT的目标是为视觉跟踪研究提供高质量、高性能的代码库。
- semantic_slam - 使用手持RGB-D相机在ROS中实现的实时语义SLAM。
- kitti_scan_unfolding - 我们在论文《基于扫描的LiDAR点云语义分割:一项实验研究》中提出了KITTI扫描展开方法。
- packnet-sfm - 丰田研究院(TRI)机器学习团队发明的自监督单目深度估计方法的PyTorch官方实现。
- AB3DMOT - 本工作提出了一种简单但精确的实时3D多目标跟踪基线系统。
- monoloco - “MonoLoco:单目行人3D定位与不确定性估计”的PyTorch官方实现。
- Poly-YOLO - 基于YOLOv3的原始思想构建,去除了其两个弱点:大量重写的标签和锚点分布效率低下。
- satellite-image-deep-learning - 面向卫星及航空影像的深度学习资源。
- robosat - 面向航空和卫星影像的语义分割。
- big_transfer - 由谷歌研究院创建的通用视觉表征学习模型。
- LEDNet - 用于实时语义分割的轻量级编码器-解码器网络。
- TorchSeg - 该项目旨在使用PyTorch为语义分割模型提供快速、模块化的参考实现。
- simpledet - 一个简单且多功能的对象检测与实例识别框架。
- meshroom - Meshroom是一款基于AliceVision摄影测量计算机视觉框架的免费开源3D重建软件。
- EasyOCR - 即用型光学字符识别(OCR),支持包括中文、日文、韩文和泰文在内的40多种语言。
- pytracking - 基于PyTorch的通用Python框架,用于视觉目标跟踪和视频目标分割。
- ros_deep_learning - 面向ROS的深度学习推理节点,支持NVIDIA Jetson TX1/TX2/Xavier及TensorRT。
- hyperpose - HyperPose:实时人体姿态估计的灵活库。
- fawkes - 抵御人脸识别系统的隐私保护工具。
- anonymizer - 用于模糊人脸和车牌的匿名化工具。
- opendatacam - 只保存调查得到的元数据,特别是物体移动路径或特定点处计数的物体数量。
- Cam2BEV - 给定多辆汽车搭载的摄像头图像,计算语义分割后的鸟瞰图(BEV)的TensorFlow实现。
- flownet2-pytorch - FlowNet 2.0的PyTorch实现:基于深度网络的光流估计演进。
- Simd - C++图像处理与机器学习库,支持SIMD指令集:SSE、SSE2、SSE3、SSSE3、SSE4.1、SSE4.2、AVX、AVX2、AVX-512、VMX(Altivec)和VSX(Power7),以及ARM平台上的NEON。
- AliceVision - 一款摄影测量计算机视觉框架,提供3D重建和相机跟踪算法。
- satpy - 用于读取和处理气象遥感数据,并将其写入各种图像和数据文件格式的Python库。
- eo-learn - 一系列开源Python软件包,旨在无缝访问和处理由任何卫星星座获取的时空图像序列,实现及时、自动化的操作。
- libvips - 一款快速且内存占用低的图像处理库。
雷达处理
- pyroSAR - 用于大规模合成孔径雷达卫星数据处理的框架。
- CameraRadarFusionNet - 慕尼黑工业大学Roborace团队软件栈 - 路径跟踪控制、速度控制、曲率控制及状态估计。
激光雷达与点云处理
- cilantro - 一个轻量级的C++库,用于处理点云数据。
- open3d - Open3D:现代的三维数据处理库。
- SqueezeSeg - SqueezeSeg的实现,基于卷积神经网络的激光雷达点云分割方法。
- point_cloud_io - ROS节点,用于从文件(如ply、vtk)中读取和写入点云。
- python-pcl - 点云库的Python绑定。
- libpointmatcher - 用于机器人2D/3D建图的“迭代最近点”库。
- depth_clustering - 使用Velodyne传感器生成的点云的快速且鲁棒的聚类算法。
- lidar-bonnetal - 面向自动驾驶的激光雷达点云语义与实例分割。
- CSF - 基于布料模拟的激光雷达点云地面滤波/分割(裸地提取)方法。
- robot_body_filter - 一个高度可配置的LaserScan/PointCloud2滤波器,允许动态地从测量数据中移除机器人自身的三维模型。
- grid_map - 通用的网格地图库,用于移动机器人建图。
- elevation_mapping - 面向崎岖地形导航的以机器人为中心的高程映射。
- rangenet_lib - 包含关于RangeNet++推理如何与TensorRT及C++接口协同工作的简单使用说明。
- pointcloud_to_laserscan - 将三维点云转换为二维激光扫描。
- octomap - 基于八叉树的高效概率性三维建图框架。
- pptk - 来自HEREMaps的点处理工具包。
- gpu-voxels - GPU-Voxels是一个基于CUDA的库,能够在各种类型的3D传感器采集的实时点云与动画3D模型之间实现高分辨率的体积碰撞检测。
- spatio_temporal_voxel_layer - 一种利用现代3D图形技术的新体素层,用于现代化导航环境表示。
- LAStools - 备受赞誉的高效激光雷达处理软件。
- PCDet - 一个基于PyTorch的通用代码库,用于从点云中进行三维目标检测。
- PDAL - 一个用于转换和操作点云数据的C++ BSD库。
- PotreeConverter - 从las、laz、二进制ply、xyz或ptx文件构建potree八叉树。
- fast_gicp - 一系列基于GICP的快速点云配准算法。
- ndt_omp - 多线程且支持SSE指令集的NDT算法。
- laser_line_extraction - 一个ROS包,用于从LaserScan消息中提取线段。
- Go-ICP - Go-ICP算法的实现,用于全局最优的三维点集配准。
- PointCNN - 一个简单通用的框架,用于从点云中学习特征。
- segmenters_lib - 激光雷达分割库,用于基于分割的目标检测。
- MotionNet - 基于鸟瞰图的地图,用于自动驾驶中的联合感知与运动预测。
- PolarSeg - 一种改进的网格表示法,用于在线激光雷达点云的语义分割。
- traversability_mapping - 接收来自Velodyne VLP-16激光雷达的点云,并实时输出用于自主导航的通行能力地图。
- lidar_super_resolution - 基于仿真的地面车辆激光雷达超分辨率技术。
- Cupoch - 一个使用CUDA实现快速三维数据处理和机器人计算的库。
- linefit_ground_segmentation - 地面分割算法的实现。
- Draco - 一个用于压缩和解压缩三维几何网格和点云的库。
- Votenet - 基于深度霍夫投票的点云三维目标检测。
- lidar_undistortion - 提供基于外部6DoF位姿估计输入的激光雷达运动去畸变功能。
- superpoint_graph - 使用超级点图进行大规模点云语义分割。
- RandLA-Net - 高效的大规模点云语义分割。
- Det3D - 第一个三维目标检测工具箱,提供了PointPillars、SECOND、PIXOR等多种三维目标检测算法的开箱即用实现。
- OverlapNet - 一种改进的暹罗网络,用于预测由3D激光雷达扫描生成的一对范围图像之间的重叠及相对偏航角。
- mp2p_icp - C++中多基元到基元(MP2P)ICP算法的集合。
- OpenPCDet - 一个基于激光雷达的三维目标检测工具箱。
- torch-points3d - 用于在点云上进行深度学习的PyTorch框架。
- PolyFit - 基于点云的多边形曲面重建。
- mmdetection3d - 下一代通用三维目标检测平台。
- gpd - 以点云作为输入,输出可行抓取姿态估计。
- SalsaNext - 面向自动驾驶的激光雷达点云不确定性感知语义分割。
- Super-Fast-Accurate-3D-Object-Detection - 基于3D激光雷达点云的超快速且精确的三维目标检测(PyTorch实现)。
- kaolin - 一个加速3D深度学习研究的PyTorch库。
- CamVox - 一个基于摄像头和Livox激光雷达的低成本SLAM系统。
- SA-SSD - 基于结构感知的单阶段点云三维目标检测。
- cuda-pcl - 利用NVIDIA CUDA加速的PCL库,助力机器人领域的激光雷达应用。
- urban_road_filter - 自动驾驶车辆的实时激光雷达城市道路与人行道检测。
- Removert - 先移除再恢复。通过构建静态地图来实现野外静态地图构建及动态点云移除工具。
- KISS-ICP - 一条几乎无需调参即可在大多数情况下直接使用的激光雷达里程计流程。
定位与状态估计
- evo - 用于评估里程计和SLAM的Python工具包。
- robot_localization - 非线性状态估计算法节点集合。
- fuse - 用于在机器人上实时进行传感器融合的通用架构。
- GeographicLib - 用于地理投影的C++库。
- ntripbrowser - 用于浏览NTRIP(通过互联网协议传输RTCM)的Python API。
- imu_tools - 与IMU相关的滤波器和可视化工具。
- RTKLIB - 针对单频和双频低成本GPS接收机,尤其是u-blox接收机优化的RTKLIB版本。
- gLAB - 能够以厘米级精度对GNSS观测值(伪距和载波相位)进行建模,支持独立GPS定位、PPP、SBAS和DGNSS。
- ai-imu-dr - 包含我们基于IMU的新型高精度轮式车辆航位推算方法的代码。
- Kalman-and-Bayesian-Filters-in-Python - 使用Jupyter Notebook的卡尔曼滤波器教程。
- mcl_3dl - 一个ROS节点,用于为配备3D激光雷达的移动机器人实现概率性的3D/6自由度定位系统。
- se2lam - 基于里程计和视觉信息融合的地面上车辆SE(2)空间上的定位与建图。
- mmWave-localization-learning - 基于毫米波传输的机器学习定位方法,具有高精度和高能效。
- dynamic_robot_localization - 一个ROS软件包,利用PCL实现3DoF和6DoF定位,并可通过OctoMap动态更新地图。
- eagleye - 一款开源的车辆定位软件,结合GNSS和IMU使用。
- python-sgp4 - SGP4卫星位置库的Python版本。
- PROJ - 地图投影与坐标变换库。
- rpg_trajectory_evaluation - 实现了视觉(惯性)里程计中常用的轨迹评估方法。
- pymap3d - 纯Python(可选Numpy)的地球空间ECEF、ENU、ECI三维坐标转换工具。
- libRSF - 用于在线定位的鲁棒传感器融合库。
同时定位与建图
激光雷达
- KISS-ICP - 一种激光雷达里程计流程,在大多数情况下无需调整任何参数即可直接运行。
- loam_velodyne - 激光里程计与建图(Loam)是一种利用3D激光雷达进行状态估计和建图的实时方法。
- lio-mapping - 紧耦合3D激光雷达惯性里程计与建图(LIO-mapping)的实现。
- A-LOAM - LOAM的高级实现。
- Fast LOAM - 快速且优化的激光雷达里程计与建图。
- LIO_SAM - 通过平滑与建图实现的紧耦合激光雷达惯性里程计。
- cartographer_ros - 提供Cartographer的ROS集成。
- loam_livox - 一款针对Livox激光雷达的鲁棒激光雷达里程计与建图(LOAM)软件包。
- StaticMapping - 使用激光雷达对静态环境进行建图。
- semantic_suma - 结合Surfel建图和语义分割的语义建图。
- slam_toolbox - 适用于潜在大规模地图的终身建图与定位的ROS Slam工具箱。
- maplab - 一个开放的视觉惯性建图框架。
- hdl_graph_slam - 一个开源的ROS软件包,用于使用3D激光雷达进行实时6DOF SLAM。
- interactive_slam - 与现有的自动SLAM软件包不同,我们只需最少的人工干预。
- LeGO-LOAM - 一种轻量级、地面优化的激光雷达里程计与建图方案,适用于复杂地形。
- pyslam - 包含一个基于单目视觉的Python里程计流程。
- Kitware SLAM - Kitware开发的纯激光雷达视觉SLAM,以及便于使用的ROS和ParaView封装。
- horizon_highway_slam - 一款鲁棒、低漂移、实时的高速公路SLAM软件包,适用于Livox Horizon激光雷达。
- mola - 一种模块化的定位与建图系统。
- DH3D - 用于大规模6DOF重定位的深度分层3D描述符。
- LaMa - LaMa是一个用于机器人定位与建图的C++11软件库。
- Scan Context - 全局激光雷达描述子,用于场景识别和长期定位。
- M-LOAM - 针对多激光雷达系统,具备在线外参标定功能的鲁棒里程计与建图。
视觉
- orb_slam_2_ros - ORB_SLAM2 的 ROS 实现。
- orbslam-map-saving-extension - 该扩展将 ORB 特征的地图保存到磁盘,以便在未来沿相同轨迹运行时作为参考。
- dso - 直接稀疏里程计。
- viso2 - libviso2 的 ROS 封装,libviso2 是一个用于视觉里程计的库。
- xivo - X 惯性辅助视觉里程计。
- rovio - 鲁棒视觉惯性里程计框架。
- LSD-SLAM - 大规模直接单目 SLAM 是一种实时单目 SLAM。
- CubeSLAM 和 ORB SLAM - CubeSLAM 和 ORB SLAM 的单目 3D 目标检测与 SLAM 套件。
- VINS-Fusion - 一种鲁棒且通用的多传感器视觉惯性状态估计算法。
- openvslam - OpenVSLAM:一个多功能的视觉 SLAM 框架。
- basalt - 基于非线性因子恢复的视觉惯性建图。
- Kimera - 一个用于实时度量语义同时定位与建图的 C++ 库,它使用相机图像和惯性数据构建环境的语义标注 3D 网格。
- tagslam - 一个基于 ROS 的包,利用 AprilTag 基准标记进行同时定位与建图。
- LARVIO - 一种轻量级、高精度且鲁棒的单目视觉惯性里程计,基于多状态约束卡尔曼滤波器。
- fiducials - 使用基准标记进行同时定位与建图。
- open_vins - 一个用于视觉惯性导航研究的开源平台。
- ORB_SLAM3 - ORB-SLAM3:一个精确的开源库,适用于视觉、视觉惯性及多地图 SLAM。
- Atlas - 从已定位图像中端到端重建 3D 场景。
- vilib - 该库专注于使用 CUDA 的 VIO 流水线前端。
- hloc - 一套模块化的工具箱,用于最先进的 6 自由度视觉定位。它实现了分层定位,利用图像检索和特征匹配,速度快、精度高且可扩展。
- ESVO - 一种新颖的实时立体事件相机视觉里程计流程。
- gradslam - 一个面向 PyTorch 的开源可微分稠密 SLAM 库。
向量地图
- OpenDRIVE - 一种用于道路网络逻辑描述的开放文件格式。
- MapsModelsImporter - 一个 Blender 插件,用于从 Google 地图导入模型。
- Lanelet2 - 用于自动驾驶的地图处理框架。
- barefoot - 在线和离线地图匹配,既可独立使用,也可在云端运行。
- iD - 一款易于使用的 JavaScript 开源地图编辑器。
- RapiD - Facebook 打造的增强版 iD,结合 AI 进行地图绘制。
- segmap - 基于 3D 分段的地图表示。
- Mapbox - 一个用于在网络上创建交互式、可定制向量地图的 JavaScript 库。
- osrm-backend - 开源路由引擎 - C++ 后端。
- assuremapingtools - 一款桌面工具,用于查看、编辑和保存道路网络地图,适用于 Autoware 等自动驾驶平台。
- geopandas - 一个为 pandas 对象添加地理数据支持的项目。
- MapToolbox - 用于在 Unity 中制作 Autoware 向量地图的插件。
- imagery-index - 一份对地图绘制有用的航空和卫星影像索引。
- mapillary_tools - 一个用于处理和上传图像到 Mapillary 的库。
- mapnik - 结合像素级完美的图像输出与闪电般的制图算法,并提供 C++、Python 和 Node.js 接口。
- gdal - GDAL 是一个开源、采用 X/MIT 许可证的栅格和矢量地理空间数据格式转换库。
- grass - GRASS GIS - 免费且开源的地理信息系统 (GIS)。
- 3d-tiles - 用于流式传输大规模异构 3D 地理空间数据集的规范。
- osmnx - 用于街道网络的 Python 工具。可以从 OpenStreetMap 获取、建模、分析和可视化街道网络及其他空间数据。
预测
- Awesome-Interaction-aware-Trajectory-Prediction - 一系列最先进的轨迹预测研究资料。
- sgan - 基于生成对抗网络的社会可接受轨迹。
行为与决策
- Groot - 用于创建行为树的图形化编辑器。兼容 BehaviorTree.CPP。
- BehaviorTree.CPP - C++ 行为树库。
- RAFCON - 使用层次状态机,支持并发状态执行,用于表示机器人程序。
- ROSPlan - 适用于 ROS 系统的任务规划通用框架。
- ad-rss-lib - 实现自动驾驶车辆责任敏感安全模型(RSS)的库。
- FlexBE - 基于 ROS 的 smach 的层次状态机图形化编辑器。
- sts_bt_library - 该库提供使用定义好的树结构(如Fallback、Sequence 或 Parallel 节点)来搭建自定义行为逻辑的功能。
- SMACC - 面向实时 ROS(机器人操作系统)应用的事件驱动、异步行为状态机库,采用 C++ 编写。
- py_trees_ros - 扩展 py_trees 以在 ROS 中使用的行为、行为树及实用工具。
规划与控制
- pacmod - 旨在让用户通过PACMod线控系统控制车辆。
- mpcc - 用于自动驾驶赛车的模型预测轮廓控制器。
- rrt - C++实现的快速探索随机树算法。
- HypridAStarTrailer - 基于混合A*算法的拖车卡车路径规划算法。
- path_planner - 用于KTH研究概念车的混合A*路径规划器。
- open_street_map - 用于处理OpenStreetMap地理信息的ROS软件包。
- 开源汽车控制 - 一套软硬件设计,可实现对现代汽车的计算机控制,从而促进自动驾驶技术的发展。
- fastrack - FaSTrack(快速安全跟踪)的ROS实现。
- commonroad - 道路运动规划的可组合基准测试集。
- traffic-editor - 用于机器人交通流的图形化编辑器。
- steering_functions - 包含一个C++库,实现了适用于具有有限转弯半径的类汽车机器人的转向函数。
- moveit - 易于使用的机器人操作平台,用于开发应用、评估设计及构建集成产品。
- flexible-collision-library - 用于在由三角形组成的几何模型对之间执行三种类型的邻近性查询的库。
- aikido - 用于运动学、动力学和优化的人工智能。
- casADi - 一种符号框架,用于数值优化,在稀疏矩阵值计算图上实现前向和反向模式的自动微分。
- ACADO工具箱 - 用于自动控制和动态优化的软件环境及算法集合。
- control-toolbox - 一个高效的C++库,用于机器人中的控制、估计、优化和运动规划。
- CrowdNav - 基于注意力机制的深度强化学习的群体感知型机器人导航。
- ompl - 包含多种最先进的基于采样的运动规划算法。
- openrave - 开放式机器人自动化虚拟环境:用于测试、开发和部署机器人运动规划算法的环境。
- teb_local_planner - 基于定时弹性带的移动机器人最优轨迹规划器,考虑了独特的拓扑结构。
- pinocchio - 刚体动力学算法及其解析导数的快速灵活实现。
- rmf_core - rmf_core软件包提供了机器人中间件框架(RMF)的集中式功能。
- OpEn - 用于下一代机器人和自主系统的快速准确嵌入式优化求解器。
- autogenu-jupyter - 该项目提供了基于延续/GMRES方法(C/GMRES方法)的非线性模型预测控制(NMPC)求解器,以及NMPC的自动代码生成器。
- global_racetrajectory_optimization - 此仓库包含多种生成全局竞速轨迹的方法。
- toppra - 用于计算受运动学和动力学约束的机器人时间最优路径参数化的库。
- tinyspline - TinySpline是一个小型但功能强大的库,可用于插值、变换和查询任意NURBS、B样条和贝塞尔曲线。
- dual quaternions ros - 用于双四元数SLERP的ROS Python包。
- mb planner - 用于狭小空间的空中飞行器规划器。曾用于DARPA SubT挑战赛。
- ilqr - 具有自动微分动力学模型的迭代线性二次调节器。
- EGO-Planner - 一种轻量级的基于梯度的局部规划器,无需ESDF构建,相比一些最先进的方法显著减少了计算时间。
- pykep - 一个科学库,提供行星际轨道设计研究的基本工具。
- am_traj - 基于交替最小化的轨迹生成,适用于四旋翼无人机的激进飞行。
- GraphBasedLocalTrajectoryPlanner - 曾在Roborace Alpha赛季的真实赛车上使用,并达到了超过200公里/小时的速度。
- se2_navigation - 纯追踪控制器和基于Reeds-Shepp采样的规划器,用于SE(2)空间中的导航。
- Ruckig - 即时运动生成。实时。加速度受限。时间最优。
用户交互
图形用户界面
- imgui - 旨在实现快速迭代,使程序员能够创建内容创作工具以及可视化和调试工具。
- qtpy - 提供一个统一的层,用单一代码库支持 PyQt5、PySide2、PyQt4 和 PySide。
- mir - Mir 是一套用于构建基于 Wayland 的桌面环境的库。
- rqt - 基于 Qt 的 ROS GUI 开发框架。它由三个部分/元包组成。
- cage - 这是 Cage,一个 Wayland 售货亭模式系统。该系统会运行一个全屏的最大化应用。
- chilipie - 易于使用的树莓派镜像,可直接启动进入全屏 Chrome 浏览器。
- pencil - 一款人人可用的绘图和 GUI 原型设计工具。
- dynamic_reconfigure - dynamic_reconfigure 的重点在于提供一种标准方法,将节点的部分参数暴露给外部重新配置。
- ddynamic_reconfigure - 允许使用 dynamic_reconfigure 框架修改 ROS 节点的参数,而无需编写 cfg 文件。
- elements - 一个轻量级、细粒度、与分辨率无关的模块化 GUI 库。
- NanoGUI - 一个极简的跨平台 OpenGL 3.x 或更高版本的小部件库。
声学用户界面
- pyo - 一个用 C 语言编写的 Python 模块,包含用于各种音频信号处理的类。
- rhasspy - Rhasspy(发音为 RAH-SPEE)是一个受 Jasper 启发的离线、多语言语音助手工具包,可与 Home Assistant、Hass.io 和 Node-RED 良好兼容。
- mycroft-core - Mycroft 是一个可 hack 的开源语音助手。
- DDSP - 一个包含常见 DSP 函数(如合成器、波形整形器和滤波器)可微分版本的库。
- NoiseTorch - 在任何应用中创建一个能够抑制噪声的虚拟麦克风。
- DeepSpeech - 一个开源的语音转文本引擎,采用基于百度 Deep Speech 研究论文的机器学习技术训练的模型。
- waveglow - 一种基于流的语音合成生成网络。
- TTS - 一个经过研究和生产验证的深度学习文本转语音工具包。
命令行界面
- the-art-of-command-line - 一页纸掌握命令行技巧。
- cornerman 的 dotfiles - 功能强大的 zsh 和 vim 配置文件。
- dotbot - 一个用于引导你的 dotfiles 的工具。
- prompt-hjem - 一个漂亮的 zsh 提示符。
- ag - 一个类似于 ack 的代码搜索工具,但速度更快。
- fzf - 一个命令行模糊查找工具。
- pkgtop - 专为 GNU/Linux 设计的交互式软件包管理器和资源监视器。
- asciimatics - 一个跨平台包,用于执行类似 curses 的操作,并提供更高级别的 API 和小部件,以创建文本 UI 和 ASCII 艺术动画。
- gocui - 一个极简的 Go 包,用于创建控制台用户界面。
- TerminalImageViewer - 一个小型 C++ 程序,使用 RGB ANSI 代码和 Unicode 方块图形字符在(现代)终端上显示图像。
- rosshow - 使用 Unicode/ASCII 艺术在终端内可视化 ROS 主题。
- python-prompt-toolkit - 一个用于在 Python 中构建强大交互式命令行应用程序的库。
- guake - GNOME 下拉终端。
- wemux - 多用户 Tmux 轻松搞定。
- tmuxp - 一个基于 libtmux 构建的会话管理器。
- mapscii - 为你的控制台渲染的世界地图。
- terminator - 该项目的目标是开发一款实用的终端布局工具。
- bat - 一个带翅膀的 cat(1) 克隆版。
- fx - 命令行工具和终端 JSON 查看器。
- tmate - 即时终端共享。
数据可视化与任务控制
- xdot - 用于Graphviz dot语言编写的图的交互式查看器。
- guacamole - 无客户端远程桌面网关。支持VNC、RDP和SSH等标准协议。
- ros3djs - 用于ROS JavaScript库的3D可视化库。
- webviz - 类似rviz的基于Web的可视化库。
- plotly.py - Python的开源交互式绘图库。
- PlotJuggler - 你应得的时间序列可视化工具。
- bokeh - 从Python实现的浏览器端交互式数据可视化。
- voila - 将Jupyter笔记本转换为独立的Web应用和仪表板。
- Pangolin - Pangolin是一个轻量级、可移植的快速开发库,用于管理OpenGL显示/交互以及抽象视频输入。
- rqt_bag - 提供用于显示和回放ROS bag文件的GUI插件。
- kepler.gl - Kepler.gl是一款功能强大的开源地理空间分析工具,适用于大规模数据集。
- qgis_ros - 在功能丰富的GIS环境中访问bag文件和实时话题数据。
- openmct - 基于Web的任务控制框架。
- web_video_server - 以多种格式对ROS图像话题进行HTTP流传输。
- RVizWeb - 提供了一种便捷的方式,构建并启动具有类似RViz功能的Web应用。
- marvros - MAVLink到ROS的网关,带有地面控制站代理。
- octave - 提供一个方便的命令行界面,用于数值求解线性和非线性问题,并使用与Matlab高度兼容的语言进行其他数值实验。
- streetscape.gl - Streetscape.gl是一个用于以XVIZ协议可视化自动驾驶和机器人数据的工具包。
- urdf-loaders - 适用于Unity和THREE.js的URDF加载器,附带示例ATHLETE URDF文件。
- obs-studio - 用于直播和屏幕录制的免费开源软件。
- K3D-tools - 用于3D可视化的Jupyter笔记本扩展。
- PyQtGraph - 面向科学/工程应用的快速数据可视化和GUI工具。
- ipygany - Jupyter笔记本中的3D科学可视化。
- Foxglove Studio - 用于机器人可视化和调试的Web及桌面应用;是webviz的活跃维护分支。
- ROS-Mobile - Android平台上的可视化与控制应用。
标注
- labelbox - 构建和部署人工智能应用最快的数据标注方式。
- PixelAnnotationTool - 快速标注图像。
- LabelImg - 一款图形化图像标注工具,用于在图像中框选标签对象。
- cvat - 功能强大且高效的计算机视觉标注工具(CVAT)。
- point_labeler - 用于单个点云或点云流的标注工具。
- label-studio - Label Studio是一款多类型数据标注工具,输出格式标准化。
- napari - 一款快速、交互式的多维图像查看器,专为Python设计。
- semantic-segmentation-editor - 一款基于Web的标注工具,用于创建AI训练数据集(2D和3D)。
- 3d-bat - 用于点云和图像标注的3D边界框标注工具。
- labelme - 使用Python进行图像多边形标注(多边形、矩形、圆形、直线、点以及图像级别的标记标注)。
- universal-data-tool - 在简单的Web界面或桌面应用中协作并标注任何类型的数据、图像、文本或文档。
- BMW-Labeltool-Lite - 为您提供易于使用的标注工具,用于最先进的深度学习训练目的。
- 3d-annotation-tool - 一款轻量级工具,可用于为点云添加边界框、矩形、关键点等标注。
点云
- CloudCompare - CloudCompare是一款用于处理3D点云(及三角网格)的软件。
- Potree - 用于大型数据集的WebGL点云查看器。
- point_cloud_viewer - 让查看海量点云变得简单便捷。
- LidarView - 对来自LiDAR传感器的实时采集3D LiDAR数据进行实时可视化和简便处理。
- VeloView - 对来自Velodyne HDL传感器的实时采集3D LiDAR数据进行实时可视化。
- entwine - 一款针对海量点云的数据组织库,旨在处理包含数万亿点的大规模数据集以及桌面规模的点云。
- polyscope - 一款C++和Python编写的3D数据查看器,适用于网格和点云等数据。
- Pcx - Unity平台下的点云导入与渲染工具。
- ImmersivePoints - 一款面向虚拟现实设备的Web应用,让用户能够以最自然的方式探索3D数据。
RViz
- mapviz - 用于2D数据的模块化ROS可视化工具。
- rviz_cinematographer - 易于使用的工具,用于为RViz相机创建和编辑轨迹。
- rviz_satellite - 在RViz中显示互联网卫星影像。
- rviz_visual_tools - 用于在RViz中显示形状和网格的C++ API封装。
- xpp - 用于足式机器人的运动规划可视化。
- rviz stereo - 3D立体渲染会为每只眼睛显示不同的视图,从而使场景看起来具有深度。
- jsk_visualization - Jsk可视化ROS包,适用于RViz和rqt。
- moveit_visual_tools - 通过发布的标记在RViz中显示和调试MoveIt!数据的辅助函数。
操作系统
监控
- rosmon - ROS节点启动器及监控守护进程。
- multimaster_fkie - 基于GUI的管理环境,非常有助于管理ROS启动配置和控制正在运行的节点。
- collectd - 一个小型守护进程,定期收集系统信息,并提供多种机制来存储和监控这些值。
- lnav - 一种增强的日志文件查看器,能够利用所查看文件中的任何语义信息,例如时间戳和日志级别。
- htop - 一款面向Unix系统的交互式文本模式进程查看器。其目标是成为更好的“top”。
- atop - 一款具有日志记录和回放功能的Linux系统与进程监控工具。
- psutil - 一个跨平台的Python库,用于进程和系统监控。
- gputil - 一个Python模块,用于通过nvidia-smi程序化地从NVIDIA GPU获取GPU状态。
- gpustat - 一个简单的命令行实用程序,用于查询和监控GPU状态。
- nvtop - 类似htop的NVIDIA GPU监控工具。
- ShellHub - ShellHub是一个现代化的SSH服务器,可通过命令行(使用任何SSH客户端)或基于Web的用户界面远程访问Linux设备,旨在作为sshd的替代方案。可以将ShellHub视为面向边缘计算和云计算的集中式SSH。
- Sshwifty - Sshwifty是一款专为Web设计的SSH和Telnet连接工具。
- spdlog - 一个非常快速、仅包含头文件或已编译的C++日志库。
- ctop - 一个类似于top的容器指标界面。
- ntop - 基于Web的流量与安全网络流量监控。
- jupyterlab-nvdashboard - 一个用于显示GPU使用情况仪表板的JupyterLab扩展。
数据库与记录
- ncdu - Ncdu是一个带有ncurses界面的磁盘使用分析工具。
- borg - 一种具有去重、压缩和认证加密功能的归档工具。
- bag-database - 一个用于编目bag文件并提供基于Web的UI以访问这些文件的服务器。
- marv-robotics - MARV Robotics是一个强大且可扩展的数据管理平台。
- kitti2bag - 以简单的方式将KITTI数据集转换为ROS bag文件。
- pykitti - 用于处理KITTI数据的Python工具。
- rosbag_editor - 使用简单的GUI从现有rosbag中创建新的rosbag。
- nextcloud - Nextcloud是一套客户端-服务器软件,用于创建和使用文件托管服务。
- ros_type_introspection - 反序列化在编译时未知的ROS消息。
- syncthing - 一个持续的文件同步程序。
- rqt_bag_exporter - 一个Qt GUI,用于将ROS bag主题导出为文件(CSV和/或视频)。
- xviz - 一种用于实时传输和可视化自动驾驶数据的协议。
- kitti_to_rosbag - 一套用于处理KITTI原始数据并将其转换为ROS bag的工具。同时还提供了一个库,可以直接访问位姿、Velodyne扫描和图像。
- ros_numpy - 用于在ROS消息与numpy数组之间进行转换的工具。
- kitti_ros - 一个基于ROS的播放器,用于回放KITTI数据集。
- DuckDB - 一个可嵌入的SQL OLAP数据库管理系统。
网络分布式文件系统
- sshfs - 基于SSH文件传输协议的文件系统。
- moosefs - 一个可扩展的分布式存储系统。
- ceph - 一个分布式对象、块和文件存储平台。
- nfs - 一种最初由Sun Microsystems开发的分布式文件系统协议。
- ansible-role-nfs - 在RedHat/CentOS或Debian/Ubuntu上安装NFS实用程序。
服务器基础设施与高性能计算
- mass - 自助式远程安装 Windows、CentOS、ESXi 和 Ubuntu 到物理服务器上,将您的数据中心转变为裸机云。
- polyaxon - 一个用于复现和管理机器学习及深度学习应用全生命周期的平台。
- localstack - 一个功能齐全的本地 AWS 云栈。可在离线状态下开发和测试您的云及无服务器应用。
- nvidia-docker - 构建并运行利用 NVIDIA GPU 的 Docker 容器。
- kubeflow - 面向 Kubernetes 的机器学习工具包。
- log-pilot - 收集 Docker 容器的日志。
- traefik - 云原生边缘路由器。
- graylog2-server - 免费且开源的日志管理工具。
- ansible - Ansible 是一款极简的 IT 自动化平台,可让您更轻松地部署应用程序和系统。
- pyinfra - 可用于临时命令执行、服务部署、配置管理等。
- docker-py - Docker Engine API 的 Python 库。
- noVNC - 基于 HTML5 的 VNC 客户端。
- Slurm - Slurm:高度可扩展的工作负载管理器。
- jupyterhub - Jupyter 笔记本的多用户服务器。
- Portainer - 让 Docker 管理变得简单。
- enroot - 一种简单而强大的工具,可将传统的容器/操作系统镜像转换为非特权沙盒环境。
- docker-firefox - 运行包含 Firefox 和 noVNC 的 Docker 容器,以便远程访问无头服务器。
- luigi - 一个帮助您构建复杂批处理作业流水线的 Python 模块。它负责处理依赖关系解析、工作流管理、可视化等功能,并内置了对 Hadoop 的支持。
- triton-inference-server - NVIDIA Triton 推理服务器提供针对 NVIDIA GPU 优化的云端推理解决方案。
- cudf - 提供类似 pandas 的 API,数据工程师和数据科学家会感到熟悉,因此他们可以使用该库轻松加速工作流程,而无需深入了解 CUDA 编程细节。
嵌入式操作系统
- vxworks7-ros2-build - 用于自动化构建 VxWorks 7 和 ROS2 的构建系统。
- Yocto - 提供工具和流程,使开发者能够为嵌入式软件创建独立于底层硬件架构的 Linux 发行版。
- Automotive Graded Linux - 一个协作式的开源项目,汇集汽车制造商、供应商和技术公司,共同构建基于 Linux 的开放式软件平台,用于汽车应用,有望成为事实上的行业标准。
- bitbake - 一个通用的任务执行引擎,能够在复杂的任务间依赖约束下高效并行地运行 Shell 和 Python 任务。
- Jailhouse - Jailhouse 是一个基于 Linux 的分区型虚拟机管理程序。
- Xen - 一个开源(GPL)Type-1 或裸金属虚拟机管理程序。
- QEMU - 一个通用且开源的机器模拟器和虚拟化工具。
- qemu-xilinx - Quick EMUlator (QEMU) 的分支版本,针对 Xilinx 平台提供了更好的支持和建模。
- rosserial - 适用于小型嵌入式设备(如 Arduino)的 ROS 客户端库。
- meta-ros - 用于 ROS 应用的 OpenEmbedded 层。
- meta-balena - 在嵌入式设备上运行 Docker 容器。
- micro-ros - 与“常规”ROS 2 相比,主要区别在于 micro-ROS 使用实时操作系统 (RTOS),而非 Linux,并采用 DDS 协议以适应资源极度受限的环境。
- nvidia-container-runtime - NVIDIA 容器运行时是一种感知 GPU 的容器运行时,兼容 Docker、CRI-O 等主流容器技术所使用的开放容器倡议 (OCI) 规范。
- fusesoc - 用于 FPGA/ASIC 开发的包管理器和构建抽象工具。
- jetson_easy - 自动化脚本,用于设置和配置您的 NVIDIA Jetson 设备。
- docker-jetpack-sdk - 允许在 Docker 容器内使用 NVIDIA JetPack SDK 进行下载、刷机和安装。
- Pressed - 提供了一种方式,在 Debian 安装过程中自动回答问题,而无需在安装进行时手动输入答案。
- jetson_stats - 用于监控和控制您的 NVIDIA Jetson 设备(Xavier NX、Nano、AGX Xavier、TX1、TX2)的工具包,兼容所有 NVIDIA Jetson 生态系统。
- ros_jetson_stats - ROS 版本的 jetson-stats 包装器,可在诊断消息中显示您的 NVIDIA Jetson 设备状态。
- OpenCR - 用于 ROS 的开源控制模块。
- acrn-hypervisor - 定义了一个设备虚拟机管理程序参考栈以及架构,允许在一个整合系统上通过虚拟机管理程序安全地运行多个软件子系统。
- jetson-containers - 适用于 Jetson 和 JetPack 4.4 的机器学习容器。
实时内核
- ELISA - 该项目旨在简化企业构建和认证基于 Linux 的安全关键型应用——即那些一旦失效可能导致人员伤亡、重大财产损失或环境破坏的系统。
- PREEMPT_RT 内核补丁 - PREEMPT_RT 内核补丁的目标是尽量减少不可抢占的内核代码量。
网络与中间件
- performance_test - 用于测试基于发布/订阅通信框架性能的工具。
- realtime_support - 用于测量抖动和延迟的最小化实时测试工具。
- ros1_bridge - 提供ROS 1与ROS 2之间双向通信的ROS 2软件包。
- Fast-RTPS - 由对象管理组织(OMG)联盟定义并维护的一种协议,它通过UDP等不可靠传输介质提供发布-订阅通信。
- protobuf - Google的数据交换格式。
- opensplice - Vortex OpenSplice社区版。
- cyclonedds - Eclipse Cyclone DDS是一个高性能且健壮的开源DDS实现。
- iceoryx - 适用于基于POSIX系统的IPC中间件。
- rosbridge_suite - 提供ROS的JSON接口,允许任何客户端发送JSON来发布或订阅ROS话题、调用ROS服务等。
- ros2arduino - 该库帮助Arduino板使用XRCE-DDS与ROS2进行通信。
- eCAL - 增强型通信抽象层(eCAL)是一种中间件,可在单个计算机节点上或计算机网络中的不同节点之间实现可扩展、高性能的进程间通信。
- AUTOSAR-Adaptive - 基于R19-11的AUTOSAR Adaptive平台实现。
- ocpp - 开放式充电桩协议(OCPP)是一种用于电动汽车充电器与中央后台系统之间通信的网络协议。
- micro-ROS for Arduino - 一个基于Arduino IDE或Arduino CLI的裸机项目的实验性micro-ROS库。
- mqtt_bridge - 提供ROS与MQTT之间双向桥接功能。
以太网与无线网络
- SOES - SOES是用C语言编写的EtherCAT从站栈。
- netplan - 只需创建所需网络接口及其配置的YAML描述即可。
- airalab - AIRA是面向支持ROS的网络物理系统的参考Robonomics网络客户端。
- rdbox - RDBOX是为ROS机器人设计的IT基础设施。
- ros_ethercat - 这是对pr2_ethercat主循环的重新实现,不依赖于PR2软件。
- wavemon - 一款基于ncurses的无线网络设备监控应用。
- wireless - 使ROS能够获取无线网络信息。
- ptpd - PTP守护进程(PTPd)是根据IEEE Std 1588-2008标准实现的精确时间协议(PTP)版本2。PTP可为以太网局域网连接的计算机提供精确的时间同步。
- iperf - 一种用于测量TCP、UDP和SCTP网络带宽的工具。
- tcpreplay - 用于pcap文件编辑和重放的工具。
- nethogs - 按进程对带宽进行分组。
- pyshark - tshark的Python封装,允许使用Wireshark解码器进行Python数据包解析。
- pingtop - 同时ping多个服务器,并在类似top的终端界面中显示结果。
- termshark - 一款受Wireshark启发的tshark终端UI。
- udpreplay - 从pcap文件中重放UDP数据包。
- openwifi - 基于软件定义无线电的Linux mac80211兼容全栈IEEE802.11/Wi-Fi设计。
控制器局域网
- awesome CAN - 一个精选的、关于CAN总线工具、硬件和资源的列表。
- AndrOBD - 使用任何ELM327适配器进行Android OBD诊断。
- ddt4all - DDT4All是一款工具,可用于创建自定义的ECU参数界面,并通过廉价的ELM327接口连接到CAN网络。
- cabana - CAN可视化工具及DBC文件生成器。
- opendbc - 该项目旨在 democratize 您爱车解码环的访问权限。
- libuavcan - 一种开源的轻量级协议,专为航空航天和机器人应用设计,可在诸如CAN总线等稳健的车载网络上实现可靠通信。
- python-can - can包为Python开发者提供控制器局域网支持。
- CANopenNode - 国际标准化(EN 50325-4)(CiA301)的基于CAN的嵌入式控制系统高层协议。
- python-udsoncan - UDS(ISO-14229)标准的Python实现。
- uds-c - 统一诊断服务(UDS)和OBD-II(车辆车载诊断)C语言库。
- cantools - Python 3中的CAN总线工具。
- CANdevStudio - CANdevStudio旨在成为CAN仿真软件的经济高效替代品。它可与多种CAN硬件接口配合使用。
- can-utils - Linux-CAN / SocketCAN用户空间应用程序。
- ros_canopen - 面向ROS的CANopen驱动框架。
- decanstructor - 最权威的ROS CAN分析工具。
- kvaser_interface - 该软件包旨在提供一种标准化方式,从ROS中访问Kvaser CAN设备。
- canmatrix - 用于转换CAN数据库格式:.arxml、.dbc、.dbf、.kcd。
- autosar - 一组用于处理AUTOSAR XML文件的Python模块。
- canopen - CANopen标准的Python实现。该项目的目标是通过Python式的接口支持CiA 301标准中最常用的部分。
- SavvyCAN - 基于Qt5的跨平台工具,可用于加载、保存和捕获CAN总线帧。
- Open-Vehicle-Monitoring-System-3 - 该系统可实时监控车辆的各项指标,如电池荷电状态、温度、胎压以及诊断故障信息。
传感器与执行器接口
- Tesla-API - 提供远程监控和控制Model S(以及未来特斯拉车型)的功能。
- flirpy - 一个用于与FLIR热成像相机及图像交互的Python库。
- nerian_stereo - 用于Nerian的SceneScan和SP1双目视觉传感器的ROS节点。
- pymmw - 这是一个由Python脚本组成的工具箱,用于与TI的IWR1443毫米波感知设备评估模块(BoosterPack)进行交互。
- ti_mmwave_rospkg - TI毫米波雷达ROS驱动程序(包含传感器融合和混合功能)。
- pacmod3 - 该ROS节点旨在让用户通过PACMod线控系统(板卡版本3)来控制车辆。
- ros2_intel_realsense - 这些是用于在ROS2中使用Intel RealSense相机(D400系列)的软件包。
- sick_scan - 该栈提供适用于SICK TiM系列激光扫描仪的ROS2驱动程序。
- ouster_example - 用于连接和配置OS1、读取及可视化数据,并与ROS对接的示例代码。
- ros2_ouster_drivers - 这些是Ouster OS-1 3D激光雷达的ROS2驱动程序实现。
- livox_ros_driver - 一个新的ROS软件包,专门用于连接Livox生产的激光雷达产品。
- velodyne - 一组支持Velodyne高精度3D激光雷达的ROS软件包。
- ublox - 提供对u-blox GPS接收器的支持。
- crazyflie_ros - Bitcraze Crazyflie的ROS驱动程序。
- pointgrey_camera_driver - 基于官方FlyCapture2 SDK的Pt. Grey相机ROS驱动程序。
- novatel_gps_driver - NovAtel GPS/GNSS接收器的ROS驱动程序。
- pylon-ros-camera - Basler GigE Vision和USB3 Vision相机的官方pylon ROS驱动程序。
- ethz_piksi_ros - 包含用于在ROS中使用Piksi实时动态定位(RTK)GPS设备的(Python)ROS驱动程序、工具、启动文件以及相关维基文档。
- sick_safetyscanners - 一个ROS驱动程序,用于读取SICK安全扫描仪的原始数据,并将其以laser_scan消息的形式发布。
- bosch_imu_driver - Bosch BNO055 IMU传感器的驱动程序。仅实现了UART通信接口(需选择正确的传感器模式)。
- oxford_gps_eth - 使用NCOM数据包结构为OxTS GPS接收器提供的以太网接口。
- ifm3d - 用于操作ifm基于pmd技术的3D ToF相机的库和实用工具。
- cepton_sdk_redist - 为Cepton激光雷达提供ROS支持。
- jetson_csi_cam - 一个ROS软件包,使用户能够轻松地在Nvidia Jetson TK1、TX1或TX2上使用CSI摄像头并与ROS集成。
- ros_astra_camera - Orbbec 3D相机的ROS驱动程序。
- spot_ros - Spot机器人的ROS驱动程序。
- blickfeld-scanner-lib - 一个跨平台库,用于与Blickfeld GmbH的激光雷达设备进行通信。
- TauLidarCamera - 用于构建基于Tau LiDAR Camera应用的主机端API。
安全
- owasp-threat-dragon-desktop - Threat Dragon 是一款免费、开源、跨平台的威胁建模应用,支持系统绘图和规则引擎,可自动生成威胁与缓解措施。
- launch_ros_sandbox - 可以定义在受限环境中运行节点的启动文件,例如 Docker 容器或具有有限权限的独立用户账户。
- wolfssl - 一个小型、快速、可移植的 TLS/SSL 实现,适用于从嵌入式设备到云端的各种场景。
- CANalyzat0r - 针对专有汽车协议的安全分析工具包。
- RSF - 机器人安全框架 (RSF) 是一种用于执行机器人安全评估的标准化方法论。
- How-to-Secure-A-Linux-Server - 一份不断更新的 Linux 服务器安全指南。
- lynis - 适用于 Linux、macOS 和基于 UNIX 的系统的安全审计工具。有助于合规性测试(HIPAA/ISO27001/PCI DSS)和系统加固。
- OpenVPN - 一个开源的 VPN 守护进程。
- openfortivpn - 一个用于 PPP+SSL VPN 隧道服务的客户端,兼容 Fortinet VPN。
- WireGuard - WireGuard 是一种创新的 VPN,直接运行在 Linux 内核中,并采用最先进的密码学技术。
- ssh-auditor - 扫描您网络中的弱 SSH 密码。
- vulscan - 使用 Nmap NSE 进行高级漏洞扫描。
- nmap-vulners - 基于 Vulners.com API 的 NSE 脚本。
- brutespray - 自动尝试针对发现的服务使用默认凭据。
- fail2ban - 一个守护进程,用于封禁多次认证失败的主机。
- DependencyCheck - 一款软件成分分析工具,可检测应用程序依赖项中公开披露的漏洞。
- Firejail - 一个 SUID 沙箱程序,通过使用 Linux 命名空间、seccomp-bpf 和 Linux 功能集来限制不受信任应用程序的运行环境,从而降低安全漏洞的风险。
- RVD - 机器人漏洞数据库。由社区贡献的机器人漏洞与弱点档案。
- ros2_dds_security - 通过定义服务插件接口 (SPI) 架构、一组内置的 SPI 实现以及由 SPI 强制实施的安全模型,来增强安全性。
- Security-Enhanced Linux - 一个 Linux 内核安全模块,提供支持访问控制安全策略的机制,包括强制访问控制 (MAC)。
- OpenTitan - 将使硅根信任的设计和实现更加透明、可信且安全,适用于企业、平台提供商和芯片制造商。OpenTitan 由 lowRISC CIC 管理,作为一个协作项目,旨在生成高质量的开放 IP,以便作为功能齐全的产品进行部署。
- bandit - 一个用于查找 Python 代码中常见安全问题的工具。
- hardening - 一种快速提升 Ubuntu 服务器安全性的方法。
- Passbolt - Passbolt 是一款免费且开源的密码管理器,允许团队成员安全地存储和共享凭据。
- gopass - 一个用 Go 编写的命令行密码管理器。
- pass - 标准的 Unix 密码管理器。
- Vault - 一个用于安全访问机密信息的工具。机密是指任何需要严格控制访问权限的内容,例如 API 密钥、密码、证书等。
- legion - 一个开源、易用、高度可扩展且半自动化的网络渗透测试框架,有助于信息系统的发现、侦察和利用。
- openscap - oscap 程序是一个命令行工具,允许用户加载、扫描、验证、编辑和导出 SCAP 文档。
数据集
- Papers With Code - Papers With Code 提供的数千个机器学习数据集。
- KITTI-360 - 这个大规模数据集包含 32 万张图像和 10 万次激光扫描,覆盖 73.7 公里的行驶距离。
- waymo_ros - 这是一个用于将 Waymo 开放数据集连接到 ROS 的 ROS 包。
- waymo-open-dataset - Waymo 开放数据集由 Waymo 自动驾驶汽车在各种条件下收集的高分辨率传感器数据组成。
- 福特自动驾驶车辆数据集 - 福特提供了一个具有挑战性的多智能体季节性数据集,该数据集由福特自动驾驶车队在不同日期和时间收集而成。
- awesome-robotics-datasets - 面向机器人技术和计算机视觉的实用数据集合集。
- nuscenes-devkit - nuScenes 数据集的开发工具包。
- dataset-api - 这是 ApolloScape 数据集、CVPR 2019 自动驾驶挑战研讨会以及 ECCV 2018 挑战赛的工具库仓库。
- utbm_robocar_dataset - 用于自动驾驶的欧盟长期多传感器数据集。
- DBNet - 用于驾驶行为学习的大规模数据集。
- argoverse-api - Argoverse 数据集的官方 GitHub 仓库。
- DDAD - 来自 TRI(丰田研究院)的新型自动驾驶基准测试,适用于在复杂多样的城市环境中进行远距离(最远 250 米)和密集深度估计。
- pandaset-devkit - Hesai 和 Scale 提供的面向自动驾驶的公开大规模数据集。
- a2d2_to_ros - 用于将 A2D2 数据集转换为 ROS bag 文件的工具。
- awesome-satellite-imagery-datasets - 计算机视觉和深度学习用带标注的卫星图像训练数据集列表。
- sentinelsat - 搜索和下载哥白尼哨兵卫星图像。
- adas-dataset-form - 用于算法训练的热成像数据集。
- h3d - H3D 是本田提供的一个大规模全环绕 3D 多目标检测与跟踪数据集。
- Mapillary Vistas 数据集 - 一个多样化的街景图像数据集,带有像素级精确且针对特定实例的人工标注,用于理解全球各地的街景。
- TensorFlow 数据集 - TensorFlow 数据集提供了许多公共数据集,以 tf.data.Dataset 格式呈现。
- racetrack-database - 包含来自全球超过 20 条赛道(主要为 F1 和 DTM)的中心线(x 和 y 坐标)、赛道宽度及理想行驶路线。
- BlenderProc - 一种基于程序化方法的 Blender 工作流,用于生成照片级真实的训练图像。
- Atlatec 样本地图数据 - 仅使用两台相机和 GPS,在旧金山市中心创建的用于自动驾驶和仿真的 3D 地图。
- Lyft Level 5 数据集 - Level 5 正在为 Lyft 网络开发自动驾驶系统。我们正在收集和处理来自自动驾驶车队的数据,并与您共享。
- holicity - 用于学习整体 3D 结构的城市尺度数据平台。
- UTD19 - 目前公开的最大多城市交通数据集。
- ASTYX HIRES2019 DATASET - 用于基于深度学习的 3D 物体检测的汽车雷达数据集。
- Objectron - 一系列以物体为中心的短视频片段,附带 AR 会话元数据,包括相机姿态、稀疏点云以及周围环境平面表面的特征描述。
- ONCE 数据集 - 一个包含 2D 和 3D 物体标注的大规模自动驾驶数据集。
脚注
感谢 xpp 团队制作了我们使用的这张精彩 GIF。
相似工具推荐
openclaw
OpenClaw 是一款专为个人打造的本地化 AI 助手,旨在让你在自己的设备上拥有完全可控的智能伙伴。它打破了传统 AI 助手局限于特定网页或应用的束缚,能够直接接入你日常使用的各类通讯渠道,包括微信、WhatsApp、Telegram、Discord、iMessage 等数十种平台。无论你在哪个聊天软件中发送消息,OpenClaw 都能即时响应,甚至支持在 macOS、iOS 和 Android 设备上进行语音交互,并提供实时的画布渲染功能供你操控。 这款工具主要解决了用户对数据隐私、响应速度以及“始终在线”体验的需求。通过将 AI 部署在本地,用户无需依赖云端服务即可享受快速、私密的智能辅助,真正实现了“你的数据,你做主”。其独特的技术亮点在于强大的网关架构,将控制平面与核心助手分离,确保跨平台通信的流畅性与扩展性。 OpenClaw 非常适合希望构建个性化工作流的技术爱好者、开发者,以及注重隐私保护且不愿被单一生态绑定的普通用户。只要具备基础的终端操作能力(支持 macOS、Linux 及 Windows WSL2),即可通过简单的命令行引导完成部署。如果你渴望拥有一个懂你
stable-diffusion-webui
stable-diffusion-webui 是一个基于 Gradio 构建的网页版操作界面,旨在让用户能够轻松地在本地运行和使用强大的 Stable Diffusion 图像生成模型。它解决了原始模型依赖命令行、操作门槛高且功能分散的痛点,将复杂的 AI 绘图流程整合进一个直观易用的图形化平台。 无论是希望快速上手的普通创作者、需要精细控制画面细节的设计师,还是想要深入探索模型潜力的开发者与研究人员,都能从中获益。其核心亮点在于极高的功能丰富度:不仅支持文生图、图生图、局部重绘(Inpainting)和外绘(Outpainting)等基础模式,还独创了注意力机制调整、提示词矩阵、负向提示词以及“高清修复”等高级功能。此外,它内置了 GFPGAN 和 CodeFormer 等人脸修复工具,支持多种神经网络放大算法,并允许用户通过插件系统无限扩展能力。即使是显存有限的设备,stable-diffusion-webui 也提供了相应的优化选项,让高质量的 AI 艺术创作变得触手可及。
everything-claude-code
everything-claude-code 是一套专为 AI 编程助手(如 Claude Code、Codex、Cursor 等)打造的高性能优化系统。它不仅仅是一组配置文件,而是一个经过长期实战打磨的完整框架,旨在解决 AI 代理在实际开发中面临的效率低下、记忆丢失、安全隐患及缺乏持续学习能力等核心痛点。 通过引入技能模块化、直觉增强、记忆持久化机制以及内置的安全扫描功能,everything-claude-code 能显著提升 AI 在复杂任务中的表现,帮助开发者构建更稳定、更智能的生产级 AI 代理。其独特的“研究优先”开发理念和针对 Token 消耗的优化策略,使得模型响应更快、成本更低,同时有效防御潜在的攻击向量。 这套工具特别适合软件开发者、AI 研究人员以及希望深度定制 AI 工作流的技术团队使用。无论您是在构建大型代码库,还是需要 AI 协助进行安全审计与自动化测试,everything-claude-code 都能提供强大的底层支持。作为一个曾荣获 Anthropic 黑客大奖的开源项目,它融合了多语言支持与丰富的实战钩子(hooks),让 AI 真正成长为懂上
ComfyUI
ComfyUI 是一款功能强大且高度模块化的视觉 AI 引擎,专为设计和执行复杂的 Stable Diffusion 图像生成流程而打造。它摒弃了传统的代码编写模式,采用直观的节点式流程图界面,让用户通过连接不同的功能模块即可构建个性化的生成管线。 这一设计巧妙解决了高级 AI 绘图工作流配置复杂、灵活性不足的痛点。用户无需具备编程背景,也能自由组合模型、调整参数并实时预览效果,轻松实现从基础文生图到多步骤高清修复等各类复杂任务。ComfyUI 拥有极佳的兼容性,不仅支持 Windows、macOS 和 Linux 全平台,还广泛适配 NVIDIA、AMD、Intel 及苹果 Silicon 等多种硬件架构,并率先支持 SDXL、Flux、SD3 等前沿模型。 无论是希望深入探索算法潜力的研究人员和开发者,还是追求极致创作自由度的设计师与资深 AI 绘画爱好者,ComfyUI 都能提供强大的支持。其独特的模块化架构允许社区不断扩展新功能,使其成为当前最灵活、生态最丰富的开源扩散模型工具之一,帮助用户将创意高效转化为现实。
gemini-cli
gemini-cli 是一款由谷歌推出的开源 AI 命令行工具,它将强大的 Gemini 大模型能力直接集成到用户的终端环境中。对于习惯在命令行工作的开发者而言,它提供了一条从输入提示词到获取模型响应的最短路径,无需切换窗口即可享受智能辅助。 这款工具主要解决了开发过程中频繁上下文切换的痛点,让用户能在熟悉的终端界面内直接完成代码理解、生成、调试以及自动化运维任务。无论是查询大型代码库、根据草图生成应用,还是执行复杂的 Git 操作,gemini-cli 都能通过自然语言指令高效处理。 它特别适合广大软件工程师、DevOps 人员及技术研究人员使用。其核心亮点包括支持高达 100 万 token 的超长上下文窗口,具备出色的逻辑推理能力;内置 Google 搜索、文件操作及 Shell 命令执行等实用工具;更独特的是,它支持 MCP(模型上下文协议),允许用户灵活扩展自定义集成,连接如图像生成等外部能力。此外,个人谷歌账号即可享受免费的额度支持,且项目基于 Apache 2.0 协议完全开源,是提升终端工作效率的理想助手。
markitdown
MarkItDown 是一款由微软 AutoGen 团队打造的轻量级 Python 工具,专为将各类文件高效转换为 Markdown 格式而设计。它支持 PDF、Word、Excel、PPT、图片(含 OCR)、音频(含语音转录)、HTML 乃至 YouTube 链接等多种格式的解析,能够精准提取文档中的标题、列表、表格和链接等关键结构信息。 在人工智能应用日益普及的今天,大语言模型(LLM)虽擅长处理文本,却难以直接读取复杂的二进制办公文档。MarkItDown 恰好解决了这一痛点,它将非结构化或半结构化的文件转化为模型“原生理解”且 Token 效率极高的 Markdown 格式,成为连接本地文件与 AI 分析 pipeline 的理想桥梁。此外,它还提供了 MCP(模型上下文协议)服务器,可无缝集成到 Claude Desktop 等 LLM 应用中。 这款工具特别适合开发者、数据科学家及 AI 研究人员使用,尤其是那些需要构建文档检索增强生成(RAG)系统、进行批量文本分析或希望让 AI 助手直接“阅读”本地文件的用户。虽然生成的内容也具备一定可读性,但其核心优势在于为机器
