pybullet-gym

881 127 简单 1 次阅读 3周前NOASSERTION开发框架其他

AI 解读由 AI 自动生成，仅供参考

pybullet-gym 是一个开源项目，旨在为 OpenAI Gym 强化学习平台提供免费的 MuJoCo 环境替代实现。在强化学习研究中，许多高难度的连续控制任务通常依赖 MuJoCo 物理引擎，但该软件属于商业性质，免费试用期仅 30 天，这给学术研究和算法复现带来了门槛。pybullet-gym 通过使用完全开源免费的 Bullet Physics 引擎（经由 pybullet 封装）重新构建了这些经典环境，让用户无需购买许可证即可无缝接入 OpenAI Gym 框架进行训练和测试。

该项目非常适合强化学习研究人员、算法开发者以及高校师生使用，尤其是那些希望降低研究成本、避免商业软件授权限制的用户。其技术亮点在于不仅完整复刻了倒立摆、行走机器人、蚂蚁等多个标准测试环境，还预置了经过训练的代理模型作为基准参考，方便用户快速验证算法效果或进行对比实验。此外，部分环境已与 Tensorforce 等主流强化学习库集成，支持开箱即用的训练流程。通过消除商业壁垒，pybullet-gym 有效促进了开放科研生态的发展，让全球研究者能更公平地获取高质量的仿真工具。

使用场景

某高校强化学习实验室的研究团队正致力于开发新型连续控制算法，需要在多种物理环境中进行大规模训练与对比实验。

没有 pybullet-gym 时

高昂的授权门槛：复现经典的 MuJoCo 环境（如 HalfCheetah、Ant）必须购买商业许可证，否则每 30 天需重新激活，严重阻碍长期实验。
环境配置繁琐：团队成员需各自处理复杂的 MuJoCo 安装依赖，不同操作系统下的兼容性问题导致“在我机器上能跑”的协作困境。
基线对比困难：由于缺乏免费且统一的预训练模型，研究人员难以快速验证新算法是否优于现有基准，拖慢了论文迭代速度。
研究复现受阻：外部合作者或开源社区成员因无法承担软件费用，难以复现和验证该团队发表的实验结果，降低了研究的透明度。

使用 pybullet-gym 后

零成本无缝替换：直接调用基于 Bullet Physics 重构的免费环境（如 HalfCheetahPyBulletEnv-v0），无需任何许可证即可无限期运行，彻底消除经济壁垒。
开箱即用的集成：环境与 OpenAI Gym 框架完美兼容，团队成员只需一行代码即可切换后端，统一了开发环境，大幅减少配置时间。
内置预训练代理：利用工具自带的预训练模型作为即时基线（Baseline），研究人员可立即评估新算法性能，显著缩短实验验证周期。
促进开放协作：生成的代码和环境配置对全球研究者完全开放，任何人皆可免费复现实验，极大提升了成果的传播力与公信力。

pybullet-gym 通过提供免费、高保真的物理环境替代方案，让强化学习研究从商业授权的束缚中解放出来，真正实现了开放科学的愿景。

运行环境要求

操作系统

Linux
Windows
macOS

GPU

未说明

内存

未说明

依赖

notes安装时请勿使用 'python setup.py install' 命令，否则会导致资产文件（如 SDF 文件）缺失从而引发错误；该工具旨在作为 MuJoCo 的免费开源替代方案，用于强化学习环境仿真。

gym

pybullet

pip>=1.5.0

快速开始

PyBullet Gymperium

PyBullet Gymperium 是 OpenAI Gym MuJoCo 环境的一个开源实现，用于与 OpenAI Gym 强化学习研究平台一起使用，以支持开放研究。

OpenAI Gym 目前是开发和比较强化学习算法最常用的工具包之一。然而，对于一些具有挑战性的连续控制环境，它要求用户安装 MuJoCo——一款需要许可证才能运行超过 30 天的商业物理引擎。这种商业壁垒阻碍了开放研究，尤其是在存在其他合适的物理引擎的情况下。本仓库提供了原始 MuJoCo 环境的替代实现，可以免费使用。这些环境使用 BulletPhysics 的 Python 封装 pybullet 重新实现，从而能够无缝集成到 OpenAI Gym 框架中。为了展示新环境的可用性，来自 Tensorforce 强化学习库的几个 RL 代理被配置为开箱即用即可训练。为了简化对已实现环境的研究，每个环境都配备了预训练好的代理，它们既可作为实现的单元测试，也可以作为其他用途的基准。

如果您在研究中发现我们的工作有所帮助，请考虑按以下方式引用：

@misc {benelot2018, author = {Benjamin Ellenberger}, title = {PyBullet Gymperium}, howpublished = {\url{ https://github.com/benelot/pybullet-gym}} , year = {2018--2019} }

实现状态

环境名称	已实现	与参考实现相似	是否有预训练代理
RoboSchool 环境
InvertedPendulumPyBulletEnv-v0	是	是	否
InvertedDoublePendulumPyBulletEnv-v0	是	是	否
InvertedPendulumSwingupPyBulletEnv-v0	是	是	否
ReacherPyBulletEnv-v0	是	是	否
Walker2DPyBulletEnv-v0	是	否	否
HalfCheetahPyBulletEnv-v0	是	否	否
AntPyBulletEnv-v0	是	是	否
HopperPyBulletEnv-v0	是	是	否
HumanoidPyBulletEnv-v0	是	是	否
HumanoidFlagrunPyBulletEnv-v0	是	是	否
HumanoidFlagrunHarderPyBulletEnv-v0	是	是	否
AtlasPyBulletEnv-v0	开发中	否	否
PusherPyBulletEnv-v0	开发中	否	否
ThrowerPyBulletEnv-v0	开发中	否	否
StrikerPyBulletEnv-v0	开发中	否	否
MuJoCo 环境
InvertedPendulumMuJoCoEnv-v0	是	是	是
InvertedDoublePendulumMuJoCoEnv-v0	是	是	是
ReacherMuJoCoEnv-v0	否	否	否
Walker2DMuJoCoEnv-v0	是	否	否
HalfCheetahMuJoCoEnv-v0	是	否	否
AntMuJoCoEnv-v0	是	否	否
HopperMuJoCoEnv-v0	是	否	否
HumanoidMuJoCoEnv-v0	是	否	否
PusherMuJoCoEnv-v0	否	否	否
ThrowerMuJoCoEnv-v0	否	否	否
StrikerMuJoCoEnv-v0	否	否	否

[请参阅下方“新增内容”部分](#What's New)

基础知识

（摘自 OpenAI Gym 的 README）

强化学习中有两个基本概念：环境（即外部世界）和代理（即您编写的算法）。代理向环境发送“动作”，而环境则返回“观测”和“奖励”（即得分）。

gym 的核心接口是 Env <https://github.com/openai/gym/blob/master/gym/core.py>_，它是统一的环境接口。代理没有专门的接口；这部分由您自行处理。以下是您应该了解的 Env 方法：

reset(self): 重置环境的状态。返回 observation。
step(self, action): 让环境向前推进一个时间步。返回 observation, reward, done, info。
render(self, mode='human', close=False): 渲染环境的一帧画面。默认模式会执行对人类友好的操作，例如弹出一个窗口。传递 close 标志表示渲染器应关闭任何此类窗口。

除了强化学习的基本概念之外，本框架还将环境的概念扩展为两个子概念：机器人（代理可以直接控制的身体）和场景（代理所交互的一切事物）。以这种方式实现 RL 环境，使我们能够切换环境中的不同部分，从而生成新的机器人-场景组合。

安装 Pybullet-Gym

首先，您可以进行 OpenAI Gym 的最小化安装：

git clone https://github.com/openai/gym.git
cd gym
pip install -e .

然后，安装 Pybullet-Gym 最简单的方法是克隆仓库并在本地安装：

git clone https://github.com/benelot/pybullet-gym.git
cd pybullet-gym
pip install -e .

重要提示：请勿使用 python setup.py install，因为这不会复制资源文件（您可能会遇到缺少 SDF 文件的错误）。

最后，要测试安装情况，打开 Python 并运行：

import gym  # open ai gym
import pybulletgym  # 将 PyBullet 环境注册到 open ai gym

env = gym.make('HumanoidPyBulletEnv-v0')
# env.render() # 如果您想看到显示环境的窗口，请在 env.reset 之前调用此方法
env.reset()  # 如果一切正常，应该返回一个状态向量

支持的系统

我们目前支持运行 Python 2.7 或 3.5 的 Linux、Windows 和 OS X。

要运行 pip install -e '.[all]'，您需要一个较新的 pip 版本。请确保您的 pip 至少为版本 1.5.0。您可以通过以下命令升级：pip install --ignore-installed pip。或者，您也可以打开 setup.py <https://github.com/openai/gym/blob/master/setup.py>_ 并手动安装依赖项。

代理

作为对环境的一种单元测试，我们为每个环境提供了预训练好的代理。RoboSchool 和 MuJoCo 环境的代理分别是在 RoboSchool 和 MuJoCo 的原始实现上训练得到的。

环境

每个环境组的代码都位于其各自的子目录 gym/envs <https://github.com/openai/gym/blob/master/gym/envs>_ 中。每个任务的规范都在 gym/envs/__init__.py <https://github.com/openai/gym/blob/master/gym/envs/__init__.py>_ 中。值得浏览这两处内容。

新内容

2018-01-09 Pybullet-gym 正式诞生。

路线图

[ROBOSCHOOL GYMS] 当前的环境是移植到 pybullet 上的 roboschool 环境。到目前为止，大多数环境都能正常工作，除了 manipulator 环境中的 striker、pusher 和 thrower，这些环境中机器人未能正确加载。这个问题需要与 Erwin Coumans 一起解决。
[OPENAI MUJOCO GYMS] 我很快将开始移植 OpenAI 的环境，但不幸的是，这些环境的观测（可能还有动作）向量略有不同。我可以快速搭建起所有环境，但要弄清楚 mujoco 中某些观测的具体含义以及它们在 pybullet 中对应的表示，则需要花费一些时间。有些观测可能在 pybullet 中并未暴露，届时我们可以提出需求；而对于另一些观测，在 mujoco 中究竟是什么含义，目前也很难确定。
[OPENAI ROBOTICS GYMS] 接下来将是 OpenAI 中的 robotics 环境。这些模拟场景尤为复杂，可能需要进行大量调优才能在 pybullet 中成功运行。
[DEEPMIND CONTROL SUITE] 最后是 Deepmind Control Suite，这是一组同样基于 mujoco 的环境，也需要被移植出来。

PyBullet Gym 快速上手指南

PyBullet Gymperium 是 OpenAI Gym MuJoCo 环境的开源实现，旨在使用免费的 Bullet 物理引擎替代商业授权的 MuJoCo，从而降低强化学习研究的门槛。它无缝集成到 OpenAI Gym 框架中，提供了多种连续控制环境。

环境准备

在开始之前，请确保您的系统满足以下要求：

操作系统：支持 Linux、Windows 或 macOS。
Python 版本：Python 2.7 或 Python 3.5+（推荐使用 Python 3.6+ 以获得更好的兼容性）。
前置依赖：
- pip 版本需至少为 1.5.0。如需升级，可运行：
```
pip install --ignore-installed pip
```
- 建议先安装基础的 OpenAI Gym 库。

提示：国内开发者在安装 Python 依赖时，推荐使用清华或阿里镜像源以加速下载。例如：pip install -i https://pypi.tuna.tsinghua.edu.cn/simple ...

安装步骤

请按照以下顺序执行命令进行安装。注意：切勿使用 python setup.py install，否则会导致资源文件（如 SDF 文件）缺失。

1. 安装 OpenAI Gym (基础依赖)

首先克隆并安装最小化的 OpenAI Gym：

git clone https://github.com/openai/gym.git
cd gym
pip install -e .

(国内加速可选):

git clone https://gitee.com/mirrors/gym.git # 如果存在镜像
cd gym
pip install -e . -i https://pypi.tuna.tsinghua.edu.cn/simple

2. 安装 PyBullet Gym

克隆本仓库并进行本地安装：

cd .. # 返回上一级目录
git clone https://github.com/benelot/pybullet-gym.git
cd pybullet-gym
pip install -e .

(国内加速可选):

git clone https://gitee.com/mirrors/pybullet-gym.git # 假设存在镜像，否则使用原地址
cd pybullet-gym
pip install -e . -i https://pypi.tuna.tsinghua.edu.cn/simple

3. 验证安装

打开 Python 交互式终端，运行以下代码测试环境是否注册成功：

import gym
import pybulletgym

# 创建一个环境实例
env = gym.make('HumanoidPyBulletEnv-v0')

# 重置环境，若返回状态向量则说明安装成功
observation = env.reset()
print("Installation successful! Observation shape:", observation.shape)

# 可选：渲染画面（需在支持图形界面的环境中运行）
# env.render()

基本使用

PyBullet Gym 的使用方式与标准的 OpenAI Gym 完全一致。核心概念包括环境（Environment）和智能体（Agent）。

核心接口

env.reset(): 重置环境状态，返回初始观测值 (observation)。
env.step(action): 执行一步动作，返回 (observation, reward, done, info)。
env.render(): 渲染当前帧（默认弹出窗口显示）。

最小运行示例

以下是一个简单的随机动作测试脚本：

import gym
import pybulletgym

# 1. 创建环境 (可选环境见 README 表格，如 InvertedPendulumPyBulletEnv-v0)
env = gym.make('InvertedPendulumPyBulletEnv-v0')

# 2. 重置环境
observation = env.reset()

# 3. 运行循环
for _ in range(1000):
    # 渲染画面 (如果需要可视化)
    env.render()
    
    # 生成随机动作
    action = env.action_space.sample()
    
    # 执行动作
    observation, reward, done, info = env.step(action)
    
    # 如果回合结束，重置环境
    if done:
        observation = env.reset()

env.close()

可用环境列表

部分常用已实现环境如下：

环境名称	状态	备注
`InvertedPendulumPyBulletEnv-v0`	✅ 可用	倒立摆
`HalfCheetahPyBulletEnv-v0`	✅ 可用	半猎豹 (与 MuJoCo 实现略有差异)
`HopperPyBulletEnv-v0`	✅ 可用	单足跳机器人
`Walker2DPyBulletEnv-v0`	✅ 可用	双足行走机器人
`AntPyBulletEnv-v0`	✅ 可用	四足蚂蚁机器人
`HumanoidPyBulletEnv-v0`	✅ 可用	人形机器人

注：部分复杂操作臂环境（如 Pusher, Thrower）目前仍在开发中 (WIP)。

常见问题

安装 pybullet-gym 时遇到与 pybullet 2.6.0 版本不兼容的 ImportError 错误怎么办？

为什么调用 env.render() 后窗口没有显示或无法渲染环境？

训练后的代理在测试时无法渲染环境（窗口不显示但不报错）是什么原因？

倒立摆环境（inverted_pendulum_env.py）中的终止条件（done）逻辑是否正确？

相似工具推荐

openclaw

OpenClaw 是一款专为个人打造的本地化 AI 助手，旨在让你在自己的设备上拥有完全可控的智能伙伴。它打破了传统 AI 助手局限于特定网页或应用的束缚，能够直接接入你日常使用的各类通讯渠道，包括微信、WhatsApp、Telegram、Discord、iMessage 等数十种平台。无论你在哪个聊天软件中发送消息，OpenClaw 都能即时响应，甚至支持在 macOS、iOS 和 Android 设备上进行语音交互，并提供实时的画布渲染功能供你操控。这款工具主要解决了用户对数据隐私、响应速度以及“始终在线”体验的需求。通过将 AI 部署在本地，用户无需依赖云端服务即可享受快速、私密的智能辅助，真正实现了“你的数据，你做主”。其独特的技术亮点在于强大的网关架构，将控制平面与核心助手分离，确保跨平台通信的流畅性与扩展性。 OpenClaw 非常适合希望构建个性化工作流的技术爱好者、开发者，以及注重隐私保护且不愿被单一生态绑定的普通用户。只要具备基础的终端操作能力（支持 macOS、Linux 及 Windows WSL2），即可通过简单的命令行引导完成部署。如果你渴望拥有一个懂你

★ 349.3k|★★★☆☆|2周前

Agent开发框架图像

n8n

n8n 是一款面向技术团队的公平代码（fair-code）工作流自动化平台，旨在让用户在享受低代码快速构建便利的同时，保留编写自定义代码的灵活性。它主要解决了传统自动化工具要么过于封闭难以扩展、要么完全依赖手写代码效率低下的痛点，帮助用户轻松连接 400 多种应用与服务，实现复杂业务流程的自动化。 n8n 特别适合开发者、工程师以及具备一定技术背景的业务人员使用。其核心亮点在于“按需编码”：既可以通过直观的可视化界面拖拽节点搭建流程，也能随时插入 JavaScript 或 Python 代码、调用 npm 包来处理复杂逻辑。此外，n8n 原生集成了基于 LangChain 的 AI 能力，支持用户利用自有数据和模型构建智能体工作流。在部署方面，n8n 提供极高的自由度，支持完全自托管以保障数据隐私和控制权，也提供云端服务选项。凭借活跃的社区生态和数百个现成模板，n8n 让构建强大且可控的自动化系统变得简单高效。

★ 184.7k|★★☆☆☆|今天

数据工具开发框架Agent

AutoGPT

AutoGPT 是一个旨在让每个人都能轻松使用和构建 AI 的强大平台，核心功能是帮助用户创建、部署和管理能够自动执行复杂任务的连续型 AI 智能体。它解决了传统 AI 应用中需要频繁人工干预、难以自动化长流程工作的痛点，让用户只需设定目标，AI 即可自主规划步骤、调用工具并持续运行直至完成任务。无论是开发者、研究人员，还是希望提升工作效率的普通用户，都能从 AutoGPT 中受益。开发者可利用其低代码界面快速定制专属智能体；研究人员能基于开源架构探索多智能体协作机制；而非技术背景用户也可直接选用预置的智能体模板，立即投入实际工作场景。 AutoGPT 的技术亮点在于其模块化“积木式”工作流设计——用户通过连接功能块即可构建复杂逻辑，每个块负责单一动作，灵活且易于调试。同时，平台支持本地自托管与云端部署两种模式，兼顾数据隐私与使用便捷性。配合完善的文档和一键安装脚本，即使是初次接触的用户也能在几分钟内启动自己的第一个 AI 智能体。AutoGPT 正致力于降低 AI 应用门槛，让人人都能成为 AI 的创造者与受益者。

★ 183.6k|★★★☆☆|今天

Agent语言模型插件

stable-diffusion-webui

stable-diffusion-webui 是一个基于 Gradio 构建的网页版操作界面，旨在让用户能够轻松地在本地运行和使用强大的 Stable Diffusion 图像生成模型。它解决了原始模型依赖命令行、操作门槛高且功能分散的痛点，将复杂的 AI 绘图流程整合进一个直观易用的图形化平台。无论是希望快速上手的普通创作者、需要精细控制画面细节的设计师，还是想要深入探索模型潜力的开发者与研究人员，都能从中获益。其核心亮点在于极高的功能丰富度：不仅支持文生图、图生图、局部重绘（Inpainting）和外绘（Outpainting）等基础模式，还独创了注意力机制调整、提示词矩阵、负向提示词以及“高清修复”等高级功能。此外，它内置了 GFPGAN 和 CodeFormer 等人脸修复工具，支持多种神经网络放大算法，并允许用户通过插件系统无限扩展能力。即使是显存有限的设备，stable-diffusion-webui 也提供了相应的优化选项，让高质量的 AI 艺术创作变得触手可及。

★ 162.1k|★★★☆☆|2周前

开发框架图像Agent

everything-claude-code

everything-claude-code 是一套专为 AI 编程助手（如 Claude Code、Codex、Cursor 等）打造的高性能优化系统。它不仅仅是一组配置文件，而是一个经过长期实战打磨的完整框架，旨在解决 AI 代理在实际开发中面临的效率低下、记忆丢失、安全隐患及缺乏持续学习能力等核心痛点。通过引入技能模块化、直觉增强、记忆持久化机制以及内置的安全扫描功能，everything-claude-code 能显著提升 AI 在复杂任务中的表现，帮助开发者构建更稳定、更智能的生产级 AI 代理。其独特的“研究优先”开发理念和针对 Token 消耗的优化策略，使得模型响应更快、成本更低，同时有效防御潜在的攻击向量。这套工具特别适合软件开发者、AI 研究人员以及希望深度定制 AI 工作流的技术团队使用。无论您是在构建大型代码库，还是需要 AI 协助进行安全审计与自动化测试，everything-claude-code 都能提供强大的底层支持。作为一个曾荣获 Anthropic 黑客大奖的开源项目，它融合了多语言支持与丰富的实战钩子（hooks），让 AI 真正成长为懂上

★ 161.7k|★★☆☆☆|今天

开发框架Agent语言模型

ComfyUI

ComfyUI 是一款功能强大且高度模块化的视觉 AI 引擎，专为设计和执行复杂的 Stable Diffusion 图像生成流程而打造。它摒弃了传统的代码编写模式，采用直观的节点式流程图界面，让用户通过连接不同的功能模块即可构建个性化的生成管线。这一设计巧妙解决了高级 AI 绘图工作流配置复杂、灵活性不足的痛点。用户无需具备编程背景，也能自由组合模型、调整参数并实时预览效果，轻松实现从基础文生图到多步骤高清修复等各类复杂任务。ComfyUI 拥有极佳的兼容性，不仅支持 Windows、macOS 和 Linux 全平台，还广泛适配 NVIDIA、AMD、Intel 及苹果 Silicon 等多种硬件架构，并率先支持 SDXL、Flux、SD3 等前沿模型。无论是希望深入探索算法潜力的研究人员和开发者，还是追求极致创作自由度的设计师与资深 AI 绘画爱好者，ComfyUI 都能提供强大的支持。其独特的模块化架构允许社区不断扩展新功能，使其成为当前最灵活、生态最丰富的开源扩散模型工具之一，帮助用户将创意高效转化为现实。

★ 109.2k|★★☆☆☆|2天前

开发框架图像Agent