SMARTS

1.1k 219 较难 1 次阅读 6天前MITAgent

AI 解读由 AI 自动生成，仅供参考

SMARTS 是一个专为自动驾驶研究打造的可扩展多智能体强化学习仿真平台，由华为诺亚方舟实验室开发。它主要解决了自动驾驶算法在真实世界中难以低成本、安全地获取多样化交通交互数据的难题。通过构建高度逼真且充满不确定性的虚拟交通环境，SMARTS 让多个智能体（如车辆）能够在复杂的动态场景中进行大规模训练与测试，从而显著提升算法应对突发状况的能力。

这款工具特别适合人工智能研究人员、自动驾驶算法工程师以及高校学者使用。如果你正在探索多智能体协作、博弈策略或端到端驾驶模型，SMARTS 能提供丰富的场景库和灵活的接口支持。其核心技术亮点在于“可扩展性”与“交互多样性”：它不仅支持从单车智能到复杂车流的全尺度模拟，还能生成大量非玩家角色（NPC）来模拟真实人类驾驶员的行为特征，甚至允许用户自定义交通流规则。作为 XingTian 强化学习平台套件的重要组成部分，SMARTS 已开源并拥有完善的文档与示例，帮助开发者快速上手，加速从理论验证到实际部署的研发进程。

使用场景

某自动驾驶初创公司的算法团队正在研发城市复杂路口的多车协同决策系统，急需验证强化学习模型在动态交通流中的表现。

没有 SMARTS 时

场景构建成本极高：团队需手动编写代码搭建仿真环境，难以还原真实路口中车辆、行人及突发状况的多样化交互，导致训练数据单一。
多智能体协作难实现：传统仿真器主要支持单车测试，缺乏原生多智能体并发训练机制，无法有效模拟车辆间的博弈与配合。
迭代周期漫长：每次调整交通密度或规则都需重构底层逻辑，且难以并行扩展大规模车流实验，严重拖慢算法验证进度。
现实迁移风险大：由于仿真环境与真实物理世界差距过大（Sim-to-Real Gap），模型在实验室表现良好，实车测试时却频繁失效。

使用 SMARTS 后

开箱即用的高保真场景：直接调用 SMARTS 预置的多样化城市地图和交通流模板，轻松生成包含激进驾驶、违规变道等长尾场景的训练环境。
原生支持多智能体博弈：利用其可扩展的多智能体强化学习架构，同时训练数十辆车进行交互，显著提升了模型在复杂路况下的协同决策能力。
高效规模化训练：通过简单的配置即可并行启动成百上千个仿真实例，将原本需要数周的算法迭代周期缩短至几天内完成。
平滑过渡到实车部署：凭借高度逼真的物理引擎和传感器模拟，训练出的策略在真实道路测试中成功率大幅提升，降低了落地风险。

SMARTS 通过提供高保真、可扩展的多智能体仿真底座，让自动驾驶算法团队能以低成本快速攻克复杂交通场景下的决策难题。

运行环境要求

操作系统

Linux

GPU

未说明

内存

未说明

依赖

notesREADME 中未直接列出具体的系统资源需求（如 GPU 型号、内存大小），但提供了 CI 测试仅在 Linux 环境下运行的徽章，暗示主要支持 Linux。该项目是自动驾驶多智能体强化学习仿真平台，通常依赖物理引擎（如 PyBullet, SUMO）和深度学习框架，实际运行可能需要 GPU 加速。详细安装步骤和依赖版本需参考官方文档 (smarts.readthedocs.io)。

python3.6+

gym

numpy

trimesh

pybullet

sumo

ray

tensorflow

torch

快速开始

SMARTS

SMARTS（可扩展多智能体强化学习训练平台）是一个用于多智能体强化学习（RL）和自动驾驶研究的仿真平台。其核心在于模拟真实且多样化的交互场景。它是华为诺亚方舟实验室 XingTian 强化学习平台套件的一部分。

更多详情请参阅论文：SMARTS: 面向自动驾驶的可扩展多智能体强化学习训练平台。

文档

在 smarts.readthedocs.io 阅读文档 :notebook_with_decorative_cover: :fire:
基础示例
强化学习模型

问题、Bug 和功能请求

首先，请阅读如何沟通问题、报告 Bug 和请求功能这里。
然后，请在 https://github.com/huawei-noah/SMARTS/issues 上使用合适的标签提交。

引用本工作

如果您在研究中使用了 SMARTS，请引用该论文：论文链接。BibTeX 格式如下：

@misc{SMARTS,
    title={SMARTS: 面向自动驾驶的可扩展多智能体强化学习训练平台},
    author={Ming Zhou and Jun Luo and Julian Villella and Yaodong Yang and David Rusu and Jiayu Miao and Weinan Zhang and Montgomery Alban and Iman Fadakar and Zheng Chen and Aurora Chongxi Huang and Ying Wen and Kimia Hassanzadeh and Daniel Graves and Dong Chen and Zhengbang Zhu and Nhat Nguyen and Mohamed Elsayed and Kun Shao and Sanjeevan Ahilan and Baokuan Zhang and Jiannan Wu and Zhengang Fu and Kasra Rezaee and Peyman Yadmellat and Mohsen Rohani and Nicolas Perez Nieves and Yihan Ni and Seyedershad Banijamali and Alexander Cowen Rivers and Zheng Tian and Daniel Palenicek and Haitham bou Ammar and Hongbo Zhang and Wulong Liu and Jianye Hao and Jun Wang},
    url={https://arxiv.org/abs/2010.09776},
    primaryClass={cs.MA},
    booktitle={第四届机器人学习大会（CoRL）论文集},
    year={2020},
    month={11}
}

SMARTS 快速上手指南

SMARTS (Scalable Multi-Agent Reinforcement Learning Training School) 是由华为诺亚方舟实验室开发的自动驾驶多智能体强化学习仿真平台，专注于提供真实且多样化的交互场景。

环境准备

在开始之前，请确保您的开发环境满足以下要求：

操作系统: Linux (推荐 Ubuntu 18.04 或更高版本)。虽然支持其他系统，但 Linux 是主要开发和测试环境。
Python 版本: Python 3.7 - 3.9。
依赖管理: 建议使用 venv 或 conda 创建独立的虚拟环境。
图形界面: 如果需要可视化演示（Envision），需要支持 OpenGL 的环境。在无头服务器（Headless server）上运行时，需配置虚拟显示（如 xvfb）。

安装步骤

推荐使用 PyPI 进行安装。国内开发者可使用清华源或阿里源加速下载。

创建并激活虚拟环境 (以 conda 为例)：

conda create -n smarts-env python=3.8
conda activate smarts-env

安装 SMARTS：

通用安装命令：
```
pip install smarts
```

使用国内镜像源加速安装 (推荐)：

pip install smarts -i https://pypi.tuna.tsinghua.edu.cn/simple

验证安装：安装完成后，可在终端输入 smarts --help 检查命令行工具是否可用。

基本使用

SMARTS 提供了丰富的示例脚本。以下是运行一个基础自动驾驶场景的最简示例。

运行基础示例：使用内置的 smarts 命令行工具启动一个包含随机交通流的仿真场景，并开启可视化界面（Envision）：
```
smarts run --headless False scenarios/intersections/4lane_t
```
- --headless False: 开启图形化界面。若在服务器运行请改为 True。
- scenarios/intersections/4lane_t: 指定要运行的场景路径（安装后示例场景通常位于包内或通过 smarts repo 命令获取）。

通过 Python 代码调用：您也可以在 Python 脚本中直接构建环境并进行单步仿真：

from smarts.env import SmartSEnv

# 初始化环境
env = SmartSEnv(
    scenarios=["scenarios/intersections/4lane_t"],
    agent_specs={}, 
    headless=False,
    visdom=False,
    timestep_limit=1000,
)

# 重置环境
observations = env.reset()

# 简单的一步仿真循环
for _ in range(10):
    actions = {agent_id: {"action": "keep_lane"} for agent_id in observations}
    observations, rewards, dones, infos = env.step(actions)
    
    if all(dones.values()):
        break

env.close()

提示：更多详细的强化学习模型示例和高级用法，请参阅官方文档 smarts.readthedocs.io 中的 "Base examples" 和 "RL models" 章节。

版本历史

v2.0.12024/03/28

v2.0.02024/02/05

v1.4.02023/08/08

v1.3.02023/07/11

v1.2.02023/06/15

v1.1.02023/04/28

v1.0.102023/04/02

v1.0.112023/04/02

v1.0.92023/03/20

v1.0.82023/03/10

v1.0.72023/03/05

v1.0.62023/02/26

v1.0.52023/02/19

v1.0.42023/02/10

v1.0.32023/02/05

v1.0.22023/01/28

v1.0.12023/01/28

v1.0.02023/01/28

v0.6.02022/03/29

v0.5.12022/02/02

常见问题

为什么 Envision 可视化界面中不显示道路地图？

运行 'make test' 时出现测试失败（如 short_determinism 或 notebook1），这是严重问题吗？

运行 ULTRA 实验时遇到 RayOutOfMemoryError（内存溢出）怎么办？

如何使用纯社会车辆代理（Social Agents）填充地图，而不定义常规交通流或气泡（Bubbles）？

社会车辆在模拟中途行为不稳定或意外失去控制权返回 SUMO 的原因是什么？

在使用 Ray 运行多实例模拟时，遇到 'connection closed by SUMO' 或 'EOFError' 导致崩溃如何解决？

相似工具推荐

openclaw

OpenClaw 是一款专为个人打造的本地化 AI 助手，旨在让你在自己的设备上拥有完全可控的智能伙伴。它打破了传统 AI 助手局限于特定网页或应用的束缚，能够直接接入你日常使用的各类通讯渠道，包括微信、WhatsApp、Telegram、Discord、iMessage 等数十种平台。无论你在哪个聊天软件中发送消息，OpenClaw 都能即时响应，甚至支持在 macOS、iOS 和 Android 设备上进行语音交互，并提供实时的画布渲染功能供你操控。这款工具主要解决了用户对数据隐私、响应速度以及“始终在线”体验的需求。通过将 AI 部署在本地，用户无需依赖云端服务即可享受快速、私密的智能辅助，真正实现了“你的数据，你做主”。其独特的技术亮点在于强大的网关架构，将控制平面与核心助手分离，确保跨平台通信的流畅性与扩展性。 OpenClaw 非常适合希望构建个性化工作流的技术爱好者、开发者，以及注重隐私保护且不愿被单一生态绑定的普通用户。只要具备基础的终端操作能力（支持 macOS、Linux 及 Windows WSL2），即可通过简单的命令行引导完成部署。如果你渴望拥有一个懂你

★ 349.3k|★★★☆☆|3天前

Agent开发框架图像

stable-diffusion-webui

stable-diffusion-webui 是一个基于 Gradio 构建的网页版操作界面，旨在让用户能够轻松地在本地运行和使用强大的 Stable Diffusion 图像生成模型。它解决了原始模型依赖命令行、操作门槛高且功能分散的痛点，将复杂的 AI 绘图流程整合进一个直观易用的图形化平台。无论是希望快速上手的普通创作者、需要精细控制画面细节的设计师，还是想要深入探索模型潜力的开发者与研究人员，都能从中获益。其核心亮点在于极高的功能丰富度：不仅支持文生图、图生图、局部重绘（Inpainting）和外绘（Outpainting）等基础模式，还独创了注意力机制调整、提示词矩阵、负向提示词以及“高清修复”等高级功能。此外，它内置了 GFPGAN 和 CodeFormer 等人脸修复工具，支持多种神经网络放大算法，并允许用户通过插件系统无限扩展能力。即使是显存有限的设备，stable-diffusion-webui 也提供了相应的优化选项，让高质量的 AI 艺术创作变得触手可及。

★ 162.1k|★★★☆☆|4天前

开发框架图像Agent

everything-claude-code

everything-claude-code 是一套专为 AI 编程助手（如 Claude Code、Codex、Cursor 等）打造的高性能优化系统。它不仅仅是一组配置文件，而是一个经过长期实战打磨的完整框架，旨在解决 AI 代理在实际开发中面临的效率低下、记忆丢失、安全隐患及缺乏持续学习能力等核心痛点。通过引入技能模块化、直觉增强、记忆持久化机制以及内置的安全扫描功能，everything-claude-code 能显著提升 AI 在复杂任务中的表现，帮助开发者构建更稳定、更智能的生产级 AI 代理。其独特的“研究优先”开发理念和针对 Token 消耗的优化策略，使得模型响应更快、成本更低，同时有效防御潜在的攻击向量。这套工具特别适合软件开发者、AI 研究人员以及希望深度定制 AI 工作流的技术团队使用。无论您是在构建大型代码库，还是需要 AI 协助进行安全审计与自动化测试，everything-claude-code 都能提供强大的底层支持。作为一个曾荣获 Anthropic 黑客大奖的开源项目，它融合了多语言支持与丰富的实战钩子（hooks），让 AI 真正成长为懂上

★ 146.8k|★★☆☆☆|今天

开发框架Agent语言模型

ComfyUI

ComfyUI 是一款功能强大且高度模块化的视觉 AI 引擎，专为设计和执行复杂的 Stable Diffusion 图像生成流程而打造。它摒弃了传统的代码编写模式，采用直观的节点式流程图界面，让用户通过连接不同的功能模块即可构建个性化的生成管线。这一设计巧妙解决了高级 AI 绘图工作流配置复杂、灵活性不足的痛点。用户无需具备编程背景，也能自由组合模型、调整参数并实时预览效果，轻松实现从基础文生图到多步骤高清修复等各类复杂任务。ComfyUI 拥有极佳的兼容性，不仅支持 Windows、macOS 和 Linux 全平台，还广泛适配 NVIDIA、AMD、Intel 及苹果 Silicon 等多种硬件架构，并率先支持 SDXL、Flux、SD3 等前沿模型。无论是希望深入探索算法潜力的研究人员和开发者，还是追求极致创作自由度的设计师与资深 AI 绘画爱好者，ComfyUI 都能提供强大的支持。其独特的模块化架构允许社区不断扩展新功能，使其成为当前最灵活、生态最丰富的开源扩散模型工具之一，帮助用户将创意高效转化为现实。

★ 108.1k|★★☆☆☆|昨天

开发框架图像Agent

LLMs-from-scratch

LLMs-from-scratch 是一个基于 PyTorch 的开源教育项目，旨在引导用户从零开始一步步构建一个类似 ChatGPT 的大型语言模型（LLM）。它不仅是同名技术著作的官方代码库，更提供了一套完整的实践方案，涵盖模型开发、预训练及微调的全过程。该项目主要解决了大模型领域“黑盒化”的学习痛点。许多开发者虽能调用现成模型，却难以深入理解其内部架构与训练机制。通过亲手编写每一行核心代码，用户能够透彻掌握 Transformer 架构、注意力机制等关键原理，从而真正理解大模型是如何“思考”的。此外，项目还包含了加载大型预训练权重进行微调的代码，帮助用户将理论知识延伸至实际应用。 LLMs-from-scratch 特别适合希望深入底层原理的 AI 开发者、研究人员以及计算机专业的学生。对于不满足于仅使用 API，而是渴望探究模型构建细节的技术人员而言，这是极佳的学习资源。其独特的技术亮点在于“循序渐进”的教学设计：将复杂的系统工程拆解为清晰的步骤，配合详细的图表与示例，让构建一个虽小但功能完备的大模型变得触手可及。无论你是想夯实理论基础，还是为未来研发更大规模的模型做准备

★ 90.1k|★★★☆☆|3天前

语言模型图像Agent

Deep-Live-Cam

Deep-Live-Cam 是一款专注于实时换脸与视频生成的开源工具，用户仅需一张静态照片，即可通过“一键操作”实现摄像头画面的即时变脸或制作深度伪造视频。它有效解决了传统换脸技术流程繁琐、对硬件配置要求极高以及难以实时预览的痛点，让高质量的数字内容创作变得触手可及。这款工具不仅适合开发者和技术研究人员探索算法边界，更因其极简的操作逻辑（仅需三步：选脸、选摄像头、启动），广泛适用于普通用户、内容创作者、设计师及直播主播。无论是为了动画角色定制、服装展示模特替换，还是制作趣味短视频和直播互动，Deep-Live-Cam 都能提供流畅的支持。其核心技术亮点在于强大的实时处理能力，支持口型遮罩（Mouth Mask）以保留使用者原始的嘴部动作，确保表情自然精准；同时具备“人脸映射”功能，可同时对画面中的多个主体应用不同面孔。此外，项目内置了严格的内容安全过滤机制，自动拦截涉及裸露、暴力等不当素材，并倡导用户在获得授权及明确标注的前提下合规使用，体现了技术发展与伦理责任的平衡。

★ 88.9k|★★★☆☆|3天前

开发框架图像Agent