DCRNN

1.4k 420 中等 1 次阅读今天MIT数据工具开发框架

AI 解读由 AI 自动生成，仅供参考

DCRNN 是一个基于 TensorFlow 实现的开源深度学习模型，全称为“扩散卷积循环神经网络”。它专为解决交通流量预测这一复杂问题而设计，能够精准地捕捉城市路网中随时间变化的动态规律以及传感器节点之间的空间依赖关系。

传统的预测方法往往难以同时处理交通数据的时间序列特性和复杂的拓扑结构，而 DCRNN 创新性地将图上的扩散卷积与循环神经网络相结合。这种架构不仅能模拟交通拥堵在路网中的传播过程，还能有效进行长短期记忆建模，从而实现高精度的数据驱动型交通 forecasting。

该工具主要适合人工智能研究人员、数据科学家以及从事智慧交通系统开发的工程师使用。如果你正在探索时空序列预测算法，或需要为城市交通管理构建可靠的预测模型，DCRNN 提供了完整的训练、评估及预训练代码，并支持洛杉矶（METR-LA）和湾区（PEMS-BAY）等标准数据集的快速复现。其核心亮点在于利用有向图上的随机游走机制来定义卷积操作，使模型能更自然地理解路网结构，是研究时空图神经网络的经典基准项目之一。

使用场景

洛杉矶市交通管理局的数据团队正致力于优化城市主干道的信号灯配时，以缓解早晚高峰的严重拥堵。

没有 DCRNN 时

忽视路网拓扑关联：传统时间序列模型（如 ARIMA 或普通 LSTM）将每个路口的传感器数据视为独立个体，无法捕捉上游路口拥堵对下游路口的扩散效应。
长时预测误差大：在面对突发事故或复杂天气时，模型难以维持长期预测的稳定性，超过 30 分钟的流量预判往往偏离实际，导致调度指令滞后。
动态响应能力弱：由于缺乏对交通流在空间上“扩散”过程的建模，系统无法提前预判拥堵蔓延路径，只能被动等待拥堵发生后再调整信号灯。

使用 DCRNN 后

精准建模空间依赖：DCRNN 利用扩散卷积机制，将道路网络结构融入深度学习，能准确计算一个路口的车流变化如何随时间波及相邻路口。
提升长周期预测精度：结合循环神经网络与图卷积，DCRNN 在长达 60 分钟的预测窗口内仍保持低误差率，为早高峰前的预防性疏导提供了可靠依据。
实现主动式交通治理：基于对拥堵扩散趋势的预判，指挥中心可提前 20 分钟调整关键节点的红绿配比，将潜在的区域性瘫痪化解在萌芽状态。

DCRNN 通过深度融合时空特征，将交通管理从“事后补救”转变为“事前预判”，显著提升了城市路网的通行效率。

运行环境要求

操作系统

未说明

GPU

非必需（提供 CPU 和 GPU 两种环境配置）
训练示例基于 GTX 1080 Ti，大规模部署建议使用 GPU 集群

内存

未说明

依赖

notes该工具基于较旧的 TensorFlow 1.x 版本。官方推荐使用 Conda 创建独立环境（提供 env.gpu.yml 和 env.cpu.yml）。数据需以 HDF5 (.h5) 格式存储。在洛杉矶数据集上单卡训练每轮约需 5 分钟。训练过程中可能出现损失爆炸，建议通过降低学习率或从检查点重启来解决。支持通过图分区技术在大规模路网（如加州高速公路网）上部署。

python未说明

tensorflow>=1.3.0

scipy>=0.19.0

numpy>=1.12.1

pandas>=0.19.2

pyaml

statsmodels

快速开始

扩散卷积循环神经网络：数据驱动的交通流量预测

扩散卷积循环神经网络

这是对以下论文中扩散卷积循环神经网络的 TensorFlow 实现：
Yaguang Li, Rose Yu, Cyrus Shahabi, Yan Liu，《扩散卷积循环神经网络：数据驱动的交通流量预测》，ICLR 2018。

需求

scipy>=0.19.0
numpy>=1.12.1
pandas>=0.19.2
pyaml
statsmodels
tensorflow>=1.3.0

可以使用以下命令安装依赖：

pip install -r requirements.txt

环境更新

你可以使用 conda 安装环境。

1. 创建用于安装 dcrnn 的环境

a. GPU

conda env create -f env.gpu.yml

b. CPU

conda env create -f env.cpu.yml

2. 激活环境

conda activate dcrnn

数据准备

洛杉矶（METR-LA）和旧金山湾区（PEMS-BAY）的交通数据文件，即 metr-la.h5 和 pems-bay.h5，可在 Google Drive 或 Baidu Yun 上获取，并应放置于 data/ 文件夹中。这些 *.h5 文件以 HDF5 文件格式存储了 pandas.DataFrame 格式的数据。以下是示例：

	sensor_0	sensor_1	sensor_2	sensor_n
2018/01/01 00:00:00	60.0	65.0	70.0	...
2018/01/01 00:05:00	61.0	64.0	65.0	...
2018/01/01 00:10:00	63.0	65.0	60.0	...
...	...	...	...	...

这里有一篇关于使用 HDF5 与 Python 的文章。

运行以下命令以在 data/{METR-LA,PEMS-BAY}/{train,val,test}.npz 中生成训练/测试/验证数据集。

# 创建数据目录
mkdir -p data/{METR-LA,PEMS-BAY}

# METR-LA
python -m scripts.generate_training_data --output_dir=data/METR-LA --traffic_df_filename=data/metr-la.h5

# PEMS-BAY
python -m scripts.generate_training_data --output_dir=data/PEMS-BAY --traffic_df_filename=data/pems-bay.h5

图构建

由于当前实现基于传感器之间预先计算的道路网络距离，因此目前仅支持洛杉矶的传感器 ID（参见 data/sensor_graph/sensor_info_201206.csv）。

python -m scripts.gen_adj_mx  --sensor_ids_filename=data/sensor_graph/graph_sensor_ids.txt --normalized_k=0.1\
    --output_pkl_filename=data/sensor_graph/adj_mx.pkl

此外，洛杉矶（METR-LA）的传感器位置信息可在 data/sensor_graph/graph_sensor_locations.csv 中找到，而 PEMS-BAY 的传感器位置信息则可在 data/sensor_graph/graph_sensor_locations_bay.csv 中找到。

在 METR-LA 上运行预训练模型

# METR-LA
python run_demo.py --config_filename=data/model/pretrained/METR-LA/config.yaml

# PEMS-BAY
python run_demo.py --config_filename=data/model/pretrained/PEMS-BAY/config.yaml

DCRNN 生成的预测结果位于 data/results/dcrnn_predictions。

模型训练

以下是分别在 METR-LA 和 PEMS-BAY 上训练模型的命令。

# METR-LA
python dcrnn_train.py --config_filename=data/model/dcrnn_la.yaml

# PEMS-BAY
python dcrnn_train.py --config_filename=data/model/dcrnn_bay.yaml

训练细节及 tensorboard 链接

在单块 GTX 1080 Ti 显卡上，每个 epoch 对于 METR-LA 大约需要 5 分钟，而对于 PEMS-BAY 则需要 13 分钟。以下是 DCRNN 在 METR-LA 和 DCRNN 在 PEMS-BAY 的 tensorboard 示例链接，其中包含训练细节和随时间变化的指标。

需要注意的是，训练过程中可能会出现损失爆炸的情况。一种临时解决方法是从爆炸前保存的最后一个模型重新开始训练，或者在学习率调度中更早地降低学习率。

不同时间尺度和数据集上的指标

下表总结了 DCRNN 在两个数据集上不同指标和时间尺度下的性能（由于 2018 年 10 月 1 日提交的 2e4b8c8 提交中的错误修复，数值优于论文中报告的结果）。

数据集	指标	5 分钟	15 分钟	30 分钟	60 分钟
METR-LA	MAE	2.18	2.67	3.08	3.56
	MAPE	5.17%	6.84%	8.38%	10.30%
	RMSE	3.77	5.17	6.3	7.52
PEMS-BAY	MAE	0.85	1.31	1.66	1.98
	MAPE	1.63%	2.74%	3.76%	4.74%
	RMSE	1.54	2.76	3.78	4.62

基线方法评估

# METR-LA
python -m scripts.eval_baseline_methods --traffic_reading_filename=data/metr-la.h5

更多细节正在添加中……

使用图划分将 DCRNN 部署到大规模图上

通过图划分，DCRNN 已成功部署用于同时预测整个加利福尼亚州高速公路网络 11,160 个交通传感器位置的交通流量。其基本思路是将大型高速公路网络划分为若干小型网络，并使用共享权重的 DCRNN 同时进行训练。训练过程在一个中等规模的 GPU 集群上大约需要 3 小时，而实时推理可以在传统的硬件设备上运行，例如 CPU。

更多信息请参阅来自阿贡国家实验室的 Tanwi Mallick 等人的论文、幻灯片和视频。

DCRNN 的应用

除了车辆交通预测之外，DCRNN 及其变体还被应用于许多重要领域，包括：

神经影像学：脑网络中的因果推断。S. Wein 等人. 用于脑网络中因果推断的图神经网络框架. Scientific Reports, 2021，GitHub 仓库。
空气质量预测：Y Lin 等人. 利用深度学习挖掘时空模式以实现精准空气质量预测. ACM SIGSPATIAL 2018。
互联网流量预测：D. Andreoletti 等人. 基于扩散卷积循环神经网络的网络流量预测，INFOCOM 2019。

第三方重实现

由 chnsh@ 提供的 PyTorch 实现可在 DCRNN-Pytorch 中找到。

引用

如果您在研究中发现本仓库（例如代码和数据集）有所帮助，请引用以下论文：

@inproceedings{li2018dcrnn_traffic,
  title={扩散卷积循环神经网络：数据驱动的交通预测},
  author={李亚光、Yu Rose、Shahabi Cyrus、刘燕},
  booktitle={国际表征学习会议 (ICLR '18)},
  year={2018}
}

DCRNN 快速上手指南

DCRNN (Diffusion Convolutional Recurrent Neural Network) 是一个基于 TensorFlow 的开源项目，主要用于数据驱动的交通流量预测。本指南将帮助你快速在本地环境中部署并运行该模型。

1. 环境准备

系统要求

操作系统: Linux / macOS (Windows 需配合 WSL 或 Docker)
Python: 建议 Python 3.6+
硬件: 推荐使用 NVIDIA GPU (需安装 CUDA)，CPU 亦可运行但速度较慢。

前置依赖

核心依赖库包括：

tensorflow >= 1.3.0
scipy, numpy, pandas
pyaml, statsmodels

国内加速提示：建议使用清华源或阿里源加速 pip 和 conda 包的下载。
Pip 临时加速：pip install -r requirements.txt -i https://pypi.tuna.tsinghua.edu.cn/simple
Conda 配置清华源：
conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/main/
conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/free/

2. 安装步骤

推荐使用 conda 创建隔离环境进行安装。

第一步：创建环境

根据是否有 GPU 选择对应的配置文件：

GPU 版本：

conda env create -f env.gpu.yml

CPU 版本：

conda env create -f env.cpu.yml

第二步：激活环境

conda activate dcrnn

若未使用 conda 配置文件，也可手动安装依赖：

pip install -r requirements.txt

3. 基本使用

以下以 METR-LA (洛杉矶交通数据) 为例，演示从数据准备到运行预训练模型的完整流程。

3.1 数据准备

下载数据文件 metr-la.h5 和 pems-bay.h5。
- 下载地址：Google Drive 或百度网盘。
将下载的 .h5 文件放入项目根目录下的 data/ 文件夹中。
生成训练、验证和测试数据集：

# 创建数据目录
mkdir -p data/{METR-LA,PEMS-BAY}

# 处理 METR-LA 数据
python -m scripts.generate_training_data --output_dir=data/METR-LA --traffic_df_filename=data/metr-la.h5

# (可选) 处理 PEMS-BAY 数据
# python -m scripts.generate_training_data --output_dir=data/PEMS-BAY --traffic_df_filename=data/pems-bay.h5

3.2 构建图结构

生成传感器之间的邻接矩阵（基于预计算的道路网络距离）：

python -m scripts.gen_adj_mx  --sensor_ids_filename=data/sensor_graph/graph_sensor_ids.txt --normalized_k=0.1\
    --output_pkl_filename=data/sensor_graph/adj_mx.pkl

3.3 运行预训练模型

直接使用官方提供的预训练权重进行推理演示：

python run_demo.py --config_filename=data/model/pretrained/METR-LA/config.yaml

运行完成后，预测结果将保存在 data/results/dcrnn_predictions 目录下。

3.4 (进阶) 训练自己的模型

如需重新训练模型，可执行以下命令：

# 在 METR-LA 数据集上训练
python dcrnn_train.py --config_filename=data/model/dcrnn_la.yaml

# 在 PEMS-BAY 数据集上训练
python dcrnn_train.py --config_filename=data/model/dcrnn_bay.yaml

注意：训练过程中可能会出现 Loss 爆炸的情况。如遇此问题，建议从爆炸前保存的模型断点重启训练，或在调度中更早地降低学习率。

常见问题

为什么在训练过程中要对 Loss 进行 Mask 操作？这是否公平？

输入张量的最后一个维度（Batch_size, Time granularity, Node number, 2）中的'2'代表什么含义？

如何获取 METR-LA 和 PEMS-Bay 数据集？

找不到文件 `data/sensor_graph/graph_sensor_ids.txt` 或配置文件怎么办？

`distances_la_2012.csv` 文件中的'cost'是如何计算的？为什么它不是对称的？

扩散卷积（Diffusion Convolution）代码中为什么要执行 `x2 = 2 * support * x1 - x0`（即减去 x0）？

如何使用预训练模型在我的自定义数据上进行推理？遇到形状不匹配错误如何解决？

相似工具推荐

openclaw

OpenClaw 是一款专为个人打造的本地化 AI 助手，旨在让你在自己的设备上拥有完全可控的智能伙伴。它打破了传统 AI 助手局限于特定网页或应用的束缚，能够直接接入你日常使用的各类通讯渠道，包括微信、WhatsApp、Telegram、Discord、iMessage 等数十种平台。无论你在哪个聊天软件中发送消息，OpenClaw 都能即时响应，甚至支持在 macOS、iOS 和 Android 设备上进行语音交互，并提供实时的画布渲染功能供你操控。这款工具主要解决了用户对数据隐私、响应速度以及“始终在线”体验的需求。通过将 AI 部署在本地，用户无需依赖云端服务即可享受快速、私密的智能辅助，真正实现了“你的数据，你做主”。其独特的技术亮点在于强大的网关架构，将控制平面与核心助手分离，确保跨平台通信的流畅性与扩展性。 OpenClaw 非常适合希望构建个性化工作流的技术爱好者、开发者，以及注重隐私保护且不愿被单一生态绑定的普通用户。只要具备基础的终端操作能力（支持 macOS、Linux 及 Windows WSL2），即可通过简单的命令行引导完成部署。如果你渴望拥有一个懂你

★ 349.3k|★★★☆☆|3天前

Agent开发框架图像

stable-diffusion-webui

stable-diffusion-webui 是一个基于 Gradio 构建的网页版操作界面，旨在让用户能够轻松地在本地运行和使用强大的 Stable Diffusion 图像生成模型。它解决了原始模型依赖命令行、操作门槛高且功能分散的痛点，将复杂的 AI 绘图流程整合进一个直观易用的图形化平台。无论是希望快速上手的普通创作者、需要精细控制画面细节的设计师，还是想要深入探索模型潜力的开发者与研究人员，都能从中获益。其核心亮点在于极高的功能丰富度：不仅支持文生图、图生图、局部重绘（Inpainting）和外绘（Outpainting）等基础模式，还独创了注意力机制调整、提示词矩阵、负向提示词以及“高清修复”等高级功能。此外，它内置了 GFPGAN 和 CodeFormer 等人脸修复工具，支持多种神经网络放大算法，并允许用户通过插件系统无限扩展能力。即使是显存有限的设备，stable-diffusion-webui 也提供了相应的优化选项，让高质量的 AI 艺术创作变得触手可及。

★ 162.1k|★★★☆☆|3天前

开发框架图像Agent

everything-claude-code

everything-claude-code 是一套专为 AI 编程助手（如 Claude Code、Codex、Cursor 等）打造的高性能优化系统。它不仅仅是一组配置文件，而是一个经过长期实战打磨的完整框架，旨在解决 AI 代理在实际开发中面临的效率低下、记忆丢失、安全隐患及缺乏持续学习能力等核心痛点。通过引入技能模块化、直觉增强、记忆持久化机制以及内置的安全扫描功能，everything-claude-code 能显著提升 AI 在复杂任务中的表现，帮助开发者构建更稳定、更智能的生产级 AI 代理。其独特的“研究优先”开发理念和针对 Token 消耗的优化策略，使得模型响应更快、成本更低，同时有效防御潜在的攻击向量。这套工具特别适合软件开发者、AI 研究人员以及希望深度定制 AI 工作流的技术团队使用。无论您是在构建大型代码库，还是需要 AI 协助进行安全审计与自动化测试，everything-claude-code 都能提供强大的底层支持。作为一个曾荣获 Anthropic 黑客大奖的开源项目，它融合了多语言支持与丰富的实战钩子（hooks），让 AI 真正成长为懂上

★ 146.8k|★★☆☆☆|今天

开发框架Agent语言模型

ComfyUI

ComfyUI 是一款功能强大且高度模块化的视觉 AI 引擎，专为设计和执行复杂的 Stable Diffusion 图像生成流程而打造。它摒弃了传统的代码编写模式，采用直观的节点式流程图界面，让用户通过连接不同的功能模块即可构建个性化的生成管线。这一设计巧妙解决了高级 AI 绘图工作流配置复杂、灵活性不足的痛点。用户无需具备编程背景，也能自由组合模型、调整参数并实时预览效果，轻松实现从基础文生图到多步骤高清修复等各类复杂任务。ComfyUI 拥有极佳的兼容性，不仅支持 Windows、macOS 和 Linux 全平台，还广泛适配 NVIDIA、AMD、Intel 及苹果 Silicon 等多种硬件架构，并率先支持 SDXL、Flux、SD3 等前沿模型。无论是希望深入探索算法潜力的研究人员和开发者，还是追求极致创作自由度的设计师与资深 AI 绘画爱好者，ComfyUI 都能提供强大的支持。其独特的模块化架构允许社区不断扩展新功能，使其成为当前最灵活、生态最丰富的开源扩散模型工具之一，帮助用户将创意高效转化为现实。

★ 108.1k|★★☆☆☆|今天

开发框架图像Agent

markitdown

MarkItDown 是一款由微软 AutoGen 团队打造的轻量级 Python 工具，专为将各类文件高效转换为 Markdown 格式而设计。它支持 PDF、Word、Excel、PPT、图片（含 OCR）、音频（含语音转录）、HTML 乃至 YouTube 链接等多种格式的解析，能够精准提取文档中的标题、列表、表格和链接等关键结构信息。在人工智能应用日益普及的今天，大语言模型（LLM）虽擅长处理文本，却难以直接读取复杂的二进制办公文档。MarkItDown 恰好解决了这一痛点，它将非结构化或半结构化的文件转化为模型“原生理解”且 Token 效率极高的 Markdown 格式，成为连接本地文件与 AI 分析 pipeline 的理想桥梁。此外，它还提供了 MCP（模型上下文协议）服务器，可无缝集成到 Claude Desktop 等 LLM 应用中。这款工具特别适合开发者、数据科学家及 AI 研究人员使用，尤其是那些需要构建文档检索增强生成（RAG）系统、进行批量文本分析或希望让 AI 助手直接“阅读”本地文件的用户。虽然生成的内容也具备一定可读性，但其核心优势在于为机器

★ 93.4k|★★☆☆☆|2天前

插件开发框架

LLMs-from-scratch

LLMs-from-scratch 是一个基于 PyTorch 的开源教育项目，旨在引导用户从零开始一步步构建一个类似 ChatGPT 的大型语言模型（LLM）。它不仅是同名技术著作的官方代码库，更提供了一套完整的实践方案，涵盖模型开发、预训练及微调的全过程。该项目主要解决了大模型领域“黑盒化”的学习痛点。许多开发者虽能调用现成模型，却难以深入理解其内部架构与训练机制。通过亲手编写每一行核心代码，用户能够透彻掌握 Transformer 架构、注意力机制等关键原理，从而真正理解大模型是如何“思考”的。此外，项目还包含了加载大型预训练权重进行微调的代码，帮助用户将理论知识延伸至实际应用。 LLMs-from-scratch 特别适合希望深入底层原理的 AI 开发者、研究人员以及计算机专业的学生。对于不满足于仅使用 API，而是渴望探究模型构建细节的技术人员而言，这是极佳的学习资源。其独特的技术亮点在于“循序渐进”的教学设计：将复杂的系统工程拆解为清晰的步骤，配合详细的图表与示例，让构建一个虽小但功能完备的大模型变得触手可及。无论你是想夯实理论基础，还是为未来研发更大规模的模型做准备

★ 90.1k|★★★☆☆|2天前

语言模型图像Agent