Awesome-Traffic-Agent-Trajectory-Prediction
Awesome-Traffic-Agent-Trajectory-Prediction 是一个专注于交通智能体轨迹预测领域的开源资源聚合库。它系统地整理了该方向下的学术论文、公开数据集及核心代码实现,涵盖从传统统计方法到深度学习的前沿方案。
针对自动驾驶与智慧交通研究中文献分散、检索效率低的问题,该项目提供了清晰的时间线与分类导航,帮助用户快速锁定关键资料。无论是高校师生、科研人员还是从事自动驾驶算法开发的工程师,都能在此找到有价值的学习素材与项目参考。
资源持续更新至 2024 年 11 月,不仅收录了 2018 年前的经典文献,还重点追踪了近年的顶会成果,甚至涉及去噪扩散概率模型(DDPM)等新兴技术方向。维护团队鼓励社区贡献,欢迎通过 Pull Request 补充新资源或加入交流群组。对于希望深入理解多智能体交互机制的研究者而言,这是一份结构清晰、内容详实的进阶指南。
使用场景
某自动驾驶初创公司的算法工程师正在开发 L4 级无人车的轨迹预测模块,面临技术选型和复现效率低下的挑战。
没有 Awesome-Traffic-Agent-Trajectory-Prediction 时
- 需要手动在 arXiv、IEEE Xplore 等多个平台搜索论文,耗时且容易遗漏关键文献
- 即使找到相关论文,也往往难以直接获取对应的开源代码实现
- 面对海量研究资料,无法快速区分传统方法与深度学习方法的演进脉络
- 不清楚哪些数据集最适合当前复杂的城市路口场景,导致实验选型困难
使用 Awesome-Traffic-Agent-Trajectory-Prediction 后
- 通过分类目录直接定位到 2024-2025 年的最新多智能体预测论文与代码资源
- 一键跳转至官方仓库,快速获取包含 PyTorch 实现的复现材料
- 清晰了解从传统方法到扩散模型(Diffusion)的技术发展路线,避免重复造轮子
- 根据列表中的数据集推荐,迅速选定匹配度高的公开数据完成验证
Awesome-Traffic-Agent-Trajectory-Prediction 通过系统整合前沿论文与代码,显著提升了团队在多智能体轨迹预测领域的研发效率。
运行环境要求
- 未说明
未说明
未说明

快速开始
精选:交通智能体轨迹预测

🤝 贡献
这是一个关于交通智能体轨迹预测的最新研究资料(数据集、论文和代码)的列表。持续更新,欢迎关注!
维护者:李超能 (兰州交通大学) 邮箱:xdchaonengli@163.com
欢迎随时提交 Pull Requests 以添加新资源,或发送电子邮件给我们提出问题、进行讨论与合作。我们希望能连接更多多智能体轨迹预测领域的学生、教师和专家,如果您也想加入,可以添加我的微信 (CN15691969157)。让我们一起创建轨迹预测社区群组吧!
🧐 引用
如果本仓库加速了您的研究,请考虑引用我们的论文:
@article{11222824,
author={Li, Chaoneng and Wang, Xiaolong and Zhao, Shuxu and Wang, Xiaohu and Ye, Ze},
journal={IEEE Transactions on Vehicular Technology},
title={DiffMATP: Interaction-Aware Multi-Agent Trajectory Prediction via Denoising Diffusion Models},
year={2025},
pages={1-14},
doi={10.1109/TVT.2025.3627215}}
@inproceedings{li2022fidelity,
title={Fidelity Evaluation of Virtual Traffic Based on Anomalous Trajectory Detection},
author={Li, Chaoneng and Chao, Qianwen and Feng, Guanwen and Wang, Qiongyan and Liu, Pengfei and Li, Yunan and Miao, Qiguang},
booktitle={2022 IEEE/RSJ International Conference on Intelligent Robots and Systems (IROS)},
pages={8157--8164},
year={2022},
organization={IEEE}
}
@article{li2024difftad,
title={DiffTAD: Denoising diffusion probabilistic models for vehicle trajectory anomaly detection},
author={Li, Chaoneng and Feng, Guanwen and Li, Yunan and Liu, Ruyi and Miao, Qiguang and Chang, Liang},
journal={Knowledge-Based Systems},
volume={286},
pages={111387},
year={2024},
publisher={Elsevier}
}
📜 目录
- 精选:交通智能体轨迹预测
- 🤝 贡献
- 🧐 引用
- 📜 目录
- 📚 传统方法
- 📚 2018 年及之前的会议与期刊论文
- 📚 2019 年会议与期刊论文
- 📚 2020 年会议与期刊论文
- 📚 2021 年会议与期刊论文
- 📚 2022 年会议与期刊论文
- 📚 2023 年会议与期刊论文
- 📚 2024 年会议与期刊论文
- 📚 2025 年会议与期刊论文
- 📚 2026 年会议与期刊论文
- 📚 相关综述论文
- 📚 数据集
- 🌹 致谢
- 🌟 星标历史
📚 传统方法
- 行人动力学社会力模型 (Social force model),Physical Review E 1995。[paper]
- 模拟逃生恐慌的动力学特征,Nature 2000。[paper] [code]
- 实证观测与微观模拟中的拥堵交通状态,Physical Review E 2000。[paper]
- 一种自动轨迹预测 (Trajectory prediction) 分析方法论,AIAA 制导、导航与控制会议及展览 2004。[paper]
- 连续体人群,ACM Transactions on Graphics (TOG 2006)。[paper]
- 飞机意图推断与轨迹预测的新算法,Journal of Guidance, Control, and Dynamics 2007。[paper]
- 用于实时多智能体导航 (Multi-Agent Navigation) 的互惠速度障碍,ICRA 2008。[paper]
- 你永远不会独行:多目标跟踪中的社交行为建模,ICCV 2009。[paper]
- 用于车辆间碰撞风险估计的实时轨迹预测,International Conference on Intelligent Computer Communication and Processing 2009。[paper]
- 基于社会力的人类运动预测进行人员跟踪,ICRA 2010。[paper]
- 解放机器人:密集交互人群中的导航,IROS 2010。[paper]
- 你和谁在一起,要去哪里?,CVPR 2011。[paper]
- 具有显式碰撞预测的社会力模型,Europhysics Letters 2011。[paper]
- 轨迹预测的机器学习方法,AIAA 制导、导航与控制 (GNC) 会议 2013。[paper]
- 混合交通 (Heterogeneous Traffic) 下无信号灯路口的骑行者社会力模型,IEEE Transactions on Industrial Informatics 2016。[paper]
- 走在前面:有向社会力模型,PLoS ONE 2017。[paper]
- AutoRVO:密集混合交通中具有动态约束的局部导航,arXiv 预印本 arXiv:1804.02915, 2018。[paper]
- 行人交通社会力模型——前沿综述,Transport Reviews 2018。[paper]
📚 2018 年及之前的会议与期刊论文
Conference Papers
- Social GAN:基于生成对抗网络的社交可接受轨迹,CVPR 2018。[paper] [code]
- 使用深度神经网络编码人群交互以进行行人轨迹预测,CVPR 2018。[paper] [code]
- 快速与疯狂:使用单个卷积网络实现实时端到端 3D 检测、跟踪与运动预测,CVPR 2018。[paper]
- MX-LSTM:混合轨迹片段与视觉片段以联合预测轨迹和头部姿态,CVPR 2018。[paper]
- 不确定交通场景下行人的长期车载预测,CVPR 2018。[paper] [code]
- R2P2:用于多样化精确生成路径预测的重参数化前推策略,ECCV 2018。[paper]
- 他们将去向何方?使用条件变分自编码器预测细粒度对抗性多智能体运动,ECCV 2018。[paper]
- 为混合交通中的自动驾驶车辆生成舒适、安全且可理解的轨迹,国际智能交通系统会议 (ITSC 2018)。[paper]
- 考虑形式化交通规则的城市环境中行人集合预测,ITSC 2018。[paper]
- 使用双 LSTM 网络感知周围车辆的意图进行长视界轨迹预测,ITSC 2018。[paper]
- 社交注意力:对人类人群注意力的建模,ICRA 2018。[paper]
- 面向物体杂乱环境的交互感知行人运动预测数据驱动模型,ICRA 2018。[paper]
- 人机交互的多模态概率模型规划,ICRA 2018。[paper] [code]
- GD-GAN:用于人群轨迹预测和群体检测的生成对抗网络,ACCV 2018。[paper]
- 基于机动 LSTM 的周围车辆多模态轨迹预测,IEEE 智能车辆研讨会 (IV 2018)。[paper]
- 通过 LSTM 编码器 - 解码器架构的车辆轨迹序列到序列预测,IV 2018。[paper]
- 利用大规模运动先验预测车辆轨迹,IV 2018。[paper]
- 用于轨迹预测的道路基础设施指标,IV 2018。[paper]
- 共享空间中基于 LSTM 模型的混合交通轨迹预测,2018 年国际地理信息科学年会。[paper]
- SS-LSTM:用于行人轨迹预测的分层 LSTM 模型,WACV 2018。[paper] [code]
- “眼见为实”:使用视觉注意力视锥进行行人轨迹预测,WACV 2018。[paper]
- 通过预测进行跟踪:一种用于多人定位和跟踪的深度生成模型,WACV 2018。[paper]
- 上下文感知轨迹预测,国际模式识别会议 (ICPR 2018)。[paper]
- 交叉口的可迁移行人运动预测模型,IROS 2018。[paper]
- 多模态多人行为的生成建模,IROS 2018。[paper] [code]
- 构建先验知识:使用城市环境数据的基于马尔可夫的行人预测模型,国际控制、自动化、机器人与视觉会议 (ICARCV 2018)。[paper]
- 使用双向循环神经网络的骑行者轨迹预测,2018 年澳大拉西亚人工智能联合会议。[paper]
- 注意力机制即所需,NIPS 2017。[paper]
- Bi-Prediction:基于双向 LSTM 分类的行人轨迹预测,数字图像计算技术与应用国际会议 (DICTA 2017)。[paper]
- 通过循环神经网络在占用栅格地图上进行概率车辆轨迹预测,ITSC 2017。[paper]
- 基于自然视觉的城市环境行人行为预测方法,ITSC 2017。[paper]
- 我的预测有多好?寻找轨迹预测评估的相似度度量,ITSC 2017。[paper]
- 用于高速公路轨迹预测的 LSTM 网络,ITSC 2017。[paper]
- DESIRE:动态场景中交互智能体的远期预测,CVPR 2017。[paper] [code]
- 使用虚构博弈预测行人交互动力学,CVPR 2017。[paper]
- 预测人群场景中的可行路径,IJCAI 2017。[paper]
- 接下来会发生什么?体育视频中球员动作的预测,ICCV 2017。[paper]
- 利用道路拓扑结构改进骑行者路径预测,IV 2017。[paper]
- 使用机器学习方法的短时 4D 轨迹预测,Proc. SID 2017。[paper]
- 使用深度层次网络生成长期轨迹,NIPS 2016。[paper]
- 学习社交礼仪:拥挤场景下的人类轨迹理解,ECCV 2016。[paper]
- 面向特定场景的运动预测知识迁移,ECCV 2016。[paper]
- Structural-RNN:时空图上的深度学习,CVPR 2016。[paper] [code]
- 拥挤移动物体的复杂场景视觉路径预测,CVPR 2016。[paper]
- Social LSTM:拥挤空间中的行人轨迹预测,CVPR 2016。[paper] [code]
- 面向车辆安全系统的行人运动模型比较与评估,ITSC 2016。[paper]
- 行人运动的意图感知长期预测,ICRA 2016。[paper]
- 用于人类运动预测的新型基于规划算法,ICRA 2016。[paper]
- 使用全局和局部运动模式的 GLMP 实时行人路径预测,ICRA 2016。[paper]
- 用于运动预测的增强字典学习,ICRA 2016。[paper]
- 预测动态环境下的未来智能体运动,国际机器学习与应用会议 (ICMLA 2016)。[paper]
- 使用物理模型和人工神经网络的骑行者轨迹预测,IV 2016。[paper]
- STF-RNN:用于预测人们下一位置的空时特征循环神经网络,IEEE 计算智能系列研讨会 (SSCI 2016)。[paper]
- 提高行人安全的轨迹分析与预测:集成框架与评估,IV 2015。[paper]
- 目标目的地未知的轨迹预测贝叶斯意图推断,IROS 2015。[paper]
- 无监督机器人学习预测人体运动,ICRA 2015。[paper]
- 用于行人意图识别与路径预测结合的受控交互式多模型滤波器,ITSC 2015。[paper]
- 社会感知的超大规模人群预测,CVPR 2014。[paper]
- 补丁通向未来:无监督视觉预测,CVPR 2014。[paper]
- 使用非参数回归的交叉口辅助在线机动识别与多模态轨迹预测,IV 2014。[paper]
- 使用肢体语言特征的行人路径预测,IV 2014。[paper]
- 拥挤环境下人类运动预测完整框架的行为估计,ICRA 2014。[paper]
- 学习预测协同导航智能体的轨迹,ICRA 2014。[paper]
- 使用人工神经网络的公共交通中行人轨迹预测,国际模式识别会议 (ICPR 2014)。[paper]
- 基于上下文的行人路径预测,ECCV 2014。[paper]
- 面向驾驶员辅助系统的贝叶斯、基于机动的长期轨迹预测与关键性评估,ITSC 2014。[paper]
- 城市环境中自动驾驶车辆的轨迹生成器,ICRA 2013。[paper]
- 基于运动模型和机动识别的车辆轨迹预测,IROS 2013。[paper]
- 用于增强车对 X 移动数据的预测性机动评估,IV 2012。[paper]
- 使用高斯混合模型的概率轨迹预测,IV 2012。[paper]
- 利用地图信息进行路口驾驶员意图估计,IV 2011。[paper]
- 轨迹预测:学习将情境映射到机器人轨迹,ICML 2009。[paper]
- 基于蒙特卡洛的威胁评估:分析与改进,IV 2007。[paper]
- 机器学习中的高斯过程,2003 年机器学习暑期学校。[paper]
期刊论文
- 软 + 硬连线注意力机制:一种用于人类轨迹预测和异常事件检测的长短期记忆网络 (LSTM) 框架,Neural networks 2018。[paper]
- 基于圆形分布的城市场景长期路径预测,Image and Vision Computing 2018。[paper]
- 非凸环境中异构多智能体系统的最优轨迹生成高效算法,RAL 2018。[paper]
- 城市交通网络中基于深度学习方法 (Deep Learning) 的网络级车辆轨迹预测,Transportation Research Record 2018。[paper]
- 利用堆叠循环神经网络 (Recurrent Neural Networks) 通过运动轨迹预测行人意图,IEEE Transactions on Intelligent Vehicles 2018。[paper]
- 周围车辆将如何移动?一种机动分类与运动预测的统一框架,IEEE Transactions on Intelligent Vehicles 2018。[paper]
- 通过高斯过程动态模型 (Gaussian Process Dynamical Models) 和行人活动识别进行行人路径、姿态和意图预测,TITS 2018。[paper]
- 虚拟交通的基于字典的保真度度量,TVCG 2018。[paper]
- 使用纹理合成的真实数据驱动交通流动画,TVCG 2017。[paper]
- 利用交互多模型整合物理与基于机动的方法进行车辆轨迹预测,IEEE Transactions on Industrial Electronics 2017。[paper]
- 实时认证概率行人预测,RAL 2017。[paper]
- 深度学习 (Deep Learning) 驱动的视觉路径单图预测,TIP 2016。[paper]
- 年龄与群体驱动的行人行为:从观察到模拟,Collective Dynamics 2016。[paper]
- 任意道路环境下基于机动的轨迹预测与关键性评估的综合方法,TITS 2016。[paper]
- 混合交通流的轨迹数据与流特性,Transportation Research Record 2015。[paper]
- 预测和识别公共空间中的人类交互,Journal of Real-Time Image Processing 2015。[paper]
- 使用动态行人代理学习集体人群行为,International Journal of Computer Vision 2015。[paper]
- 具有不确定、变化意图的行人的实时预测建模与鲁棒避让,Algorithmic Foundations of Robotics XI 2015。[paper]
- BRVO:使用速度空间推理预测行人轨迹,International Journal of Robotics Research 2015。[paper]
- 学习意图以改进人类运动预测,Robotics and Autonomous Systems 2014。[paper]
- 基于隐马尔可夫模型 (Hidden Markov Models) 的自适应性参数选择轨迹预测方法,TITS 2014。[paper]
- TraPlan:交通网络中有效的三位一体轨迹预测模型,TITS 2014。[paper]
- 行人会过马路吗?关于行人路径预测的研究,TITS 2013。[paper]
- 使用贝叶斯非参数可达性树 (Bayesian Nonparametric Reachability Trees) 的移动智能体轨迹预测,Infotech@ Aerospace 2011。[paper]
- 用于人类运动的高斯过程动态模型,TPAMI 2008。[paper]
- 线性滤波与预测问题的新方法,Journal of Basic Engineering 1960。[paper]
其他
- 轨迹预测方法评估与 TrajNet 基准说明。arXiv 预印本 arXiv:1805.07663, 2018。[论文] [论文]
- Scene-LSTM:一种人类轨迹预测模型,arXiv 预印本 arXiv:1808.04018, 2018。[论文]
- 用于车辆轨迹预测的卷积社会池化,CVPR 研讨会 2018。[论文] [代码]
- 用于轨迹预测的卷积神经网络,ECCV 研讨会 2018。[论文]
- Group LSTM:拥挤场景中的群体轨迹预测,ECCV 研讨会 2018。[论文]
- 他们要过马路吗?行人过街行为的基准数据集与基线,ICCV 研讨会 2017。[论文] [网站]
- 使用空间感知深度注意力模型进行人类轨迹预测,arXiv 预印本 arXiv:1705.09436, 2017。[论文]
- 建模人类运动的时空动态以预测未来轨迹,AAAI 研讨会 2015。[论文]
📚 2019 年会议与期刊论文
2019 年会议论文
- MultiPath:用于行为预测的多个概率锚点轨迹假设,机器人学习会议 (CoRL 2019)。[论文]
- 使用程序化弱监督生成多智能体轨迹,ICLR 2019。[论文] [代码]
- 从部分观测中随机预测多智能体交互,ICLR 2019。[论文]
- TrafficPredict:面向异构交通参与者的轨迹预测,AAAI 2019。[论文] [代码]
- 基于生成对抗网络的数据驱动人群仿真,国际计算机动画与社会代理会议 (CASA 2019)。[论文] [代码]
- RobustTP:针对密集交通中噪声传感器输入的异构道路参与者端到端轨迹预测,ACM 汽车计算机科学研讨会 (CSCS 2019)。[论文] [代码]
- 你要去哪里?动态场景中路径预测的模仿决策学习,CVPR 2019。[论文]
- 用于上下文轨迹预测的多智能体张量融合,CVPR 2019。[论文] [代码]
- 窥探未来:视频中未来人员活动和位置的预测,CVPR 2019。[论文] [代码] [网站]
- SoPhie:一种用于预测符合社会与物理约束路径的注意力 GAN,CVPR 2019。[论文] [代码]
- SR-LSTM:面向行人轨迹预测的 LSTM 状态细化,CVPR 2019。[论文] [代码]
- TraPHic:利用加权交互进行密集和异构交通中的轨迹预测,CVPR 2019。[论文] [代码]
- 克服混合密度网络的局限性:多模态未来预测的采样与拟合框架,CVPR 2019。[论文] [代码]
- Argoverse:利用丰富地图进行 3D 跟踪与预测,CVPR 2019。[论文] [代码]
- 多智能体体育游戏的多样化生成,CVPR 2019。[论文]
- 面向未来轨迹预测的关系查找,ICCV 2019。[论文]
- 概率轨迹预测背景下多样性损失的分析,ICCV 2019。[论文]
- The Trajectron:具有动态时空图的概率多智能体轨迹建模,ICCV 2019。[论文] [代码]
- 车辆 - 行人混合场景下运动学轨迹的联合预测,ICCV 2019。[论文]
- STGAT:用于人类轨迹预测的时空交互建模,ICCV 2019。[论文] [代码]
- PIE:用于行人意图估计和轨迹预测的大规模数据集与模型,ICCV 2019。[论文] [代码]
- 用于模拟车对车相遇场景的多车辆轨迹生成器,ICRA 2019。[论文]
- 使用深度卷积网络进行自动驾驶的多模态轨迹预测,ICRA 2019。[论文] [代码]
- 用于自动驾驶车辆测试的基于力的异构交通仿真,ICRA 2019。[论文]
- 通过对抗学习实现感知交互的多智能体跟踪与概率行为预测,ICRA 2019。[论文]
- StarNet:基于星型拓扑深度神经网络的行人轨迹预测,IROS 2019。[论文]
- 使用多智能体联合轨迹预测和交通规则的深度预测自动驾驶,IROS 2019。[论文]
- 用于概率轨迹预测的条件生成神经系统,IROS 2019。[论文]
- 自动驾驶车辆的可联合学习行为与轨迹规划,IROS 2019。[论文]
- INFER:用于未来预测的中间表示,IROS 2019。[论文] [代码] [网站]
- 用于行人轨迹预测的随机采样仿真,IROS 2019。[论文]
- 使用路径同调聚类的运动轨迹长期预测,IROS 2019。[论文]
- Social-BiGAT:使用 Bicycle-GAN 和图注意力网络进行多模态轨迹预测,NIPS 2019。[论文]
- 多未来预测,NIPS 2019。[论文] [代码]
- 通过耦合场景 LSTM 与人类运动 LSTM 进行轨迹预测,国际视觉计算研讨会 (ISVC 2019)。[论文]
- 使用社会金字塔的行人轨迹预测,太平洋 rim 国际人工智能会议 (PRICAI 2019)。[论文]
- 带有时空注意力模型的情境感知行人轨迹预测,计算机视觉冬季研讨会 (CVWW 2019)。[论文]
- 用于行人轨迹预测的位置 - 速度注意力,WACV 2019。[论文]
- 通过贝叶斯生成建模进行车辆交互的协调与轨迹预测,IV 2019。[论文]
- 带有运动学约束的 Wasserstein 生成学习用于概率交互式驾驶行为预测,IV 2019。[论文]
- AGen:用于自动驾驶的自适应生成预测网络,IV 2019。[论文]
- 使用基于交互的生成对抗网络进行交叉口车辆轨迹预测,ITSC 2019。[论文, 论文]
- GRIP:基于图的感知交互轨迹预测,智能运输系统会议 (ITSC 2019)。[论文] [代码]
- GRIP++:增强版用于自动驾驶的基于图的感知交互轨迹预测,arXiv 预印本 arXiv:1907.07792, 2019。[论文] [代码]
- 基于姿态的脆弱道路使用者轨迹预测,IEEE 计算智能系列研讨会 (SSCI 2019)。[论文]
- 使用对象属性和语义环境的轨迹预测,计算机视觉、成像与计算机图形理论及应用国际联合会议 (VISIGRAPP 2019)。[论文]
- 使用障碍物轨迹预测的概率路径规划,CoDS-COMAD 2019。[论文]
- 使用对抗损失的行人轨迹预测,第 19 届瑞士交通研究会议 2019 论文集。[论文] [代码]
2019 年期刊论文
- 一种可扩展的轨迹预测框架,TITS。[论文]
- 用于脆弱道路用户长期意图预测的情境循环预测模型,TITS。[论文]
- 基于结构 LSTM 网络的自动驾驶周围道路用户交互式轨迹预测,TITS。[论文]
- 基于深度学习的交叉口交通仿真与编辑框架,TVCG。[论文]
- Heter-Sim:通过交互式数据驱动优化的异构多智能体系统仿真,TVCG。[论文]
- AADS:使用数据驱动算法增强自动驾驶仿真,SCIENCE ROBOTICS。[论文]
- 学习行人运动的生成式社会感知模型,RAL。[论文]
- 极端拥挤场景下的行人轨迹预测,Sensors。[论文]
- 利用社会亲和性长短期记忆 (Long Short-Term Memory) 网络进行拥挤场景中人类轨迹预测,PR。[论文]
其他 2019 年成果
- 使用图神经网络 (Graph Neural Networks) 进行自动驾驶联合交互与轨迹预测,arXiv preprint arXiv:1912.07882, 2019。[论文]
- 学习推断未来轨迹预测的关系,CVPR Workshops 2019。[论文]
- Social Ways:学习行人轨迹的多模态分布,CVPR Workshops 2019。[论文] [代码]
- 拥挤空间中的社交和场景感知轨迹预测,ICCV Workshops 2019。[论文] [代码]
- 具有注意力循环神经过程的自动驾驶车辆概率轨迹预测,arXiv preprint arXiv:1910.08102, 2019。[论文]
- 带有社交图网络的随机轨迹预测,arXiv preprint arXiv:1907.10233, 2019。[论文]
📚 2020 年会议和期刊论文
2020 年会议论文
- 用于行人轨迹预测的时空图 Transformer 网络,ECCV 2020。[论文] [代码]
- AutoTrajectory:使用动态点从视频中无标签提取和预测轨迹,ECCV 2020。[论文]
- PiP:面向自动驾驶的规划感知轨迹预测,ECCV 2020。[论文] [代码]
- SMART:同时多智能体循环轨迹预测,ECCV 2020。[论文]
- Trajectron++:具有异构数据的动态可行轨迹预测,ECCV 2020。[论文] [代码]
- SimAug:从仿真中学习鲁棒表示以进行轨迹预测,ECCV 2020。[论文] [代码]
- 通过多模态上下文理解实现多样且可行的轨迹预测,ECCV 2020。[论文] [代码]
- 不在于旅程而在于目的地:终点条件化的轨迹预测,ECCV 2020。[论文] [代码]
- 我如何看见我的未来?FvTraj:利用第一人称视角进行行人轨迹预测,ECCV 2020。[论文]
- 用于多智能体运动预测的动态与静态上下文感知 LSTM,ECCV 2020。[论文]
- 学习车道图表示以进行运动预测,ECCV 2020。[论文] [代码]
- 隐式潜在变量模型用于场景一致的运动预测,ECCV 2020。[论文]
- 通过模拟感知和预测测试自动驾驶车辆的安全性,ECCV 2020。[论文]
- 感知、预测与规划:通过可解释语义表示实现安全运动规划,ECCV 2020。[论文]
- 用于轨迹预测的 Transformer 网络,国际模式识别会议 (ICPR 2020)。[论文] [代码]
- DAG-Net:用于轨迹预测的双注意力图神经网络,ICPR 2020。[论文] [代码]
- TNT:目标驱动轨迹预测,机器人学习会议 (CoRL 2020)。[论文] [代码]
- Social-VRNN:交互行人的单次多模态轨迹预测,CoRL 2020。[论文] [代码]
- 用于多模态概率运动预测的核轨迹图,CoRL 2020。[论文] [代码]
- MATS:一种用于规划和控制的解释性轨迹预测表示,CoRL 2020。[论文] [代码]
- 一种基于注意力的交互感知时空图神经网络用于轨迹预测,国际神经网络信息处理大会 (ICONIP 2020)。[论文]
- OpenTraj:评估人类轨迹数据集中的预测复杂度,ACCV 2020。[论文] [代码]
- Goal-GAN:基于目标位置估计的多模态轨迹预测,ACCV 2020。[论文] [代码]
- 行人运动的语义合成,ACCV 2020。[论文] [代码]
- EvolveGraph:具有动态关系推理的多智能体轨迹预测,NIPS 2020。[论文] [网站]
- 模糊查询注意力下的多智能体轨迹预测,NIPS 2020。[论文] [代码]
- 用于交通预测的时空图结构学习,AAAI 2020。[论文]
- GMAN:用于交通预测的图多注意力网络,AAAI 2020。[论文] [代码]
- CF-LSTM:基于级联特征的长短期网络用于预测行人轨迹,AAAI 2020。[论文]
- OMuLeT:飓风轨迹预测的在线多领先时间位置预测,AAAI 2020。[论文]
- 拥挤空间中的多模态交互感知轨迹预测,AAAI 2020。[论文]
- STINet:用于行人检测和轨迹预测的时空交互网络,CVPR 2020。[论文]
- CoverNet:使用轨迹集的多模态行为预测,CVPR 2020。[论文]
- TPNet:用于运动预测的轨迹提议网络,CVPR 2020。[论文]
- 用于人类轨迹预测的互惠学习网络,CVPR 2020。[论文]
- MANTRA:用于多轨迹预测的记忆增强网络,CVPR 2020。[论文]
- 用于轨迹预测的递归社会行为图,CVPR 2020。[论文]
- 分叉路径的花园:迈向多未来轨迹预测,CVPR 2020。[论文] [代码]
- Social-STGCNN:一种用于人类轨迹预测的社会时空图卷积神经网络,CVPR 2020。[论文] [代码]
- VectorNet:从向量化表示编码高清地图和智能体动力学,CVPR 2020。[论文] [代码]
- 用于轨迹预测和填补的模仿非自回归建模,CVPR 2020。[论文]
- 通过神经运动消息传递进行协同运动预测,CVPR 2020。[论文] [代码]
- UST:统一自动驾驶中轨迹预测的时空上下文,IROS 2020。[论文]
- 使用 CNN-LSTM 网络的联网车辆交互感知轨迹预测,IEEE 工业电子学会年会 (IECON 2020)。[论文]
- GISNet:用于车辆轨迹预测的基于信息共享的网络,国际神经网络联合会议 (IJCNN 2020)。[论文]
- 在噪声监督下解耦人类动力学以进行行人运动预测,WACV 2020。[论文] [网站]
- 用于灵活推理、规划和控制的深度模仿模型,ICLR 2020。[论文] [代码] [网站]
- 使用行列式点过程进行多样轨迹预测,ICLR 2020。[论文] [代码]
- 通过关注生态嵌入在异构环境中进行轨迹预测,ACM 国际多媒体会议 2020。[论文] [代码]
- 使用深度时间和空间卷积神经网络进行多轨迹预测,IROS 2020。[论文]
- 用于自动驾驶车辆的带车道注意力的概率多模态轨迹预测,IROS 2020。[论文]
- Lane-Attention:通过学习车辆对车道的注意力来预测车辆移动轨迹,IROS 2020。[论文]
- 用于轨迹预测的交互感知卡尔曼神经网络,IEEE 智能车辆研讨会 (IV 2020)。[论文]
- 用于多模态联合车辆运动预测的多头注意力,ICRA 2020。[论文]
2020 年期刊论文
- TrajVAE:一种用于轨迹生成的变分自编码器(Variational AutoEncoder)模型,Neurocomputing。[paper]
- 基于状态细化 LSTM(长短期记忆网络)的社交感知行人轨迹预测,TPAMI。[paper]
- 利用图 LSTM 中的谱聚类预测道路参与者的轨迹和行为,IEEE Robotics and Automation Letters。[paper]
- 基于注意力(Attention)机制的车辆轨迹预测,IEEE Transactions on Intelligent Vehicles。[paper]
- AC-VRNN:用于多未来轨迹预测的注意力条件变分循环神经网络,Computer Vision and Image Understanding。[paper]
- PoPPL:结合自动路线类别聚类的 LSTM 行人轨迹预测,TNNLS。[paper]
- 使用深度条件生成模型进行实时轨迹预测,IEEE Robotics and Automation Letters。[paper]
- 基于以参与者为中心的空时网格的场景合规轨迹预测,RAL。[paper]
- 恒定速度模型能教给我们关于行人运动预测的什么,RAL。[paper] [code]
- 用于轨迹预测的多模态深度生成模型:一种条件变分自编码器方法,RAL。[paper]
- 深度上下文地图:使用特定位置潜在地图的参与者轨迹预测,RAL。[paper]
- 学习拥挤场景中空间与交互动态的结构化表示以用于轨迹预测,RAL。[paper] [code, code]
- 概率人群 GAN(生成对抗网络):使用图车辆 - 行人注意力网络的多模态行人轨迹预测,RAL。[paper]
- 面向自主街道穿越的多模态交互感知运动预测,International Journal of Robotics Research。[paper]
- 基于深度卷积 LSTM 网络的行人轨迹预测,TITS。[paper] [code]
- 具有空时张量融合的多车协同学习用于轨迹预测,TITS。[paper]
- 使用记忆增强网络对移动参与者进行多轨迹预测,TPAMI。[paper]
- 通过逆强化学习框架正则化神经网络以用于未来轨迹预测,IET Computer Vision。[paper] [code]
- 基于 CNN(卷积神经网络)-LSTM 序列模型的运动轨迹预测,Science China Information Sciences。[paper]
其他 2020 年论文
- 场景门控社交图:基于动态社交图和场景约束的行人轨迹预测,arXiv 预印本 arXiv:2010.05507, 2020。[paper]
- 动态场景中多个智能体的鲁棒轨迹预测,arXiv 预印本 arXiv:2005.13133, 2020。[paper]
- 地图自适应目标导向轨迹预测,arXiv 预印本 arXiv:2009.04450, 2020。[paper]
- 具有空间连续性的时空注意力网络用于轨迹预测,arXiv 预印本 arXiv:2003.06107, 2020。[paper]
- Trajformer:用于自动驾驶的具有局部自注意力上下文的轨迹预测,arXiv 预印本 arXiv:2011.14910, 2020。[paper] [code]
- TPPO:一种带有伪预言家的新颖轨迹预测器,arXiv 预印本 arXiv:2002.01852, 2020。[paper]
- 通过半监督模型的迁移学习进行车辆轨迹预测,arXiv 预印本 arXiv:2007.06781, 2020。[paper]
- Social-WaGDAT:通过 Wasserstein 图双注意力网络实现交互感知轨迹预测,arXiv 预印本 arXiv:2002.06241, 2020。[paper]
- 基于网格计划的条件未知环境轨迹预测,arXiv 预印本 arXiv:2001.00735, 2020。[paper] [code]
- 结合语义地图和动态图注意力网络的自动驾驶多模态轨迹预测,NIPS Workshops 2020。[paper]
- 场景门控社交图:基于动态社交图和场景约束的行人轨迹预测,arXiv 预印本 arXiv:2010.05507, 2020。[paper]
- PathGAN:使用注意力生成对抗网络进行局部路径规划,arXiv 预印本 arXiv:2007.03877, 2020。[paper] [code]
📚 2021 年会议和期刊论文
2021 年会议论文
- 多智能体轨迹预测中的协作不确定性,NIPS 2021。[论文]
- GRIN:用于多智能体轨迹预测的生成关系与意图网络,NIPS 2021。[论文] [代码]
- LibCity:交通预测开源库,SIGSPATIAL 2021。[论文] [代码]
- 使用 Transformer 网络和增强信息预测城市场景中的车辆轨迹,IEEE 智能车辆研讨会 (IV 2021)。[论文]
- Social-STAGE:时空多模态未来轨迹预测,ICRA 2021。[论文]
- AVGCN:基于人类注意力引导的图卷积网络进行轨迹预测,ICRA 2021。[论文]
- 探索多路径轨迹预测的动态上下文,ICRA 2021。[论文] [代码]
- 使用上下文增强的 Transformer 网络进行行人轨迹预测,ICRA 2021。[论文] [代码]
- 用于轨迹预测的光谱时序图神经网络,ICRA 2021。[论文]
- 避障的拥堵感知多智能体轨迹预测,ICRA 2021。[论文] [代码]
- 通过概率预测行人未来运动实现人群中的预见性导航,ICRA 2021。[论文]
- AgentFormer:用于社会 - 时间多智能体预测的感知智能体 Transformer,ICCV 2021。[论文] [代码] [网站]
- 用于轨迹预测的基于似然的多样性采样,ICCV 2021。[论文] [代码]
- MG-GAN:防止行人轨迹预测中分布外样本的多生成器模型,ICCV 2021。[论文] [代码]
- 用于低延迟轨迹预测的时空一致性网络,ICCV 2021。[论文]
- 多模态轨迹预测三步法:模态聚类、分类与合成,ICCV 2021。[论文]
- 从目标、航点与路径到长期人类轨迹预测,ICCV 2021。[论文] [代码]
- 你要去哪里?利用专家目标示例进行动态轨迹预测,ICCV 2021。[论文] [代码]
- DenseTNT:从密集目标集进行的端到端轨迹预测,ICCV 2021。[论文]
- 自动驾驶的安全感知运动预测(针对未见车辆),ICCV 2021。[论文] [代码]
- LOKI:用于轨迹预测的长期与关键意图,ICCV 2021。[论文] [数据集]
- 通过反事实分析进行人类轨迹预测,ICCV 2021。[论文] [代码]
- 通过分布判别进行个性化轨迹预测,ICCV 2021。[论文] [代码]
- 异构轨迹预测的无限邻域交互,ICCV 2021。[论文] [代码]
- Social NCE:社交感知运动表示的对比学习,ICCV 2021。[论文] [代码]
- RAIN:用于运动预测的强化混合注意力推理网络,ICCV 2021。[论文]
- 用于行人轨迹预测的多监督时间金字塔网络,AAAI 2021。[论文]
- SCAN:用于联合多智能体意图预测的空间上下文注意网络,AAAI 2021。[论文]
- 用于行人轨迹预测的解耦多关系图卷积网络,AAAI 2021。[论文] [代码]
- MotionRNN:一种适用于时空变化运动的视频预测灵活模型,CVPR 2021。[论文]
- 使用堆叠 Transformer 进行多模态运动预测,CVPR 2021。[论文] [代码] [网站]
- SGCN:用于行人轨迹预测的稀疏图卷积网络,CVPR 2021。[论文] [代码]
- LaPred:动态智能体多模态未来轨迹的车道感知预测,CVPR 2021。[论文]
- 用于车道感知多样性轨迹预测的分治法,CVPR 2021。[论文]
- Euro-PVI:密集城市中心的行人与车辆交互,CVPR 2021。[论文] [数据集]
- 基于潜在信念能量模型的轨迹预测,CVPR 2021。[论文] [代码]
- 自动驾驶的共享跨模态轨迹预测,CVPR 2021。[论文]
- 基于单目相机的行人与自车轨迹预测,CVPR 2021。[论文] [代码]
- 人群中人类轨迹预测的可解释社会锚点,CVPR 2021。[论文]
- Introvert:通过条件 3D 注意力进行人类轨迹预测,CVPR 2021。[论文]
- MP3:一个统一的建图、感知、预测和规划模型,CVPR 2021。[论文]
- TrafficSim:学习模拟真实的多智能体行为,CVPR 2021。[论文]
- SceneGen:学习生成真实的交通场景,CVPR 2021。[论文]
- 用于行人轨迹预测的多模态 Transformer 网络,IJCAI 2021。[论文] [代码]
- Decoder Fusion RNN:用于轨迹预测的感知上下文和交互的解码器,IROS 2021。[论文]
- 基于 Transformer 的联合意图和轨迹预测,IROS 2021。[论文]
- 使用时空卷积网络进行自动驾驶汽车的基于机动操作的轨迹预测,IROS 2021。[论文]
- 集成多上下文线索的自动驾驶轨迹预测,IROS 2021。[论文]
- MultiXNet:多类多阶段多模态运动预测,IEEE 智能车辆研讨会 (IV 2021)。[论文]
- 基于多头注意力与联合智能体 - 地图表示的自动驾驶轨迹预测,IEEE 智能车辆研讨会 (IV 2021)。[论文]
- Social-IWSTCNN:用于城市交通场景行人轨迹预测的社交交互加权时空卷积神经网络,IV 2021。[论文]
- 生成具有多样行人行为的场景用于自动驾驶车辆测试,机器人学习会议 (CoRL 2021)。[论文] [代码]
- 以车道图遍历为条件的多模态轨迹预测,CoRL 2021。[论文] [代码]
- 使用基于模型的规划学习预测车辆轨迹,CoRL 2021。[论文]
- 使用循环神经网络进行弱势道路使用者的基于姿态的轨迹预测,模式识别国际会议 (ICPR 2021)。[论文]
- GraphTCN:用于人类轨迹预测的时空交互建模,WACV 2021。[论文]
- 目标驱动的长期轨迹预测,WACV 2021。[论文]
- 无需详细先验地图的自动驾驶多模态轨迹预测,WACV 2021。[论文]
- 用于上下文感知行人轨迹预测的自生长空间图网络,IEEE 国际图像处理会议 (ICIP 2021)。[论文] [代码]
- S2TNet:用于自动驾驶轨迹预测的时空 Transformer 网络,亚洲机器学习会议 2021。[论文] [代码]
- 使用等变连续卷积进行轨迹预测,ICLR 2021。[论文] [代码]
- TridentNet:用于动态轨迹生成的条件生成模型,国际智能自主系统会议 2021。[论文]
- HOME:用于未来运动估计的热图输出,ITSC 2021。[论文]
- 基于图和循环神经网络的车辆轨迹预测(用于高速公路驾驶),ITSC 2021。[论文]
- SCSG Attention:用于行人轨迹预测的带注意力的自中心星图,高级应用数据库系统国际会议 (DASFAA 2021)。[论文]
- 利用轨迹预测进行行人视频异常检测,IEEE 计算智能系列研讨会 (SSCI 2021)。[论文] [代码]
2021 年期刊论文
- 社会感知的轨迹预测模型真的具有社会感知能力吗?,Transportation Research: Part C. [paper, paper] [code]
- 在数据驱动的车辆轨迹预测器中注入知识,Transportation Research: Part C. [paper] [code]
- 利用沉浸式虚拟现实和可解释深度学习解码行人与自动驾驶车辆的交互,Transportation Research: Part C. [paper]
- 拥挤环境中的人类轨迹预测:深度学习视角,IEEE Transactions on Intelligent Transportation Systems. [paper] [code]
- NetTraj:一种基于网络的车辆轨迹预测模型,包含方向表示与时空注意力机制,TITS. [paper]
- 用于多智能体预测与跟踪的时空图双注意力网络,TITS. [paper]
- 基于图神经网络的异构交通参与者交互行为预测分层框架,TITS. [paper]
- TrajGAIL:使用生成对抗模仿学习生成城市车辆轨迹,Transportation Research Part C. [paper] [code]
- 使用带有时序逻辑语法树特征的生成对抗网络进行车辆轨迹预测,IEEE ROBOTICS AND AUTOMATION LETTERS. [paper]
- 使用时空注意力机制的 LSTM 进行车辆轨迹预测,IEEE Intelligent Transportation Systems Magazine. [paper] [code]
- 基于长短期记忆的网联自动驾驶环境下人工驾驶车辆纵向轨迹预测,Transportation Research Record. [paper]
- 用于行人轨迹预测的带有空间 - 时间注意力的时间金字塔网络,IEEE Transactions on Network Science and Engineering. [paper]
- 一种基于门控线性单元的高效时空轨迹预测模型,Neurocomputing. [paper]
- SRAI-LSTM:一种基于社会关系注意力的交互感知 LSTM 用于人类轨迹预测,Neurocomputing. [paper]
- AST-GNN:一种基于注意力的时空图神经网络用于交互感知行人轨迹预测,Neurocomputing. [paper]
- Multi-PPTP:复杂路口场景下的多模态概率行人轨迹预测,IEEE Transactions on Intelligent Transportation Systems. [paper]
- 一种带有伪预言机的新型基于图的轨迹预测器,TNNLS. [paper]
- 基于两阶段 GAN 的基于地图的大规模 GPS 轨迹生成,Journal of Data Science. [paper] [code]
- 基于姿态和语义地图的弱势道路使用者轨迹概率预测,IEEE Transactions on Intelligent Vehicles. [paper]
- STI-GAN:使用时空交互和生成对抗网络的多模态行人轨迹预测,IEEE Access. [paper]
- 用于行人轨迹预测的整体 LSTM,TIP. [paper]
- 使用卷积神经网络进行行人轨迹预测,PR. [paper]
- 利用与环境多重交互的基于 LSTM 的骑行者轨迹预测模型,PR. [paper]
- 使用 LSTM 模型和 GAN 进行人类轨迹预测与生成,PR. [paper]
- 使用 LSTM 模型和 GAN 进行车辆轨迹预测与生成,Plos one. [paper]
- BiTraP:具有多模态目标估计的双向行人轨迹预测,RAL. [paper] [code]
- 通用高速公路场景下的轨迹预测运动学模型,RAL. [paper] [code]
- 自动驾驶中的轨迹预测:带有车道航向辅助损失,RAL. [paper]
- 使用带有时序逻辑语法树特征的生成对抗网络进行车辆轨迹预测,RAL. [paper]
- Tra2Tra:带有全局社会时空注意力神经网络的轨迹到轨迹预测,RAL. [paper]
- 用于行人轨迹预测的社会图卷积 LSTM,IET Intelligent Transport Systems. [paper]
- HSTA:用于轨迹预测的分层时空注意力模型,IEEE Transactions on Vehicular Technology (TVT). [paper]
- 用于车辆轨迹预测的环境注意力网络,TVT. [paper]
- 他们要去哪里?拥挤场景中的人类行为预测,ACM Transactions on Multimedia Computing, Communications, and Applications (TOMM). [paper]
- 带有时空序列融合的多智能体轨迹预测,IEEE Transactions on Multimedia (TMM). [paper]
其他 2021
- 多类别场景下基于生成对抗网络 (GAN) 的轨迹预测,arXiv 预印本 arXiv:2110.11401, 2021。[paper]
- 用于交通场景轨迹预测的空间 - 通道 Transformer 网络,arXiv 预印本 arXiv:2101.11472, 2021。[paper]
- 物理可行的车辆轨迹预测,arXiv 预印本 arXiv:2104.14679, 2021。[paper]
- MSN:用于轨迹预测的多风格网络,arXiv 预印本 arXiv:2107.00932, 2021。[paper] [code]
- 重新思考轨迹预测评估,arXiv 预印本 arXiv:2107.10297, 2021。[paper]
- 基于空间交互 Transformer 网络的行人轨迹预测,IEEE 智能车辆研讨会工作坊 (IV Workshops 2021)。[paper]
- 深度社会力,arXiv 预印本 arXiv:2109.12081, 2021。[paper] [code]
📚 2022 会议与期刊论文
2022 年会议论文
- 用于行人轨迹预测的社会可解释树,AAAI 2022。[论文] [代码]
- 用于行人轨迹预测的互补注意力门控网络,AAAI 2022。[论文] [代码]
- 场景 Transformer:一种用于预测多个智能体未来轨迹的统一架构,ICLR 2022。[论文]
- 你大多独自行走:分析轨迹预测中的特征归因,ICLR 2022。[论文]
- 潜在变量序列集合 Transformer 用于联合多智能体运动预测,ICLR 2022。[论文] [代码]
- THOMAS:具有学习到的多智能体采样的轨迹热力图输出,ICLR 2022。[论文]
- 记住意图:基于回顾性记忆的轨迹预测,CVPR 2022。[论文] [代码]
- STCrowd:拥挤场景中行人感知的多模态数据集,CVPR 2022。[论文] [代码]
- 车辆轨迹预测有效,但并非处处适用,CVPR 2022。[论文] [代码]
- 通过运动不确定性扩散进行随机轨迹预测,CVPR 2022。[论文] [代码]
- 用于随机人类轨迹预测的非概率采样网络,CVPR 2022。[论文] [代码]
- 关于自动驾驶车辆轨迹预测的对抗鲁棒性,CVPR 2022。[论文] [代码]
- 通过可迁移图神经网络 (GNN) 进行自适应轨迹预测,CVPR 2022。[论文]
- 迈向鲁棒和自适应的运动预测:一个因果表示视角,CVPR 2022。[论文] [代码, 代码]
- 多少观测就足够了?用于轨迹预测的知识蒸馏,CVPR 2022。[论文]
- 向所有车辆学习,CVPR 2022。[论文] [代码]
- 通过未来目标检测从 LiDAR 进行预测,CVPR 2022。[论文] [代码]
- 基于占用栅格地图的端到端轨迹分布预测,CVPR 2022。[论文] [代码]
- M2I:从分解边缘轨迹预测到交互式预测,CVPR 2022。[论文] [代码]
- GroupNet:用于具有关系推理的轨迹预测的多尺度超图神经网络,CVPR 2022。[论文] [代码]
- 这究竟是谁的轨迹?通过基于亲和度的预测提高对跟踪误差的鲁棒性,CVPR 2022。[论文]
- ScePT:用于规划的与场景一致的基于策略的轨迹预测,CVPR 2022。[论文] [代码]
- 基于记忆回放的图空间 Transformer 用于多未来行人轨迹预测,CVPR 2022。[论文] [代码]
- MUSE-VAE:用于环境感知长期轨迹预测的多尺度变分自编码器 (VAE),CVPR 2022。[论文]
- LTP:用于自动驾驶的基于车道线的轨迹预测,CVPR 2022。[论文]
- ATPFL:联邦学习框架下的自动轨迹预测模型设计,CVPR 2022。[论文]
- 瞬时观测下的人类轨迹预测,CVPR 2022。[论文]
- HiVT:用于多智能体运动预测的分层向量 Transformer,CVPR 2022。[论文] [代码]
- 运动预测中 HD 地图的路径感知图注意力,ICRA 2022。[论文]
- 使用语言表示的轨迹预测,ICRA 2022。[论文]
- 利用平滑注意力先验进行多智能体轨迹预测,ICRA 2022。[论文] [网站]
- KEMP:用于长期轨迹预测的基于关键帧的分层端到端深度学习模型,ICRA 2022。[论文]
- 基于视觉的驾驶轨迹生成的域泛化,ICRA 2022。[论文] [网站]
- 用于交互感知轨迹预测的深度概念图网络,ICRA 2022。[论文]
- 使用迭代注意力块的条件人类轨迹预测,ICRA 2022。[论文]
- StopNet:面向城市自动驾驶的可扩展轨迹和占用预测,ICRA 2022。[论文]
- 时空图上的元路径分析用于行人轨迹预测,ICRA 2022。[论文] [网站]
- 通过轨迹预测传播状态不确定性,ICRA 2022。[论文] [代码]
- HYPER:通过分解推理和自适应采样学习的混合轨迹预测,ICRA 2022。[论文]
- Grouptron:用于群体感知密集人群轨迹预测的动态多尺度图卷积网络,ICRA 2022。[论文]
- 基于跨模态 Transformer 的行人轨迹预测生成框架,ICRA 2022。[论文]
- 带有拓扑度量地图的自动驾驶轨迹预测,ICRA 2022。[论文] [代码]
- CRAT-Pred:结合晶体图卷积神经网络和多头自注意力的车辆轨迹预测,ICRA 2022。[论文] [代码]
- MultiPath++:用于行为预测的高效信息融合和轨迹聚合,ICRA 2022。[论文]
- 用于自动驾驶的基于 Transformer 神经网络的多模态运动预测,ICRA 2022。[论文]
- GOHOME:面向未来运动估计的图导向热力图输出,ICRA 2022。[论文]
- TridentNetV2:用于动态轨迹生成的轻量级图形全局计划表示,ICRA 2022。[论文]
- 结合类别不确定性的异构智能体轨迹预测,IROS 2022。[论文] [代码] [轨迹数据]
- 基于图的双尺度上下文融合的轨迹预测,IROS 2022。[论文] [代码]
- 学习行人群体表示用于多模态轨迹预测,ECCV 2022。[论文] [代码]
- Social-Implicit:重新思考轨迹预测评估及隐式最大似然估计的有效性,ECCV 2022。[论文] [代码] [网站]
- 用于多模态车辆轨迹预测的分层潜在结构,ECCV 2022。[论文] [代码]
- SocialVAE:使用时序潜在变量进行人类轨迹预测,ECCV 2022。[论文] [代码]
- 垂直视角:通过傅里叶频谱进行轨迹预测的分层网络,ECCV 2022。[论文] [代码]
- 入口翻转 Transformer 用于参与者行为的推理和预测,ECCV 2022。[论文]
- D2-TPred:交通信号灯下轨迹预测的不连续依赖,ECCV 2022。[论文] [代码]
- 通过神经社会物理进行人类轨迹预测,ECCV 2022。[论文] [代码]
- Social-SSL:基于 Transformer 的用于多智能体轨迹预测的自监督跨序列表示学习,ECCV 2022。[论文] [代码]
- 感知历史:利用局部行为数据进行轨迹预测,ECCV 2022。[论文] [代码]
- 用于轨迹预测的基于动作的对比学习,ECCV 2022。[论文]
- AdvDO:用于轨迹预测的真实对抗攻击,ECCV 2022。[论文]
- ST-P3:通过时空特征学习实现端到端视觉自动驾驶,ECCV 2022。[论文] [代码]
- Social ODE:使用神经常微分方程 (ODE) 进行多智能体轨迹预测,ECCV 2022。[论文]
- 从场景历史预测人类轨迹,NIPS 2022。[论文] [代码]
- 用于端到端自动驾驶的轨迹引导控制预测:一个简单而强大的基线,NIPS 2022。[论文] [代码]
- 具有全局意图定位和局部运动细化的运动 Transformer,NIPS 2022。[论文] [网站]
- 使用多重注意力进行交互建模,NIPS 2022。[论文] [代码]
- 深度交互式运动预测和规划:与运动预测模型玩游戏,动力学与控制学习会议 (L4DC)。[论文] [网站]
- 针对对抗攻击的鲁棒轨迹预测,CoRL 2022。[论文] [代码]
- 使用扩散进行规划以实现灵活的行为合成,ICML 2022。[论文] [网站]
- 带有误差补偿的同步双向行人轨迹预测,ACCV 2022。[论文]
- 用于城市驾驶的基于模型的模仿学习,NIPS 2022。[论文] [代码]
2022 年期刊论文
- AI-TP:面向自动驾驶的基于注意力的交互感知轨迹预测,IEEE Transactions on Intelligent Vehicles. [paper] [code]
- MDST-DGCN:用于行人轨迹预测的多级动态时空有向图卷积网络 (GCN),Computational Intelligence and Neuroscience. [paper]
- 基于图卷积神经网络 (CNN) 的自动驾驶车辆轨迹预测,TITS. [paper]
- 具有异构边增强图注意力的多智能体轨迹预测,TITS. [paper]
- 带有注意力机制的全卷积编码器 - 解码器用于实用行人轨迹预测,TITS. [paper]
- STGM:基于时空特征生成模型的车辆轨迹预测,TITS. [paper]
- 使用时空图注意力 Transformer (Transformer 模型) 进行自动驾驶轨迹预测,TITS. [paper]
- 基于时空动态注意力网络的意图感知车辆轨迹预测用于车联网,TITS. [paper] [code]
- 基于先验感知有向图卷积神经网络的轨迹预测,TITS. [paper]
- DeepTrack:高速公路车辆轨迹预测的轻量级深度学习,TITS. [paper]
- 使用集成驾驶风险图的深度学习方法进行高速公路周围车辆的交互式轨迹预测,TITS. [paper]
- 通过异构上下文感知图卷积网络在互联环境中进行车辆轨迹预测,TITS. [paper]
- 基于时间模式注意力的轨迹预测神经网络和模型解释,TITS. [paper]
- 学习部分检测行人的稀疏交互图用于轨迹预测,RAL. [paper] [code]
- GAMMA:面向自动驾驶的通用智能体运动预测模型,RAL. [paper] [code]
- 用于轨迹预测的逐步目标驱动网络,RAL. [paper] [code]
- GA-STT:具有群体感知时空 Transformer 的人体轨迹预测,RAL. [paper]
- 使用生成对抗网络 (GAN) 进行长期 4D 轨迹预测,Transportation Research Part C: Emerging Technologies. [paper]
- 面向自动化车辆的上下文感知行人轨迹预测框架,Transportation Research Part C: Emerging Technologies. [paper]
- 使用注意力模型的可解释多模态轨迹预测,Transportation Research Part C: Emerging Technologies. [paper]
- CSCNet:拥挤空间中轨迹预测的上下文语义一致性网络,PR. [paper]
- CSR:用于行人轨迹预测的具有社交感知回归的级联条件变分自编码器,PR. [paper]
- Step Attention:序列行人轨迹预测,IEEE Sensors Journal. [paper]
- 双重注意力机制下耦合本车运动趋势的车辆轨迹预测方法,IEEE Transactions on Instrumentation and Measurement. [paper]
- 时空交互感知和轨迹分布感知图卷积网络用于行人多模态轨迹预测,IEEE Transactions on Instrumentation and Measurement. [paper]
- 深度编码器 - 解码器神经网络:基于深度学习的自动驾驶车辆轨迹预测和校正模型,Physica A: Statistical Mechanics and its Applications. [paper]
- PTPGC:利用带有 ConvLSTM (卷积长短期记忆网络) 的图注意力网络进行行人轨迹预测,Robotics and Autonomous Systems. [paper]
- GCHGAT:使用群体约束层次图注意力网络进行行人轨迹预测,Applied Intelligence. [paper]
- 使用循环变分自编码器 (VAE) 网络进行车辆轨迹预测,IEEE Access. [paper] [code]
- SEEM:基于序列熵能量的行人轨迹全然后一预测模型,TPAMI. [paper]
- PTP-STGCN:基于时空图卷积神经网络的行人轨迹预测,Applied Intelligence. [paper]
- 轨迹分布:轨迹预测中运动的新描述,Computational Visual Media. [paper]
- 基于多尺度时空图的自动驾驶轨迹预测,IET Intelligent Transport Systems. [paper]
- 基于记忆增强网络的持续学习轨迹预测,Knowledge-Based Systems. [paper]
- Atten-GAN:基于注意力机制的生成对抗网络 (GAN) 行人轨迹预测,Cognitive Computation. [paper]
- EvoSTGAT:用于行人轨迹预测的演化时空图注意力网络,Neurocomputing. [paper]
其他 2022
- 提升运动预测中的上下文感知能力,CVPR 研讨会 2022。[论文] [代码]
- 用于轨迹预测的目标驱动自注意力循环网络,CVPR 研讨会 2022。[论文] [代码]
- 重要性在于你的注意力:自动驾驶中的代理重要性预测,CVPR 研讨会 2022。[论文]
- MPA:基于 MultiPath++ 的运动预测架构,CVPR 研讨会 2022。[论文] [代码]
- TPAD:在轨迹异常检测模型的指导下识别有效的轨迹预测,arXiv:2201.02941, 2022。[论文]
- Wayformer:通过简单且高效的注意力网络进行运动预测,arXiv 预印本 arXiv:2207.05844, 2022。[论文]
- PreTR:时空非自回归轨迹预测 Transformer,arXiv 预印本 arXiv:2203.09293, 2022。[论文]
- LatentFormer:基于 Transformer 的多智能体交互建模与轨迹预测,arXiv 预印本 arXiv:2203.01880, 2022。[论文]
- 使用带车道损失的二阶段预测网络进行多样化的多轨迹预测,arXiv 预印本 arXiv:2206.08641, 2022。[论文]
- 用于轨迹预测的半监督语义引导对抗训练,arXiv 预印本 arXiv:2205.14230, 2022。[论文]
- 通过风险和场景图学习进行异构轨迹预测,arXiv 预印本 arXiv:2211.00848, 2022。[论文]
- GATraj:一种基于图和注意力的多智能体轨迹预测模型,arXiv 预印本 arXiv:2209.07857, 2022。[论文] [代码]
- 具有关系推理能力的动态组感知网络用于多智能体轨迹预测,arXiv 预印本 arXiv:2206.13114, 2022。[论文]
- 协作不确定性有益于多智能体多模态轨迹预测,arXiv 预印本 arXiv:2207.05195, 2022。[论文] [代码]
- 用于可控交通仿真的引导条件扩散,arXiv 预印本 arXiv:2210.17366, 2022。[论文] [网站]
- PhysDiff:物理引导的人体运动扩散模型,arXiv 预印本 arXiv:2212.02500, 2022。[论文]
- 基于时序图的轨迹预测,arXiv 预印本 arXiv:2207.00255, 2022。[论文] [网站]
📚 2023 会议与期刊论文
2023 年会议论文
- 用于随机运动预测的人类关节运动学扩散细化方法,AAAI 2023。[paper]
- 用于行人轨迹预测的多流表示学习,AAAI 2023。[paper] [code]
- 基于两阶段 GAN 的连续轨迹生成,AAAI 2023。[paper] [code]
- 基于控制点集的行人轨迹预测,AAAI 2023。[paper] [code]
- WSiP:用于动态交互感知轨迹预测的波叠加启发池化,AAAI 2023。[paper] [code]
- 利用未来关系推理进行车辆轨迹预测,ICLR 2023。[paper]
- IPCC-TP:利用增量皮尔逊相关系数进行联合多智能体轨迹预测,CVPR 2023。[paper]
- FEND:用于长尾轨迹预测的未来增强分布感知对比学习框架,CVPR 2023。[paper]
- Trace and Pace:通过引导式轨迹扩散实现可控行人动画,CVPR 2023。[paper] [website]
- FJMP:在学到的有向无环交互图上进行因子化联合多智能体运动预测,CVPR 2023。[paper] [website]
- 用于随机轨迹预测的蛙跳扩散模型,CVPR 2023。[paper] [code]
- ViP3D:通过 3D 智能体查询进行端到端视觉轨迹预测,CVPR 2023。[paper] [website]
- EqMotion:具有不变交互推理的等变多智能体运动预测,CVPR 2023。[paper] [code]
- 揭示缺失模式:面向轨迹补全与预测的统一框架,CVPR 2023。[paper]
- 用于随机人类轨迹预测的无监督采样促进,CVPR 2023。[paper] [code]
- 刺激验证是多模态人类轨迹预测中的通用有效采样器,CVPR 2023。[paper]
- 以查询为中心的轨迹预测,CVPR 2023。[paper] [code] [QCNeXt]
- 用于自动驾驶的弱监督类别无关运动预测,CVPR 2023。[paper]
- 更多分解与更好聚合:对人类运动预测频率表示学习的两次深入观察,CVPR 2023。[paper]
- MotionDiffuser:使用扩散的可控多智能体运动预测,CVPR 2023。[paper]
- 规划导向自动驾驶,CVPR 2023。[paper] [code]
- TrafficGen:学习生成多样且真实的交通场景,ICRA 2023。[paper] [code]
- GANet:用于运动预测的目标区域网络,ICRA 2023。[paper] [code]
- TOFG:自动驾驶中统一且细粒度的环境表示,ICRA 2023。[paper]
- SSL-Lanes:自动驾驶运动预测的自监督学习,CoRL 2023。[paper] [code]
- PowerBEV:一种强大且轻量级的鸟瞰图实例预测框架,IJCAI 2023。[paper] [code]
- HumanMAC:用于人类运动预测的掩码运动补全,ICCV 2023。[paper] [code]
- BeLFusion:用于行为驱动人类运动预测的潜在扩散,ICCV 2023。[paper] [code]
- EigenTrajectory:用于多模态轨迹预报的低秩描述符,ICCV 2023。[paper] [code]
- ADAPT:带有适应的高效多智能体轨迹预测,ICCV 2023。[paper] [code]
- 基于图的轨迹预测的微分约束运动模型评估,IV 2023。[paper] [code]
- LimSim:长期交互式多场景交通模拟器,ITSC 2023。[paper] [code]
- V2X-Seq:用于车路协同感知与预测的大规模序列数据集,CVPR 2023。[paper] [code]
- INT2:交叉口的交互式轨迹预测,ICCV 2023。[paper] [code]
- 用于行人轨迹预测的轨迹统一 Transformer,ICCV 2023。[paper]
- 稀疏实例条件的多模态轨迹预测,ICCV 2023。[paper]
- MotionLM:多智能体运动预测作为语言建模,ICCV 2023。[paper]
- 轨迹预测上概率密度估计的快速推理与更新,ICCV 2023。[paper] [code]
- ADAPT:动作感知驾驶描述 Transformer,ICRA 2023。[paper] [code]
- 场景扩散:使用扩散的可控驾驶场景生成,NIPS 2023。[paper]
- BCDiff:用于瞬时轨迹预测的双向一致扩散,NIPS 2023。[paper]
- 带有潜在扩散先验的多模态轨迹预测的条件变分推断,太平洋地区人工智能国际会议 (PRICAI 2023)。[paper]
- 通过场景级扩散的语言引导交通模拟,CoRL 2023。[paper]
- 语言条件交通生成,CoRL 2023。[paper] [code]
- LightSim:城市场景的神经光照模拟,NIPS 2023。[paper] [website]
- 自动驾驶轨迹预测中真正重要的是什么?NIPS 2023。[paper] [code]
2023 年期刊论文
- MVHGN:基于多视图自适应分层空间图卷积网络的非同质交通智能体轨迹预测,TITS。[paper]
- 通过可迁移分层 Transformer 网络实现异构智能体的自适应与同步轨迹预测,TITS。[paper]
- SSAGCN:用于行人轨迹预测的社会软注意力图卷积网络,TNNLS。[paper] [code]
- 解耦人群交互以进行行人轨迹预测,RAL。[paper]
- VNAGT:用于多智能体轨迹预测的变分非自回归图 Transformer 网络,IEEE Transactions on Vehicular Technology。[paper]
- 时空谱 LSTM:一种用于行人轨迹预测的可迁移模型,TIV。[paper]
- 整体 Transformer:用于自动驾驶车辆轨迹预测与决策的联合神经网络,PR。[paper]
- Tri-HGNN:学习融合三重策略的分层图神经网络用于行人轨迹预测,PR。[paper]
- 基于逆强化学习与风险规避的城市无信号灯交叉口多模态车辆轨迹预测,TITS。[paper]
- 基于多尺度时空图的自动驾驶轨迹预测,IET Intelligent Transport Systems。[paper]
- 用于人类轨迹预测的社会自注意力生成对抗网络,IEEE Transactions on Artificial Intelligence。[paper]
- CSIR:具有迭代社会感知重思考的级联滑动条件变分自编码器用于轨迹预测,TITS。[paper]
- 使用 Transformer 网络的高速公路自动驾驶多模态机动与轨迹预测,RAL。[paper]
- 一种用于高速公路车辆轨迹预测的物理信息 Transformer 模型,Transportation Research Part C: Emerging Technologies。[paper] [code]
- MacFormer:用于实时且鲁棒轨迹预测的地图 - 智能体耦合 Transformer,RAL。[paper]
- MRGTraj:一种用于人类轨迹预测的新型非自回归方法,TCSVT。[paper] [code]
- 受规划启发的通过横向 - 纵向分解实现自动驾驶分层轨迹预测,TIV。[paper]
- 一种通过条件扩散模型的多模态车辆轨迹预测框架:由粗到细的方法,KBS。[paper]
- 轨迹预测中的模态探索、检索与适应,TPAMI。[paper]
- MFAN:用于轨迹预测的混合特征注意力网络,PR。[paper]
- IE-GAN:一种基于生成对抗网络的数据驱动人群模拟方法,Multimedia Tools and Applications。[paper]
- 考虑时空交互与场景信息的轨迹分布感知图卷积网络用于轨迹预测,TKDE。[paper]
- 具有多级时空建模的交通免地图轨迹预测,TIV。[paper]
- STIGCN:用于行人轨迹预测的时空交互感知图卷积网络,The Journal of Supercomputing。[paper] [code]
- 面向智能车辆的随机非自回归 Transformer 基础多模态行人轨迹预测,TITS。[paper] [code]
- 基于结构 Informer 方法的自动驾驶轨迹预测,IEEE Transactions on Automation Science and Engineering。[paper]
- MTP-GO:基于神经常微分方程的图概率多智能体轨迹预测,IEEE Transactions on Intelligent Vehicles。[paper] [code]
其他 2023
- Traj-MAE:用于轨迹预测的掩码自编码器,arXiv 预印本 arXiv:2303.06697, 2023。[论文]
- 通过分布扩散 (Diffusion) 实现不确定性感知行人轨迹预测,arXiv 预印本 arXiv:2303.08367, 2023。[论文]
- DiffTraj:使用扩散概率模型生成 GPS 轨迹,arXiv 预印本 arXiv:2304.11582, 2023。[论文] [代码]
- Multiverse Transformer(变换器):Waymo Open Sim Agents Challenge 2023 第一名解决方案,CVPR 2023 自动驾驶研讨会。[论文] [官网]
- Joint-Multipath++ for Simulation Agents:Waymo Open Sim Agents Challenge 2023 第二名解决方案,CVPR 2023 自动驾驶研讨会。[论文] [代码]
- MTR++:具有对称场景建模和引导意图查询的多智能体运动预测,Waymo Open Motion Prediction Challenge 2023 第一名解决方案,CVPR 2023 自动驾驶研讨会。[论文] [代码]
- GameFormer:面向自动驾驶的基于 Transformer 的交互式预测与规划的博弈建模与学习,arXiv 预印本 arXiv:2303.05760, 2023。[论文] [代码] [官网]
- GameFormer Planner:面向自动驾驶车辆的赋能学习的交互式预测与规划框架,CVPR 2023 端到端 (End-to-End) 自动驾驶研讨会的 nuPlan 规划挑战赛。[论文] [代码]
- trajdata:多个人类轨迹数据集的统一接口,arXiv 预印本 arXiv:2307.13924, 2023。[论文] [代码]
- 使用扩散图卷积网络进行基于图的交互感知多模态 2D 车辆轨迹预测,arXiv 预印本 arXiv:2309.01981, 2023。[论文]
- EquiDiff:用于轨迹预测的条件等变扩散模型,arXiv 预印本 arXiv:2308.06564, 2023。[论文]
- DICE:用于轨迹预测的带评分的多样化扩散模型,arXiv 预印本 arXiv:2310.14570, 2023。[论文]
- 使用基于动力学的深度学习进行行人轨迹预测,arXiv 预印本 arXiv:2309.09021, 2023。[论文] [代码]
- VT-Former:面向智能公路交通系统的基于 Transformer 的车辆轨迹预测方法,arXiv 预印本 arXiv:2311.06623, 2023。[论文]
- 学习用于运动预测的合作轨迹表示,arXiv 预印本 arXiv:2311.00371, 2023。[论文] [代码]
- Social-Transmotion:可提示的人类轨迹预测,arXiv 预印本 arXiv:2312.16168, 2023。[论文] [代码]
- RealGen:用于可控交通场景的检索增强生成 (RAG),arXiv 预印本 arXiv:2312.13303, 2023。[论文] [代码]
- SceneDM:具有一致性扩散模型的场景级多智能体轨迹生成,arXiv 预印本 arXiv:2311.15736, 2023。[论文] [官网]
- DriveDreamer:迈向由真实世界驱动的自动驾驶世界模型 (World Models),arXiv 预印本 arXiv:2309.09777, 2023。[论文] [官网]
- 自动驾驶的语言提示,arXiv 预印本 arXiv:2309.04379, 2023。[论文] [代码]
- GAIA-1:自动驾驶的生成式世界模型,arXiv 预印本 arXiv:2309.17080, 2023。[论文] [官网]
- LanguageMPC:作为自动驾驶决策者的大语言模型 (LLM),arXiv 预印本 arXiv:2310.03026, 2023。[论文] [官网]
- DriveGPT4:通过大语言模型实现可解释的端到端自动驾驶,arXiv 预印本 arXiv:2310.01412, 2023。[论文] [官网]
- Drive Like a Human:利用大语言模型重新思考自动驾驶,arXiv 预印本 arXiv:2307.07162, 2023。[论文] [代码]
- DiLu:一种利用大语言模型的知识驱动型自动驾驶方法,arXiv 预印本 arXiv:2309.16292, 2023。[论文] [官网]
- DrivingDiffusion:使用潜在扩散模型进行布局引导的多视角驾驶场景视频生成,arXiv 预印本 arXiv:2310.07771, 2023。[论文] [官网]
- Driving with LLMs:融合对象级向量模态以实现可解释的自动驾驶,arXiv 预印本 arXiv:2310.01957, 2023。[论文] [代码]
- WEDGE:从生成式视觉 - 语言模型构建的多天气自动驾驶数据集,CVPR 2023 研讨会。[论文] [官网]
- BEVGPT:用于自动驾驶预测、决策和规划的生成式预训练大模型,arXiv 预印本 arXiv:2310.10357, 2023。[论文]
- 扩散世界模型,ICLR 2024 会议投稿,2023。[论文]
- Waymax:用于大规模自动驾驶研究的加速数据驱动模拟器,arXiv 预印本 arXiv:2310.08710, 2023。[论文] [代码] [官网]
- MagicDrive:具有多样化 3D 几何控制的街景生成,arXiv 预印本 arXiv:2310.02601, 2023。[论文] [官网]
- GPT-Driver:使用 GPT 学习驾驶,arXiv 预印本 arXiv:2310.01415, 2023。[论文] [代码]
- 你能描述正在发生的事情吗?将预训练语言编码器集成到自动驾驶轨迹预测模型中,arXiv 预印本 arXiv:2309.05282, 2023。[论文]
- HiLM-D:迈向自动驾驶多模态大语言模型的高分辨率理解,arXiv 预印本 arXiv:2309.05186, 2023。[论文]
- 面向自动驾驶的语言智能体,arXiv 预印本 arXiv:2311.10813, 2023。[论文] [官网]
- ADriver-I:自动驾驶的通用世界模型,arXiv 预印本 arXiv:2311.13549, 2023。[论文]
- LLM4Drive:自动驾驶大语言模型综述,arXiv 预印本 arXiv:2311.01043, 2023。[论文] [代码]
- 自动驾驶与智能交通系统中的视觉语言模型,arXiv 预印本 arXiv:2310.14414, 2023。[论文]
- 与 GPT-4V(ision) 同行:视觉 - 语言模型在自动驾驶上的早期探索,arXiv 预印本 arXiv:2311.05332, 2023。[论文] [代码]
- Driving into the Future:利用世界模型进行自动驾驶的多视角视觉预测与规划,arXiv 预印本 arXiv:2311.17918, 2023。[论文] [代码] [官网]
- 自动驾驶多模态大语言模型综述,arXiv 预印本 arXiv:2311.12320, 2023。[论文] [代码]
- Panacea:面向自动驾驶的全景可控视频生成,arXiv 预印本 arXiv:2311.16813, 2023。[论文] [官网] [代码]
- LMDrive:利用大语言模型进行闭环端到端驾驶,arXiv 预印本 arXiv:2312.07488, 2023。[论文] [代码]
- DriveMLM:将多模态大语言模型与自动驾驶行为规划状态对齐,arXiv 预印本 arXiv:2312.09245, 2023。[论文] [代码]
- 语言模型、智能体模型与世界模型:机器推理与规划的 LAW,arXiv 预印本 arXiv:2312.05230, NIPS Tutorial 2023。[论文] [官网]
- Dolphins:用于驾驶的多模态语言模型,arXiv 预印本 arXiv:2312.00438, 2023。[论文] [官网]
- DriveLM:通过图视觉问答进行驾驶,arXiv 预印本 arXiv:2312.14150, 2023。[论文] [代码] [官网]
- LingoQA:自动驾驶的视频问答,arXiv 预印本 arXiv:2312.14115, 2023。[论文] [代码]
- ViFiT:从惯性测量单元 (IMU) 和 Wi-Fi 精细时间测量重建视觉轨迹,MobiCom ISACom Workshop 2023。[论文] [代码]
📚 2024 年会议与期刊论文
2024 年会议论文
- BAT:面向自动驾驶的行为感知类人轨迹预测,AAAI 2024。[论文] [代码]
- NuScenes-QA:自动驾驶场景的多模态视觉问答基准,AAAI 2024。[论文] [代码]
- SocialCVAE:通过交互条件潜在变量预测行人轨迹,AAAI 2024。[论文] [代码]
- 通过神经随机微分方程提升跨域轨迹预测的可迁移性,AAAI 2024。[论文] [代码]
- 语言能胜过数值回归吗?基于语言的多模态轨迹预测,CVPR 2024。[论文] [代码]
- SingularTrajectory:使用扩散模型的通用轨迹预测器,CVPR 2024。[论文] [代码]
- 生成并利用在线地图不确定性进行轨迹预测,CVPR 2024。[论文] [代码]
- HPNet:带有历史预测注意力的动态轨迹预测,CVPR 2024。[论文] [代码]
- 适应长度偏移:用于轨迹预测的 FlexiLength 网络,CVPR 2024。[论文]
- T4P:通过掩码自编码器和特定角色令牌记忆实现轨迹预测的测试时训练,CVPR 2024。[论文] [代码]
- SocialCircle:学习基于角度的社会交互表示以用于行人轨迹预测,CVPR 2024。[论文] [代码]
- 自然数据投毒对自动驾驶轨迹预测的对抗后门攻击,CVPR 2024。[论文]
- CaDeT:一种用于自动驾驶鲁棒轨迹预测的因果解耦方法,CVPR 2024。
- 用于行人轨迹预测的高阶关系推理,CVPR 2024。
- 基于 Motif 矩阵的密度自适应多智能体轨迹预测模型,CVPR 2024。
- OOSTraj:具有视觉定位去噪的视外轨迹预测,CVPR 2024。[论文] [代码]
- SmartRefine:用于高效运动预测的场景自适应精炼框架,CVPR 2024。[论文] [代码]
- MFTraj:面向自动驾驶的无地图、行为驱动轨迹预测,IJCAI 2024。[论文]
- 用于自动驾驶轨迹预测的特征化扩散与时空交互网络,IJCAI 2024。[论文]
- 混合自主环境下自动驾驶的认知驱动轨迹预测模型,IJCAI 2024。[论文]
- 缺失观测下自动驾驶的物理信息轨迹预测,IJCAI 2024。[论文]
- 探索大语言模型在轨迹预测中的应用:技术视角,ACM/IEEE 人机交互国际会议 (HRI 2024)。[论文]
- SpectrumNet:用于行人轨迹预测的基于频谱的轨迹编码神经网络,IEEE 声学、语音和信号处理国际会议 (ICASSP 2024)。[论文]
- MapFlow:使用归一化流的多人智能体行人轨迹预测,ICASSP 2024。[论文]
- 可提示的闭环交通仿真,CoRL 2024。[论文] [代码]
- TrajCLIP:使用对比学习和幂等网络的行人轨迹预测方法,NIPS 2024。[论文]
- 缺失数据下的行人轨迹预测:数据集、插补与基准测试,NIPS 2024。[论文] [代码]
- LaKD:针对任意长度观测的轨迹预测的长度无关知识蒸馏,NIPS 2024。[论文]
- 无人机辅助无人机:多无人机物体轨迹预测及其他应用的协作框架,NIPS 2024。[论文] [代码]
- MGF:用于多样化轨迹预测的混合高斯流,NIPS 2024。[论文] [代码]
- 推理交互式自动驾驶中的多智能体行为拓扑,NIPS 2024。[论文] [代码]
- SMART:通过下一个 token 预测实现可扩展的多智能体实时仿真,NIPS 2024。[论文] [代码]
- MART:用于多智能体轨迹预测的多尺度关系 Transformer 网络,ECCV 2024。[论文] [代码]
- 优化扩散模型以实现联合轨迹预测和可控生成,ECCV 2024。[论文] [代码]
- 用于人类轨迹预测的渐进式预文本任务学习,ECCV 2024。[论文] [代码]
- 面向自动驾驶应用的可靠概率人类轨迹预测,ECCV 2024。[论文] [代码]
- DySeT:一种用于鲁棒轨迹预测的动态掩码自蒸馏方法,ECCV 2024。[论文]
- 通过潜在走廊进行自适应人类轨迹预测,ECCV 2024。[论文]
- CRITERIA:评估自动驾驶轨迹预测模型的新基准范式,ICRA 2024。[论文] [代码]
- FIMP:用于多智能体运动预测的未来交互建模,ICRA 2024。[论文]
- 使用基于动力学的深度学习进行行人轨迹预测,ICRA 2024。[论文] [代码]
- Scene Informer:部分可观测环境中的基于锚点的遮挡推断与轨迹预测,ICRA 2024。[论文] [代码]
- 混合自主交通环境中受人类观察启发的自动驾驶轨迹预测,ICRA 2024。[论文]
- 用于多智能体轨迹预测的神经交互能量,ACM MM 2024。[论文]
2024 年期刊论文
- SMEMO:用于轨迹预测的社会记忆,TPAMI。[paper]
- 一种面向自动驾驶的认知型轨迹预测方法,TIV。[paper]
- EMSIN:用于车辆轨迹预测的增强多流交互网络,IEEE Transactions on Fuzzy Systems。[paper]
- 面向多类轨迹预测的嵌入社会力的混合图卷积网络,TIV。[paper]
- 用于实时车辆轨迹预测的上下文感知时序变分自编码器 (VAE),RAL。[paper] [code]
- 学习行人群体关系的自编码器 (Autoencoder) 扩散模型以用于多模态轨迹预测,IEEE Transactions on Instrumentation and Measurement (TIM)。[paper]
- DSTCNN:用于行人轨迹预测的可变形时空卷积神经网络 (CNN),Information Sciences。[paper]
- 用于交互感知车辆轨迹预测的异构图社会池化,Transportation Research Part E: Logistics and Transportation Review。[paper]
- VTSIM:用于交叉口车辆轨迹模拟的基于注意力的循环神经网络 (RNN),Computer Animation and Virtual Worlds。[paper]
- 用于实时车辆轨迹预测的上下文感知时序变分自编码器 (VAE),RAL。[paper] [code]
- MacFormer:用于实时且鲁棒的轨迹预测的地图 - 代理耦合 Transformer,RAL。[paper]
- 基于扩散模型的轨迹生成框架模拟人类移动性,International Journal of Geographical Information Science。[paper] [code]
其他 2024
- 通过引导扩散实现可控安全关键闭环交通仿真,arXiv 预印本 arXiv:2401.00391, 2024。[paper] [website]
- 锻造自动驾驶视觉基础模型:挑战、方法与机遇,arXiv 预印本 arXiv:2401.08045, 2024。[paper] [code]
- 用于轨迹预测的意图感知去噪扩散模型,arXiv 预印本 arXiv:2403.09190, 2024。[paper]
- LG-Traj:大语言模型引导的行人轨迹预测,arXiv 预印本 arXiv:2403.08032, 2024。[paper]
- Traj-LLM:利用预训练大语言模型赋能轨迹预测的新探索,arXiv 预印本 arXiv:2405.04909, 2024。[paper]
- UniTraj:可扩展车辆轨迹预测的统一框架,arXiv 预印本 arXiv:2403.15098, 2024。[paper] [code]
- 基于扩散优化的多功能场景一致交通场景生成,arXiv 预印本 arXiv:2404.02524, 2024。[paper] [code]
- ControlTraj:基于拓扑约束扩散模型的可控轨迹生成,arXiv 预印本 arXiv:2404.15380, 2024。[paper]
- 基于扩散的环境感知轨迹预测,arXiv 预印本 arXiv:2403.11643, 2024。[paper]
- 面向无人机数据集的轨迹预测研究预处理与评估工具箱,arXiv 预印本 arXiv:2405.00604, 2024。[paper] [code]
- BehaviorGPT:基于下一补丁预测的自动驾驶智能体模拟,arXiv 预印本 arXiv:2405.17372, 2024。[paper]
- Vista:高保真且多功能可控的通用驾驶世界模型,arXiv 预印本 arXiv:2405.17398, 2024。[paper] [code]
- UrbanGPT:时空大语言模型,arXiv 预印本 arXiv:2403.00813, 2024。[paper] [code]
- 持续学习、适应与改进:自动驾驶的双过程方法,arXiv 预印本 arXiv:2405.15324, 2024。[paper] [code]
- DriveVLM:自动驾驶与大视觉语言模型的融合,arXiv 预印本 arXiv:2402.12289, 2024。[paper] [website]
- NAVSIM:数据驱动的非反应式自动驾驶车辆仿真与基准测试,arXiv 预印本 arXiv:2406.15349, 2024。[paper] [code] [supplementary]
- SimGen:基于模拟器条件的驾驶场景生成,arXiv 预印本 arXiv:2406.09386, 2024。[paper] [code]
- GenAD:生成式端到端自动驾驶,arXiv 预印本 arXiv:2402.11502, 2024。[paper] [code]
- LCSim:大规模可控交通模拟器,arXiv 预印本 arXiv:2406.19781, 2024。[paper] [code]
- Strada-LLM:用于交通预测的图大语言模型,arXiv 预印本 arXiv:2410.20856, 2024。[paper]
- MADiff:用于第一人称视频手部轨迹预测的运动感知 Mamba 扩散模型,arXiv 预印本 arXiv:2409.02638, 2024。[paper] [code]
- Gen-Drive:通过奖励建模和强化学习微调增强扩散生成驾驶策略,arXiv 预印本 arXiv:2410.05582, 2024。[paper] [code]
- 协同驾驶中多视图数据整合的共形轨迹预测,arXiv 预印本 arXiv:2408.00374, 2024。[paper] [code]
- LHPF:回顾历史并规划未来在自动驾驶中的应用,arXiv 预印本 arXiv:2411.17253, 2024。[paper] [website]
📚 2025 会议与期刊论文
2025 年会议论文
- 通过上下文学习生成交通场景以学习更好的运动规划器,AAAI 2025。[paper] [code]
- NEST:一种用于自动驾驶的神经调节小世界超图轨迹预测模型,AAAI 2025。[paper]
- C2F-TP:一种用于不确定性感知轨迹预测的由粗到细去噪框架,AAAI 2025。[paper] [code]
- CUQDS:分布偏移下的共形不确定性量化用于轨迹预测,AAAI 2025。[paper]
- STraj:自训练以弥合轨迹预测中的跨地理差异,AAAI 2025。[paper] [code]
- 桥接交通状态与轨迹以实现动态路网和轨迹表征学习,AAAI 2025。[paper] [code]
- GTG:面向城市移动性的可泛化轨迹生成模型,AAAI 2025。[paper] [code]
- MoFlow:基于隐式最大似然估计蒸馏的一步流匹配用于人类轨迹预测,CVPR 2025。[paper] [code]
- 认证人类轨迹预测,CVPR 2025。[paper] [website] [code]
- 通过优化驱动多帧扰动框架实现自动驾驶中持久、高效且鲁棒的轨迹预测攻击,CVPR 2025。[paper] [code]
- PerReg+:利用双层表征学习和自适应提示实现可泛化的轨迹预测,CVPR 2025。[paper]
- 利用 SD 地图增强基于 HD 地图的轨迹预测,CVPR 2025。[paper]
- 通过对比学习适应轨迹预测的观察长度,CVPR 2025。[paper]
- 基于多模态知识蒸馏的人类轨迹预测,CVPR 2025。[paper] [code]
- 通过运动具身实现物理合理性感知的轨迹预测,CVPR 2025。[paper] [code]
- Sim-to-Real 因果转移:一种因果感知交互表征的度量学习方法,CVPR 2025。[paper] [code]
- SocialMOIF:用于行人轨迹预测的多阶意图融合,CVPR 2025。[paper]
- Trajectory-Mamba:基于选择性状态空间模型的高效注意力-Mamba 预测模型,CVPR 2025。[paper] [code]
- Tra-MoE:从多个领域学习轨迹预测模型以实现自适应策略条件化,CVPR 2025。[paper] [code]
- 统一的不确定性感知扩散用于多智能体轨迹建模,CVPR 2025。[paper]
- AMD:用于鲁棒长尾轨迹预测的自适应动量和解耦对比学习框架,ICCV 2025。[paper]
- DONUT:一种用于轨迹预测的仅解码器模型,ICCV 2025。[paper] [code]
- 运动中的远见:通过奖励启发式强化轨迹预测,ICCV 2025。[paper]
- ForeSight:多视图流式联合目标检测和轨迹预测,ICCV 2025。[paper] [code]
- 通过可控扩散模型进行长尾轨迹预测的生成式主动学习,ICCV 2025。[paper]
- NATRA:针对噪声观测的轨迹预测噪声无关框架,ICCV 2025。[paper]
- SRefiner:用于多智能体轨迹细化的软编织注意力,ICCV 2025。[paper] [code]
- TOTP:具有时间自适应 Mamba 潜在扩散的可迁移在线行人轨迹预测,ICCV 2025。[paper]
- 使用掩码轨迹扩散的统一多智能体轨迹建模,ICCV 2025。[paper]
- 一种用于车辆轨迹预测的驾驶风格自适应框架,NIPS 2025。[paper]
- 迈向在上下文中预测任意人类轨迹,NIPS 2025。[paper]
- 带个体反馈的人类轨迹预测交互式调整,ICLR 2025。[paper]
- 利用驾驶员视野进行多模态自车轨迹预测,ICLR 2025。[paper] [code]
- 用于交互感知随机人类轨迹预测的神经化马尔可夫随机场,ICLR 2025。[paper] [code]
- Sports-Traj:用于体育中多智能体运动的统一轨迹生成模型,ICLR 2025。paper] [code]
- Trajectory-LLM:用于自动驾驶中轨迹预测的基于语言的数据生成器,ICLR 2025。[paper] [code]
- TSC-Net:通过轨迹 - 场景 - 单元分类预测行人轨迹,ICLR 2025。[paper]
- SmartPretrain:用于运动预测的模型无关和数据集无关表征学习,ICLR 2025。[paper] [code]
- DriveGPT:扩展用于驾驶的自回归行为模型,ICML 2025。[paper]
- SAH-Drive:用于闭环车辆轨迹生成的场景感知混合规划器,ICML 2025。[paper] [code]
- 使用 3DMoTraj 数据集的三维轨迹预测,ICML 2025。[paper] [code]
- 用于条件轨迹预测的跨时间域意图交互,ACM MM 2025。[paper]
- ViTraj:学习用于车路协同轨迹预测的双边表征,ACM MM 2025。[paper]
- 使用单目视觉的统一人类定位与轨迹预测,ICRA 2025。[paper] [code]
- 使用 IDD-PeD 在非结构化交通中进行行人意图和轨迹预测,ICRA 2025。[paper] [code]
- 用于行人轨迹预测的视觉 - 语言推理,ICRA 2025。[paper]
- 约束你的注意力:用于自动驾驶中鲁棒轨迹预测的因果注意力门控,ICRA 2025。[paper] [code]
- Co-MTP:一种用于自动驾驶的具有多时间融合的协同轨迹预测框架,ICRA 2025。[paper] [code]
- WcDT:用于交通场景生成的以世界为中心的扩散变换器,ICRA 2025。[paper] [code]
- Diff-Refiner:使用即插即用扩散细化器增强多智能体轨迹预测,ICRA 2025。[paper]
- 场景感知可解释多模态轨迹预测,ICRA 2025。[paper] [code]
- 非结构化约束下的随机轨迹预测,ICRA 2025。[paper]
- DSFormer-RTP:用于实时确定性轨迹预测的动态流变换器,IROS 2025。[paper] [code]
- ParkDiffusion:使用扩散模型的用于自动泊车的异构多智能体多模态轨迹预测,IROS 2025。[paper]
- GDTS:带有树采样的目标引导扩散模型用于多模态行人轨迹预测,IROS 2025。[paper]
- TR-LLM:整合轨迹数据以实现场景感知的基于 LLM 的人类动作预测,IROS 2025。[paper] [code]
2025 年期刊论文
- DEMO:一种用于自动驾驶车辆 (Autonomous Vehicles) 多时间尺度轨迹预测 (Trajectory Prediction) 的动力增强学习模型,信息融合 (Information Fusion)。 [论文]
- DSTIGCN:用于行人轨迹预测的可变形时空交互图卷积网络 (Graph Convolution Network),IEEE 智能交通系统汇刊 (TITS)。 [论文] [代码]
- PCHGCN:用于行人轨迹预测的物理约束高阶图卷积网络,IEEE 物联网期刊。 [论文] [代码]
- DiffMATP:基于去噪扩散模型 (Diffusion Models) 的交互感知多智能体轨迹预测,IEEE 车辆技术汇刊 (TVT)。 [论文]
- HDSVT:基于大都市城市桥梁的高密度语义车辆轨迹数据集,科学数据 (Scientific Data)。 [论文] [数据集]
- CoT-Drive:利用大语言模型 (LLMs) 和思维链提示 (Chain-of-Thought Prompting) 进行自动驾驶的高效运动预测,IEEE 人工智能汇刊。 [论文]
2025 年其他论文
- V2V-LLM:基于多模态大语言模型 (Multi-Modal Large Language Models) 的车对车协同自动驾驶,arXiv 预印本 arXiv:2502.09980, 2025。 [论文] [代码]
- V2V-GoT:基于多模态大语言模型和思维图 (Graph-of-Thoughts) 的车对车协同自动驾驶,arXiv 预印本 arXiv:2509.18053, 2025。 [论文] [代码]
📚 2026 年会议与期刊论文
2026 年会议论文
- ViTE:用于行人轨迹预测的虚拟图轨迹专家路由器,AAAI 2026。 [论文] [代码]
- DiffRefiner:用于端到端 (End to End) 自动驾驶的通过扩散细化与语义交互实现由粗到细的轨迹规划,AAAI 2026。 [论文] [代码]
- TRAJEVO:通过大语言模型 (LLM) 驱动的进化设计轨迹预测启发式方法,AAAI 2026。 [论文] [代码]
2026 年期刊论文
*
2026 年其他论文
📚 相关综述论文
- 自动驾驶中轨迹预测的大型基础模型:综合综述,arXiv 预印本 arXiv:2509.10570, 2025。[paper]
- 轨迹预测遇上大型语言模型:综述,arXiv 预印本 arXiv:2506.03408, 2025。[paper] [code]
- 自动驾驶领域行人轨迹预测的总结与反思,TIV 2024。[paper]
- 弱势道路使用者轨迹预测方法综述,Robotics 2023。[paper]
- 面向智能交通系统的生成式人工智能综述,arXiv 预印本 arXiv:2312.08248, 2023。[paper]
- 自动驾驶系统中的行人与车辆行为预测——综述,Expert Systems With Applications 2023。[paper]
- 数据驱动的交通仿真:全面综述,arXiv 预印本 arXiv:2310.15975, 2023。[paper]
- 人车混合环境中的行人轨迹预测:系统综述,TITS 2023。[paper]
- 自动驾驶车辆轨迹预测的机器学习:综合综述、挑战与未来研究方向,arXiv 预印本 arXiv:2307.07527, 2023。[paper]
- 在基于深度学习的车辆轨迹预测中融入驾驶知识:综述,IEEE Transactions on Intelligent Vehicles 2023。[paper]
- 基于深度学习模型的车辆轨迹预测综述,国际可持续专家系统会议:ICSES 2022。[paper]
- 自动驾驶轨迹预测方法综述,IEEE Transactions on Intelligent Vehicles 2022。[paper]
- 时空数据的生成对抗网络:综述,ACM Transactions on Intelligent Systems and Technology 2022。[paper]
- 自动驾驶车辆的场景理解与运动预测——回顾与比较,TITS 2022。[paper]
- 自动驾驶的深度强化学习:综述,TITS 2022。[paper]
- 自动驾驶中的社会交互:回顾与展望,arXiv 预印本 arXiv:2208.07541, 2022。[paper]
- 驾驶场景中的行为意图预测:综述,arXiv 预印本 arXiv:2211.00385, 2022。[paper]
- 基于车辆信息的多模态融合技术:综述,arXiv 预印本 arXiv:2211.06080, 2022。[paper]
- 自动驾驶中的行人行为预测:需求、指标及相关特征,TITS 2021。[paper]
- 基于深度学习的行人轨迹预测方法综述,Sensors 2021。[paper]
- 自动驾驶中车辆轨迹预测的深度学习途径综述,IEEE 机器人与仿生学国际会议 (ROBIO 2021)。[paper] [code]
- 行人轨迹预测方法回顾:比较深度学习与基于知识的方法,arXiv 预印本 arXiv:2111.06740, 2021。[paper]
- 轨迹数据管理、分析与学习综述,ACM Computing Surveys (CSUR 2021)。[paper]
- 自动驾驶中行人和车辆运动预测综述,IEEE Access 2021。[paper]
- 基于深度学习的自动驾驶:前沿技术综述,arXiv 预印本 arXiv:2006.06091, 2020。[paper]
- 视觉交通仿真综述:模型、评估及在自动驾驶中的应用,Computer Graphics Forum 2020。[paper]
- 自动驾驶深度学习技术综述,Journal of Field Robotics 2020。[paper]
- 人类运动轨迹预测:综述,International Journal of Robotics Research 2020。[paper]
- 车辆轨迹相似度:模型、方法与应用,ACM Computing Surveys (CSUR 2020)。[paper]
- 面向自动驾驶应用的基于深度学习的车辆行为预测:综述,TITS 2020。[paper]
- 自动驾驶车辆运动规划深度强化学习综述,TITS 2020。[paper]
- 支持自动驾驶规划的工具概述,ITSC 2020。[paper]
- 与行人交互的自动驾驶车辆:理论与实践综述,TITS 2019。[paper]
- 弱势道路使用者路径预测技术综述:从传统到深度学习途径,ITSC 2019。[paper]
- 时空数据挖掘:问题与方法综述,ACM Computing Surveys 2018。[paper]
- 基于视觉的路径预测综述,分布式、环境与普适交互国际会议 (DAPI 2018)。[paper]
- 移动对象分析:未来位置与轨迹预测方法综述,arXiv 预印本 arXiv:1807.04639, 2018。[paper]
- 轨迹数据挖掘综述:技术与应用,IEEE Access 2016。[paper]
- 轨迹数据挖掘:概述,ACM Transactions on Intelligent Systems and Technology 2015。[paper]
- 智能车辆运动预测与风险评估综述,ROBOMECH Journal 2014。[paper]
📚 数据集
数据集综述
- 自动驾驶数据集综述:数据统计、标注与展望,arXiv 预印本 arXiv:2401.01454, 2024。 [paper]
- 自动驾驶开源数据生态系统:现状与未来,arXiv 预印本 arXiv:2312.03408, 2023。 [paper] [中文] [代码]
- HDSVT:基于大都市城市桥梁的高密度语义车辆轨迹数据集,Scientific Data 2025。 [paper] [数据集]
- AD4CHE 数据集及其在交通拥堵领航系统典型拥堵场景中的应用,IEEE Transactions on Intelligent Vehicles 2023。 [paper] [代码]
公开可用的车辆数据集
- Porto, 网站
- NGSIM
- NYC
- T-drive
- Greek Trucks
- highD
- inD
- rounD
- uniD
- exiD
- Dronalize
- Mirror-Traffic
- Argoverse 网站, Argoverse 1, Argoverse 2
- ApolloScape
- INTERACTION
- Waymo Open Dataset
- Cityscapes
- KITTI
- nuScenes
- TRAF
- Lyft Level 5
- METEOR
- DiDi GAIA, D²-City, 论文
- 上海 & 杭州
- 北京
- VMT
- TRAFFIC, 网站
- CROSS, 网站
- Ubiquitous Traffic Eyes (UTE)
- CitySim
- pNEUMA
- I-24 MOTION
- Zen Traffic Data
- DLR Urban Traffic
- DLR Highway Traffic
公开可用的行人数据集
- GeoLife
- UCY
- ETH, 论文
- Stanford Drone Dataset
- TrajNet
- Oxford Town Center
- New York Grand Central Station, 论文, 论文, 论文
- PIE
- JAAD
- DS4C-PPP
- BDBC COVID-19
- Vi-Fi
其他智能体数据集
航空器
船舶
飓风与动物
🌹 致谢
我们要感谢提供论文、开源代码和项目网站的作者及开发者!感谢您为智能体轨迹预测社区做出的积极贡献。您的想法和贡献是我们前行的积极信号。如果您有任何建议或额外见解,欢迎提交 issue (问题) 或 pull request (拉取请求)。
🌟 Star 历史
常见问题
相似工具推荐
stable-diffusion-webui
stable-diffusion-webui 是一个基于 Gradio 构建的网页版操作界面,旨在让用户能够轻松地在本地运行和使用强大的 Stable Diffusion 图像生成模型。它解决了原始模型依赖命令行、操作门槛高且功能分散的痛点,将复杂的 AI 绘图流程整合进一个直观易用的图形化平台。 无论是希望快速上手的普通创作者、需要精细控制画面细节的设计师,还是想要深入探索模型潜力的开发者与研究人员,都能从中获益。其核心亮点在于极高的功能丰富度:不仅支持文生图、图生图、局部重绘(Inpainting)和外绘(Outpainting)等基础模式,还独创了注意力机制调整、提示词矩阵、负向提示词以及“高清修复”等高级功能。此外,它内置了 GFPGAN 和 CodeFormer 等人脸修复工具,支持多种神经网络放大算法,并允许用户通过插件系统无限扩展能力。即使是显存有限的设备,stable-diffusion-webui 也提供了相应的优化选项,让高质量的 AI 艺术创作变得触手可及。
everything-claude-code
everything-claude-code 是一套专为 AI 编程助手(如 Claude Code、Codex、Cursor 等)打造的高性能优化系统。它不仅仅是一组配置文件,而是一个经过长期实战打磨的完整框架,旨在解决 AI 代理在实际开发中面临的效率低下、记忆丢失、安全隐患及缺乏持续学习能力等核心痛点。 通过引入技能模块化、直觉增强、记忆持久化机制以及内置的安全扫描功能,everything-claude-code 能显著提升 AI 在复杂任务中的表现,帮助开发者构建更稳定、更智能的生产级 AI 代理。其独特的“研究优先”开发理念和针对 Token 消耗的优化策略,使得模型响应更快、成本更低,同时有效防御潜在的攻击向量。 这套工具特别适合软件开发者、AI 研究人员以及希望深度定制 AI 工作流的技术团队使用。无论您是在构建大型代码库,还是需要 AI 协助进行安全审计与自动化测试,everything-claude-code 都能提供强大的底层支持。作为一个曾荣获 Anthropic 黑客大奖的开源项目,它融合了多语言支持与丰富的实战钩子(hooks),让 AI 真正成长为懂上
ComfyUI
ComfyUI 是一款功能强大且高度模块化的视觉 AI 引擎,专为设计和执行复杂的 Stable Diffusion 图像生成流程而打造。它摒弃了传统的代码编写模式,采用直观的节点式流程图界面,让用户通过连接不同的功能模块即可构建个性化的生成管线。 这一设计巧妙解决了高级 AI 绘图工作流配置复杂、灵活性不足的痛点。用户无需具备编程背景,也能自由组合模型、调整参数并实时预览效果,轻松实现从基础文生图到多步骤高清修复等各类复杂任务。ComfyUI 拥有极佳的兼容性,不仅支持 Windows、macOS 和 Linux 全平台,还广泛适配 NVIDIA、AMD、Intel 及苹果 Silicon 等多种硬件架构,并率先支持 SDXL、Flux、SD3 等前沿模型。 无论是希望深入探索算法潜力的研究人员和开发者,还是追求极致创作自由度的设计师与资深 AI 绘画爱好者,ComfyUI 都能提供强大的支持。其独特的模块化架构允许社区不断扩展新功能,使其成为当前最灵活、生态最丰富的开源扩散模型工具之一,帮助用户将创意高效转化为现实。
NextChat
NextChat 是一款轻量且极速的 AI 助手,旨在为用户提供流畅、跨平台的大模型交互体验。它完美解决了用户在多设备间切换时难以保持对话连续性,以及面对众多 AI 模型不知如何统一管理的痛点。无论是日常办公、学习辅助还是创意激发,NextChat 都能让用户随时随地通过网页、iOS、Android、Windows、MacOS 或 Linux 端无缝接入智能服务。 这款工具非常适合普通用户、学生、职场人士以及需要私有化部署的企业团队使用。对于开发者而言,它也提供了便捷的自托管方案,支持一键部署到 Vercel 或 Zeabur 等平台。 NextChat 的核心亮点在于其广泛的模型兼容性,原生支持 Claude、DeepSeek、GPT-4 及 Gemini Pro 等主流大模型,让用户在一个界面即可自由切换不同 AI 能力。此外,它还率先支持 MCP(Model Context Protocol)协议,增强了上下文处理能力。针对企业用户,NextChat 提供专业版解决方案,具备品牌定制、细粒度权限控制、内部知识库整合及安全审计等功能,满足公司对数据隐私和个性化管理的高标准要求。
ML-For-Beginners
ML-For-Beginners 是由微软推出的一套系统化机器学习入门课程,旨在帮助零基础用户轻松掌握经典机器学习知识。这套课程将学习路径规划为 12 周,包含 26 节精炼课程和 52 道配套测验,内容涵盖从基础概念到实际应用的完整流程,有效解决了初学者面对庞大知识体系时无从下手、缺乏结构化指导的痛点。 无论是希望转型的开发者、需要补充算法背景的研究人员,还是对人工智能充满好奇的普通爱好者,都能从中受益。课程不仅提供了清晰的理论讲解,还强调动手实践,让用户在循序渐进中建立扎实的技能基础。其独特的亮点在于强大的多语言支持,通过自动化机制提供了包括简体中文在内的 50 多种语言版本,极大地降低了全球不同背景用户的学习门槛。此外,项目采用开源协作模式,社区活跃且内容持续更新,确保学习者能获取前沿且准确的技术资讯。如果你正寻找一条清晰、友好且专业的机器学习入门之路,ML-For-Beginners 将是理想的起点。
ragflow
RAGFlow 是一款领先的开源检索增强生成(RAG)引擎,旨在为大语言模型构建更精准、可靠的上下文层。它巧妙地将前沿的 RAG 技术与智能体(Agent)能力相结合,不仅支持从各类文档中高效提取知识,还能让模型基于这些知识进行逻辑推理和任务执行。 在大模型应用中,幻觉问题和知识滞后是常见痛点。RAGFlow 通过深度解析复杂文档结构(如表格、图表及混合排版),显著提升了信息检索的准确度,从而有效减少模型“胡编乱造”的现象,确保回答既有据可依又具备时效性。其内置的智能体机制更进一步,使系统不仅能回答问题,还能自主规划步骤解决复杂问题。 这款工具特别适合开发者、企业技术团队以及 AI 研究人员使用。无论是希望快速搭建私有知识库问答系统,还是致力于探索大模型在垂直领域落地的创新者,都能从中受益。RAGFlow 提供了可视化的工作流编排界面和灵活的 API 接口,既降低了非算法背景用户的上手门槛,也满足了专业开发者对系统深度定制的需求。作为基于 Apache 2.0 协议开源的项目,它正成为连接通用大模型与行业专有知识之间的重要桥梁。
