Mamba_State_Space_Model_Paper_List

GitHub
749 40 非常简单 1 次阅读 1周前MIT语言模型视频
AI 解读 由 AI 自动生成,仅供参考

Mamba_State_Space_Model_Paper_List 是一个专注于状态空间模型(SSM)及 Mamba 架构的开源论文清单与综述资源库。随着深度学习领域对高效长序列建模需求的增长,传统的 Transformer 架构在计算效率上逐渐面临瓶颈,而 Mamba 作为一种新兴的线性时间复杂度替代方案应运而生。该资源库旨在解决研究人员在面对这一快速演进领域时,难以系统追踪最新理论突破、应用案例及技术变体的痛点。

它汇集了包括基础理论、视觉应用、医疗影像分析以及控制理论视角在内的多篇核心综述论文和博士论文,并提供了相关的视频教程与演示文稿。通过持续更新的日志,用户能够便捷地获取从算法原理到多模态落地的全方位文献指引。

这份清单特别适合人工智能领域的研究人员、算法工程师以及对新一代神经网络架构感兴趣的高校师生使用。无论是希望深入理解 SSM 数学基础的学者,还是寻求将 Mamba 应用于实际项目的开发者,都能从中获得结构化的知识脉络。其独特的价值在于不仅罗列文献,更通过分类整理揭示了 Mamba 作为“下一代 Transformer 替代品”在不同场景下的潜力与挑战,是进入该前沿技术领域的理想入门指南。

使用场景

某高校实验室的博士生正致力于将 Mamba 架构应用于长序列医疗影像分析,急需全面掌握该领域的最新研究动态以确立创新点。

没有 Mamba_State_Space_Model_Paper_List 时

  • 文献检索如大海捞针:需要在 arXiv、Google Scholar 等多个平台反复搜索"State Space Model"、"Mamba"等关键词,极易遗漏近期发布的预印本论文。
  • 缺乏系统性分类:找到的几十篇论文杂乱无章,难以快速区分哪些是基础理论突破,哪些是视觉或医疗领域的具体应用,梳理综述耗时数周。
  • 错过关键资源:容易忽略与论文配套的代码仓库、技术幻灯片或视频教程,导致复现算法时因缺少细节指导而频频受阻。
  • 难以把握前沿趋势:无法直观看到 2024 年以来的密集更新日志,对“线性时间序列建模”等核心优势的演进路径缺乏宏观认知。

使用 Mamba_State_Space_Model_Paper_List 后

  • 一站式获取全集:直接访问该清单即可获取从基础理论到医疗影像分析的全链路论文列表,甚至包含了 330 页的斯坦福博士毕业论文等深度资料。
  • 结构化知识导航:利用其清晰的分类(如 Thesis & Surveys, Vision Mamba),迅速定位到《Computation-Efficient Era》等针对医疗图像的最新综述,半天即可完成文献调研。
  • 资源链接直达:每篇条目下均附带 PDF、arXiv、GitHub 代码及视频讲解链接,特别是 COLM Oral 的视频教程,极大降低了算法复现的门槛。
  • 实时同步前沿:通过更新的 Update Log 和新增的专项调查(如 Mamba-360),即时掌握 5 月、6 月的最新成果,确保研究选题始终处于领域最前沿。

Mamba_State_Space_Model_Paper_List 将原本需要数周的碎片化文献调研工作压缩至数小时,为研究者构建了通往下一代序列建模技术的最高效桥梁。

运行环境要求

GPU

未说明

内存

未说明

依赖
notes该仓库(Mamba_State_Space_Model_Paper_List)是一个论文和综述列表,主要包含指向 arXiv 论文、PDF 文档、幻灯片以及其他相关代码仓库的链接。它本身不是一个可执行的软件工具或模型库,因此 README 中未提供任何关于操作系统、GPU、内存、Python 版本或依赖库的安装运行需求。用户若需运行列表中提到的具体模型(如 MambaEVT, Memba 等),需前往对应的子项目仓库查看其具体的环境配置。
python未说明
Mamba_State_Space_Model_Paper_List hero image

快速开始

蛙池-状态空间模型论文列表

状态空间模型及其应用相关论文列表

我们非常欢迎各位同行对本论文列表或综述提出任何有益的改进建议。请通过提交Issue或发送邮件至xiaowang@ahu.edu.cn与我们联系。感谢您的支持!

面向新一代网络、替代Transformer的状态空间模型:综述, [Xiao Wang],Shiao Wang,Yuhe Ding,Yuehang Li,Wentao Wu,Yao Rong,Weizhe Kong,Ju Huang,Shihao Li,Haoxiang Yang,Ziwen Wang,Bo Jiang,Chenglong Li,Yaowei Wang,Yonghong Tian,Jin Tang,2024年 [PDF] [arXiv] [幻灯片]

:collision: 更新日志

  • [2024年4月15日] 我们发布了关于状态空间模型的第一版综述[arXiv]

视频教程

学位论文与综述

  • 利用结构化状态空间建模序列,作者:Albert Gu,出版地:美国加利福尼亚州斯坦福大学,2023年 [学位论文(330页)] [PDF]

  • 面向新一代网络、替代Transformer的状态空间模型:综述,Xiao Wang,Shiao Wang,Yuhe Ding,Yuehang Li,Wentao Wu,Yao Rong,Weizhe Kong,Ju Huang,Shihao Li,Haoxiang Yang,Ziwen Wang,Bo Jiang,Chenglong Li,Yaowei Wang,Yonghong Tian,Jin Tang,2024年 [PDF] [arXiv]

  • 作为基础模型的状态空间模型:控制理论视角综述,arXiv:2403.16899, Carmen Amo Alonso,Jerome Sieber,Melanie N. Zeilinger [论文]

  • 视觉Mamba综述,arXiv:2404.15956,Hanwei Zhang,Ying Zhu,Dan Wang,Lijun Zhang,Tianxiang Chen,Zi Ye [论文]

  • Mamba-360:作为Transformer替代品用于长序列建模的状态空间模型综述:方法、应用与挑战, Badri Narayana Patro,Vijay Srinivas Agneeswaran [论文] [GitHub]

  • 视觉Mamba综述:模型、应用与挑战, Rui Xu,Shu Yang,Yihui Wang,Bo Du,Hao Chen [论文] [论文列表]

  • 视觉Mamba:全面综述与分类学,arXiv:2405.03978, Xiao Liu,Chenxu Zhang,Lei Zhang [论文] [GitHub]

  • 计算高效时代:医学图像分析中状态空间模型的全面综述,Moein Heidari,Sina Ghorbani Kolahi,Sanaz Karimijafarbigloo,Bobby Azad,Afshin Bozorgpour,Soheila Hatami,Reza Azad,Ali Diba,Ulas Bagci,Dorit Merhof,Ilker Hacihaliloglu,arXiv:2406.03430 [论文] [GitHub]

  • Mamba综述,Haohao Qu,Liangbo Ning,Rui An,Wenqi Fan,Tyler Derr,Xin Xu,Qing Li [论文]

  • 探索未知领域:从Transformer到Mamba的导航指南, Yuchen Zou,Yineng Chen,Zuchao Li,Lefei Zhang,Hai Zhao [论文]

  • 效能与效率技术:状态空间模型综述, Xingtai Lv,Youbang Sun,Kaiyan Zhang,Shang Qu,Xuekai Zhu,Yuchen Fan,Yi Wu,Ermo Hua,Xinwei Long,Ning Ding,Bowen Zhou [论文]

2025年

  • Memba:基于膜的参数高效微调Mamba,Donghyun Lee,Yuhang Li,Ruokai Yin,Shiting Xiao,Priyadarshini Panda [论文] [代码]

  • 从层到状态:深度神经网络层动态的状态空间模型视角, Qinshuo Liu,Weiqin Zhao,Wei Huang,Yanwen Fang,Lequan Yu,Guodong Li [论文]

  • [arXiv:2501.16295] Mixture-of-Mamba:以模态感知稀疏性增强多模态状态空间模型, Weixin Liang,Junhong Shen,Genghan Zhang,Ning Dong,Luke Zettlemoyer,Lili Yu [论文] [代码]

2024年

  • 物理驱动的自回归状态空间模型用于医学图像重建, Bilal Kabas,Fuat Arslan,Valiyeh A. Nezhad,Saban Ozturk,Emine U. Saritas,Tolga Çukur [论文] [GitHub]

  • OMEGA:基于状态空间模型的高效遮挡感知空地机器人动态环境导航, Junming Wang,Dong Huang,Xiuxian Guan,Zekai Sun,Tianxiang Shen,Fangming Liu,Heming Cui [论文]

  • OccRWKV:重新思考线性复杂度的高效3D语义占用预测, Junming Wang,Wei Yin,Xiaoxiao Long,Xingyu Zhang,Zebin Xing,Xiaoyang Guo,Qian Zhang [论文] [代码]

  • [arXiv:2408.08583] Zhao,Gongpei,Tao Wang,Yi Jin,Congyan Lang,Yidong Li,和Haibin Ling。 “GrassNet:状态空间模型遇见图神经网络。” arXiv预印本arXiv:2408.08583(2024)。 [论文]

  • [arXiv:2409.05395] 颠覆视觉语言模型:对比Transformer与结构化状态空间模型在视觉与语言建模中的表现, Georgios Pantazopoulos、Malvina Nikandrou、Alessandro Suglia、Oliver Lemon、Arash Eshghi [论文]

  • [arXiv:2409.02097] LinFusion:1张GPU卡、1分钟、16,000张图像, 刘松华、于伟豪、谭振雄、王新超 [论文] [代码]

  • [arXiv:2408.17081] 随机逐层洗牌:一种提升Vision Mamba训练效果的良好实践, 黄子正、陈浩兴、李佳琪、兰俊、朱慧嘉、王伟强、王利民 [论文] [代码]

  • SpineMamba:通过残差视觉Mamba层和形状先验增强临床影像中的三维脊柱分割, 张志清、刘天勇、范国佳、李斌、冯千金、周守军 [论文]

  • [arXiv:2408.10189] 从Transformer到SSM:将二次知识蒸馏至次二次模型, 阿维夫·比克、凯文·Y·李、埃里克·P·辛格、J·齐科·科尔特、阿尔伯特·顾 [论文]

  • [arXiv:2408.10487] MambaEVT:基于状态空间模型的事件流视觉目标跟踪, 王晓、王超、王啸、王希希、赵志成、朱林、江波, arXiv预印本arXiv:2408.10487,2024年 [论文] [代码]

  • [arXiv:2408.12245] 使用Mamba实现可扩展的自回归图像生成, 李浩鹏、杨金悦、王可欣、邱雪睿、周宇红、李欣、李国奇 [论文] [代码]

  • [arXiv:2408.07889] MambaVT:用于鲁棒RGB-T跟踪的时空上下文建模, 赖思淼、刘畅、朱佳雯、康奔、刘洋、王东、陆虎川 [论文]

  • [arXiv:2408.08070] MambaMIM:利用状态空间标记插值对Mamba进行预训练, 唐峰河、年炳坤、李英泰、杨杰、刘伟、S·凯文·周 [论文] [代码]

  • [ACM MM 2024] MambaTrack:基于状态空间模型的简单多目标跟踪基线, 肖昌成、曹琼、罗志刚、兰龙 [论文]

  • [arXiv:2408.09764] 基于事件流的人体动作识别:高分辨率基准数据集及算法, 王晓、王啸、邵鹏鹏、江波、朱林、田永宏,arXiv预印本arXiv:2408.09764,2024年 [论文]

  • [arXiv:2408.09743] R2GenCSR:为基于大语言模型的X射线医学报告生成检索上下文样本, 王晓、李跃航、王福灵、王啸、李传富、江波,arXiv预印本arXiv:2408.09743,2024年 [论文] [代码]

  • [arXiv:2408.03540] PoseMamba:基于双向全局-局部时空状态空间模型的单目三维人体姿态估计, 黄云龙、刘俊硕、许可贤、Robert Caiming Qiu [论文]

  • [arXiv:2408.02922] Pose Magic:利用混合Mamba-GCN网络实现高效且时序一致的人体姿态估计, 张心怡、鲍琪琪、崔钦鹏、杨文明、廖庆敏 [论文]

  • [arXiv:2408.02615] LaMamba-Diff:基于局部注意力和Mamba的线性时间高保真扩散模型, 付云翔、陈超奇、俞一舟 [论文]

  • [arXiv:2408.01627] JambaTalk:基于混合Transformer-Mamba语言模型的语音驱动三维说话头生成, 法尔扎内·贾法里、斯特凡诺·贝雷蒂、阿努普·巴苏 [论文]

  • [arXiv:2408.01077] PhysMamba:利用双流交叉注意力SSD进行远程生理测量, 严志新、钟燕、张文俊、舒琳、徐洪彬、康文雄 [论文]

  • [arXiv:2408.01037] MambaST:用于高效行人检测的即插即用跨光谱时空融合器, 高向波、阿西格布·奇迹·卡努-阿西格布、杜晓晓 [论文] [代码]

  • [arXiv:2407.19274] Mamba?抓住 hype 还是重新思考真正有助于图像配准的因素, 建百良、潘家珍、莫特扎·加赫拉马尼、丹尼尔·吕克特、克里斯蒂安·瓦欣格、本尼迪克特·维斯特勒 [论文] [代码]

  • [arXiv:2407.21773] RainMamba:利用状态空间模型增强视频去雨中的局部学习能力,ACM多媒体2024, 吴洪涛、杨义军、徐慧慧、王伟明、周金妮、朱磊 [论文]

  • 赋能快照压缩成像:跨扫描与局部增强的空间光谱状态空间模型, 田文哲、曾海津、赵银平、陈永永、王震、李学龙 [论文]

  • MonoMM:用于实时单目三维目标检测的多尺度Mamba增强网络,傅友佳、徐子豪、傅俊松、薛慧霞、谭淑秋、李蕾 [论文]

  • [arXiv:2407.19832] ML-Mamba:利用Mamba-2的高效多模态大语言模型,黄文俊、胡建国 [论文] [代码]

  • [arXiv:2407.13772] GroupMamba:参数高效且准确的群体视觉状态空间模型,阿卜杜勒拉赫曼·沙克尔、赛义德·塔拉勒·瓦西姆、萨尔曼·汗、尤尔根·加尔、法哈德·沙赫巴兹·汗 [论文] [代码]

  • [arXiv:2407.13078] 提升时序动作定位:利用循环机制的高级S6建模,李尚允、郑周浩、吴昌大、尹成熙 [论文] [代码]

  • [ECCV 2024] VideoMamba:时空选择性状态空间模型,朴仁英、金熙善、高康旭、金珉范、金昌益 [论文] [代码]

  • [arXiv:2407.08083] MambaVision:混合Mamba-Transformer视觉骨干网络,阿里·哈塔米扎德、扬·考茨 [论文] [代码]

  • [arXiv:2407.03552] 用于乳腺超声图像分类的Vision Mamba,Ali Nasiri-Sarvi、Mahdi S. Hosseini、Hassan Rivaz [论文]

  • [arXiv:2407.02315] VFIMamba:基于状态空间模型的视频帧插值,Guozhen Zhang、Chunxu Liu、Yutao Cui、Xiaotong Zhao、Kai Ma、Limin Wang [论文] [代码]

  • [arXiv:2407.02228] MTMamba:基于Mamba解码器增强多任务密集场景理解,Baijiong Lin、Weisen Jiang、Pengguang Chen、Yu Zhang、Shu Liu、Ying-Cong Chen [论文] [代码]

  • [arXiv:2407.02109] HRSAM:高效地对高分辨率图像中的任何内容进行分割,You Huang、Wenbin Lai、Jiayi Ji、Liujuan Cao、Shengchuan Zhang、Rongrong Ji [论文] [代码]

  • [arXiv:2406.19369] Mamba还是RWKV:探索高质量与高效率的万物分割模型,Haobo Yuan、Xiangtai Li、Lu Qi、Tao Zhang、Ming-Hsuan Yang、Shuicheng Yan、Chen Change Loy [论文] [代码]

  • [arXiv:2406.19006] VideoMambaPro:Mamba在视频理解领域的飞跃式发展,Hui Lu、Albert Ali Salah、Ronald Poppe [论文] [代码]

  • [arXiv:2406.18950] MMR-Mamba:结合Mamba与空频信息融合的多对比度MRI重建,Jing Zou、Lanqing Liu、Qi Chen、Shujun Wang、Xiaohan Xing、Jing Qin [论文]

  • [arXiv:2406.17815] SUM:通过Mamba实现显著性统一的视觉注意力建模, Alireza Hosseini、Amirhossein Kazerouni、Saeed Akhavan、Michael Brudno、Babak Taati [论文]

  • [arXiv:2406.17442] Mamba24/8D:利用状态空间模型增强点云中的全局交互作用, Zhuoyuan Li、Yubo Ai、Jiahao Lu、ChuXin Wang、Jiacheng Deng、Hanzhi Chang、Yanzhe Liang、Wenfei Yang、Shifeng Zhang、Tianzhu Zhang [论文]

  • [arXiv:2406.15131] KalMamba:面向不确定性下强化学习的高效概率状态空间模型, Philipp Becker、Niklas Freymuth、Gerhard Neumann [论文]

  • [arXiv:2406.14528] DeciMamba:探索Mamba的长度外推潜力, Assaf Ben-Kish、Itamar Zimerman、Shady Abu-Hussein、Nadav Cohen、Amir Globerson、Lior Wolf、Raja Giryes [论文] [代码]

  • [arXiv:2406.12272] 槽位状态空间模型,Jindong Jiang、Fei Deng、Gautam Singh、Minseung Lee、Sungjin Ahn [论文]

  • [arXiv:2406.11244,IJCAI24,研讨会] SpoT-Mamba:利用选择性状态空间在时空图上学习长距离依赖关系, Jinhyeok Choi、Heehyeon Kim、Minhyeong An、Joyce Jiyoung Whang [论文]

  • [arXiv:2406.10828] PyramidMamba:重新思考金字塔特征融合,采用选择性状态空间模型用于遥感影像语义分割, Libo Wang、Dongxu Li、Sijun Dong、Xiaoliang Meng、Xiaokang Zhang、Danfeng Hong [论文] [代码]

  • [arXiv:2406.10700] Voxel Mamba:无分组状态空间模型用于基于点云的3D目标检测, Guowen Zhang、Lue Fan、Chenhang He、Zhen Lei、Zhaoxiang Zhang、Lei Zhang [论文] [代码]

  • [arXiv:2406.10098] ECGMamba:迈向基于BiSSM的高效心电图分类, Yupeng Qiang、Xunde Dong、Xiuling Liu、Yang Yang、Yihai Fang、Jianhong Dou [论文]

  • [arXiv:2406.09546] Q-Mamba:首次探索Vision Mamba用于图像质量评估, Fengbin Guan、Xin Li、Zihao Yu、Yiting Lu、Zhibo Chen [论文]

  • [arXiv:2406.08423] 状态汤:上下文技能学习、检索与混合, Maciej Pióro、Maciej Wołczyk、Razvan Pascanu、Johannes von Oswald、João Sacramento [论文]

  • [arXiv:2406.08234] MaIL:利用Mamba改进模仿学习, Xiaogang Jia、Qian Wang、Atalay Donat、Bowen Xing、Ge Li、Hongyi Zhou、Onur Celik、Denis Blessing、Rudolf Lioutikov、Gerhard Neumann [论文]

  • [arXiv:2406.07887] 基于Mamba的语言模型实证研究,Roger Waleffe、Wonmin Byeon、Duncan Riach、Brandon Norick、Vijay Korthikanti、Tri Dao、Albert Gu、Ali Hatamizadeh、Sudhakar Singh、Deepak Narayanan、Garvit Kulshreshtha、Vartika Singh、Jared Casper、Jan Kautz、Mohammad Shoeybi、Bryan Catanzaro [论文] [代码]

  • [arXiv:2406.07592] MambaLRP:解释选择性状态空间序列模型, Farnoush Rezaei Jafari、Grégoire Montavon、Klaus-Robert Müller、Oliver Eberle [论文]

  • [arXiv:2406.07537] 在视觉领域中使用Mamba进行自回归预训练, Sucheng Ren、Xianhang Li、Haoqin Tu、Feng Wang、Fangxun Shu、Lei Zhang、Jieru Mei、Linjie Yang、Peng Wang、Heng Wang、Alan Yuille、Cihang Xie [论文] [代码]

  • [arXiv:2406.07522] Samba:简单混合状态空间模型,用于高效的无限上下文语言建模, Liliang Ren、Yang Liu、Yadong Lu、Yelong Shen、Chen Liang、Weizhu Chen [论文] [代码]

  • [arXiv:2406.06086] RawBMamba:端到端双向状态空间模型用于音频深度伪造检测, Yujie Chen、Jiangyan Yi、Jun Xue、Chenglong Wang、Xiaohui Zhang、Shunbo Dong、Siding Zeng、Jianhua Tao、Lv Zhao、Cunhang Fan [论文]

  • [arXiv:2406.06069] PointABM:将双向状态空间模型与多头自注意力相结合用于点云分析, Jia-wei Chen、Yu-jie Xiong、Yong-bin Gao [论文]

  • [arXiv:2406.05992] MHS-VM:在平行子空间中进行多头扫描以用于Vision Mamba,Zhongping Ji [论文] [代码]

  • Vision Mamba:利用3D MRI扫描对阿尔茨海默病进行前沿分类, Muthukumar K A、Amit Gurung、Priya Ranjan [论文]

  • [arXiv:2406.04377] 结合图神经网络与Mamba以捕捉全切片图像中的局部和全局组织空间关系, Ruiwen Ding, Kha-Dinh Luong, Erika Rodriguez, Ana Cristina Araujo Lemos da Silva, William Hsu [论文] [代码]

  • [arXiv:2406.04339] RoboMamba:用于高效机器人推理与操作的多模态状态空间模型,Jiaming Liu, Mengzhen Liu, Zhenyu Wang, Lily Lee, Kaichen Zhou, Pengju An, Senqiao Yang, Renrui Zhang, Yandong Guo, Shanghang Zhang [论文] [代码]

  • [arXiv:2406.04320] Chimera:利用二维状态空间模型有效建模多元时间序列,Ali Behrouz, Michele Santacatterina, Ramin Zabih [论文]

  • [arXiv:2406.12463] LFMamba:基于状态空间模型的光场图像超分辨率,Wang xia, Yao Lu, Shunzhou Wang, Ziqi Wang, Peiqi Xia, Tianfei Zhou [论文]

  • [arXiv:2406.05835] Mamba YOLO:基于SSM的YOLO目标检测方法,Zeyu Wang, Chen Li, Huiying Xu, Xinzhong Zhu [论文] [代码]

  • [arXiv:2406.08444] PixMamba:在双层架构中利用状态空间模型进行水下图像增强,Wei-Tung Lin, Yong-Xiang Lin, Jyun-Wei Chen, Kai-Lung Hua [论文] [代码]

  • [arXiv:2406.07050] DualMamba:一种用于高光谱图像分类的轻量级光谱-空间Mamba卷积网络, Jiamu Sheng, Jingyi Zhou, Jiong Wang, Peng Ye, Jiayuan Fan [论文]

  • [arXiv:2406.07537] 视觉领域的Mamba自回归预训练, Sucheng Ren, Xianhang Li, Haoqin Tu, Feng Wang, Fangxun Shu, Lei Zhang, Jieru Mei, Linjie Yang, Peng Wang, Heng Wang, Alan Yuille, Cihang Xie [论文] [代码]

  • [arXiv:2406.06367] MVGamba:将3D内容生成统一为状态空间序列建模, Xuanyu Yi, Zike Wu, Qiuhong Shen, Qingshan Xu, Pan Zhou, Joo-Hwee Lim, Shuicheng Yan, Xinchao Wang, Hanwang Zhang [论文]

  • [arXiv:2406.02395] GrootVL:状态空间模型中树状拓扑即所需的一切,Yicheng Xiao, Lin Song, Shaoli Huang, Jiangshan Wang, Siyu Song, Yixiao Ge, Xiu Li, Ying Shan [论文] [代码]

  • [arXiv:2406.05038] 通过双向SSM的扩散Mamba实现高效3D形状生成,Shentong Mo [论文]

  • [arXiv:2406.03430] 计算效率时代:医学图像分析中状态空间模型的全面综述,Moein Heidari, Sina Ghorbani Kolahi, Sanaz Karimijafarbigloo, Bobby Azad, Afshin Bozorgpour, Soheila Hatami, Reza Azad, Ali Diba, Ulas Bagci, Dorit Merhof, Ilker Hacihaliloglu [论文] [GitHub]

  • [arXiv:2405.16712] Zamba:一款紧凑的7B参数混合SSM模型, Paolo Glorioso, Quentin Anthony, Yury Tokpanov, James Whittington, Jonathan Pilault, Adam Ibrahim, Beren Millidge [论文]

  • [arXiv:2405.20881] S4Fusion:面向红外可见光图像融合的显著性感知选择性状态空间模型,Haolong Ma, Hui Li, Chunyang Cheng, Gaoang Wang, Xiaoning Song, Xiaojun Wu [论文]

  • 联合选择性状态空间模型与去趋势化用于鲁棒的时间序列异常检测, Junqi Chen, Xu Tan, Sylwan Rahardja, Jiawei Yang, Susanto Rahardja [论文]

  • MSSC-BiMamba:利用双向Mamba进行多模态睡眠阶段分类及睡眠障碍早期诊断, Chao Zhanga, Weirong Cuia, Jingjing Guo [论文]

  • DeMamba:在百万规模生成视频基准上进行AI生成视频检测, Haoxing Chen, Yan Hong, Zizheng Huang, Zhuoer Xu, Zhangxuan Gu, Yaohui Li, Jun Lan, Huijia Zhu, Jianfu Zhang, Weiqiang Wang, Huaxiong Li [论文] [代码]

  • FourierMamba:将傅里叶学习与状态空间模型结合用于图像去雨, Dong Li, Yidi Liu, Xueyang Fu, Senyan Xu, Zheng-Jun Zha [论文]

  • 生理信号的深度潜在变量建模,Khuong Vo [论文]

  • 用于贝叶斯忠实数据同化的深度贝叶斯滤波器,Yuta Tarumi, Keisuke Fukuda, Shin-ichi Maeda [论文]

  • 状态空间模型的表达能力:从形式语言视角看, Yash Sarrof, Yana Veitsman, Michael Hahn [论文]

  • SMR:用于长序列建模的状态记忆重放, Biqing Qi, Junqi Gao, Kaiyan Zhang, Dong Li, Jianxing Liu, Ligang Wu, Bowen Zhou [论文]

  • 从统一视角揭示线性复杂度序列模型的秘密, Zhen Qin, Xuyang Shen, Dong Li, Weigao Sun, Stan Birchfield, Richard Hartley, Yiran Zhong [论文]

  • Mamba4KT:一种高效且有效的基于Mamba的知识追踪模型,Yang Cao, Wei Zhang [论文]

  • MambaTS:改进的用于长期时间序列预测的选择性状态空间模型,Xiuding Cai, Yaoyao Zhu, Xueyao Wang, Yu Yao [论文]

  • Time-SSM:简化并统一用于时间序列预测的状态空间模型,Jiaxi Hu, Disen Lan, Ziyu Zhou, Qingsong Wen, Yuxuan Liang [论文]

  • 理解基础模型之间的差异:注意力机制、状态空间模型和循环神经网络, Jerome Sieber, Carmen Amo Alonso, Alexandre Didier, Melanie N. Zeilinger, Antonio Orvieto [论文]

  • MambaVC:基于选择性状态空间的学习型视觉压缩, Shiyu Qin, Jinpeng Wang, Yimin Zhou, Bin Chen, Tianci Luo, Baoyi An, Tao Dai, Shutao Xia, Yaowei Wang [论文] [代码]

  • 对于长记忆状态空间模型而言,避免HiPPOs仍有希望,Annan Yu, Michael W. Mahoney, N. Benjamin Erichson [论文]

  • HeteGraph-Mamba:通过选择性状态空间模型进行异构图学习,Zhenyu Pan, Yoonsung Jeong, Xiaoda Liu, Han Liu [论文]

  • Audio Mamba:用于音频标签的预训练音频状态空间模型,林家驹、胡浩轩 [论文]

  • SSAMBA:基于 Mamba 状态空间模型的自监督音频表示学习,Siavash Shams、Sukru Samet Dindar、姜锡林、Nima Mesgarani [论文] [代码]

  • 下一时隙 OFDM-CSI 预测:多头自注意力还是状态空间模型? Mohamed Akrout、Faouzi Bellili、Amine Mezghani、Robert W. Heath [论文] [代码]

  • 利用加权正则化神经网络增强物理引导的状态空间模型, 刘宇涵、Roland Tóth、Maarten Schoukens [论文]

  • IRSRMamba:基于 Mamba 的小波变换特征调制模型实现红外图像超分辨率; 黄永松、宫崎智、刘晓峰、大町真一郎 [arXiv] [代码]

  • [arXiv:2405.06147] 状态空间模型的无状态推断:传递函数方法, Rom N. Parnichkun、Stefano Massaroli、Alessandro Moro、Jimmy T.H. Smith、Ramin Hasani、Mathias Lechner、Qi An、Christopher Ré、Asama Hajime、Stefano Ermon、铃木泰二、山下敦史、Michael Poli [论文] [代码]

  • [arXiv:2405.17951] 通过标记合并提升 Transformer 和状态空间模型的时间序列处理效率, Leon Götz、Marcel Kollovieh、Stephan Günnemann、Leo Schwinn [论文]

  • [arXiv:2405.19036] 状态空间模型在估计具有动态平滑性的函数方面可与 Transformer 相媲美, 西川直树、铃木泰二 [论文]

  • [arXiv:2405.18679] Vim-F:受益于频域学习的视觉状态空间模型, 张俊涛、卞坤、程鹏、安文博、刘建宁、周军 [论文] [代码]

  • [arXiv:2405.18533] 基于 BI-Mamba 的多视角胸部 X 光片心血管疾病检测, 杨泽凡、张佳晋、王戈、Kalra Mannudeep K.、Yan Pingkun [论文] [代码]

  • [arXiv:2405.18014] 耦合 Mamba:利用耦合状态空间模型增强多模态融合, 李文兵、周航、俞俊青、宋子凯、杨伟 [论文]

  • [arXiv:2405.17659] 蒙特卡洛任意掩码 Mamba 提升医学图像重建中的全局敏感性和不确定性量化, 黄嘉豪、杨柳涛、王凡文、吴银哲、南洋、吴伟文、王成言、石匡宇、Angelica I. Aviles-Rivero、Carola-Bibiane Schönlieb、张道强、杨光 [论文]

  • [arXiv:2405.16470] 基于频率增强的状态空间模型进行图像去雨, 山下修吾、池原正明 [论文]

  • [arXiv:2405.16605] 揭秘视觉中的 Mamba:线性注意力视角, 韩东辰、王子怡、夏卓凡、韩义增、蒲一帆、葛春江、宋俊、宋世基、郑博、黄高 [论文] [代码]

  • [arXiv:2405.16105] MambaLLIE:全局后局部状态空间的隐式 Retinex 感知低光增强, 翁江伟、严志强、邰英、钱建军、杨健、李俊 [论文] [代码]

  • [arXiv:2405.15881] 利用双向 SSM 扩展扩散 Mamba,实现高效图像和视频生成, 莫申通、田亚鹏 [论文]

  • [arXiv:2405.15925] MUCM-Net:基于 Mamba 的 UCM-Net 用于皮肤病变分割, 袁春宇、赵东方、Sos S. Agaian [论文] [代码]

  • [arXiv:2405.15574] Meteor:基于 Mamba 的大型语言和视觉模型推理路径遍历, 李炳宽、金彩媛、朴范灿、卢永满 [论文] [代码]

  • [arXiv:2405.15463] PoinTramba:点云分析的混合 Transformer-Mamba 框架, 王子诚、陈正浩、吴一鸣、赵振、周鲁平、徐东 [论文] [代码]

  • [arXiv:2405.14022] I2I-Mamba:通过选择性状态空间建模实现多模态医学图像合成,Omer F. Atli、Bilal Kabas、Fuat Arslan、Mahmut Yurt、Onat Dalmaz、Tolga Çukur [论文]

  • [arXiv:2405.14858] Mamba-R:视觉 Mamba 同样需要寄存器, 王峰、王嘉豪、任苏成、魏国哲、梅继儒、邵伟、周宇音、Alan Yuille、谢赐航 [论文]

  • [arXiv:2405.14480] 具有分形扫描的可扩展视觉状态空间模型,唐璐、肖浩科、蒋鹏涛、张浩、陈锦威、李博 [论文]

  • [arXiv:2405.14343] 用于图像去模糊的高效视觉状态空间模型,孔令顺、董江鑫、Yang Ming-Hsuan、潘金山 [论文]

  • [arXiv:2405.14338] MAMBA4D:利用解耦的空间-时间状态空间模型高效理解长序列点云视频, 刘久明、韩金如、刘立浩、Angelica I. Aviles-Rivero、蒋超康、刘哲、王和生 [论文]

  • [arXiv:2405.14224] DiM:扩散 Mamba 用于高效高分辨率图像合成,滕瑶、吴悦、石汉、宁雪菲、戴国豪、王宇、李振国、刘希辉 [论文]

  • [arXiv:2405.14174] 多尺度 VMamba:层次中的层次视觉状态空间模型,施宇恒、董敏静、许昌 [论文] [代码]

  • [arXiv:2405.11263] MAMCA——在精度与效率之间取得最佳平衡,适用于扩展信号长度的自动调制分类, 张叶卓、周子楠、曹一超、李广宇和李宣鹏 [论文] [代码]

  • [arXiv:2405.12609] 语音中的 Mamba:迈向自注意力的替代方案,张翔宇、张其全、刘赫欣、肖天毅、钱新源、Beena Ahmed、Eliathamby Ambikairajah、Li Haizhou、Julien Epps [论文]

  • [arXiv:2405.11449] NetMamba:通过预训练单向Mamba实现高效的网络流量分类, 王通泽、谢晓辉、王文铎、王楚毅、赵友健、崔勇 [论文]

  • [arXiv:2405.12094] Mamba是否适用于离线强化学习中的轨迹优化? 戴阳、马欧博、张龙飞、梁兴兴、胡圣超、王孟竹、季守岭、黄金才、沈力 [论文]

  • [arxiv:2405.12487] 3DSS-Mamba:用于高光谱图像分类的三维-光谱-空间Mamba, 何燕、涂兵、刘波、李军、安东尼奥·普拉萨 [论文]

  • [arXiv:2405.11831] SSAMBA:基于Mamba状态空间模型的自监督音频表征学习, 西亚瓦什·沙姆斯、苏克鲁·萨梅特·丁达尔、姜锡林、尼玛·梅斯加拉尼 [论文] [代码]

  • [arXiv:2405.12003] Mamba-in-Mamba:面向高光谱图像分类的分词Mamba模型中的集中式Mamba跨扫描, 周伟廉、镰田诚一郎、王海鹏、黄文胜、侯慧英(辛西娅) [论文]

  • [arXiv:2405.10530] CM-UNet:用于遥感图像语义分割的混合CNN-Mamba UNet, 刘牧水、单俊、陆子谦、于云龙、李英明、李曦 [论文] [代码]

  • RSDehamba:用于遥感卫星图像去雾的轻量级视觉Mamba, 周慧玲、吴贤浩、陈洪明、陈翔、何欣 [论文]

  • [arXiv:2405.07022] DTMamba:用于时间序列预测的双孪生Mamba, 吴泽学、龚一峰、张傲谦 [论文]

  • [arXiv:2405.08493] 重新思考在遥感影像语义分割中使用视觉Mamba的扫描策略:一项实验研究, 朱钦峰、方源、蔡元志、陈程、范磊 [论文]

  • [arXiv:2405.08419] WaterMamba:用于水下图像增强的视觉状态空间模型, 关美生、徐海永、蒋刚毅、余梅、陈叶瑶、罗婷、宋洋 [论文]

  • [arXiv:2405.07943] 层次决策Mamba, 安德烈·科雷亚、路易斯·A·亚历山大 [论文] [代码]

  • [arXiv:2405.07777] GMSR:基于梯度引导的Mamba,用于从RGB图像重建光谱, 王新莹、黄志雄、张思凡、朱嘉雯、冯琳 [论文] [代码]

  • [arXiv:2405.07966] OverlapMamba:一种用于基于LiDAR的场景识别的新型移位状态空间模型, 相秋驰、程锦涛、罗杰豪、吴进、范锐、陈谢远立、唐小宇 [论文]

  • [arXiv:2405.07992] MambaOut:我们真的需要视觉Mamba吗? 于伟浩、王新超 [论文] [代码]

  • 关于将Mamba应用于语音增强的探讨,arXiv:2405.06573, 曹荣、程文煌、莫雷诺·拉夸特拉、萨巴托·马尔科·西尼斯卡尔基、杨朝汉·赫克、傅思伟、曹宇 [论文]

  • [arXiv:2405.06116] 重新思考用于事件相机分类和回归的高效有效点云网络:EventMamba, 任宏伟、周悦、朱家栋、付昊天、黄宇龙、林晓鹏、方月彤、马飞、于浩、程博君 [论文]

  • [arXiv:2405.04964] 用于遥感图像超分辨率的频率辅助Mamba, 肖毅、袁强强、江奎、陈玉增、张强、林佳文 [论文]

  • [arXiv:2405.05007] HC-Mamba:结合混合卷积技术的视觉MAMBA,用于医学图像分割, 徐家树 [论文]

  • [arXiv:2405.05027] StyleMamba:用于高效文本驱动图像风格迁移的状态空间模型, 王子嘉、刘志松 [论文]

  • VM-DDPM:用于医学图像合成的视觉Mamba扩散模型,arXiv:2405.05667, 鞠志瀚、周婉婷 [论文]

  • VMambaCC:用于人群计数的视觉状态空间模型,arXiv:2405.03978, 马浩源、张莉、史帅 [论文]

  • [Mamba-2] Transformer即SSM:具有结构化状态空间对偶性的通用模型与高效算法,Tri Dao · Albert Gu,ICML 2024, [论文] [arXiv] [代码]

  • AC-MAMBASEG:一种基于自适应卷积和Mamba的架构,用于增强皮肤病变分割, 阮越清、范文壮、陈氏草 [论文] [代码]

  • MemoryMamba:用于缺陷识别的记忆增强状态空间模型, 王倩宁、胡鹤、周宇成 [论文]

  • SMCD:基于Mamba扩散的高逼真运动风格迁移, 钱子云、肖泽宇、吴振毅、杨鼎康、李明成、王顺利、王帅兵、寇东亮、张丽华 [论文]

  • Retinexmamba:基于Retinex的Mamba,用于低光照图像增强,白继松、尹宇浩、何启源 [论文]

  • Matten:基于Mamba注意力的视频生成, 高宇、黄建诚、孙晓鹏、解泽群、钟宇杰、马林 [论文]

  • FER-YOLO-Mamba:基于选择性状态空间的人脸表情检测与分类,arXiv:2405.01828, 马辉、雷森、图尔盖·切利克、李恒超 [论文]

  • SOAR:利用状态空间模型和可编程梯度在航空影像中小物体检测方面的进展, 图沙尔·维尔马、乔茨娜·辛格、雅什·巴尔塔里、里希·贾瓦尔、苏拉杰·辛格、舒布卡曼·辛格 [论文]

  • SSUMamba:用于高光谱图像去噪的空间-光谱选择性状态空间模型,arXiv:2405.01726, 傅冠义满、熊凤超、陆建峰、周俊、钱云涛 [论文] [代码]

  • CLIP-Mamba:具有OOD和海森矩阵评估的CLIP预训练Mamba模型,arXiv:2404.19394, 黄伟权、沈一飞、杨一帆 [论文] [代码]

  • 基于深度状态空间模型的神经形态传感信号可扩展逐事件处理,arXiv:2404.18508, 马克·舍内、尼拉杰·莫汉·苏什玛、诸景岳、克里斯蒂安·迈尔、阿南德·萨布拉莫尼、大卫·卡佩尔 [论文]

  • 利用广义状态空间模型与概率引导融合重访多模态情感学习,arXiv:2404.17858, 寿云涛、孟涛、张福臣、尹楠、李克勤 [论文]

  • 用于高光谱图像分类的频谱-空间Mamba,arXiv:2404.18401, 黄凌波、陈宇诗、何欣 [论文]

  • RSCaMa:基于状态空间模型的遥感影像变化描述生成, 刘晨阳、陈凯言、陈博文、张浩天、邹正霞、史振威 [论文] [代码]

  • S2Mamba:用于高光谱图像分类的空谱状态空间模型, 王冠春、张向荣、彭泽林、张天阳、贾秀萍、焦立成 [论文] [代码]

  • Mamba-FETrack:基于状态空间模型的帧-事件跟踪,arXiv:2404.18174,黄菊、王小傲、王帅、吴哲、王晓、江博 [论文] [代码]

  • Bi-Mamba4TS:用于时间序列预测的双向Mamba,arXiv:2404.15772, 梁奥博、蒋兴国、孙燕、卢昌 [论文]

  • ST-MambaSync:Mamba结构与时空Transformer的融合在突发性交通预测中的应用,arXiv:2404.15899, 邵志奇、姚旭升、王泽、高俊斌 [论文]

  • 优化通用病灶分割:基于状态空间模型指导的特征重要性调整分层网络, 卡齐·沙里亚尔·桑吉德、穆罕默德·坦齐姆·侯赛因、穆罕默德·沙基布·沙哈里亚尔·朱奈德、M·莫尼尔·乌丁 [论文]

  • 基于状态空间模型的光学多普勒断层扫描稀疏重建,arXiv:2404.17484, 李正宏、任家祥、程文胜、杜聪武、潘英田、凌海彬 [论文]

  • CFMW:恶劣天气条件下多光谱目标检测的跨模态融合Mamba,arXiv:2404.16302, 李浩远、胡琪、姚友、杨凯伦、陈鹏 [论文] [代码]

  • MambaTrack:在多目标跟踪中探索基于学习的运动模型,arXiv:2403.10826, 黄湘伟、杨承延、柴文浩、蒋仲宇、黄仁能 [论文]

  • MambaUIE&SR:仅用2.8 FLOPs揭开海洋的秘密,arXiv:2404.13884, 陈志豪、葛一元 [论文] [代码]

  • Vim4Path:用于组织病理学图像的自监督视觉Mamba,arXiv:2404.13222, 阿里·纳西里-萨尔维、文森特·屈克辉·郑、哈桑·里瓦兹、马赫迪·S·侯赛尼 [论文] [代码]

  • 将Mamba与Transformer结合用于长短时距时间序列预测,arXiv:2404.14757, 徐雄霄、梁月清、黄百祥、兰志玲、舒凯 [论文] [代码]

  • Mamba3D:通过状态空间模型增强局部特征以进行3D点云分析,arXiv:2404.14966, 韩旭、唐源、王兆轩、李贤志 [论文]

  • ST-SSMs:用于交通预测的空间–时间选择性状态空间模型,arXiv:2404.13257, 邵志奇、迈克尔·G.H.贝尔、王泽、D.格伦·吉尔斯、席浩宁、高俊斌 [论文]

  • 状态空间模型中的状态幻象,arXiv:2404.08819, 威廉·梅里尔、杰克逊·佩蒂、阿希什·萨巴瓦尔 [论文]

  • MambaMOS:基于LiDAR的3D移动物体分割,采用运动感知状态空间模型, 曾康、石浩、林嘉诚、李思宇、程金涛、王凯威、李志勇、杨凯伦 [论文] [代码]

  • MambaPupil:用于事件驱动眼动追踪的双向选择性循环模型,CVPR 2024研讨会(AIS:面向流媒体的视觉、图形与AI), 王忠、万增宇、韩寒、廖博浩、吴宇亮、翟伟、曹洋、查正军 [论文]

  • CU-Mamba:具有通道学习功能的选择性状态空间模型用于图像修复,arXiv:2404.11778, 邓锐、顾天培 [论文]

  • 考虑长期运动趋势的视频预测状态空间分解模型, 崔飞、方娇娇、吴小江、赖泽龙、杨梦珂、贾梦涵、刘贵中 [论文]

  • 文本控制的运动Mamba:文本指令下的人体运动时序定位, 王星翰、康子熙、穆亚东,arXiv:2404.11375 [论文]

  • HumMUSS:利用状态空间模型理解人类运动, 阿尔纳布·库马尔·蒙达尔、斯特凡诺·阿莱托、丹尼斯·托梅,CVPR 2024,arXiv:2404.10880 [论文]

  • HSIDMamba:探索用于高光谱去噪的双向状态空间模型, 刘洋、肖佳华、郭宇、蒋佩琳、杨海伟、王飞 [论文]

  • FusionMamba:利用Mamba实现多模态图像融合的动态特征增强, 谢欣宇、崔雅雯、杨巧茵、谭涛、张晓智、郑旭彬、于子彤 [论文] [代码]

  • FreqMamba:从频率视角看待Mamba以用于图像去雨, 邹震、胡宇、赵峰 [论文]

  • 一种具有局部增强和状态共享的新型状态空间模型用于图像融合, 曹子涵、吴晓、邓良建、钟宇 [论文]

  • 用于跨模态目标检测的Fusion-Mamba,arXiv:2404.09146, 董文浩、朱浩东、林绍辉、罗晓燕、申云航、刘旭辉、张娟、郭国栋、张宝昌 [论文]

  • "用于序列推荐的线性循环单元。" 岳振瑞等 第17届ACM国际网络搜索与数据挖掘会议论文集。2024年。 [论文] [代码]

  • 具有形状约束的功能型时间序列的状态空间建模, 平木大地、滨村康之、入江薰、菅泽祥介,arXiv:2404.07586 [论文]

  • HGRN2:带有状态扩展的门控线性RNN, 秦震、杨松林、孙伟轩、沈旭阳、李东、孙卫高、钟一然,arXiv:2404.07904 [论文] [代码]

  • MambaDFuse:基于Mamba的双阶段多模态图像融合模型, 李哲、潘海威、张克嘉、王宇华、于峰明,arXiv:2404.08406 [论文]

  • SpectralMamba:用于高光谱图像分类的高效Mamba模型, 姚静、洪丹凤、李晨宇、乔赛琳·沙努索,arXiv:2404.08489 [论文] [代码]

  • SurvMamba:用于生存预测的多粒度多模态交互状态空间模型, 陈颖、谢佳婧、林宇翔、宋宇航、杨文贤、余荣山,arXiv:2404.08027 [论文]

  • [2024_143] FusionMamba:基于状态空间模型的高效图像融合, 彭思然、朱向宇、邓浩宇、雷震、邓良健 [论文]

  • [2024_142] DGMamba:通过广义状态空间模型实现领域泛化, 龙绍聪、周千语、李湘泰、陆学权、应晨昊、罗源、马立壮、颜水成 [论文]

  • [2024_141] ViM-UNet:用于生物医学分割的视觉Mamba模型, 安瓦伊·阿奇特、康斯坦丁·帕佩 [论文] [代码]

  • [2024_140] Simba:基于Mamba增强的U-ShiftGCN用于视频中骨骼动作识别, 索米布拉塔·乔杜里、索米克·巴塔查里亚 [论文]

  • [2024_139] MambaAD:探索状态空间模型用于多类无监督异常检测, 豪洋·何、宇虎·白、江宁·张、庆东·何、宏旭·陈、振业·甘、成杰·王、湘泰·李、冠中·田、雷·谢 [论文]

  • [2024_138] 3DMambaComplete:探索结构化状态空间模型用于点云补全, 易轩·李、伟东·杨、本·费伊 [论文]

  • [2024_137] RhythmMamba:利用任意长度视频进行快速远程生理测量, 博超·邹、子正·郭、晓成·胡、慧敏·马 [论文] [代码]

  • [2024_136] VMambaMorph:基于视觉Mamba框架并结合跨扫描模块的可变形3D图像配准, 子扬·王、建青·郑、超·马、涛·郭 [论文]

  • [2024_135] 3DMambaIPF:一种基于状态空间模型的迭代点云滤波方法,通过可微渲染实现, 清远·周、伟东·杨、本·费伊、京怡·徐、睿·张、凯毅·刘、叶琪·罗、英·何 [论文]

  • [2024_134] Sigma:用于多模态语义分割的暹罗Mamba网络, 子富·万、宇豪·王、斯隆·永、平平·张、西蒙·施特普蒂斯、卡蒂娅·西卡拉、雅琪·谢 [论文] [代码]

  • [2024_133] xT:用于大图像更大上下文的嵌套标记化方法, 里特维克·古普塔、舒凡·李、泰勒·朱、吉滕德拉·马利克、特雷弗·达雷尔、卡尔提凯亚·曼加拉姆 [论文] [代码]

  • [2024_132] 在Mamba中定位和编辑事实关联, 阿尔纳布·森·夏尔马、大卫·阿特金森、大卫·鲍 [论文]

  • [2024_131] InsectMamba:基于状态空间模型的昆虫害虫分类, 恰宁·王、程林·王、志新·赖、宇成·周 [论文]

  • [2024_130] ChangeMamba:基于时空状态空间模型的遥感变化检测, 宏瑞轩·陈、建·宋、承熙·韩、俊石·夏、直人·横屋 [论文] [代码]

  • [2024_129] RS-Mamba用于大型遥感图像密集预测, 思洁·赵、浩·陈、雪亮·张、鹏峰·肖、雷·白、万里·欧阳 [论文] [代码]

  • [2024_128] RS3Mamba:用于遥感图像语义分割的视觉状态空间模型, 西安平·马、晓康·张、满恩·潘 [论文] [代码]

  • [2024_127] SPMamba:语音分离中只需状态空间模型即可, 凯·李、国·陈 [论文]

  • [2024_126] 关于线性参数时变状态空间模型的约简, E. 哈维尔·奥卢查、博戈柳布·特尔津、阿姆里塔姆·达斯、罗兰·托特 [论文]

  • [2024_125] Samba:基于状态空间模型的遥感图像语义分割, 秦峰·朱、元智·蔡、元芳·杨、以涵·杨、成·陈、雷·范、安·阮 [论文] [代码]

  • [2024_124] T-Mamba:用于牙齿3D CBCT分割的频率增强型门控长距离依赖模型, 敬浩、雷·何、郭·冯·洪 [论文] [代码]

  • [2024_123] Decision Mamba:通过选择性状态空间的序列建模实现强化学习, 东弘·太田 [论文]

  • [2024_122] RankMamba:在Transformer时代评估Mamba在文档排序方面的性能, 志超·许 [论文] [代码]

  • [2024_121] SpikeMba:用于时序视频定位的多模态脉冲显著性Mamba, 文锐·李、小鹏·洪、小鹏·范 [论文]

  • [2024_120] HSIMamba:用于高光谱成像分类的双向状态空间高效特征学习, 朱迪·X·杨、俊·周、京·王、惠·田、艾伦·韦·钟·刘 [论文] [代码]

  • [2024_119] HARMamba:基于双向选择性SSM的高效可穿戴传感器人体活动识别, 李双剑、朱涛、段福荣、陈利明、宁焕生、万亚平 [论文]

  • [2024_118] UltraLight VM-UNet:并行视觉Mamba显著减少参数量,用于皮肤病变分割, 吴仁凯、刘英浩、梁鹏臣、常青 [论文] [代码]

  • [2024_117] MambaMixer:具有双重标记和通道选择的高效选择性状态空间模型, Ali Behrouz、Michele Santacatterina、Ramin Zabih [论文]

  • [2024_116] 双路径Mamba:用于语音分离的短时与长时双向选择性结构化状态空间模型, 蒋锡林、韩聪、Nima Mesgarani [论文]

  • [2024_115] STG-Mamba:通过选择性状态空间模型进行时空图学习, 李林灿、王汉辰、张文杰、Adelle Coster [论文]

  • [2024_114] Cobra:将Mamba扩展为多模态大语言模型以实现高效推理, 赵晗、张敏、赵伟、丁鹏翔、黄思腾、王东林 [论文]

  • [2024_113] 音乐到舞蹈的语言翻译:基于序列模型的方法, André Correia、Luís A. Alexandre [论文] [代码]

  • [2024_112] CMViM:对比掩码Vim自编码器,用于AD分类的3D多模态表征学习, 杨广谦、杜康睿、杨志涵、杜烨、郑永平、王树军 [论文]

  • [2024_111] 本体感知就够了:针对北方森林的地形分类, Damien LaRocque、William Guimont-Martin、David-Alexandre Duclos、Philippe Giguère、François Pomerleau [论文]

  • [2024_110] ReMamber:利用Mamba Twister进行引用图像分割, 杨宇桓、马超凡、姚江潮、钟准、张雅、王彦峰 [论文]

  • [2024_109] 混合架构的机制设计与规模扩展, Michael Poli、Armin W Thomas、Eric Nguyen、Pragaash Ponnusamy、Björn Deiseroth、Kristian Kersting、铃木泰治、Brian Hie、Stefano Ermon、Christopher Ré、Ce Zhang、Stefano Massaroli [论文]

  • [2024_108] 深度结构化状态空间模型的模型阶数约简:系统理论方法, Marco Forgione、Manas Mejari、Dario Piga

  • [2024_107] 利用深度学习和状态空间模型建模模拟动态范围压缩器, 尹瀚智、程刚、Christian J. Steinmetz、袁瑞斌、Richard M. Stern、Roger B. Dannenberg [论文]

  • [2024_106] 揭示选择性状态空间模型在终身序列推荐中的能力, 杨继远、李元子、赵静宇、王汉冰、马牧阳、马俊、任兆春、张梦琪、辛欣、陈柱民、任鹏杰 [论文] [代码]

  • [2024_105]

  • [2024_104] Serpent:通过多尺度结构化状态空间模型实现可扩展且高效的图像恢复, Mohammad Shahab Sepehri、Zalan Fabian、Mahdi Soltanolkotabi [论文]

  • [2024_103] Jamba:一种混合Transformer-Mamba语言模型, Opher Lieber、Barak Lenz、Hofit Bata、Gal Cohen、Jhonathan Osin、Itay Dalmedigos、Erez Safahi、Shaked Meirom、Yonatan Belinkov、Shai Shalev-Shwartz、Omri Abend、Raz Alon、Tomer Asida、Amir Bergman、Roman Glozman、Michael Gokhman、Avashalom Manevich、Nir Ratner、Noam Rozen、Erez Shwartz、Mor Zusman、Yoav Shoham [论文] [官网] [Huggingface]

  • [2024_102] Gamba:将高斯喷溅与Mamba结合,用于单视图3D重建, 沈秋红、易轩宇、吴子科、周攀、张汉旺、颜水成、王新超 [论文]

  • [2024_101] RSMamba:利用状态空间模型进行遥感图像分类, [项目] [论文] [代码]

  • [2024_100] 旋转扫描:带有三重SSM模块的UNet-like Mamba,用于医学图像分割, 唐浩、程良伦、黄国恒、谭正光、陆俊豪、吴凯宏 [论文]

  • [2024_099] PlainMamba:改进非层次化Mamba在视觉识别中的表现, 杨晨鸿毅、陈泽辉、Miguel Espinosa、Linus Ericsson、王振宇、刘嘉铭、Elliot J. Crowley [论文] [代码]

  • [2024_098] 将Mamba序列模型与层次化上采样网络相结合,用于多发性硬化症病灶的精确语义分割, Kazi Shahriar Sanjid、Md. Tanzim Hossain、Md. Shakib Shahariar Junayed、Dr. Mohammad Monir Uddin [论文]

  • [2024_097] VMRNN:整合视觉Mamba和LSTM,实现高效准确的时空预测, 唐宇进、董培杰、唐振亨、楚晓雯、梁俊伟 [论文] [代码]

  • [2024_096] SiMBA:面向视觉和多元时间序列的简化Mamba架构, Badri N. Patro、Vijay S. Agneeswaran [论文] [代码]

  • [2024_095] 跟我学:Transformer在复制任务上优于状态空间模型,Samy Jelassi、David Brandfonbrener、Sham M. Kakade、Eran Malach [论文]

  • [2024_094]H-vmunet:高阶视觉Mamba UNet,用于医学图像分割, 吴仁凯、刘英浩、梁鹏臣、常青 [论文] [代码]

  • [2024_093]VL-Mamba:探索状态空间模型在多模态学习中的应用,乔燕远、郑宇、郭龙腾、陈思涵、赵子佳、孙明珍、吴奇、刘静 [论文] [项目] [代码]

  • [2024_092]ProMamba:用于息肉分割的提示-Mamba,谢建浩、廖若凡、张子昂、易思达、朱岳生、罗贵波 [论文]

  • [2024_091]ZigMa:锯齿形Mamba扩散模型(ECCV 2024),Vincent Tao Hu、Stefan Andreas Baumann、Ming Gui、Olga Grebenkova、Pingchuan Ma、Johannes Fischer、Bjorn Ommer [论文] [代码]

  • [2024_090]关于[V]-Mamba的小样本迁移性,Diganta Misra、Jay Gala、Antonio Orvieto [论文]

  • [2024_089]Mamba对时间序列预测有效吗? Zihan Wang、Fanheng Kong、Shi Feng、Ming Wang、Han Zhao、Daling Wang、Yifei Zhang [论文] [代码]

  • [2024_088]VmambaIR:用于图像修复的视觉状态空间模型, Yuan Shi、Bin Xia、Xiaoyu Jin、Xing Wang、Tianyu Zhao、Xin Xia、Xuefeng Xiao、Wenming Yang [论文]

  • [2024_087]理解视觉状态空间模型在图像分类中的鲁棒性, Chengbin Du、Yanxi Li、Chang Xu [论文]

  • [2024_086]基于正则化的深度状态空间模型高效持续学习, Yuanhang Zhang、Zhidi Lin、Yiyong Sun、Feng Yin、Carsten Fritsche [论文]

  • [2024_085]TimeMachine:长期预测中,一个时间序列胜过四个Mamba,Md Atik Ahamed、Qiang Cheng [论文] [代码]

  • [2024_084]EfficientVMamba:轻量级视觉Mamba的空洞选择性扫描,Xiaohuan Pei、Tao Huang、Chang Xu [论文] [代码]

  • [2024_083]MambaTalk:利用选择性状态空间模型实现高效的全息手势合成, Zunnan Xu、Yukang Lin、Haonan Han、Sicheng Yang、Ronghui Li、Yachao Zhang、Xiu Li [论文]

  • [2024_082]LocalMamba:带有窗口化选择性扫描的视觉状态空间模型, Tao Huang、Xiaohuan Pei、Shan You、Fei Wang、Chen Qian、Chang Xu [论文] [代码]

  • [2024_081]VM-UNET-V2:重新思考用于医学图像分割的Vision Mamba UNet, Mingya Zhang、Yue Yu、Limei Gu、Tingsheng Lin、Xianping Tao [论文] [代码]

  • [2024_080]视频Mamba套件:作为视频理解的多功能替代方案的状态空间模型, Guo Chen、Yifei Huang、Jilan Xu、Baoqi Pei、Zhe Chen、Zhiqi Li、Jiahao Wang、Kunchang Li、Tong Lu、Limin Wang [论文] [代码]

  • [2024_079]用于连续序列到序列建模的层次化状态空间模型, Raunaq Bhirangi、Chenyu Wang、Venkatesh Pattabiraman、Carmel Majidi、Abhinav Gupta、Tess Hellebrekers、Lerrel Pinto [论文]

  • [2024_078]MambaStock:用于股票预测的选择性状态空间模型,Zhuangwei Shi [论文] [代码]

  • [2024_077]简单的线性注意力语言模型平衡召回率与吞吐量之间的权衡, Simran Arora、Sabri Eyuboglu、Michael Zhang、Aman Timalsina、Silas Alberti、Dylan Zinsley、James Zou、Atri Rudra、Christopher Ré [论文]

  • [2024_076]LightM-UNet:Mamba助力轻量化UNet用于医学图像分割, Weibin Liao、Yinghao Zhu、Xinyuan Wang、Chengwei Pan、Yasha Wang、Liantao Ma [论文] [代码]

  • [2024_075]运动引导的双目跟踪器,用于胃镜检查的低成本技能评估, Yuelin Zhang、Wanquan Yan、Kim Yan、Chun Ping Lam、Yufu Qiu、Pengyu Zheng、Raymond Shing-Yan Tang、Shing Shin Cheng [论文] [代码]

  • [2024_074]Caduceus:双向等变的长距离DNA序列建模,Yair Schiff、Chia-Hsiang Kao、Aaron Gokaslan、Tri Dao、Albert Gu、Volodymyr Kuleshov [论文]

  • [2024_073]MD-Dose:基于Mamba的扩散模型,用于放疗剂量预测, Linjie Fu、Xia Li、Xiuding Cai、Yingkai Wang、Xueyao Wang、Yali Shen、Yu Yao [论文]

  • [2024_072]在图像超分辨率中激活更广的区域,Cheng Cheng、Hang Wang、Hongbin Sun [论文]

  • [2024_071]针对静止和移动说话者的多通道长期流式神经语音增强, Changsheng Quan、Xiaofei Li [论文]

  • [2024_070]一项使用选择性状态空间模型预测急性脑功能障碍状态的多队列研究, Brandon Silva、Miguel Contreras、Sabyasachi Bandyopadhyay、Yuanfang Ren、Ziyuan Guan、Jeremy Balch、Kia Khezeli、Tezcan Ozrazgat Baslanti、Ben Shickel、Azra Bihorac、Parisa Rashidi [论文]

  • [2024_069]下一令牌预测的陷阱, Gregor Bachmann、Vaishnavh Nagarajan [论文] [代码]

  • [2024_068]用于医学图像分割的大窗口Mamba UNet:超越卷积与自注意力,Jinhong Wang、Jintai Chen、Danny Chen、Jian Wu [论文] [代码]

  • [2024_067]Motion Mamba:利用层次化与双向选择性SSM实现高效且长序列的运动生成, Zeyu Zhang、Akide Liu、Ian Reid、Richard Hartley、Bohan Zhuang、Hao Tang [论文] [项目] [代码]

  • [2024_066]ClinicalMamba:基于纵向临床记录的生成式临床语言模型, Zhichao Yang、Avijit Mitra、Sunjae Kwon、Hong Yu [论文] [代码]

  • [2024_065]MambaMIL:通过计算病理学中的序列重排提升长序列建模能力, Shu Yang、Yihui Wang、Hao Chen [论文] [代码]

  • [2024_064]Point Mamba:基于八叉树排序策略的状态空间模型点云骨干网络, 刘久明、于瑞吉、王一安、郑宇、邓天辰、叶伟才、王鹤生 [论文] [代码]

  • [2024_063]VideoMamba:用于高效视频理解的状态空间模型,李坤昌、李新浩、王毅、何一楠、王亚丽、王利民、乔宇 [论文] [代码]

  • [2024_062]MamMIL:基于状态空间模型的全切片图像多示例学习,方子杰、王义峰、王志、张健、姬向阳、张永兵 [论文]

  • [2024_061]视频扩散状态空间模型,费正聪、范明远、余长谦、黄俊时, [论文] [代码]

  • [2024_060]Mamba4Rec:基于选择性状态空间模型的高效序列推荐,刘成凯、林江浩、王建玲、刘汉周、詹姆斯·卡弗利 [论文]

  • [2024_059]MedMamba:用于医学图像分类的视觉Mamba,岳雨标、李振章 [论文] [代码]

  • [2024_058]Griffin:将门控线性递归与局部注意力相结合以构建高效语言模型,索哈姆·德、塞缪尔·L·史密斯、阿努尚·费尔南多、亚历山大·博特夫、乔治·克里斯蒂安-穆拉鲁、阿尔伯特·顾、鲁巴·哈伦、莱昂纳德·贝拉达、陈宇田、斯里瓦茨桑·斯里尼瓦桑、纪尧姆·德扎丹、阿尔诺·杜塞、大卫·布登、提耶·韦伊·特、拉兹万·帕斯卡努、南多·德·弗雷塔斯、查格拉尔·古尔切赫雷 [论文]

  • [2024_057]具有硬件高效训练的门控线性注意力Transformer,杨松林、王柏霖、沈益康、拉梅什瓦尔·潘达、尹金 [论文] [代码]

  • [2024_056]DenseMamba:具有密集隐藏连接的状态空间模型,用于高效大型语言模型, [论文] [代码]

  • [2024_055]Mamba模型的隐藏注意力, [论文] [代码]

  • [2024_054]MiM-ISTD:Mamba-in-Mamba用于高效红外小目标检测,陈天翔、谭振涛、龚涛、楚奇、吴悦、刘斌、叶洁平、于能海 [论文] [代码]

  • [2024_053]Point Could Mamba:基于状态空间模型的点云学习,张涛、李向泰、袁浩博、季顺平、严树成 [论文] [代码]

  • [2024_052]Res-VMamba:利用选择性状态空间模型结合深度残差学习进行细粒度食品类别视觉分类,陈启盛、陈冠英、周东、蒋迪、陈戴石 [论文] [代码]

  • [2024_051]MambaMIR:一种可任意掩码的Mamba用于联合医学图像重建与不确定性估计,黄家豪、杨柳涛、王凡文、吴寅哲、杨楠、安杰莉卡·I·阿维莱斯-里韦罗、卡罗拉-比比安·舍恩利布、张道强、杨光 [论文] [代码]

  • [2024_050]MambaIR:一种基于状态空间模型的简单图像恢复基线,郭航、李金敏、戴涛、欧阳志浩、任旭东、夏树涛 [论文] [代码]

  • [2024_049]用于事件相机的状态空间模型,尼古拉·祖比奇、马蒂亚斯·盖里格、达维德·斯卡拉穆扎 [论文]

  • [2024_048][ICLR 2024] FlashFFTConv:利用张量核心实现长序列的高效卷积,傅逸飞、赫尔曼·昆邦、埃里克·阮、克里斯托弗·雷 [论文]

  • [2024_047]状态空间模型的变分量化,艾蒂安·大卫、让·贝洛、西尔万·勒科尔夫 [论文]

  • [2024_046]通过状态空间增强的Transformer实现高效长序列建模,左思邈、刘晓东、焦健、丹尼斯·X·查尔斯、埃伦·马纳沃格鲁、赵拓、高建峰 [论文]

  • [2024_045][ICLR 2024] 通过近似对角化提升长序列状态空间模型的鲁棒性,安娜·于、阿尔努尔·尼格梅托夫、德米特里·莫罗佐夫、迈克尔·W·马霍尼、N·本杰明·埃里克森 [论文]

  • [2024_044]从泛化分析到状态空间模型的优化设计,刘福生、李千晓 [论文]

  • [2024_043]用于空间归纳偏置的二维状态空间层,伊森·巴伦、伊塔马尔·齐默曼、利奥尔·沃尔夫 [论文]

  • [2024_042][ICLR 2024] Hieros:基于结构化状态空间序列世界模型的层次化想象,保罗·马特斯、赖纳·施洛瑟、拉尔夫·赫布里希 [论文]

  • [2024_041]S4++:通过状态记忆回复提升长序列建模能力,[论文]

  • [2024_040][被ICLR 2024拒绝] Mamba:基于选择性状态空间的线性时间序列建模,阿尔伯特·顾、崔·道 [论文] [Mamba:艰难之路] [annotated-mamba]

  • [2024_039][ICLR 2024] 门控循环神经网络发现注意力机制,尼古拉斯·祖切特、小林诚二、亚西尔·阿克拉姆、约翰内斯·冯·奥斯瓦尔德、马克西姆·拉尔谢、安杰莉卡·施泰格、若昂·萨克拉门托 [论文]

  • [2024_038][ICLR 2024] GateLoop:完全由数据控制的线性递归用于序列建模,托比亚斯·卡奇 [论文]

  • [2024_037][ICLR 2024] 切勿从零开始训练:长序列模型的公平比较需要基于数据的先验知识,伊多·阿莫斯、乔纳森·贝兰特、安基特·古普塔 [论文]

  • [2024_036] [ICLR 2024] 掌握记忆任务的世界模型,穆罕默德·雷扎·萨姆萨米、阿特姆·卓卢斯、贾纳尔塔南·拉煎德兰、萨拉特·钱达尔 [论文] [项目页面] [代码]

  • [2024_035]谱状态空间模型, Naman Agarwal, Daniel Suo, Xinyi Chen, Elad Hazan [论文]

  • [2024_034]图Mamba:迈向基于状态空间模型的图学习, Ali Behrouz, Farnoosh Hashemi [论文]

  • [2024_033]Mamba能否学会学习?关于上下文学习任务的比较研究, Jongho Park, Jaeseung Park, Zheyang Xiong, Nayoung Lee, Jaewoong Cho, Samet Oymak, Kangwook Lee, Dimitris Papailiopoulos [论文]

  • [2024_032]Mamba是否具备上下文学习能力? Riccardo Grazzi, Julien Siems, Simon Schrodi, Thomas Brox, Frank Hutter [论文]

  • [2024_031]LOCOST:用于长文档摘要生成的状态空间模型, Florian Le Bronnec, Song Duong, Mathieu Ravaut, Alexandre Allauzen, Nancy F. Chen, Vincent Guigue, Alberto Lumbreras, Laure Soulier, Patrick Gallinari [论文] [代码]

  • [2024_030]RWKV-TS:超越传统循环神经网络的时间序列任务, Haowen Hou, F. Richard Yu [论文] [代码]

  • [2024_029]BlackMamba:面向状态空间模型的专家混合, Quentin Anthony, Yury Tokpanov, Paolo Glorioso, Beren Millidge [论文] [代码]

  • [2024_028]用于图表示学习的递归距离滤波, Yuhui Ding, Antonio Orvieto, Bobby He, Thomas Hofmann [论文] [代码]

  • [2024_027]SSM邂逅视频扩散模型:利用结构化状态空间实现高效视频生成, Yuta Oshima, Shohei Taniguchi, Masahiro Suzuki, Yutaka Matsuo [论文]

  • [2024_026]Pan-Mamba:基于状态空间模型的有效全色锐化, Xuanhua He, Ke Cao, Keyu Yan, Rui Li, Chengjun Xie, Jie Zhang, Man Zhou [论文] [代码]

  • [2024_025]Weak-Mamba-UNet:视觉Mamba使CNN和ViT在基于涂鸦的医学图像分割中表现更佳, Ziyang Wang, Chao Ma [论文] [代码]

  • [2024_024]PointMamba:一种用于点云分析的简单状态空间模型, Dingkang Liang, Xin Zhou, Xinyu Wang, Xingkui Zhu, Wei Xu, Zhikang Zou, Xiaoqing Ye, Xiang Bai [论文] [代码]

  • [2024_023]P-Mamba:将Perona–Malik扩散与Mamba结合,用于高效的儿科超声心动图左心室分割, Zi Ye, Tianxiang Chen [论文]

  • [2024_022]Semi-Mamba-UNet:基于对比学习的像素级交叉监督视觉Mamba UNet,用于半监督医学图像分割, Ziyang Wang, Chao Ma [论文]

  • [2024_021]FD-Vision Mamba用于内窥镜曝光校正, Zhuoran Zheng, Jun Zhang, [论文]

  • [2024_020]具有状态空间主干的可扩展扩散模型, Zhengcong Fei, Mingyuan Fan, Changqian Yu, Junshi Huang [论文] [代码]

  • [2024_019]Mamba-ND:面向多维数据的选择性状态空间建模, Shufan Li, Harkanwar Singh, Aditya Grover [论文]

  • [2024_018]Mamba-UNet:类似UNet的纯视觉Mamba,用于医学图像分割, Ziyang Wang, Jian-Qing Zheng, Yichi Zhang, Ge Cui, Lei Li [论文] [代码]

  • [2024_017]MambaTab:一种简单而有效的处理表格数据的方法, Md Atik Ahamed1, Qiang Cheng [论文]

  • [2024_016] nnMamba:基于状态空间模型的3D生物医学图像分割、分类和标志点检测, Haifan Gong, Luoyao Kang, Yitao Wang, Xiang Wan, Haofeng Li [论文] [代码]

  • [2024_015] U型视觉Mamba用于单张图像去雾, Zhuoran Zheng, Chen Wu [论文]

  • [2024_014] Graph-Mamba:迈向基于选择性状态空间的长程图序列建模, Chloe Wang, Oleksii Tsepa, Jun Ma, Bo Wang [论文] [代码]

  • [2024_013] VM-UNet:用于医学图像分割的视觉Mamba UNet, Jiacheng Ruan, Suncheng Xiang [论文] [代码]

  • [2024_012] Swin-UMamba:基于Mamba且经过ImageNet预训练的UNet, Jiarun Liu, Hao Yang, Hong-Yu Zhou, Yan Xi, Lequan Yu, Yizhou Yu, Yong Liang, Guangming Shi, Shaoting Zhang, Hairong Zheng, Shanshan Wang [论文] [代码]

  • [2024_011] Ma, Jun, Feifei Li, and Bo Wang. "U-mamba:增强生物医学图像分割中的长程依赖关系." arXiv预印本 arXiv:2401.04722 (2024). [论文] [代码]

  • [2024_010] Vivim:用于医学视频目标分割的视频视觉Mamba, Yijun Yang, Zhaohu Xing, and Lei Zhu [论文] [代码]

  • [2024_009] Wang, Junxiong, et al. "MambaByte:无标记的选择性状态空间模型。" arXiv预印本 arXiv:2401.13660 (2024). [论文] [代码]

  • [2024_008] MoE-Mamba:具有专家混合的高效选择性状态空间模型。 Pióro, M., Ciebiera, K., Król, K., Ludziejewski, J., & Jaszczur, S. (2024). arXiv预印本 arXiv:2401.04081. [论文]

  • [2024_007] [ICLR-2024] 用世界模型掌握记忆任务 [论文]

  • [2024_006] MambaMorph:基于Mamba的主干,结合对比特征学习用于可形变MR-CT配准, Tao Guo, Yinuo Wang, and Cai Meng [论文] [代码]

  • [2024_005] SegMamba:用于3D医学图像分割的长程序列建模Mamba, [论文] [代码]

  • [2024_003] Vision Mamba:基于双向状态空间模型的高效视觉表征学习,朱良辉1∗、廖本成1∗、张倩2、王欣龙3、刘文宇1、王兴刚 [论文] [代码]

  • [2024_002] VMamba:视觉状态空间模型,刘悦1、田云杰1、赵宇中1、于鸿天1、谢凌溪2、王耀伟3、叶奇翔1、刘云帆1 [论文] [代码]

  • [2024_001] 深度选择性状态空间模型的理论基础,尼古拉·穆卡·西罗内、安东尼奥·奥尔维耶托、本杰明·沃克、克里斯托弗·萨尔维、特里·莱昂斯 [论文]

2023年

  • [2023_018] [CHIL 2023] 利用图神经网络和结构化状态空间模型建模多变量生物信号,唐思怡、贾雷德·A·邓蒙、屈梁琼、哈立德·K·萨阿卜、蒂娜·拜卡纳、克里斯托弗·李-梅瑟、丹尼尔·L·鲁宾 [论文]

  • [2023_017] “StableSSM:通过稳定重参数化缓解状态空间模型中的记忆诅咒。” 王诗达、李千晓。arXiv预印本 arXiv:2311.14495 (2023)。 [论文] [代码]

  • [2023_016] 具有逐层非线性的状态空间模型是具有指数衰减记忆的通用逼近器,王诗达、薛贝晨 [论文]

  • [2023_015] 用于单声道语音增强的脉冲式结构化状态空间模型。杜Y、刘X、蔡Y(2023)。arXiv预印本 arXiv:2309.03641。 [论文]

  • [2023_014] 通过世界模型掌握多样化的领域,达尼雅尔·哈夫纳12、尤尔吉斯·帕苏科尼斯1、吉米·巴2、蒂莫西·利利克拉普 [论文] [代码]

  • [2023_013] 用于长视频理解的选择性结构化状态空间,王珏、朱文涛、王丕超、于翔、刘琳达、穆罕默德·奥马尔、拉法伊·哈米德 [论文]

  • [2023_012] Mamba:基于选择性状态空间的线性时间序列建模,阿尔伯特·顾*1和崔·道 [论文] [GitHub]

  • [2023_011] [NeurIPS 2023] 面向上下文强化学习的结构化状态空间模型,克里斯·卢、扬尼克·施罗克尔、阿尔伯特·顾、埃米利奥·帕里索托、雅各布·福斯特、萨廷德·辛格、费里亚尔·贝赫巴哈尼 [论文] [代码]

  • [2023_010] 无需注意力机制的扩散模型,景内森·严、贾陶·顾、亚历山大·M·拉什 [论文]

  • [2023_009] 用于序列建模的分层门控循环神经网络,秦振、杨松林、钟一然 [论文] [代码]

  • [2023_008] Retentive Network:大型语言模型的Transformer继任者,孙宇涛、董力、黄绍涵、马淑明、夏雨晴、薛继龙、王建勇、魏富儒 [论文] [代码]

  • [2023_007] 用于长距离时空建模的卷积状态空间模型,吉米·T.H. 史密斯、沙莉妮·德·梅洛、扬·考茨、斯科特·W·林德曼、卞元民 [论文] [代码]

  • [2023_006] 笑鬣狗酿酒厂:从卷积中提取紧凑的递归结构,斯特凡诺·马萨罗利、迈克尔·波利、丹尼尔·Y·傅、赫尔曼·昆邦、罗姆·N·帕尔尼丘恩、阿曼·蒂马尔西纳、大卫·W·罗梅罗、奎因·麦金泰尔、贝迪·陈、阿特里·鲁德拉、齐·张、克里斯托弗·雷、斯特凡诺·埃尔蒙、约书亚·本吉奥 [论文]

  • [2023_005] 结构化状态空间模型是深度维纳模型,法比奥·博纳西、卡尔·安德森、佩尔·马特松、托马斯·B·舍恩 [论文]

  • [2023_004] 动物学:衡量并提升高效语言模型的召回率,西姆兰·阿罗拉、萨布里·艾尤博格鲁、阿曼·蒂马尔西纳、伊西斯·约翰逊、迈克尔·波利、詹姆斯·邹、阿特里·鲁德拉、克里斯托弗·雷 [论文]

  • [2023_003] [ICML 2023] 为长序列复活循环神经网络,安东尼奥·奥尔维耶托、塞缪尔·史密斯、阿尔伯特·顾、阿努尚·费尔南多、查格拉尔·古尔切赫雷、拉兹万·帕斯卡努、索汉·德 [论文]

  • [2023_002] 鬣狗层级:迈向更大的卷积语言模型,迈克尔·波利、斯特凡诺·马萨罗利、埃里克·阮、丹尼尔·Y·傅、崔·道、斯蒂芬·巴库斯、约书亚·本吉奥、斯特凡诺·埃尔蒙、克里斯托弗·雷 [论文]

  • [2023_001] [ICLR 2023] 用于序列建模的简化状态空间层,吉米·T.H. 史密斯、安德鲁·沃灵顿、斯科特·林德曼 [论文]

2022年

  • [2022_009] [ECCV-2022] 基于状态空间视频模型的长视频片段分类, Md Mohaiminul Islam, Gedas Bertasius [论文] [代码]

  • [2022_008] [NIPS-2022] “S4nd:用状态空间对图像和视频进行多维信号建模”。Nguyen, Eric 等。神经信息处理系统进展 35 (2022):2846–2861。 [论文] [代码]

  • [2022_007] [预训练] Wang, J., Yan, J. N., Gu, A., & Rush, A. M. (2022). 无需注意力机制的预训练。arXiv 预印本 arXiv:2212.10544。 [论文] [代码]

  • [2022_006] 通过门控状态空间实现长距离语言建模, Harsh Mehta1∗ Ankit Gupta2 Ashok Cutkosky3 Behnam Neyshabur1 [论文]

  • [2022_005] [ICML2022] 原生态!基于状态空间模型的音频生成, Karan Goel, Albert Gu, Chris Donahue, and Christopher R´e [论文]

  • [2022_004] 对角状态空间与结构化状态空间同样有效, Ankit Gupta˚Albert Gu Jonathan Berant [论文]

  • [2022_003] 如何训练你的 HiPPO:带有广义正交基投影的状态空间模型, Albert Gu∗†, Isys Johnson∗‡, Aman Timalsina‡, Atri Rudra‡, 和 Christopher R´e† [论文]

  • [2022_002] 关于对角状态空间模型的参数化与初始化, Albert Gu†, Ankit Gupta‡, Karan Goel†, 和 Christopher R´e† [论文]

  • [2022_001] 用结构化状态空间高效建模长序列, Albert Gu, Karan Goel, Christopher Ré [论文] [注释版 S4]

2021年及以前

  • [2021_003] 用结构化状态空间高效建模长序列, Albert Gu, Karan Goel, 和 Christopher R´e [论文] [代码]

  • [2021_002] HiPPO:具有最优多项式投影的循环记忆, Albert Gu∗†, Tri Dao∗†, Stefano Ermon†, Atri Rudra‡, 和 Christopher Ré† [论文] [代码]

  • [2021_001] 将循环、卷积和连续时间模型结合于线性状态空间层, Albert Gu†, Isys Johnson†, Karan Goel†, Khaled Saab†, Tri Dao†, Atri Rudra‡, 和 Christopher Ré† [论文]

相关模型

  • [arXiv:2406.13362] VisualRWKV:探索用于视觉语言模型的循环神经网络, Haowen Hou, Peigen Zeng, Fei Ma, Fei Richard Yu [论文] [代码]

  • [arXiv:2406.06973] RWKV-CLIP:一种鲁棒的视觉-语言表征学习器, Tiancheng Gu, Kaicheng Yang, Xiang An, Ziyong Feng, Dongnan Liu, Weidong Cai, Jiankang Deng [论文] [代码]

  • [arXiv:2405.21022] 你只需扫描一次:用 LightNet 实现高效的多维序列建模, Zhen Qin, Yuxin Mao, Xuyang Shen, Dong Li, Jing Zhang, Yuchao Dai, Yiran Zhong [论文] [代码]

  • [arXiv:2405.15214] PointRWKV:用于分层点云学习的高效 RWKV 类似模型, Qingdong He, Jiangning Zhang, Jinlong Peng, Haoyang He, Yabiao Wang, Chengjie Wang [论文] [代码]

  • 扩散-RWKV:为扩散模型扩展 RWKV 类似架构, Zhengcong Fei, Mingyuan Fan, Changqian Yu, Debang Li, Junshi Huang [论文]

  • “Retentive network:大型语言模型中 Transformer 的继任者。” Sun, Yutao 等。arXiv 预印本 arXiv:2307.08621 (2023)。 [论文] [代码]

  • TLS-RWKV:基于时间标签平滑的实时在线动作检测。Zhu, Z., Shao, W. & Jiao, D. Neural Process Lett 56, 57 (2024)。 [论文]

  • RRWKV:在 RWKV 中捕捉长距离依赖关系, Leilei Wang [论文]

  • RWKV-TS:超越传统循环神经网络的时间序列任务, Haowen Hou, F. Richard Yu [论文] [代码]

  • Vision-RWKV:用 RWKV 类似架构实现高效且可扩展的视觉感知, Yuchen Duan, Weiyun Wang, Zhe Chen, Xizhou Zhu, Lewei Lu, Tong Lu, Yu Qiao, Hongsheng Li, Jifeng Dai, Wenhai Wang [论文] [代码]

  • RWKV:为 Transformer 时代重塑 RNN, Bo Peng, Eric Alcaide, Quentin Anthony, Alon Albalak, Samuel Arcadinho, Stella Biderman, Huanqi Cao, Xin Cheng, Michael Chung, Matteo Grella, Kranthi Kiran GV, Xuzheng He, Haowen Hou, Jiaju Lin, Przemyslaw Kazienko, Jan Kocon, Jiaming Kong, Bartlomiej Koptyra, Hayden Lau, Krishna Sri Ipsit Mantri, Ferdinand Mom, Atsushi Saito, Guangyu Song, Xiangru Tang, Bolun Wang, Johan S. Wind, Stanislaw Wozniak, Ruichong Zhang, Zhenyuan Zhang, Qihang Zhao, Peng Zhou, Qinghua Zhou, Jian Zhu, Rui-Jie Zhu [论文]

其他有用的网址

:newspaper: 引用

如果您认为本综述有所帮助,请随时点个赞⭐️并引用我们的论文:

@misc{Wang2024SSMSurvey,
      title={新一代网络中替代Transformer的状态空间模型:综述}, 
      author={王晓、萧王、丁宇赫、李跃航、吴文涛、荣瑶、孔伟哲、黄菊、李世豪、杨浩翔、王子文、江博、李承龙、王耀威、田永红、唐进},
      year={2024},
      eprint={2404.09516},
      archivePrefix={arXiv},
      primaryClass={cs.LG}
}

星标历史

星标历史图表

相似工具推荐

everything-claude-code

everything-claude-code 是一套专为 AI 编程助手(如 Claude Code、Codex、Cursor 等)打造的高性能优化系统。它不仅仅是一组配置文件,而是一个经过长期实战打磨的完整框架,旨在解决 AI 代理在实际开发中面临的效率低下、记忆丢失、安全隐患及缺乏持续学习能力等核心痛点。 通过引入技能模块化、直觉增强、记忆持久化机制以及内置的安全扫描功能,everything-claude-code 能显著提升 AI 在复杂任务中的表现,帮助开发者构建更稳定、更智能的生产级 AI 代理。其独特的“研究优先”开发理念和针对 Token 消耗的优化策略,使得模型响应更快、成本更低,同时有效防御潜在的攻击向量。 这套工具特别适合软件开发者、AI 研究人员以及希望深度定制 AI 工作流的技术团队使用。无论您是在构建大型代码库,还是需要 AI 协助进行安全审计与自动化测试,everything-claude-code 都能提供强大的底层支持。作为一个曾荣获 Anthropic 黑客大奖的开源项目,它融合了多语言支持与丰富的实战钩子(hooks),让 AI 真正成长为懂上

156.8k|★★☆☆☆|今天
开发框架Agent语言模型

LLMs-from-scratch

LLMs-from-scratch 是一个基于 PyTorch 的开源教育项目,旨在引导用户从零开始一步步构建一个类似 ChatGPT 的大型语言模型(LLM)。它不仅是同名技术著作的官方代码库,更提供了一套完整的实践方案,涵盖模型开发、预训练及微调的全过程。 该项目主要解决了大模型领域“黑盒化”的学习痛点。许多开发者虽能调用现成模型,却难以深入理解其内部架构与训练机制。通过亲手编写每一行核心代码,用户能够透彻掌握 Transformer 架构、注意力机制等关键原理,从而真正理解大模型是如何“思考”的。此外,项目还包含了加载大型预训练权重进行微调的代码,帮助用户将理论知识延伸至实际应用。 LLMs-from-scratch 特别适合希望深入底层原理的 AI 开发者、研究人员以及计算机专业的学生。对于不满足于仅使用 API,而是渴望探究模型构建细节的技术人员而言,这是极佳的学习资源。其独特的技术亮点在于“循序渐进”的教学设计:将复杂的系统工程拆解为清晰的步骤,配合详细的图表与示例,让构建一个虽小但功能完备的大模型变得触手可及。无论你是想夯实理论基础,还是为未来研发更大规模的模型做准备

90.1k|★★★☆☆|1周前
语言模型图像Agent

Deep-Live-Cam

Deep-Live-Cam 是一款专注于实时换脸与视频生成的开源工具,用户仅需一张静态照片,即可通过“一键操作”实现摄像头画面的即时变脸或制作深度伪造视频。它有效解决了传统换脸技术流程繁琐、对硬件配置要求极高以及难以实时预览的痛点,让高质量的数字内容创作变得触手可及。 这款工具不仅适合开发者和技术研究人员探索算法边界,更因其极简的操作逻辑(仅需三步:选脸、选摄像头、启动),广泛适用于普通用户、内容创作者、设计师及直播主播。无论是为了动画角色定制、服装展示模特替换,还是制作趣味短视频和直播互动,Deep-Live-Cam 都能提供流畅的支持。 其核心技术亮点在于强大的实时处理能力,支持口型遮罩(Mouth Mask)以保留使用者原始的嘴部动作,确保表情自然精准;同时具备“人脸映射”功能,可同时对画面中的多个主体应用不同面孔。此外,项目内置了严格的内容安全过滤机制,自动拦截涉及裸露、暴力等不当素材,并倡导用户在获得授权及明确标注的前提下合规使用,体现了技术发展与伦理责任的平衡。

88.9k|★★★☆☆|1周前
开发框架图像Agent

NextChat

NextChat 是一款轻量且极速的 AI 助手,旨在为用户提供流畅、跨平台的大模型交互体验。它完美解决了用户在多设备间切换时难以保持对话连续性,以及面对众多 AI 模型不知如何统一管理的痛点。无论是日常办公、学习辅助还是创意激发,NextChat 都能让用户随时随地通过网页、iOS、Android、Windows、MacOS 或 Linux 端无缝接入智能服务。 这款工具非常适合普通用户、学生、职场人士以及需要私有化部署的企业团队使用。对于开发者而言,它也提供了便捷的自托管方案,支持一键部署到 Vercel 或 Zeabur 等平台。 NextChat 的核心亮点在于其广泛的模型兼容性,原生支持 Claude、DeepSeek、GPT-4 及 Gemini Pro 等主流大模型,让用户在一个界面即可自由切换不同 AI 能力。此外,它还率先支持 MCP(Model Context Protocol)协议,增强了上下文处理能力。针对企业用户,NextChat 提供专业版解决方案,具备品牌定制、细粒度权限控制、内部知识库整合及安全审计等功能,满足公司对数据隐私和个性化管理的高标准要求。

87.6k|★★☆☆☆|1周前
开发框架语言模型

ML-For-Beginners

ML-For-Beginners 是由微软推出的一套系统化机器学习入门课程,旨在帮助零基础用户轻松掌握经典机器学习知识。这套课程将学习路径规划为 12 周,包含 26 节精炼课程和 52 道配套测验,内容涵盖从基础概念到实际应用的完整流程,有效解决了初学者面对庞大知识体系时无从下手、缺乏结构化指导的痛点。 无论是希望转型的开发者、需要补充算法背景的研究人员,还是对人工智能充满好奇的普通爱好者,都能从中受益。课程不仅提供了清晰的理论讲解,还强调动手实践,让用户在循序渐进中建立扎实的技能基础。其独特的亮点在于强大的多语言支持,通过自动化机制提供了包括简体中文在内的 50 多种语言版本,极大地降低了全球不同背景用户的学习门槛。此外,项目采用开源协作模式,社区活跃且内容持续更新,确保学习者能获取前沿且准确的技术资讯。如果你正寻找一条清晰、友好且专业的机器学习入门之路,ML-For-Beginners 将是理想的起点。

85.1k|★★☆☆☆|5天前
图像数据工具视频

funNLP

funNLP 是一个专为中文自然语言处理(NLP)打造的超级资源库,被誉为"NLP 民工的乐园”。它并非单一的软件工具,而是一个汇集了海量开源项目、数据集、预训练模型和实用代码的综合性平台。 面对中文 NLP 领域资源分散、入门门槛高以及特定场景数据匮乏的痛点,funNLP 提供了“一站式”解决方案。这里不仅涵盖了分词、命名实体识别、情感分析、文本摘要等基础任务的标准工具,还独特地收录了丰富的垂直领域资源,如法律、医疗、金融行业的专用词库与数据集,甚至包含古诗词生成、歌词创作等趣味应用。其核心亮点在于极高的全面性与实用性,从基础的字典词典到前沿的 BERT、GPT-2 模型代码,再到高质量的标注数据和竞赛方案,应有尽有。 无论是刚刚踏入 NLP 领域的学生、需要快速验证想法的算法工程师,还是从事人工智能研究的学者,都能在这里找到急需的“武器弹药”。对于开发者而言,它能大幅减少寻找数据和复现模型的时间;对于研究者,它提供了丰富的基准测试资源和前沿技术参考。funNLP 以开放共享的精神,极大地降低了中文自然语言处理的开发与研究成本,是中文 AI 社区不可或缺的宝藏仓库。

79.9k|★☆☆☆☆|1周前
语言模型数据工具其他