LSTM-FCN

804 265 简单 1 次阅读 1个月前开发框架

AI 解读由 AI 自动生成，仅供参考

LSTM-FCN 是一个专为时间序列分类任务设计的开源深度学习模型库。它巧妙地将全卷积网络（FCN）的高效特征提取能力与长短期记忆网络（LSTM）对长期依赖关系的精准捕捉能力相结合，旨在解决单一模型在处理复杂时间序列数据时性能不足的问题。

该工具不仅提供了基础的单变量分类模型，还特别推出了针对多变量数据集优化的 MLSTM-FCN 版本，有效提升了多维数据下的分类准确率。其独特的技术亮点在于引入了“维度洗牌”（Dimension Shuffle）机制，在不破坏循环神经网络特性的前提下，实现了卷积层与循环层的无缝融合。此外，项目还包含了详尽的消融实验代码，帮助使用者深入理解各模块对最终性能的贡献。

LSTM-FCN 非常适合人工智能研究人员、数据科学家以及从事时序数据分析的开发者使用。无论是需要复现经典论文结果，还是希望在 UCR 等标准数据集上快速构建高性能基线模型，它都能提供基于 Keras 和 TensorFlow 后端的成熟实现与预训练权重，帮助用户高效开展实验与研究。

使用场景

某工业预测性维护团队正在利用传感器时序数据，实时监测大型旋转机械的健康状态以预防突发故障。

没有 LSTM-FCN 时

特征提取困难：传统机器学习方法依赖人工设计统计特征，难以捕捉振动信号中复杂的局部模式与长期依赖关系。
多变量处理乏力：面对温度、压力、转速等多通道传感器数据，普通单变量模型无法有效融合不同维度的关联信息，导致判断片面。
误报率居高不下：由于模型对噪声敏感且泛化能力弱，频繁将正常波动误判为故障前兆，造成不必要的停机检修成本。
训练效率低下：尝试堆叠深层网络往往导致梯度消失或过拟合，调参过程耗时耗力却难以收敛到最优解。

使用 LSTM-FCN 后

自动捕获时空特征：LSTM-FCN 结合全卷积层的局部感知与 LSTM 的长短期记忆能力，自动提取出从瞬时冲击到长期趋势的关键特征。
多变量协同分析：通过引入 Multivariate LSTM-FCN 变体，模型能精准对齐并融合多维传感器数据，显著提升对复杂工况的理解力。
分类精度大幅跃升：在 UCR 标准数据集验证过的架构有效抑制了噪声干扰，将故障识别的准确率提升至新高度，极大降低了误报率。
部署流程标准化：基于 Keras/TensorFlow 的成熟代码库支持一键加载预训练权重，团队无需从零调参即可快速在新设备上落地应用。

LSTM-FCN 通过将卷积的高效性与循环网络的时序敏感性完美融合，为工业时序分类任务提供了高精度且易落地的解决方案。

运行环境要求

操作系统

未说明

GPU

未明确必需，但依赖 TensorFlow 后端（通常建议使用 GPU 加速深度学习训练），具体型号、显存及 CUDA 版本未在文中提及

内存

未说明

依赖

notes该工具仅支持使用 TensorFlow 后端的 Keras，不支持 Theano 或 CNTK 后端。用户需自行从 UCR 时间序列数据档案库下载数据集，并运行提供的脚本进行解压和整理。代码中包含针对 127 个数据集的批量训练和评估脚本，输入数据在模型内部会自动进行维度置换（Dimension Shuffle）处理。

python未说明

Keras (with TensorFlow backend)

TensorFlow

快速开始

用于时间序列分类的LSTM FCN

LSTM FCN模型源自论文《LSTM全卷积网络用于时间序列分类》（https://ieeexplore.ieee.org/document/8141873/），它结合了时序卷积层的快速分类性能与长短期记忆循环神经网络的精确分类能力。

多变量LSTM-FCN用于时间序列分类

通用的LSTM-FCN模型在单变量数据集上表现优异。然而，在多变量数据集上，我们发现直接应用该模型的效果并不理想。因此，我们针对此类数据集提出了多变量LSTM-FCN (MLSTM-FCN)。

论文：多变量LSTM-FCN用于时间序列分类
仓库：MLSTM-FCN

LSTM-FCN用于时间序列分类的消融研究

过去一年里，社区围绕该模型的细节提出了许多问题，例如：

为什么选择将全卷积网络与LSTM相结合？
维度洗牌到底起到了什么作用？
维度洗牌之后，LSTM是否就完全失去了其循环特性？
为什么不直接用GRU等其他RNN替代LSTM？
这种组合究竟带来了哪些实际的性能提升？

为此，我们进行了一项详尽的消融研究，共设计并执行了近3,627组实验，旨在分析和解答上述问题，从而更深入地理解LSTM-FCN/ALSTM-FCN时间序列分类模型及其各个子模块。

题为《关于LSTM全卷积网络用于时间序列分类的见解》的论文详细探讨并从统计学角度分析了维度洗牌后的LSTM对全卷积网络所带来的优势。

论文：关于LSTM全卷积网络用于时间序列分类的见解
仓库：LSTM-FCN-Ablation

安装

下载本仓库，并运行 pip install -r requirements.txt 以安装所需的依赖库。

模型开发过程中使用的是Keras配合TensorFlow后端，目前暂不支持Theano或CNTK后端。权重文件尚未在这些后端上进行测试。

数据可从以下链接以压缩包形式获取：http://www.cs.ucr.edu/~eamonn/time_series_data/
解压后会得到127个不同的文件夹。将工具脚本 extract_all_datasets.py 复制到该文件夹中并运行，即可生成一个名为 _data 的文件夹，其中包含所有127个数据集的解压内容。随后将这些文件剪切并粘贴到 Data 目录下。

注意：所有模型的输入层输入会被预先洗牌成形状为 (Batchsize, 1, Number of timesteps)，并在送入CNN之前再次洗牌（以获得正确的形状 (Batchsize, Number of timesteps, 1)）。这与论文中的做法有所不同：论文中输入的形状为 (Batchsize, Number of timesteps, 1)，且洗牌操作是在LSTM之前进行，以得到 (Batchsize, 1, Number of timesteps) 的输入形状。这两种操作在功能上是等价的。

训练与评估

提供的代码和权重文件可用于评估全部127个UCR数据集。具体说明请参阅权重目录。

现在只需运行一个脚本，即可在三个不同的单元配置（8、64、128）下，对LSTM-FCN及其注意力变体在127个数据集上进行所有可能的组合循环训练。

使用LSTM FCN模型：model = generate_lstmfcn()
使用ALSTM FCN模型：model = generate_alstmfcn()

训练

训练过程位于 all_datasets_training.py 的最内层循环中。

需提前设置以下几个参数：

数据集：数据集应以 (dataset name, id) 的形式列出。所有127个数据集的 (name, id) 对已预先设定好，对应于 utils 目录下的 constants.py 文件中的ID。
模型：模型列表应以 (model_name, model_function) 的形式定义。请注意：model_function 必须是一个返回Keras Model的对象，而非实际的模型实例。该函数可以接受3个参数——最大序列长度、类别数以及可选的单元数量。
单元：需要训练的单元配置。默认为 [8, 64, 128]，与论文一致。

完成上述设置后，训练开始时，每个模型将按照指定参数进行训练，并生成日志文件，记录所有相关参数以及训练结束时的训练集和测试集准确率。权重文件会自动保存到相应目录，可供后续分析使用。

训练内循环

要训练某个模型，请取消注释下方代码行并执行脚本。注意：???????' 已经被预设，无需替换，它代表保存的权重文件前缀。此外，如果已有权重文件存在，此操作将会覆盖原有权重。

train_model(model, did, dataset_name_, epochs=2000, batch_size=128,normalize_timeseries=normalize_dataset)

评估内循环

要评估模型性能，只需取消注释下方代码行并执行脚本即可。

evaluate_model(model, did, dataset_name_, batch_size=128,normalize_timeseries=normalize_dataset)

评估

没有单独的评估脚本。若需重新评估已训练好的模型，请在最内层循环中注释掉 train_model 函数。

可视化

由于文件夹和权重路径的命名是自动生成的，因此在进行以下所有可视化操作时，需要仔细选择3个共同参数：

DATASET_ID：constants.py 中用于标识数据集的唯一整数ID。
num_cells：使用的LSTM或注意力LSTM单元数量。
model：用于构建相应Keras模型的模型函数。

接下来还需要选择 dataset_name 和 model_name。dataset_name 必须与 all_dataset_traning.py 脚本中列出的数据集名称一致。同样，model_name 必须与 all_dataset_training.py 中 MODELS 列表里的模型名称匹配。

滤波器可视化

要可视化LSTMFCN或注意力LSTMFCN的卷积滤波器输出，请使用 visualize_filters.py 脚本。

该脚本有两个参数：CONV_ID 表示卷积块编号（取值范围为 [0, 2]），而 FILTER_ID 则决定了选择哪一组卷积层滤波器。其取值范围取决于所选的 CONV_ID：当 CONV_ID = {0, 2} 时，取值范围为 [0, 127]；当 CONV_ID = 1 时，取值范围为 [0, 255]。

上下文可视化

要可视化 Attention LSTM 模块的上下文向量，请使用 visualize_context.py 脚本。

要在数据集的所有样本上生成上下文，需将 LIMIT=None 修改为相应值。同时建议将 VISUALIZE_CLASSWISE=False 设置为真，以加快计算速度。请注意，对于较大的数据集，生成图像可能需要极长的时间，且输出效果可能并不理想。我们建议改为按类别分别可视化，每类取一个样本，如上所示。

类激活图

要可视化最后一层卷积层的类激活图，请执行 visualize_cam.py 脚本。可通过更改 CLASS_ID 的值（从 0 到类数减 1）来改变所可视化输入信号的类别。

结果

基于测试验证检查点的结果

基于最小训练损失的结果

临界差异图

Wilcoxon 符号秩检验——统计检验

在应用 Dunn-Sidak 校正后，我们将 p 值表与显著性水平 α=0.00465 进行比较。结果显示，ALSTM、LSTM 以及集成方法（COTE 和 EE）在统计学上无显著差异。

引用

@article{karim2018lstm,
  title={LSTM 全卷积网络用于时间序列分类},
  author={Karim, Fazle 和 Majumdar, Somshubra 和 Darabi, Houshang 和 Chen, Shun},
  journal={IEEE Access},
  volume={6},
  pages={1662--1669},
  year={2018},
  publisher={IEEE}
}

LSTM-FCN 快速上手指南

LSTM-FCN 是一种用于时间序列分类的高性能模型，它结合了全卷积网络（FCN）的快速分类能力与长短期记忆网络（LSTM）的精确时序特征提取能力。本指南将帮助您快速搭建环境并运行模型。

环境准备

在开始之前，请确保您的开发环境满足以下要求：

操作系统：Linux, macOS 或 Windows
Python 版本：推荐 Python 3.6 - 3.8
核心框架：本项目基于 Keras 开发，后端必须使用 TensorFlow。
- 注意：目前不支持 Theano 或 CNTK 后端。
硬件建议：虽然可在 CPU 上运行，但建议使用 NVIDIA GPU 以加速训练过程。

安装步骤

克隆仓库 首先下载项目源代码：

git clone https://github.com/titu1994/LSTM-FCN.git
cd LSTM-FCN

安装依赖 使用 pip 安装所需的 Python 库。国内用户建议使用清华源或阿里源以加速下载：

# 默认源
pip install -r requirements.txt

# 推荐：使用清华镜像源加速安装
pip install -r requirements.txt -i https://pypi.tuna.tsinghua.edu.cn/simple

准备数据集 本项目默认使用 UCR 时间序列归档数据集。
- 下载地址：http://www.cs.ucr.edu/~eamonn/time_series_data/
- 解压下载的 zip 文件，您将得到 127 个文件夹。
- 将项目中的工具脚本 extract_all_datasets.py 复制到解压后的目录中并运行，它将生成一个包含所有数据的 _data 文件夹。
- 将生成的数据文件剪切并粘贴到项目根目录下的 Data 文件夹中。

基本使用

本项目提供了统一的脚本来处理模型的训练与评估。以下是如何调用不同变体模型的最简示例。

1. 选择模型

在代码中，您可以通过调用相应的生成函数来实例化模型：

使用标准 LSTM-FCN 模型：
```
model = generate_lstmfcn()
```
使用带注意力机制的 ALSTM-FCN 模型：
```
model = generate_alstmfcn()
```

2. 训练模型

训练逻辑位于 all_datasets_training.py 脚本的内层循环中。您需要配置数据集列表、模型定义以及 LSTM 单元数量（默认为 [8, 64, 128]）。

取消注释以下代码行即可开始训练单个模型：

# 参数说明：
# model: 上述生成的模型对象
# did: 数据集 ID (对应 utils/constants.py)
# dataset_name_: 数据集名称
# epochs: 训练轮数
# batch_size: 批次大小
# normalize_timeseries: 是否归一化

train_model(model, did, dataset_name_, epochs=2000, batch_size=128, normalize_timeseries=normalize_dataset)

注：权重文件会自动保存在指定目录。如果目录中已存在权重文件，再次运行将会覆盖。

3. 评估模型

若要评估已训练好的模型性能，无需单独的运行脚本。只需在 all_datasets_training.py 中注释掉 train_model 函数，并取消注释 evaluate_model 函数即可：

evaluate_model(model, did, dataset_name_, batch_size=128, normalize_timeseries=normalize_dataset)

4. 可视化（可选）

项目提供了三个脚本用于分析模型内部机制：

卷积滤波器可视化：
```
python visualize_filters.py
```
需设置 CONV_ID (0-2) 和 FILTER_ID。
注意力上下文向量可视化：
```
python visualize_context.py
```
建议设置 LIMIT=None 以生成全量样本的上下文，或按类别采样以加快速度。
类激活图 (CAM) 可视化：
```
python visualize_cam.py
```
通过修改 CLASS_ID 来查看不同类别的激活区域。

版本历史

v1.02019/02/28

常见问题

为什么在 LSTM 之前要进行维度洗牌（Dimension Shuffle）？这会不会导致模型忽略时间序列的时间信息？

是否尝试过用双向 LSTM（BiLSTM）或多层 LSTM 替代当前结构？

运行代码时出现 'OSError: Unable to open file' 错误，提示找不到权重文件（如 bird_chicken_weights.h5），如何解决？

训练时出现 'ValueError: expected input_1 to have 3 dimensions, but got array with shape (5000, 2048)' 错误，原因是什么？

代码中使用测试集作为验证集来监控回调函数（如 ModelCheckpoint 和 ReduceLROnPlateau），是否存在数据泄露问题？

维度洗牌后，模型是否还能处理可变长度的时间序列输入？

面对严重过拟合问题（训练准确率很高但验证准确率很低），有什么建议？

滑动窗口（Sliding Window）是否能提升时间序列分类性能？

带维度洗牌的 LSTM 与直接将整个时间序列输入带 Tanh 激活的全连接层有何区别？

如何选择使用普通 LSTM 还是 Attention LSTM？

相似工具推荐

openclaw

OpenClaw 是一款专为个人打造的本地化 AI 助手，旨在让你在自己的设备上拥有完全可控的智能伙伴。它打破了传统 AI 助手局限于特定网页或应用的束缚，能够直接接入你日常使用的各类通讯渠道，包括微信、WhatsApp、Telegram、Discord、iMessage 等数十种平台。无论你在哪个聊天软件中发送消息，OpenClaw 都能即时响应，甚至支持在 macOS、iOS 和 Android 设备上进行语音交互，并提供实时的画布渲染功能供你操控。这款工具主要解决了用户对数据隐私、响应速度以及“始终在线”体验的需求。通过将 AI 部署在本地，用户无需依赖云端服务即可享受快速、私密的智能辅助，真正实现了“你的数据，你做主”。其独特的技术亮点在于强大的网关架构，将控制平面与核心助手分离，确保跨平台通信的流畅性与扩展性。 OpenClaw 非常适合希望构建个性化工作流的技术爱好者、开发者，以及注重隐私保护且不愿被单一生态绑定的普通用户。只要具备基础的终端操作能力（支持 macOS、Linux 及 Windows WSL2），即可通过简单的命令行引导完成部署。如果你渴望拥有一个懂你

★ 349.3k|★★★☆☆|2周前

Agent开发框架图像

n8n

n8n 是一款面向技术团队的公平代码（fair-code）工作流自动化平台，旨在让用户在享受低代码快速构建便利的同时，保留编写自定义代码的灵活性。它主要解决了传统自动化工具要么过于封闭难以扩展、要么完全依赖手写代码效率低下的痛点，帮助用户轻松连接 400 多种应用与服务，实现复杂业务流程的自动化。 n8n 特别适合开发者、工程师以及具备一定技术背景的业务人员使用。其核心亮点在于“按需编码”：既可以通过直观的可视化界面拖拽节点搭建流程，也能随时插入 JavaScript 或 Python 代码、调用 npm 包来处理复杂逻辑。此外，n8n 原生集成了基于 LangChain 的 AI 能力，支持用户利用自有数据和模型构建智能体工作流。在部署方面，n8n 提供极高的自由度，支持完全自托管以保障数据隐私和控制权，也提供云端服务选项。凭借活跃的社区生态和数百个现成模板，n8n 让构建强大且可控的自动化系统变得简单高效。

★ 184.7k|★★☆☆☆|今天

数据工具开发框架Agent

stable-diffusion-webui

stable-diffusion-webui 是一个基于 Gradio 构建的网页版操作界面，旨在让用户能够轻松地在本地运行和使用强大的 Stable Diffusion 图像生成模型。它解决了原始模型依赖命令行、操作门槛高且功能分散的痛点，将复杂的 AI 绘图流程整合进一个直观易用的图形化平台。无论是希望快速上手的普通创作者、需要精细控制画面细节的设计师，还是想要深入探索模型潜力的开发者与研究人员，都能从中获益。其核心亮点在于极高的功能丰富度：不仅支持文生图、图生图、局部重绘（Inpainting）和外绘（Outpainting）等基础模式，还独创了注意力机制调整、提示词矩阵、负向提示词以及“高清修复”等高级功能。此外，它内置了 GFPGAN 和 CodeFormer 等人脸修复工具，支持多种神经网络放大算法，并允许用户通过插件系统无限扩展能力。即使是显存有限的设备，stable-diffusion-webui 也提供了相应的优化选项，让高质量的 AI 艺术创作变得触手可及。

★ 162.1k|★★★☆☆|2周前

开发框架图像Agent

everything-claude-code

everything-claude-code 是一套专为 AI 编程助手（如 Claude Code、Codex、Cursor 等）打造的高性能优化系统。它不仅仅是一组配置文件，而是一个经过长期实战打磨的完整框架，旨在解决 AI 代理在实际开发中面临的效率低下、记忆丢失、安全隐患及缺乏持续学习能力等核心痛点。通过引入技能模块化、直觉增强、记忆持久化机制以及内置的安全扫描功能，everything-claude-code 能显著提升 AI 在复杂任务中的表现，帮助开发者构建更稳定、更智能的生产级 AI 代理。其独特的“研究优先”开发理念和针对 Token 消耗的优化策略，使得模型响应更快、成本更低，同时有效防御潜在的攻击向量。这套工具特别适合软件开发者、AI 研究人员以及希望深度定制 AI 工作流的技术团队使用。无论您是在构建大型代码库，还是需要 AI 协助进行安全审计与自动化测试，everything-claude-code 都能提供强大的底层支持。作为一个曾荣获 Anthropic 黑客大奖的开源项目，它融合了多语言支持与丰富的实战钩子（hooks），让 AI 真正成长为懂上

★ 161.1k|★★☆☆☆|今天

开发框架Agent语言模型

ComfyUI

ComfyUI 是一款功能强大且高度模块化的视觉 AI 引擎，专为设计和执行复杂的 Stable Diffusion 图像生成流程而打造。它摒弃了传统的代码编写模式，采用直观的节点式流程图界面，让用户通过连接不同的功能模块即可构建个性化的生成管线。这一设计巧妙解决了高级 AI 绘图工作流配置复杂、灵活性不足的痛点。用户无需具备编程背景，也能自由组合模型、调整参数并实时预览效果，轻松实现从基础文生图到多步骤高清修复等各类复杂任务。ComfyUI 拥有极佳的兼容性，不仅支持 Windows、macOS 和 Linux 全平台，还广泛适配 NVIDIA、AMD、Intel 及苹果 Silicon 等多种硬件架构，并率先支持 SDXL、Flux、SD3 等前沿模型。无论是希望深入探索算法潜力的研究人员和开发者，还是追求极致创作自由度的设计师与资深 AI 绘画爱好者，ComfyUI 都能提供强大的支持。其独特的模块化架构允许社区不断扩展新功能，使其成为当前最灵活、生态最丰富的开源扩散模型工具之一，帮助用户将创意高效转化为现实。

★ 109.2k|★★☆☆☆|2天前

开发框架图像Agent

gemini-cli

gemini-cli 是一款由谷歌推出的开源 AI 命令行工具，它将强大的 Gemini 大模型能力直接集成到用户的终端环境中。对于习惯在命令行工作的开发者而言，它提供了一条从输入提示词到获取模型响应的最短路径，无需切换窗口即可享受智能辅助。这款工具主要解决了开发过程中频繁上下文切换的痛点，让用户能在熟悉的终端界面内直接完成代码理解、生成、调试以及自动化运维任务。无论是查询大型代码库、根据草图生成应用，还是执行复杂的 Git 操作，gemini-cli 都能通过自然语言指令高效处理。它特别适合广大软件工程师、DevOps 人员及技术研究人员使用。其核心亮点包括支持高达 100 万 token 的超长上下文窗口，具备出色的逻辑推理能力；内置 Google 搜索、文件操作及 Shell 命令执行等实用工具；更独特的是，它支持 MCP（模型上下文协议），允许用户灵活扩展自定义集成，连接如图像生成等外部能力。此外，个人谷歌账号即可享受免费的额度支持，且项目基于 Apache 2.0 协议完全开源，是提升终端工作效率的理想助手。

★ 100.8k|★★☆☆☆|1周前

插件Agent图像