Neural-Net-with-Financial-Time-Series-Data

GitHub
762 308 中等 1 次阅读 6天前开发框架其他
AI 解读 由 AI 自动生成,仅供参考

Neural-Net-with-Financial-Time-Series-Data 是一个基于 TensorFlow 和 Keras 构建的开源深度学习项目,旨在利用金融时间序列数据预测资产的每日对数收益率。它主要解决了传统模型在处理复杂金融市场波动时精度不足的问题,通过引入随机动量指标(如 MACD、随机振荡器)等内生因子,显著提升了预测的准确性。

该项目非常适合具备一定编程基础的开发者、量化金融研究人员以及对 AI 炒股感兴趣的技术爱好者使用。用户可以直接复用其灵活的架构,无需重写代码即可在支持 Nvidia CuDNN 的环境中进行高效训练与部署。

在技术亮点方面,Neural-Net-with-Financial-Time-Series-Data 采用了先进的长短期记忆网络(LSTM),并结合了多项前沿优化策略:包括利用 CuDNN 加速计算、应用带热重启的随机梯度下降(SGDR)与余弦退火算法以优化收敛过程,以及通过贝叶斯搜索自动微调超参数。此外,项目还集成了事件驱动分析、新闻情感测试及多种可视化功能(如 TensorBoard 和相关性热力图),为探索金融数据的深层规律提供了强大且易用的工具包。

使用场景

某量化交易团队的初级分析师试图构建一个基于深度学习的股票日收益率预测模型,以辅助制定短期交易策略。

没有 Neural-Net-with-Financial-Time-Series-Data 时

  • 特征工程繁琐且单一:分析师需手动编写代码抓取并计算移动平均线、随机振荡器等技术指标,往往因遗漏关键内生因子导致模型输入信息不足。
  • 训练效率低下:使用普通 LSTM 单元在未优化的 TensorFlow 环境下训练,无法利用 Nvidia CuDNN 加速,处理多年历史数据耗时极长,难以快速迭代。
  • 调参依赖经验猜测:缺乏系统的超参数优化机制,只能依靠人工试错调整学习率和 Dropout 比例,极易陷入局部最优解,预测均方误差居高不下。
  • 架构扩展性差:若要切换到底层加速库或引入新的数据源(如新闻情绪),往往需要重构大量底层代码,开发维护成本高昂。

使用 Neural-Net-with-Financial-Time-Series-Data 后

  • 多维特征自动集成:直接调用内置模块,自动整合 MACD、随机振荡器及平均真实波幅(ATR)等多种技术指标,显著丰富了模型对市场波动的感知能力。
  • 训练速度大幅提升:依托集成的 CuDNN LSTM 和批量归一化技术,在相同硬件下训练速度显著加快,支持快速验证不同时间跨度的策略有效性。
  • 智能超参数寻优:利用贝叶斯搜索算法自动微调网络结构,结合带热重启的随机梯度下降(SGDR)和余弦退火策略,使日对数收益率的预测精度显著提高。
  • 灵活部署无需重写:基于面向对象架构和 Keras/TensorFlow 封装,分析师可轻松替换数据源或添加新变量,无需修改核心计算逻辑即可实现模型更新。

Neural-Net-with-Financial-Time-Series-Data 通过集成先进的深度学习技巧与自动化调参流程,将复杂的金融时序预测从“手工作坊”升级为高效、精准的工业化生产模式。

运行环境要求

操作系统
  • Windows
GPU

建议使用 NVIDIA GPU 以启用 CuDNN 加速(非绝对必需但推荐),具体型号、显存大小及 CUDA 版本未说明

内存

未说明

依赖
notes该项目利用 CuDNN LSTM 进行加速训练,需配置支持 CuDNN 的 TensorFlow 环境。数据源主要依赖 Quandl(需提供 API Key)或本地 HDF 文件。项目包含技术指标(如 MACD、随机振荡器)计算及贝叶斯超参数搜索功能。注意:README 最后更新时间为 2018 年,部分依赖库版本可能较旧,需在现代环境中进行兼容性调整。
python3.5+
TensorFlow
Keras
Scikit-learn
Quandl
HDF5
Neural-Net-with-Financial-Time-Series-Data hero image

快速开始



Neural-Net-with-Financial-Time-Series-Data 是一个开源软件项目,利用内生因素预测金融资产的每日对数收益率。该项目集成了多种技术指标(如随机指标、移动平均收敛/发散振荡器),并通过带有热重启的随机梯度下降法(SGDR)和余弦退火策略来训练 LSTM 神经网络。这种灵活的架构允许您在不需自行重写代码的情况下,使用 Nvidia CuDNN 进行高效计算部署。超参数则通过贝叶斯搜索进行精细调优。

最新结果:

当前 LSTM 模型用于预测每日对数收益率的结果。 Alt text

旧模型结果

该旧模型使用 LSTM 预测股票价格。

Alt text

LSTM 单元

这是我们模型中使用的 LSTM 单元。

Alt text

由于模型中实现了 CuDNN LSTM 和批量归一化,它比普通 LSTM 单元更快

更新:

2017年3月26日 第一次更新

  1. 代码中新增了基于 LSTM 的循环神经网络。
  2. 同时实现了 Keras 与 TensorFlow 的集成。
  3. 代码中还加入了 TensorBoard,用于神经网络的可视化。

2017年4月14日 第二次更新

  1. 调整后的收盘价已进行归一化处理。
  2. 为简化操作,实现了一个新的数据下载工具。
  3. 增加了更多用于预测调整后收盘价的变量。
  4. 结果更加准确,均方误差显著降低。
  5. 新增了收盘价的可视化展示。
  6. 反归一化问题即将修复。
  7. Twitter 情感分析目前正处于测试阶段。

2017年4月16日 第三次更新

  1. 更新了反归一化方法。
  2. 提供了更多测试结果。

2017年4月18日 第四次更新

  1. 更新了来自 Kaggle 的纽约证券交易所基本面数据。

2017年4月19日 第五次更新

  1. 支持 Windows 10 上的 Python 3.5。
  2. 准确性有了显著提升。

2017年4月29日 第六次更新

  1. 添加了自 1970 年以来的 ^GSPC 数据,训练数据量增加,模型准确性更高。
  2. 提供了 7 年的测试数据。
  3. 采用面向对象编程。
  4. 对 Dropout 的超参数进行了测试。

2017年5月8日 第七次更新

  1. 所有超参数均已测试完毕,并上传了相关结果。
  2. 修复了数据加载器的注释。
  3. 接下来将加入更多技术分析指标,如成交量、移动平均线及其他指数。

2017年5月28日 第八次更新

  1. 使用 Quandl 替代 Pandas datareader。
  2. 新增了相关性热力图。
  3. 网络输入采用调整后的 OHLCV 数据。
  4. 所有功能均可从 lstmstock.py 中加载。
  5. 为没有 Quandl 账户的用户临时提供了 Quandl API 密钥。
  6. 新增了移动平均线。

2017年10月2日 第九次更新

Alt text

  1. 事件驱动分析。
  2. 切换至 TensorFlow LSTM 模型。

2018年6月25日 第十次更新

  1. 完全重写了新闻下载工具,移除了 Newsapi,以便免费获取完整的 NYTimes 数据。
  2. 新增了移动平均收敛/发散振荡器(MACD)、随机振荡器以及平均真实波幅等指标用于模型训练。
  3. 目标变量现改为对数收益率。
  4. 使用 Keras 架构于 TensorFlow 之上。
  5. 采用 SKLearn 的随机搜索进行优化。

2018年10月11日 第十一次更新 应用了多项前沿技术:

  1. 使用 CuDNN LSTM 加速训练。
  2. 采用带有热重启的随机梯度下降法。
  3. 应用余弦退火策略。
  4. 使用贝叶斯搜索优化超参数。
  5. 引入新的数据划分方法。
  6. 提供了数据集。
  7. 使用 HDF 文件以加快读取速度。

如何使用 Quandl

如果您希望使用更多数据来训练您的神经网络,可以直接从 Quandl 加载数据。 登录后,您应该能够获取特定股票的历史价格数据。 请使用“Export > Python > api key”选项,并将 API 密钥插入到您的模型中。 https://www.quandl.com/databases/WIKIP Alt text

参考文献:

Bernal, A., Fok, S., & Pidaparthi, R. (2012). 利用循环神经网络预测金融市场时间序列。

Box, G. E., Jenkins, G. M., Reinsel, G. C., & Ljung, G. M. (2015). 时间序列分析:预测与控制。约翰·威利出版社。

Gu, J., Wang, Z., Kuen, J., Ma, L., Shahroudy, A., Shuai, B., ... & Cai, J. (2015). 卷积神经网络的最新进展。arXiv 预印本 arXiv:1512.07108。

Hutto, C.J. & Gilbert, E.E. (2014). VADER:一种基于规则的简约情感分析模型,适用于社交媒体文本。第八届国际博客与社交媒体会议(ICWSM-14)。密歇根州安娜堡,2014年6月。

Jaeger, H. (2001). “回声状态”方法:用于分析和训练循环神经网络——附勘误说明。德国波恩:德国国家信息技术研究中心 GMD 技术报告,第 148(34) 号,第 13 页。

Jaeger, H. (2002). 循环神经网络训练教程,涵盖 BPPT、RTRL、EKF 以及“回声状态网络”方法(第 5 卷)。GMD 信息技术研究中心。

Maass, W., Natschläger, T., & Markram, H. (2002). 无需稳定状态的实时计算:一种基于扰动的新神经计算框架。神经计算,第 14 卷,第 11 期,第 2531–2560 页。

常见问题

相似工具推荐

stable-diffusion-webui

stable-diffusion-webui 是一个基于 Gradio 构建的网页版操作界面,旨在让用户能够轻松地在本地运行和使用强大的 Stable Diffusion 图像生成模型。它解决了原始模型依赖命令行、操作门槛高且功能分散的痛点,将复杂的 AI 绘图流程整合进一个直观易用的图形化平台。 无论是希望快速上手的普通创作者、需要精细控制画面细节的设计师,还是想要深入探索模型潜力的开发者与研究人员,都能从中获益。其核心亮点在于极高的功能丰富度:不仅支持文生图、图生图、局部重绘(Inpainting)和外绘(Outpainting)等基础模式,还独创了注意力机制调整、提示词矩阵、负向提示词以及“高清修复”等高级功能。此外,它内置了 GFPGAN 和 CodeFormer 等人脸修复工具,支持多种神经网络放大算法,并允许用户通过插件系统无限扩展能力。即使是显存有限的设备,stable-diffusion-webui 也提供了相应的优化选项,让高质量的 AI 艺术创作变得触手可及。

162.1k|★★★☆☆|今天
开发框架图像Agent

everything-claude-code

everything-claude-code 是一套专为 AI 编程助手(如 Claude Code、Codex、Cursor 等)打造的高性能优化系统。它不仅仅是一组配置文件,而是一个经过长期实战打磨的完整框架,旨在解决 AI 代理在实际开发中面临的效率低下、记忆丢失、安全隐患及缺乏持续学习能力等核心痛点。 通过引入技能模块化、直觉增强、记忆持久化机制以及内置的安全扫描功能,everything-claude-code 能显著提升 AI 在复杂任务中的表现,帮助开发者构建更稳定、更智能的生产级 AI 代理。其独特的“研究优先”开发理念和针对 Token 消耗的优化策略,使得模型响应更快、成本更低,同时有效防御潜在的攻击向量。 这套工具特别适合软件开发者、AI 研究人员以及希望深度定制 AI 工作流的技术团队使用。无论您是在构建大型代码库,还是需要 AI 协助进行安全审计与自动化测试,everything-claude-code 都能提供强大的底层支持。作为一个曾荣获 Anthropic 黑客大奖的开源项目,它融合了多语言支持与丰富的实战钩子(hooks),让 AI 真正成长为懂上

139k|★★☆☆☆|今天
开发框架Agent语言模型

ComfyUI

ComfyUI 是一款功能强大且高度模块化的视觉 AI 引擎,专为设计和执行复杂的 Stable Diffusion 图像生成流程而打造。它摒弃了传统的代码编写模式,采用直观的节点式流程图界面,让用户通过连接不同的功能模块即可构建个性化的生成管线。 这一设计巧妙解决了高级 AI 绘图工作流配置复杂、灵活性不足的痛点。用户无需具备编程背景,也能自由组合模型、调整参数并实时预览效果,轻松实现从基础文生图到多步骤高清修复等各类复杂任务。ComfyUI 拥有极佳的兼容性,不仅支持 Windows、macOS 和 Linux 全平台,还广泛适配 NVIDIA、AMD、Intel 及苹果 Silicon 等多种硬件架构,并率先支持 SDXL、Flux、SD3 等前沿模型。 无论是希望深入探索算法潜力的研究人员和开发者,还是追求极致创作自由度的设计师与资深 AI 绘画爱好者,ComfyUI 都能提供强大的支持。其独特的模块化架构允许社区不断扩展新功能,使其成为当前最灵活、生态最丰富的开源扩散模型工具之一,帮助用户将创意高效转化为现实。

107.7k|★★☆☆☆|2天前
开发框架图像Agent

NextChat

NextChat 是一款轻量且极速的 AI 助手,旨在为用户提供流畅、跨平台的大模型交互体验。它完美解决了用户在多设备间切换时难以保持对话连续性,以及面对众多 AI 模型不知如何统一管理的痛点。无论是日常办公、学习辅助还是创意激发,NextChat 都能让用户随时随地通过网页、iOS、Android、Windows、MacOS 或 Linux 端无缝接入智能服务。 这款工具非常适合普通用户、学生、职场人士以及需要私有化部署的企业团队使用。对于开发者而言,它也提供了便捷的自托管方案,支持一键部署到 Vercel 或 Zeabur 等平台。 NextChat 的核心亮点在于其广泛的模型兼容性,原生支持 Claude、DeepSeek、GPT-4 及 Gemini Pro 等主流大模型,让用户在一个界面即可自由切换不同 AI 能力。此外,它还率先支持 MCP(Model Context Protocol)协议,增强了上下文处理能力。针对企业用户,NextChat 提供专业版解决方案,具备品牌定制、细粒度权限控制、内部知识库整合及安全审计等功能,满足公司对数据隐私和个性化管理的高标准要求。

87.6k|★★☆☆☆|今天
开发框架语言模型

ML-For-Beginners

ML-For-Beginners 是由微软推出的一套系统化机器学习入门课程,旨在帮助零基础用户轻松掌握经典机器学习知识。这套课程将学习路径规划为 12 周,包含 26 节精炼课程和 52 道配套测验,内容涵盖从基础概念到实际应用的完整流程,有效解决了初学者面对庞大知识体系时无从下手、缺乏结构化指导的痛点。 无论是希望转型的开发者、需要补充算法背景的研究人员,还是对人工智能充满好奇的普通爱好者,都能从中受益。课程不仅提供了清晰的理论讲解,还强调动手实践,让用户在循序渐进中建立扎实的技能基础。其独特的亮点在于强大的多语言支持,通过自动化机制提供了包括简体中文在内的 50 多种语言版本,极大地降低了全球不同背景用户的学习门槛。此外,项目采用开源协作模式,社区活跃且内容持续更新,确保学习者能获取前沿且准确的技术资讯。如果你正寻找一条清晰、友好且专业的机器学习入门之路,ML-For-Beginners 将是理想的起点。

85k|★★☆☆☆|今天
图像数据工具视频

ragflow

RAGFlow 是一款领先的开源检索增强生成(RAG)引擎,旨在为大语言模型构建更精准、可靠的上下文层。它巧妙地将前沿的 RAG 技术与智能体(Agent)能力相结合,不仅支持从各类文档中高效提取知识,还能让模型基于这些知识进行逻辑推理和任务执行。 在大模型应用中,幻觉问题和知识滞后是常见痛点。RAGFlow 通过深度解析复杂文档结构(如表格、图表及混合排版),显著提升了信息检索的准确度,从而有效减少模型“胡编乱造”的现象,确保回答既有据可依又具备时效性。其内置的智能体机制更进一步,使系统不仅能回答问题,还能自主规划步骤解决复杂问题。 这款工具特别适合开发者、企业技术团队以及 AI 研究人员使用。无论是希望快速搭建私有知识库问答系统,还是致力于探索大模型在垂直领域落地的创新者,都能从中受益。RAGFlow 提供了可视化的工作流编排界面和灵活的 API 接口,既降低了非算法背景用户的上手门槛,也满足了专业开发者对系统深度定制的需求。作为基于 Apache 2.0 协议开源的项目,它正成为连接通用大模型与行业专有知识之间的重要桥梁。

77.1k|★★★☆☆|昨天
Agent图像开发框架