RLTrader

1.9k 548 中等 1 次阅读昨天GPL-3.0开发框架Agent

AI 解读由 AI 自动生成，仅供参考

RLTrader 是一个基于深度强化学习构建的加密货币交易环境，旨在利用人工智能技术探索自动化交易策略。它基于 OpenAI Gym 框架开发，允许用户模拟真实的加密货币市场数据，训练智能体在复杂多变的市场环境中做出买卖决策，从而解决传统量化交易中策略难以自适应市场变化的问题。

作为知名项目 TensorTrade 的前身，RLTrader 特别适合对人工智能、强化学习及量化金融感兴趣的开发者与研究人员使用。通过该项目，用户可以深入理解如何将深度学习模型应用于实际金融场景，并进行策略回测与优化。其技术亮点在于提供了一套完整的交易模拟环境，支持特征工程、统计建模以及贝叶斯优化等高级功能，并兼容 NVIDIA GPU 加速以提升训练效率。此外，项目还提供了详细的文档、Docker 部署方案及可视化交易演示，帮助用户快速上手。虽然目前核心开发已转向功能更强大的 TensorTrade，但 RLTrader 依然是学习如何构建“不亏钱”的比特币交易机器人的优秀入门教材。

使用场景

一位量化交易开发者正试图构建一个能自动适应比特币市场波动的加密货币交易机器人，以替代低效的人工盯盘策略。

没有 RLTrader 时

策略开发依赖硬编码的规则（如固定均线交叉），无法动态应对市场风格的快速切换，导致在震荡市中频繁止损。
缺乏统一的强化学习环境，开发者需手动编写复杂的状态空间、动作空间和奖励函数代码，与深度学习框架对接耗时且易错。
回测与实盘脱节，难以验证策略在不同历史数据下的鲁棒性，往往实盘运行后才发现过拟合问题。
调优过程盲目，缺少贝叶斯优化等自动化工具支持，只能靠人工反复试错调整超参数，效率极低。

使用 RLTrader 后

基于深度强化学习（DRL）的代理能通过与 OpenAI Gym 环境交互，自主学习买卖时机，显著提升在非平稳市场中的适应能力。
直接复用内置的标准化交易环境和预置特征工程，几分钟内即可搭建起从数据加载到模型训练的完整流水线。
提供可视化的实时交易演示和严谨的回测框架，让开发者能在部署前直观评估策略表现，大幅降低实盘风险。
集成自动化优化命令（optimize），结合贝叶斯搜索快速锁定最优超参数组合，将策略迭代周期从数周缩短至数小时。

RLTrader 通过提供标准化的深度强化学习交易框架，让开发者能从繁琐的基础设施搭建中解脱，专注于策略逻辑的创新与验证。

运行环境要求

操作系统

Linux
macOS
Windows

GPU

非必需
支持 NVIDIA GPU（需安装 CUDA 相关驱动），也可使用 CPU 或其他类型 GPU
未指定具体型号、显存大小或 CUDA 版本

内存

未说明

依赖

notes该项目是 TensorTrade 的前身，开发已放缓。若在 Windows 上运行且无 CUDA，可使用 conda 安装 tensorflow-gpu。缺少 MPI 模块时需手动安装（Windows 用 Microsoft MPI，Linux/Mac 用 MPICH）。优化训练过程耗时较长（数小时至数天），结果存储在 SQLite 数据库中。支持 Docker 和 Vagrant 环境测试，但 Vagrant 无法充分利用 GPU。

python3.6

tensorflow-gpu

stable-baselines

mpi4py

快速开始

RLTrader — TensorTrade 的前身

目前此库的开发已放缓，我们正致力于 TensorTrade——一个基于强化学习的交易框架：https://github.com/notadamking/tensortrade。

若想深入了解我们如何构建该智能体，请阅读这篇 Medium 文章：https://towardsdatascience.com/creating-bitcoin-trading-bots-that-dont-lose-money-2e7165fb0b29

随后，我们通过特征工程、统计建模和贝叶斯优化对该项目进行了优化，详情请参阅： https://towardsdatascience.com/using-reinforcement-learning-to-trade-bitcoin-for-massive-profit-b69d0e8f583b

Discord 社区：https://discord.gg/ZZ7BGWh

数据集：https://www.cryptodatadownload.com/data/northamerican/

实时交易可视化

快速入门

如何检查是否拥有 NVIDIA 显卡？

Linux：

sudo lspci | grep -i --color 'vga\|3d\|2d' | grep -i nvidia

如果返回任何结果，则说明您拥有 NVIDIA 显卡。

基本使用方法

开始使用前，您需要先安装依赖项。如果您系统中配备了 NVIDIA 显卡，建议首先执行以下命令：

cd "您的克隆的 RLTrader 目录路径"
pip install -r requirements.txt

有关在使用 Docker 时如何充分利用 GPU 的更多信息：https://github.com/NVIDIA/nvidia-docker

如果您使用的是其他类型的显卡，或仅希望使用 CPU，请运行：

pip install -r requirements.no-gpu.txt

更新默认使用的静态文件：

python ./cli.py update-static-data

之后，您可以查看当前可用的选项：

python ./cli.py --help

或者直接以默认参数运行项目：

python ./cli.py optimize

如果您有一组标准配置文件，想要针对这些配置运行交易策略，可以指定配置文件来加载设置。将 config/config.ini.dist 重命名为 config/config.ini，然后运行：

python ./cli.py --from-config config/config.ini optimize

python ./cli.py optimize

使用 Vagrant 测试

使用以下命令启动 Vagrant 虚拟机：

vagrant up

代码位于 /vagrant 目录下。您可以随意玩耍或测试所需的软件包。

注意：使用 Vagrant 无法充分发挥 GPU 性能，因此主要用于测试目的。

使用 Docker 测试

如果您希望在 Docker 容器中运行所有内容，只需执行：

./run-with-docker (cpu|gpu) (yes|no) optimize

cpu：使用 CPU 资源启动容器
gpu：使用 GPU 资源启动容器
yes/no：是否启动本地 PostgreSQL 容器注意：如果第二个参数为 yes，请使用以下命令：

python ./ cli.py --params-db-path "postgres://rl_trader:rl_trader@localhost" optimize

数据库及其数据会持久化存储在本地的 data/postgres 目录下。

若要搭建 Docker 测试环境：

./run-with-docker (cpu|gpu) (yes|no)

若要运行现有测试：

./run-tests-with-docker

启动本地 Docker 开发环境

./dev-with-docker

Windows 10 安装，无需 CUDA

conda create --name rltrader python=3.6.8 pip git conda activate rltrader conda install tensorflow-gpu git clone https://github.com/notadamking/RLTrader pip install -r RLTrader/requirements.txt

优化、训练与测试

虽然您可以直接让智能体使用默认的 PPO2 超参数进行训练和运行，但其收益可能并不理想。stable-baselines 库提供了一套适用于大多数问题领域的优秀默认参数，但我们仍需进一步优化。

为此，您需要运行 optimize.py。

python ./optimize.py

这可能需要一段时间（根据您的硬件配置，耗时数小时到数天不等），但随着试验的完成，程序会不断在控制台输出信息。每次试验完成后，结果都会被保存到 ./data/params.db 这个 SQLite 数据库中，我们可以从中提取超参数来训练我们的智能体。

随后，我们将使用最佳超参数集对智能体进行训练，并在全新的数据上进行测试，以验证算法的泛化能力。

如有任何疑问，欢迎在 Discord 上提问！

Google Colab

在第一个单元格中输入并运行以下代码片段，即可将 RLTrader 加载到 Google Colab 环境中。别忘了将硬件加速设置为 GPU，以加快训练速度！

!git init && git remote add origin https://github.com/notadamking/RLTrader.git && git pull origin master
!pip install -r requirements.txt

常见问题排查

指定的模块未找到。

通常这是由于缺少 MPI 模块所致。您应根据自己的平台安装它。

Windows：https://docs.microsoft.com/en-us/message-passing-interface/microsoft-mpi
Linux/MacOS：https://www.mpich.org/downloads/

贡献

我们鼓励大家贡献代码，并将尽最大努力尽快将其合并到库中。本项目旨在随着社区的发展而不断壮大。如果您有任何想法或觉得缺少某些功能，请随时告知我们。

正在提交您的第一个 Pull Request？ 您可以从这个免费系列中学习：如何为 GitHub 上的开源项目做出贡献

支持

想支持本项目并帮助其发展吗？

请移步至其继任框架：https://github.com/notadamking/tensortrade

支持者：

Ap9944
KILLth
Nex

RLTrader 快速上手指南

RLTrader 是一个基于强化学习（Reinforcement Learning）的加密货币交易机器人框架，也是 TensorTrade 的前身。本指南将帮助你快速在本地环境中部署并运行该工具。

环境准备

在开始之前，请确保你的系统满足以下要求：

操作系统：Linux, macOS 或 Windows 10
Python 版本：推荐 Python 3.6 (官方示例基于 3.6.8)
硬件加速（可选但推荐）：
- NVIDIA GPU：用于加速训练过程。
- 检测命令 (Linux): sudo lspci | grep -i --color 'vga\|3d\|2d' | grep -i nvidia
- 若无返回结果，可使用 CPU 模式运行。
依赖模块：
- 若使用 Linux/macOS 且遇到 module could not be found 错误，需安装 MPI 模块：
  - Linux/MacOS: 访问 https://www.mpich.org/downloads/ 安装
- Windows 用户需安装 Microsoft MPI: https://docs.microsoft.com/en-us/message-passing-interface/microsoft-mpi

安装步骤

你可以根据自身硬件情况选择以下任一方式进行安装。

方式一：标准安装 (推荐)

克隆项目代码：

git clone https://github.com/notadamking/RLTrader
cd RLTrader

根据硬件安装依赖：
- 拥有 NVIDIA GPU:
```
pip install -r requirements.txt
```
- 仅使用 CPU 或其他显卡:
```
pip install -r requirements.no-gpu.txt
```
(注：国内用户若下载缓慢，可添加 -i https://pypi.tuna.tsinghua.edu.cn/simple 参数使用清华源)
更新默认静态数据文件：
```
python ./cli.py update-static-data
```

方式二：Windows 10 Conda 安装

如果你使用的是 Windows 10 且希望使用 Conda 管理环境：

conda create --name rltrader python=3.6.8 pip git
conda activate rltrader
conda install tensorflow-gpu
git clone https://github.com/notadamking/RLTrader
cd RLTrader
pip install -r requirements.txt

方式三：Docker 安装

如果你希望隔离环境运行，可以使用 Docker：

# 语法：./run-with-docker (cpu|gpu) (yes|no) optimize
# 示例：使用 GPU 运行，不启动本地 postgres 容器
./run-with-docker gpu no optimize

基本使用

安装完成后，你可以立即开始优化策略或运行默认配置。

1. 查看可用选项

查看命令行帮助信息：

python ./cli.py --help

2. 运行默认优化

使用默认参数启动优化流程（这将自动进行超参数搜索）：

python ./cli.py optimize

注意：此过程可能耗时较长（数小时至数天），取决于硬件性能。完成的试验结果将保存在 ./data/params.db SQLite 数据库中。

3. 使用自定义配置文件

如果你需要指定特定的配置：

复制配置模板：

cp config/config.ini.dist config/config.ini

编辑 config/config.ini 填入你的参数。

运行：

python ./cli.py --from-config config/config.ini optimize

4. Google Colab 快速体验

如果你想在云端免费使用 GPU 进行尝试，可在 Colab 的第一个单元格中运行以下代码（记得在菜单中将运行时类型更改为 GPU）：

!git init && git remote add origin https://github.com/notadamking/RLTrader.git && git pull origin master
!pip install -r requirements.txt

完成上述步骤后，代理将利用找到的最佳超参数进行训练，并在新数据上进行测试以验证算法的泛化能力。

版本历史

v0.3.32019/07/17

v0.3.22019/07/11

v0.3.12019/07/10

v0.3.02019/07/10

v0.2.12019/07/08

v0.2.02019/07/08

v0.1.22019/07/06

v0.1.12019/07/06

v.0.1.02019/07/06

v0.0.12019/06/24

常见问题

为什么按日期排序后时间顺序混乱（出现 AM/PM 格式错误），导致交易策略产生前视偏差？

运行 optimize.py 时遇到 'ImportError: libcublas.so.10.0: cannot open shared object file' 错误怎么办？

优化过程中出现 'LinAlgError: Non-positive-definite forecast error covariance matrix' 错误导致试验失败如何解决？

运行优化脚本时内存消耗过高（超过 60GB 甚至 100GB）导致系统崩溃怎么办？

首次运行训练脚本时出现 'ValueError: Record does not exist' 错误是什么原因？

能否提供文章中提到的实现了 850% 收益的预训练 Sortino 和 Profit 模型？

相似工具推荐

openclaw

OpenClaw 是一款专为个人打造的本地化 AI 助手，旨在让你在自己的设备上拥有完全可控的智能伙伴。它打破了传统 AI 助手局限于特定网页或应用的束缚，能够直接接入你日常使用的各类通讯渠道，包括微信、WhatsApp、Telegram、Discord、iMessage 等数十种平台。无论你在哪个聊天软件中发送消息，OpenClaw 都能即时响应，甚至支持在 macOS、iOS 和 Android 设备上进行语音交互，并提供实时的画布渲染功能供你操控。这款工具主要解决了用户对数据隐私、响应速度以及“始终在线”体验的需求。通过将 AI 部署在本地，用户无需依赖云端服务即可享受快速、私密的智能辅助，真正实现了“你的数据，你做主”。其独特的技术亮点在于强大的网关架构，将控制平面与核心助手分离，确保跨平台通信的流畅性与扩展性。 OpenClaw 非常适合希望构建个性化工作流的技术爱好者、开发者，以及注重隐私保护且不愿被单一生态绑定的普通用户。只要具备基础的终端操作能力（支持 macOS、Linux 及 Windows WSL2），即可通过简单的命令行引导完成部署。如果你渴望拥有一个懂你

★ 349.3k|★★★☆☆|今天

Agent开发框架图像

stable-diffusion-webui

stable-diffusion-webui 是一个基于 Gradio 构建的网页版操作界面，旨在让用户能够轻松地在本地运行和使用强大的 Stable Diffusion 图像生成模型。它解决了原始模型依赖命令行、操作门槛高且功能分散的痛点，将复杂的 AI 绘图流程整合进一个直观易用的图形化平台。无论是希望快速上手的普通创作者、需要精细控制画面细节的设计师，还是想要深入探索模型潜力的开发者与研究人员，都能从中获益。其核心亮点在于极高的功能丰富度：不仅支持文生图、图生图、局部重绘（Inpainting）和外绘（Outpainting）等基础模式，还独创了注意力机制调整、提示词矩阵、负向提示词以及“高清修复”等高级功能。此外，它内置了 GFPGAN 和 CodeFormer 等人脸修复工具，支持多种神经网络放大算法，并允许用户通过插件系统无限扩展能力。即使是显存有限的设备，stable-diffusion-webui 也提供了相应的优化选项，让高质量的 AI 艺术创作变得触手可及。

★ 162.1k|★★★☆☆|昨天

开发框架图像Agent

everything-claude-code

everything-claude-code 是一套专为 AI 编程助手（如 Claude Code、Codex、Cursor 等）打造的高性能优化系统。它不仅仅是一组配置文件，而是一个经过长期实战打磨的完整框架，旨在解决 AI 代理在实际开发中面临的效率低下、记忆丢失、安全隐患及缺乏持续学习能力等核心痛点。通过引入技能模块化、直觉增强、记忆持久化机制以及内置的安全扫描功能，everything-claude-code 能显著提升 AI 在复杂任务中的表现，帮助开发者构建更稳定、更智能的生产级 AI 代理。其独特的“研究优先”开发理念和针对 Token 消耗的优化策略，使得模型响应更快、成本更低，同时有效防御潜在的攻击向量。这套工具特别适合软件开发者、AI 研究人员以及希望深度定制 AI 工作流的技术团队使用。无论您是在构建大型代码库，还是需要 AI 协助进行安全审计与自动化测试，everything-claude-code 都能提供强大的底层支持。作为一个曾荣获 Anthropic 黑客大奖的开源项目，它融合了多语言支持与丰富的实战钩子（hooks），让 AI 真正成长为懂上

★ 141.5k|★★☆☆☆|今天

开发框架Agent语言模型

ComfyUI

ComfyUI 是一款功能强大且高度模块化的视觉 AI 引擎，专为设计和执行复杂的 Stable Diffusion 图像生成流程而打造。它摒弃了传统的代码编写模式，采用直观的节点式流程图界面，让用户通过连接不同的功能模块即可构建个性化的生成管线。这一设计巧妙解决了高级 AI 绘图工作流配置复杂、灵活性不足的痛点。用户无需具备编程背景，也能自由组合模型、调整参数并实时预览效果，轻松实现从基础文生图到多步骤高清修复等各类复杂任务。ComfyUI 拥有极佳的兼容性，不仅支持 Windows、macOS 和 Linux 全平台，还广泛适配 NVIDIA、AMD、Intel 及苹果 Silicon 等多种硬件架构，并率先支持 SDXL、Flux、SD3 等前沿模型。无论是希望深入探索算法潜力的研究人员和开发者，还是追求极致创作自由度的设计师与资深 AI 绘画爱好者，ComfyUI 都能提供强大的支持。其独特的模块化架构允许社区不断扩展新功能，使其成为当前最灵活、生态最丰富的开源扩散模型工具之一，帮助用户将创意高效转化为现实。

★ 107.9k|★★☆☆☆|今天

开发框架图像Agent

markitdown

MarkItDown 是一款由微软 AutoGen 团队打造的轻量级 Python 工具，专为将各类文件高效转换为 Markdown 格式而设计。它支持 PDF、Word、Excel、PPT、图片（含 OCR）、音频（含语音转录）、HTML 乃至 YouTube 链接等多种格式的解析，能够精准提取文档中的标题、列表、表格和链接等关键结构信息。在人工智能应用日益普及的今天，大语言模型（LLM）虽擅长处理文本，却难以直接读取复杂的二进制办公文档。MarkItDown 恰好解决了这一痛点，它将非结构化或半结构化的文件转化为模型“原生理解”且 Token 效率极高的 Markdown 格式，成为连接本地文件与 AI 分析 pipeline 的理想桥梁。此外，它还提供了 MCP（模型上下文协议）服务器，可无缝集成到 Claude Desktop 等 LLM 应用中。这款工具特别适合开发者、数据科学家及 AI 研究人员使用，尤其是那些需要构建文档检索增强生成（RAG）系统、进行批量文本分析或希望让 AI 助手直接“阅读”本地文件的用户。虽然生成的内容也具备一定可读性，但其核心优势在于为机器

★ 93.4k|★★☆☆☆|今天

插件开发框架

LLMs-from-scratch

LLMs-from-scratch 是一个基于 PyTorch 的开源教育项目，旨在引导用户从零开始一步步构建一个类似 ChatGPT 的大型语言模型（LLM）。它不仅是同名技术著作的官方代码库，更提供了一套完整的实践方案，涵盖模型开发、预训练及微调的全过程。该项目主要解决了大模型领域“黑盒化”的学习痛点。许多开发者虽能调用现成模型，却难以深入理解其内部架构与训练机制。通过亲手编写每一行核心代码，用户能够透彻掌握 Transformer 架构、注意力机制等关键原理，从而真正理解大模型是如何“思考”的。此外，项目还包含了加载大型预训练权重进行微调的代码，帮助用户将理论知识延伸至实际应用。 LLMs-from-scratch 特别适合希望深入底层原理的 AI 开发者、研究人员以及计算机专业的学生。对于不满足于仅使用 API，而是渴望探究模型构建细节的技术人员而言，这是极佳的学习资源。其独特的技术亮点在于“循序渐进”的教学设计：将复杂的系统工程拆解为清晰的步骤，配合详细的图表与示例，让构建一个虽小但功能完备的大模型变得触手可及。无论你是想夯实理论基础，还是为未来研发更大规模的模型做准备

★ 90.1k|★★★☆☆|今天

语言模型图像Agent