llmtime

825 179 简单 1 次阅读今天MIT语言模型其他

AI 解读由 AI 自动生成，仅供参考

llmtime 是一个创新性的开源项目，旨在利用大型语言模型（LLM）进行时间序列预测。它解决的核心痛点是传统预测方法通常需要在特定数据集上进行繁琐的训练和调参，而 llmtime 实现了“零样本”（Zero-Shot）预测，即无需针对目标数据进行任何训练，直接即可生成预测结果。

该工具的独特技术亮点在于将数值型时间序列数据编码为文本格式，利用大模型强大的文本补全能力来推断未来趋势。研究发现，其预测性能随底层模型能力的增强而提升，但经过对齐处理（如 RLHF）的模型表现反而可能下降。目前支持 GPT-3/4、Mistral 及 LLaMA 2 等多种主流模型，且部分功能无需 GPU 即可通过 API 运行。

llmtime 非常适合人工智能研究人员、数据科学家以及希望探索大模型新应用的开发者使用。对于需要快速验证预测想法、处理缺乏历史训练数据的新场景，或研究大模型在数值推理领域潜力的团队，这是一个极具参考价值的实验性工具。通过简单的配置，用户即可复现论文中的经典实验，体验大模型在时间序列分析领域的独特潜力。

使用场景

某电商数据团队需要在周末紧急预测新上线的“季节性限定商品”未来两周销量，但该类商品缺乏历史数据，传统模型无法训练。

没有 llmtime 时

冷启动困境：由于完全没有历史销售记录，ARIMA 或 Prophet 等传统时间序列模型因缺乏训练数据而直接失效，只能依靠人工经验拍脑袋估算。
开发周期漫长：若尝试寻找相似品类数据进行迁移学习，需花费数天时间清洗数据、调整特征工程并反复验证模型效果，无法应对紧急业务需求。
资源门槛高：为了获得更精准的预测，通常需要申请昂贵的 GPU 资源来训练深度学习模型（如 DeepAR），但在非核心业务上难以获批。
泛化能力弱：即使勉强用通用趋势拟合，模型也难以理解“限量版”、“节日效应”等文本语境隐含的非线性波动规律。

使用 llmtime 后

零样本即时预测：llmtime 利用大语言模型的常识推理能力，直接将数值编码为文本进行补全，无需任何目标数据集训练即可生成高质量的销量预测曲线。
分钟级落地：数据分析师只需调用 API 并将销售数据转化为文本格式，几分钟内即可获得预测结果，大幅缩短从数据到决策的时间。
免 GPU 部署：支持直接通过 OpenAI 或 Mistral 等 API 运行，完全不需要本地 GPU 资源，降低了基础设施成本和运维复杂度。
语境感知增强：llmtime 能捕捉数据背后的语义逻辑，对突发趋势和季节性模式的 extrapolation（外推）表现优于未经过对齐微调的传统专用模型。

llmtime 通过将时间序列转化为文本生成任务，彻底解决了无历史数据场景下的预测难题，让大模型成为真正的零样本 forecasting 专家。

运行环境要求

操作系统

Linux
macOS

GPU

非必需
若运行本地模型（如 LLaMA 2, Mistral）需 NVIDIA GPU，README 建议根据环境调整 CUDA 版本（默认脚本针对 CUDA 11.8）
若仅调用 OpenAI/Mistral API 则无需 GPU

内存

未说明

依赖

notes1. 推荐使用 conda 创建名为 'llmtime' 的环境并通过 install.sh 安装依赖。2. 支持零样本预测，可直接调用 OpenAI (GPT-3/3.5/4) 或 Mistral API，此时无需本地显卡但需配置 API Key。3. 若运行本地开源模型（LLaMA 2, Mistral），需在 models/llms.py 中配置并具备相应算力。4. 复现论文实验需下载额外的预处理数据集。

python未说明 (需支持 conda 环境)

torch

transformers

gdown

快速开始

大型语言模型是零样本时间序列预测器

本仓库包含论文 大型语言模型是零样本时间序列预测器（作者：Nate Gruver、Marc Finzi、Shikai Qiu 和 Andrew Gordon Wilson，NeurIPS 2023）的代码。 Large Language Models Are Zero Shot Time Series Forecasters

我们提出了 *LLMTime* 方法，通过将数值编码为文本，并以文本补全的方式采样可能的外推结果，从而实现使用大型语言模型（LLMs）进行 *零样本*时间序列预测。LLMTime 在无需针对目标数据集进行任何训练的情况下（即零样本），就能超越许多流行的时间序列方法。此外，LLMTime 的性能会随着基础模型能力的增强而提升。然而，经过对齐优化（如 RLHF）的模型则不遵循这一缩放趋势。例如，GPT-4 的表现反而不如 GPT-3。

🛠 安装

运行以下命令即可在名为 llmtime 的 conda 环境中安装所有依赖项。如果你没有 CUDA 11.8，请根据实际情况修改 PyTorch 的 CUDA 版本。

source install.sh

安装完成后，激活环境：

conda activate llmtime

如果你不想使用 conda，也可以手动安装 install.sh 中列出的依赖项。

若希望通过 OpenAI 的 API 运行模型（无需 GPU），请将你的 OpenAI API 密钥添加到 ~/.bashrc 文件中：

echo "export OPENAI_API_KEY=<your key>" >> ~/.bashrc

此外，如果使用不同的 OpenAI API 基础地址，可在 ~/.bashrc 中进行如下设置：

echo "export OPENAI_API_BASE=<your base url>" >> ~/.bashrc

🚀 体验 LLMTime

想快速感受 LLMTime 的强大功能吗？运行 demo.ipynb 笔记本中的快速演示即可，完全不需要 GPU！

🤖 接入其他 LLM

目前我们支持 GPT-3、GPT-3.5、GPT-4、Mistral 和 LLaMA 2。只需在 models/llms.py 中指定如何从这些模型生成文本补全，即可轻松接入其他 LLM。

要运行 Mistral 模型，请将你的 Mistral API 密钥添加到 ~/.bashrc 文件中：

echo "export MISTRAL_KEY=<your key>" >> ~/.bashrc

💡 使用技巧

以下是使用 LLMTime 的一些小贴士：

模型性能对数据缩放超参数 alpha、beta 和 basic 并不敏感。推荐默认值为 alpha=0.95、beta=0.3、basic=False。对于围绕 0 对称的数据（如正弦波），建议将 basic 设置为 True，以避免数据偏移。
最近发布的 gpt-3.5-turbo-instruct 似乎需要比其他模型更低的温度（如 0.3），并且根据我们的有限实验，其表现往往不如 text-davinci-003。
根据验证似然性调整超参数（如 get_autotuned_predictions_data 所做的那样），通常能获得更好的测试似然性，但未必能得到更好的预测样本。

📊 复现论文中的实验

运行以下命令即可复现论文中的实验，结果将保存在 ./outputs/ 目录下。你可以使用 visualize.ipynb 来可视化结果。我们还在 ./precomputed_outputs/ 中提供了论文中使用的预计算结果。

Darts 数据集（第 4 节）

python -m experiments.run_darts

Monash 数据集（第 4 节）

你可以从这里下载预处理数据，或使用以下命令：

gdown 'https://drive.google.com/uc?id=1sKrpWbD3LvLQ_e5lWgX3wJqT50sTd1aZ'

然后解压数据（解压后的数据将位于 ./datasets/monash/）：

tar -xzvf monash.tar.gz

最后运行实验：

python -m experiments.run_monash

合成数据集（第 5 节）

python -m experiments.run_synthetic

缺失值场景（第 6 节）

python -m experiments.run_missing

记忆能力分析（附录 B）

python -m experiments.run_memorization

引用

请按以下格式引用我们的工作：

@inproceedings{gruver2023llmtime,
    title={{Large Language Models Are Zero Shot Time Series Forecasters}},
    author={Nate Gruver, Marc Finzi, Shikai Qiu and Andrew Gordon Wilson},
    booktitle={Advances in Neural Information Processing Systems},
    year={2023}
}

LLMTime 快速上手指南

LLMTime 是一个利用大型语言模型（LLM）进行零样本（Zero-Shot）时间序列预测的工具。它无需在目标数据集上进行训练，即可将数字编码为文本并通过采样生成预测结果，性能可媲美许多传统时间序列方法。

环境准备

操作系统：Linux / macOS (Windows 用户建议使用 WSL2)
Python 环境：推荐安装 Conda 或 Miniconda 以管理依赖。
**GPU **(可选)：若运行本地开源模型（如 LLaMA 2, Mistral），需要 NVIDIA GPU 及对应的 CUDA 驱动（默认脚本针对 CUDA 11.8）。若仅调用 OpenAI/Mistral API，则无需 GPU。
**API Key **(可选)：若使用云端模型，需准备 OpenAI 或 Mistral 的 API Key。

安装步骤

1. 克隆与安装依赖

项目提供了一键安装脚本，会自动创建名为 llmtime 的 Conda 环境并安装所需依赖。

# 克隆仓库（如果尚未克隆）
git clone <repository-url>
cd <repository-directory>

# 运行安装脚本
source install.sh

注意：如果您的系统 CUDA 版本不是 11.8，请在运行上述命令前编辑 install.sh 文件，修改其中 torch 的安装命令以匹配您的 CUDA 版本。

2. 激活环境

安装完成后，激活虚拟环境：

conda activate llmtime

3. 配置 API Key (仅限使用云端模型)

如果您计划通过 API 调用 OpenAI 或 Mistral 模型（无需本地 GPU），请将密钥添加到环境变量中。

配置 OpenAI:

echo "export OPENAI_API_KEY=<your_key>" >> ~/.bashrc
# 如果有自定义 API Base URL (如国内镜像)，也可在此配置
echo "export OPENAI_API_BASE=<your_base_url>" >> ~/.bashrc
source ~/.bashrc

配置 Mistral:

echo "export MISTRAL_KEY=<your_key>" >> ~/.bashrc
source ~/.bashrc

基本使用

快速体验 (推荐)

最简单的方式是运行项目提供的 Jupyter Notebook 演示文件，无需编写额外代码即可直观感受 LLMTime 的预测能力。此过程不需要 GPU。

# 确保已激活 conda 环境
conda activate llmtime

# 启动 Jupyter Notebook
jupyter notebook demo.ipynb

在浏览器打开的 demo.ipynb 中，按顺序执行单元格即可看到时间序列数据的零样本预测结果。

扩展其他模型

目前支持 GPT-3, GPT-3.5, GPT-4, Mistral, 和 LLaMA 2。如需接入其他 LLM，只需修改 models/llms.py 文件，定义相应的文本生成逻辑即可。

参数调优建议

数据缩放：默认参数 alpha=0.95, beta=0.3, basic=False 适用于大多数情况。
对称数据：如果数据围绕 0 对称（如正弦波），建议设置 basic=True 以避免数据偏移。
模型选择：实验表明，经过对齐处理（如 RLHF）的模型（例如 GPT-4）在某些场景下表现可能不如基础模型（如 GPT-3）。gpt-3.5-turbo-instruct 通常需要较低的 temperature (如 0.3)。

常见问题

如何在没有 LLM API 密钥（如 OpenAI 或 Mistral）的情况下运行模型？

如何使用个人表格数据对模型进行微调（Fine-tuning）？

如何复现论文 Figure-4 中的 MAE/NMAE 指标计算结果？

为什么在 Monash 数据集实验中找不到 LLaMA 模型的运行代码或配置？

代码中 `p_extra` 在 NLL/D 计算中的作用是什么？

运行 monash.py 时出现 'cannot import name load_dataset' 错误怎么办？

相似工具推荐

everything-claude-code

everything-claude-code 是一套专为 AI 编程助手（如 Claude Code、Codex、Cursor 等）打造的高性能优化系统。它不仅仅是一组配置文件，而是一个经过长期实战打磨的完整框架，旨在解决 AI 代理在实际开发中面临的效率低下、记忆丢失、安全隐患及缺乏持续学习能力等核心痛点。通过引入技能模块化、直觉增强、记忆持久化机制以及内置的安全扫描功能，everything-claude-code 能显著提升 AI 在复杂任务中的表现，帮助开发者构建更稳定、更智能的生产级 AI 代理。其独特的“研究优先”开发理念和针对 Token 消耗的优化策略，使得模型响应更快、成本更低，同时有效防御潜在的攻击向量。这套工具特别适合软件开发者、AI 研究人员以及希望深度定制 AI 工作流的技术团队使用。无论您是在构建大型代码库，还是需要 AI 协助进行安全审计与自动化测试，everything-claude-code 都能提供强大的底层支持。作为一个曾荣获 Anthropic 黑客大奖的开源项目，它融合了多语言支持与丰富的实战钩子（hooks），让 AI 真正成长为懂上

★ 150.7k|★★☆☆☆|今天

开发框架Agent语言模型

LLMs-from-scratch

LLMs-from-scratch 是一个基于 PyTorch 的开源教育项目，旨在引导用户从零开始一步步构建一个类似 ChatGPT 的大型语言模型（LLM）。它不仅是同名技术著作的官方代码库，更提供了一套完整的实践方案，涵盖模型开发、预训练及微调的全过程。该项目主要解决了大模型领域“黑盒化”的学习痛点。许多开发者虽能调用现成模型，却难以深入理解其内部架构与训练机制。通过亲手编写每一行核心代码，用户能够透彻掌握 Transformer 架构、注意力机制等关键原理，从而真正理解大模型是如何“思考”的。此外，项目还包含了加载大型预训练权重进行微调的代码，帮助用户将理论知识延伸至实际应用。 LLMs-from-scratch 特别适合希望深入底层原理的 AI 开发者、研究人员以及计算机专业的学生。对于不满足于仅使用 API，而是渴望探究模型构建细节的技术人员而言，这是极佳的学习资源。其独特的技术亮点在于“循序渐进”的教学设计：将复杂的系统工程拆解为清晰的步骤，配合详细的图表与示例，让构建一个虽小但功能完备的大模型变得触手可及。无论你是想夯实理论基础，还是为未来研发更大规模的模型做准备

★ 90.1k|★★★☆☆|5天前

语言模型图像Agent

NextChat

NextChat 是一款轻量且极速的 AI 助手，旨在为用户提供流畅、跨平台的大模型交互体验。它完美解决了用户在多设备间切换时难以保持对话连续性，以及面对众多 AI 模型不知如何统一管理的痛点。无论是日常办公、学习辅助还是创意激发，NextChat 都能让用户随时随地通过网页、iOS、Android、Windows、MacOS 或 Linux 端无缝接入智能服务。这款工具非常适合普通用户、学生、职场人士以及需要私有化部署的企业团队使用。对于开发者而言，它也提供了便捷的自托管方案，支持一键部署到 Vercel 或 Zeabur 等平台。 NextChat 的核心亮点在于其广泛的模型兼容性，原生支持 Claude、DeepSeek、GPT-4 及 Gemini Pro 等主流大模型，让用户在一个界面即可自由切换不同 AI 能力。此外，它还率先支持 MCP（Model Context Protocol）协议，增强了上下文处理能力。针对企业用户，NextChat 提供专业版解决方案，具备品牌定制、细粒度权限控制、内部知识库整合及安全审计等功能，满足公司对数据隐私和个性化管理的高标准要求。

★ 87.6k|★★☆☆☆|6天前

开发框架语言模型

ML-For-Beginners

ML-For-Beginners 是由微软推出的一套系统化机器学习入门课程，旨在帮助零基础用户轻松掌握经典机器学习知识。这套课程将学习路径规划为 12 周，包含 26 节精炼课程和 52 道配套测验，内容涵盖从基础概念到实际应用的完整流程，有效解决了初学者面对庞大知识体系时无从下手、缺乏结构化指导的痛点。无论是希望转型的开发者、需要补充算法背景的研究人员，还是对人工智能充满好奇的普通爱好者，都能从中受益。课程不仅提供了清晰的理论讲解，还强调动手实践，让用户在循序渐进中建立扎实的技能基础。其独特的亮点在于强大的多语言支持，通过自动化机制提供了包括简体中文在内的 50 多种语言版本，极大地降低了全球不同背景用户的学习门槛。此外，项目采用开源协作模式，社区活跃且内容持续更新，确保学习者能获取前沿且准确的技术资讯。如果你正寻找一条清晰、友好且专业的机器学习入门之路，ML-For-Beginners 将是理想的起点。

★ 85.1k|★★☆☆☆|昨天

图像数据工具视频

funNLP

funNLP 是一个专为中文自然语言处理（NLP）打造的超级资源库，被誉为"NLP 民工的乐园”。它并非单一的软件工具，而是一个汇集了海量开源项目、数据集、预训练模型和实用代码的综合性平台。面对中文 NLP 领域资源分散、入门门槛高以及特定场景数据匮乏的痛点，funNLP 提供了“一站式”解决方案。这里不仅涵盖了分词、命名实体识别、情感分析、文本摘要等基础任务的标准工具，还独特地收录了丰富的垂直领域资源，如法律、医疗、金融行业的专用词库与数据集，甚至包含古诗词生成、歌词创作等趣味应用。其核心亮点在于极高的全面性与实用性，从基础的字典词典到前沿的 BERT、GPT-2 模型代码，再到高质量的标注数据和竞赛方案，应有尽有。无论是刚刚踏入 NLP 领域的学生、需要快速验证想法的算法工程师，还是从事人工智能研究的学者，都能在这里找到急需的“武器弹药”。对于开发者而言，它能大幅减少寻找数据和复现模型的时间；对于研究者，它提供了丰富的基准测试资源和前沿技术参考。funNLP 以开放共享的精神，极大地降低了中文自然语言处理的开发与研究成本，是中文 AI 社区不可或缺的宝藏仓库。

★ 79.9k|★☆☆☆☆|3天前

语言模型数据工具其他

cs-video-courses

cs-video-courses 是一个精心整理的计算机科学视频课程清单，旨在为自学者提供系统化的学习路径。它汇集了全球知名高校（如加州大学伯克利分校、新南威尔士大学等）的完整课程录像，涵盖从编程基础、数据结构与算法，到操作系统、分布式系统、数据库等核心领域，并深入延伸至人工智能、机器学习、量子计算及区块链等前沿方向。面对网络上零散且质量参差不齐的教学资源，cs-video-courses 解决了学习者难以找到成体系、高难度大学级别课程的痛点。该项目严格筛选内容，仅收录真正的大学层级课程，排除了碎片化的简短教程或商业广告，确保用户能接触到严谨的学术内容。这份清单特别适合希望夯实计算机基础的开发者、需要补充特定领域知识的研究人员，以及渴望像在校生一样系统学习计算机科学的自学者。其独特的技术亮点在于分类极其详尽，不仅包含传统的软件工程与网络安全，还细分了生成式 AI、大语言模型、计算生物学等新兴学科，并直接链接至官方视频播放列表，让用户能一站式获取高质量的教育资源，免费享受世界顶尖大学的课堂体验。

★ 79.8k|★☆☆☆☆|3天前

其他图像数据工具