[{"data":1,"prerenderedAt":-1},["ShallowReactive",2],{"similar-yuqinie98--PatchTST":3,"tool-yuqinie98--PatchTST":64},[4,17,27,35,43,56],{"id":5,"name":6,"github_repo":7,"description_zh":8,"stars":9,"difficulty_score":10,"last_commit_at":11,"category_tags":12,"status":16},3808,"stable-diffusion-webui","AUTOMATIC1111\u002Fstable-diffusion-webui","stable-diffusion-webui 是一个基于 Gradio 构建的网页版操作界面，旨在让用户能够轻松地在本地运行和使用强大的 Stable Diffusion 图像生成模型。它解决了原始模型依赖命令行、操作门槛高且功能分散的痛点，将复杂的 AI 绘图流程整合进一个直观易用的图形化平台。\n\n无论是希望快速上手的普通创作者、需要精细控制画面细节的设计师，还是想要深入探索模型潜力的开发者与研究人员，都能从中获益。其核心亮点在于极高的功能丰富度：不仅支持文生图、图生图、局部重绘（Inpainting）和外绘（Outpainting）等基础模式，还独创了注意力机制调整、提示词矩阵、负向提示词以及“高清修复”等高级功能。此外，它内置了 GFPGAN 和 CodeFormer 等人脸修复工具，支持多种神经网络放大算法，并允许用户通过插件系统无限扩展能力。即使是显存有限的设备，stable-diffusion-webui 也提供了相应的优化选项，让高质量的 AI 艺术创作变得触手可及。",162132,3,"2026-04-05T11:01:52",[13,14,15],"开发框架","图像","Agent","ready",{"id":18,"name":19,"github_repo":20,"description_zh":21,"stars":22,"difficulty_score":23,"last_commit_at":24,"category_tags":25,"status":16},1381,"everything-claude-code","affaan-m\u002Feverything-claude-code","everything-claude-code 是一套专为 AI 编程助手（如 Claude Code、Codex、Cursor 等）打造的高性能优化系统。它不仅仅是一组配置文件，而是一个经过长期实战打磨的完整框架，旨在解决 AI 代理在实际开发中面临的效率低下、记忆丢失、安全隐患及缺乏持续学习能力等核心痛点。\n\n通过引入技能模块化、直觉增强、记忆持久化机制以及内置的安全扫描功能，everything-claude-code 能显著提升 AI 在复杂任务中的表现，帮助开发者构建更稳定、更智能的生产级 AI 代理。其独特的“研究优先”开发理念和针对 Token 消耗的优化策略，使得模型响应更快、成本更低，同时有效防御潜在的攻击向量。\n\n这套工具特别适合软件开发者、AI 研究人员以及希望深度定制 AI 工作流的技术团队使用。无论您是在构建大型代码库，还是需要 AI 协助进行安全审计与自动化测试，everything-claude-code 都能提供强大的底层支持。作为一个曾荣获 Anthropic 黑客大奖的开源项目，它融合了多语言支持与丰富的实战钩子（hooks），让 AI 真正成长为懂上",140436,2,"2026-04-05T23:32:43",[13,15,26],"语言模型",{"id":28,"name":29,"github_repo":30,"description_zh":31,"stars":32,"difficulty_score":23,"last_commit_at":33,"category_tags":34,"status":16},2271,"ComfyUI","Comfy-Org\u002FComfyUI","ComfyUI 是一款功能强大且高度模块化的视觉 AI 引擎，专为设计和执行复杂的 Stable Diffusion 图像生成流程而打造。它摒弃了传统的代码编写模式，采用直观的节点式流程图界面，让用户通过连接不同的功能模块即可构建个性化的生成管线。\n\n这一设计巧妙解决了高级 AI 绘图工作流配置复杂、灵活性不足的痛点。用户无需具备编程背景，也能自由组合模型、调整参数并实时预览效果，轻松实现从基础文生图到多步骤高清修复等各类复杂任务。ComfyUI 拥有极佳的兼容性，不仅支持 Windows、macOS 和 Linux 全平台，还广泛适配 NVIDIA、AMD、Intel 及苹果 Silicon 等多种硬件架构，并率先支持 SDXL、Flux、SD3 等前沿模型。\n\n无论是希望深入探索算法潜力的研究人员和开发者，还是追求极致创作自由度的设计师与资深 AI 绘画爱好者，ComfyUI 都能提供强大的支持。其独特的模块化架构允许社区不断扩展新功能，使其成为当前最灵活、生态最丰富的开源扩散模型工具之一，帮助用户将创意高效转化为现实。",107662,"2026-04-03T11:11:01",[13,14,15],{"id":36,"name":37,"github_repo":38,"description_zh":39,"stars":40,"difficulty_score":23,"last_commit_at":41,"category_tags":42,"status":16},3704,"NextChat","ChatGPTNextWeb\u002FNextChat","NextChat 是一款轻量且极速的 AI 助手，旨在为用户提供流畅、跨平台的大模型交互体验。它完美解决了用户在多设备间切换时难以保持对话连续性，以及面对众多 AI 模型不知如何统一管理的痛点。无论是日常办公、学习辅助还是创意激发，NextChat 都能让用户随时随地通过网页、iOS、Android、Windows、MacOS 或 Linux 端无缝接入智能服务。\n\n这款工具非常适合普通用户、学生、职场人士以及需要私有化部署的企业团队使用。对于开发者而言，它也提供了便捷的自托管方案，支持一键部署到 Vercel 或 Zeabur 等平台。\n\nNextChat 的核心亮点在于其广泛的模型兼容性，原生支持 Claude、DeepSeek、GPT-4 及 Gemini Pro 等主流大模型，让用户在一个界面即可自由切换不同 AI 能力。此外，它还率先支持 MCP（Model Context Protocol）协议，增强了上下文处理能力。针对企业用户，NextChat 提供专业版解决方案，具备品牌定制、细粒度权限控制、内部知识库整合及安全审计等功能，满足公司对数据隐私和个性化管理的高标准要求。",87618,"2026-04-05T07:20:52",[13,26],{"id":44,"name":45,"github_repo":46,"description_zh":47,"stars":48,"difficulty_score":23,"last_commit_at":49,"category_tags":50,"status":16},2268,"ML-For-Beginners","microsoft\u002FML-For-Beginners","ML-For-Beginners 是由微软推出的一套系统化机器学习入门课程，旨在帮助零基础用户轻松掌握经典机器学习知识。这套课程将学习路径规划为 12 周，包含 26 节精炼课程和 52 道配套测验，内容涵盖从基础概念到实际应用的完整流程，有效解决了初学者面对庞大知识体系时无从下手、缺乏结构化指导的痛点。\n\n无论是希望转型的开发者、需要补充算法背景的研究人员，还是对人工智能充满好奇的普通爱好者，都能从中受益。课程不仅提供了清晰的理论讲解，还强调动手实践，让用户在循序渐进中建立扎实的技能基础。其独特的亮点在于强大的多语言支持，通过自动化机制提供了包括简体中文在内的 50 多种语言版本，极大地降低了全球不同背景用户的学习门槛。此外，项目采用开源协作模式，社区活跃且内容持续更新，确保学习者能获取前沿且准确的技术资讯。如果你正寻找一条清晰、友好且专业的机器学习入门之路，ML-For-Beginners 将是理想的起点。",84991,"2026-04-05T10:45:23",[14,51,52,53,15,54,26,13,55],"数据工具","视频","插件","其他","音频",{"id":57,"name":58,"github_repo":59,"description_zh":60,"stars":61,"difficulty_score":10,"last_commit_at":62,"category_tags":63,"status":16},3128,"ragflow","infiniflow\u002Fragflow","RAGFlow 是一款领先的开源检索增强生成（RAG）引擎，旨在为大语言模型构建更精准、可靠的上下文层。它巧妙地将前沿的 RAG 技术与智能体（Agent）能力相结合，不仅支持从各类文档中高效提取知识，还能让模型基于这些知识进行逻辑推理和任务执行。\n\n在大模型应用中，幻觉问题和知识滞后是常见痛点。RAGFlow 通过深度解析复杂文档结构（如表格、图表及混合排版），显著提升了信息检索的准确度，从而有效减少模型“胡编乱造”的现象，确保回答既有据可依又具备时效性。其内置的智能体机制更进一步，使系统不仅能回答问题，还能自主规划步骤解决复杂问题。\n\n这款工具特别适合开发者、企业技术团队以及 AI 研究人员使用。无论是希望快速搭建私有知识库问答系统，还是致力于探索大模型在垂直领域落地的创新者，都能从中受益。RAGFlow 提供了可视化的工作流编排界面和灵活的 API 接口，既降低了非算法背景用户的上手门槛，也满足了专业开发者对系统深度定制的需求。作为基于 Apache 2.0 协议开源的项目，它正成为连接通用大模型与行业专有知识之间的重要桥梁。",77062,"2026-04-04T04:44:48",[15,14,13,26,54],{"id":65,"github_repo":66,"name":67,"description_en":68,"description_zh":69,"ai_summary_zh":70,"readme_en":71,"readme_zh":72,"quickstart_zh":73,"use_case_zh":74,"hero_image_url":75,"owner_login":76,"owner_name":77,"owner_avatar_url":78,"owner_bio":79,"owner_company":79,"owner_location":79,"owner_email":79,"owner_twitter":79,"owner_website":79,"owner_url":80,"languages":81,"stars":90,"forks":91,"last_commit_at":92,"license":93,"difficulty_score":10,"env_os":94,"env_gpu":95,"env_ram":95,"env_deps":96,"category_tags":106,"github_topics":79,"view_count":107,"oss_zip_url":79,"oss_zip_packed_at":79,"status":16,"created_at":108,"updated_at":109,"faqs":110,"releases":146},415,"yuqinie98\u002FPatchTST","PatchTST","An offical implementation of PatchTST: \"A Time Series is Worth 64 Words: Long-term Forecasting with Transformers.\" (ICLR 2023) https:\u002F\u002Farxiv.org\u002Fabs\u002F2211.14730","PatchTST 是一个基于 Transformer 的时间序列长期预测模型，灵感来源于论文《A Time Series is Worth 64 Words》（ICLR 2023）。它通过将时间序列切分为“片段”（patches），把每个片段当作类似自然语言中的“词”输入到 Transformer 中，从而更有效地捕捉长时间依赖关系。传统 Transformer 在处理长序列时容易受噪声干扰且计算效率低，而 PatchTST 通过“分片”和“通道独立”设计显著提升了预测精度与稳定性。在多个公开数据集上，PatchTST 不仅优于其他 Transformer 变体（如 Autoformer、Informer），还超越了非 Transformer 模型（如 DLinear），尤其在回看窗口较长时表现更佳。此外，它还支持自监督预训练，可迁移到下游任务。PatchTST 已被集成到 GluonTS、NeuralForecast 和 tsai 等主流时间序列库中，适合从事时间序列建模的研究人员和开发者使用，尤其适用于电力负荷、气象、交通等需要高精度长期预测的场景。项目提供清晰的训练脚本和示例，便","PatchTST 是一个基于 Transformer 的时间序列长期预测模型，灵感来源于论文《A Time Series is Worth 64 Words》（ICLR 2023）。它通过将时间序列切分为“片段”（patches），把每个片段当作类似自然语言中的“词”输入到 Transformer 中，从而更有效地捕捉长时间依赖关系。传统 Transformer 在处理长序列时容易受噪声干扰且计算效率低，而 PatchTST 通过“分片”和“通道独立”设计显著提升了预测精度与稳定性。在多个公开数据集上，PatchTST 不仅优于其他 Transformer 变体（如 Autoformer、Informer），还超越了非 Transformer 模型（如 DLinear），尤其在回看窗口较长时表现更佳。此外，它还支持自监督预训练，可迁移到下游任务。PatchTST 已被集成到 GluonTS、NeuralForecast 和 tsai 等主流时间序列库中，适合从事时间序列建模的研究人员和开发者使用，尤其适用于电力负荷、气象、交通等需要高精度长期预测的场景。项目提供清晰的训练脚本和示例，便于快速复现与实验。","# PatchTST (ICLR 2023)\n\n### This is an offical implementation of PatchTST: [A Time Series is Worth 64 Words: Long-term Forecasting with Transformers](https:\u002F\u002Farxiv.org\u002Fabs\u002F2211.14730). \n\n:triangular_flag_on_post: Our model has been included in [GluonTS](https:\u002F\u002Fgithub.com\u002Fawslabs\u002Fgluonts). Special thanks to the contributor @[kashif](https:\u002F\u002Fgithub.com\u002Fkashif)!\n\n:triangular_flag_on_post: Our model has been included in [NeuralForecast](https:\u002F\u002Fgithub.com\u002FNixtla\u002Fneuralforecast). Special thanks to the contributor @[kdgutier](https:\u002F\u002Fgithub.com\u002Fkdgutier) and @[cchallu](https:\u002F\u002Fgithub.com\u002Fcchallu)!\n\n:triangular_flag_on_post: Our model has been included in [timeseriesAI(tsai)](https:\u002F\u002Fgithub.com\u002FtimeseriesAI\u002Ftsai\u002Fblob\u002Fmain\u002Ftutorial_nbs\u002F15_PatchTST_a_new_transformer_for_LTSF.ipynb). Special thanks to the contributor @[oguiza](https:\u002F\u002Fgithub.com\u002Foguiza)!\n\nWe offer a video that provides a concise overview of our paper for individuals seeking a rapid comprehension of its contents: https:\u002F\u002Fwww.youtube.com\u002Fwatch?v=Z3-NrohddJw\n\n\n\n## Key Designs\n\n:star2: **Patching**: segmentation of time series into subseries-level patches which are served as input tokens to Transformer.\n\n:star2: **Channel-independence**: each channel contains a single univariate time series that shares the same embedding and Transformer weights across all the series.\n\n![alt text](https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002Fyuqinie98_PatchTST_readme_7f2063a13b92.png)\n\n## Results\n\n### Supervised Learning\n\nCompared with the best results that Transformer-based models can offer, PatchTST\u002F64 achieves an overall **21.0%** reduction on MSE and **16.7%** reduction\non MAE, while PatchTST\u002F42 attains a overall **20.2%** reduction on MSE and **16.4%** reduction on MAE. It also outperforms other non-Transformer-based models like DLinear.\n\n![alt text](https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002Fyuqinie98_PatchTST_readme_fdbea985de1a.png)\n\n### Self-supervised Learning\n\nWe do comparison with other supervised and self-supervised models, and self-supervised PatchTST is able to outperform all the baselines. \n\n![alt text](https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002Fyuqinie98_PatchTST_readme_f1a3a42e5551.png)\n\n![alt text](https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002Fyuqinie98_PatchTST_readme_594e1d482d38.png)\n\nWe also test the capability of transfering the pre-trained model to downstream tasks.\n\n![alt text](https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002Fyuqinie98_PatchTST_readme_576d905ad0ca.png)\n\n## Efficiency on Long Look-back Windows\n\nOur PatchTST consistently \u003Cins>reduces the MSE scores as the look-back window increases\u003C\u002Fins>, which confirms our model’s capability to learn from longer receptive field.\n\n![alt text](https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002Fyuqinie98_PatchTST_readme_b10f9f32caa3.png)\n\n## Getting Started\n\nWe seperate our codes for supervised learning and self-supervised learning into 2 folders: ```PatchTST_supervised``` and ```PatchTST_self_supervised```. Please choose the one that you want to work with.\n\n### Supervised Learning\n\n1. Install requirements. ```pip install -r requirements.txt```\n\n2. Download data. You can download all the datasets from [Autoformer](https:\u002F\u002Fdrive.google.com\u002Fdrive\u002Ffolders\u002F1ZOYpTUa82_jCcxIdTmyr0LXQfvaM9vIy). Create a seperate folder ```.\u002Fdataset``` and put all the csv files in the directory.\n\n3. Training. All the scripts are in the directory ```.\u002Fscripts\u002FPatchTST```. The default model is PatchTST\u002F42. For example, if you want to get the multivariate forecasting results for weather dataset, just run the following command, and you can open ```.\u002Fresult.txt``` to see the results once the training is done:\n```\nsh .\u002Fscripts\u002FPatchTST\u002Fweather.sh\n```\n\nYou can adjust the hyperparameters based on your needs (e.g. different patch length, different look-back windows and prediction lengths.). We also provide codes for the baseline models.\n\n### Self-supervised Learning\n\n1. Follow the first 2 steps above\n\n2. Pre-training: The scirpt patchtst_pretrain.py is to train the PatchTST\u002F64. To run the code with a single GPU on ettm1, just run the following command\n```\npython patchtst_pretrain.py --dset ettm1 --mask_ratio 0.4\n```\nThe model will be saved to the saved_model folder for the downstream tasks. There are several other parameters can be set in the patchtst_pretrain.py script.\n \n 3. Fine-tuning: The script patchtst_finetune.py is for fine-tuning step. Either linear_probing or fine-tune the entire network can be applied.\n```\npython patchtst_finetune.py --dset ettm1 --pretrained_model \u003Cmodel_name>\n```\n\n## Acknowledgement\n\nWe appreciate the following github repo very much for the valuable code base and datasets:\n\nhttps:\u002F\u002Fgithub.com\u002Fcure-lab\u002FLTSF-Linear\n\nhttps:\u002F\u002Fgithub.com\u002Fzhouhaoyi\u002FInformer2020\n\nhttps:\u002F\u002Fgithub.com\u002Fthuml\u002FAutoformer\n\nhttps:\u002F\u002Fgithub.com\u002FMAZiqing\u002FFEDformer\n\nhttps:\u002F\u002Fgithub.com\u002Falipay\u002FPyraformer\n\nhttps:\u002F\u002Fgithub.com\u002Fts-kim\u002FRevIN\n\nhttps:\u002F\u002Fgithub.com\u002FtimeseriesAI\u002Ftsai\n\n## Contact\n\nIf you have any questions or concerns, please contact us: ynie@princeton.edu or nnguyen@us.ibm.com or submit an issue\n\n## Citation\n\nIf you find this repo useful in your research, please consider citing our paper as follows:\n\n```\n@inproceedings{Yuqietal-2023-PatchTST,\n  title     = {A Time Series is Worth 64 Words: Long-term Forecasting with Transformers},\n  author    = {Nie, Yuqi and\n               H. Nguyen, Nam and\n               Sinthong, Phanwadee and \n               Kalagnanam, Jayant},\n  booktitle = {International Conference on Learning Representations},\n  year      = {2023}\n}\n```\n\n","# PatchTST (ICLR 2023)\n\n### 这是论文《PatchTST: A Time Series is Worth 64 Words: Long-term Forecasting with Transformers》（[arXiv 链接](https:\u002F\u002Farxiv.org\u002Fabs\u002F2211.14730)）的官方实现。\n\n:triangular_flag_on_post: 我们的模型已被集成到 [GluonTS](https:\u002F\u002Fgithub.com\u002Fawslabs\u002Fgluonts) 中。特别感谢贡献者 @[kashif](https:\u002F\u002Fgithub.com\u002Fkashif)！\n\n:triangular_flag_on_post: 我们的模型已被集成到 [NeuralForecast](https:\u002F\u002Fgithub.com\u002FNixtla\u002Fneuralforecast) 中。特别感谢贡献者 @[kdgutier](https:\u002F\u002Fgithub.com\u002Fkdgutier) 和 @[cchallu](https:\u002F\u002Fgithub.com\u002Fcchallu)！\n\n:triangular_flag_on_post: 我们的模型已被集成到 [timeseriesAI(tsai)](https:\u002F\u002Fgithub.com\u002FtimeseriesAI\u002Ftsai\u002Fblob\u002Fmain\u002Ftutorial_nbs\u002F15_PatchTST_a_new_transformer_for_LTSF.ipynb) 中。特别感谢贡献者 @[oguiza](https:\u002F\u002Fgithub.com\u002Foguiza)！\n\n我们提供了一个视频，为希望快速理解论文内容的读者提供简洁概述：https:\u002F\u002Fwww.youtube.com\u002Fwatch?v=Z3-NrohddJw\n\n\n\n## 核心设计\n\n:star2: **分块（Patching）**：将时间序列分割成子序列级别的“块”（patches），这些块作为 Transformer 的输入 token。\n\n:star2: **通道独立性（Channel-independence）**：每个通道包含一个单变量时间序列，所有序列共享相同的嵌入（embedding）和 Transformer 权重。\n\n![alt text](https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002Fyuqinie98_PatchTST_readme_7f2063a13b92.png)\n\n## 实验结果\n\n### 有监督学习（Supervised Learning）\n\n与基于 Transformer 模型所能达到的最佳结果相比，PatchTST\u002F64 在 MSE 上整体降低了 **21.0%**，在 MAE 上整体降低了 **16.7%**；而 PatchTST\u002F42 在 MSE 上整体降低了 **20.2%**，在 MAE 上整体降低了 **16.4%**。它也优于其他非 Transformer 模型，如 DLinear。\n\n![alt text](https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002Fyuqinie98_PatchTST_readme_fdbea985de1a.png)\n\n### 自监督学习（Self-supervised Learning）\n\n我们将自监督版本的 PatchTST 与其他有监督和自监督模型进行了比较，结果表明自监督 PatchTST 能够超越所有基线模型。\n\n![alt text](https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002Fyuqinie98_PatchTST_readme_f1a3a42e5551.png)\n\n![alt text](https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002Fyuqinie98_PatchTST_readme_594e1d482d38.png)\n\n我们还测试了将预训练模型迁移到下游任务的能力。\n\n![alt text](https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002Fyuqinie98_PatchTST_readme_576d905ad0ca.png)\n\n## 在长回看窗口（Long Look-back Windows）下的效率\n\n随着回看窗口（look-back window）长度的增加，我们的 PatchTST 能够持续 \u003Cins>降低 MSE 分数\u003C\u002Fins>，这验证了模型从更长感受野（receptive field）中学习的能力。\n\n![alt text](https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002Fyuqinie98_PatchTST_readme_b10f9f32caa3.png)\n\n## 快速开始\n\n我们将有监督学习和自监督学习的代码分别放在两个文件夹中：```PatchTST_supervised``` 和 ```PatchTST_self_supervised```。请根据你的需求选择对应的文件夹。\n\n### 有监督学习\n\n1. 安装依赖：```pip install -r requirements.txt```\n\n2. 下载数据：你可以从 [Autoformer](https:\u002F\u002Fdrive.google.com\u002Fdrive\u002Ffolders\u002F1ZOYpTUa82_jCcxIdTmyr0LXQfvaM9vIy) 下载所有数据集。创建一个独立的文件夹 ```.\u002Fdataset```，并将所有 CSV 文件放入该目录。\n\n3. 训练：所有脚本位于 ```.\u002Fscripts\u002FPatchTST``` 目录下。默认模型为 PatchTST\u002F42。例如，如果你想获取 weather 数据集的多变量预测结果，只需运行以下命令。训练完成后，你可以打开 ```.\u002Fresult.txt``` 查看结果：\n```\nsh .\u002Fscripts\u002FPatchTST\u002Fweather.sh\n```\n\n你可以根据需要调整超参数（例如不同的 patch 长度、不同的回看窗口长度和预测长度）。我们也提供了基线模型的代码。\n\n### 自监督学习\n\n1. 完成上述前两步\n\n2. 预训练：脚本 ```patchtst_pretrain.py``` 用于训练 PatchTST\u002F64。若要在单个 GPU 上对 ettm1 数据集运行代码，请执行以下命令：\n```\npython patchtst_pretrain.py --dset ettm1 --mask_ratio 0.4\n```\n模型将被保存到 ```saved_model``` 文件夹中，供下游任务使用。你还可以在 ```patchtst_pretrain.py``` 脚本中设置其他参数。\n\n3. 微调（Fine-tuning）：脚本 ```patchtst_finetune.py``` 用于微调步骤，支持线性探测（linear probing）或对整个网络进行微调：\n```\npython patchtst_finetune.py --dset ettm1 --pretrained_model \u003Cmodel_name>\n```\n\n## 致谢\n\n我们非常感谢以下 GitHub 仓库提供的宝贵代码库和数据集：\n\nhttps:\u002F\u002Fgithub.com\u002Fcure-lab\u002FLTSF-Linear\n\nhttps:\u002F\u002Fgithub.com\u002Fzhouhaoyi\u002FInformer2020\n\nhttps:\u002F\u002Fgithub.com\u002Fthuml\u002FAutoformer\n\nhttps:\u002F\u002Fgithub.com\u002FMAZiqing\u002FFEDformer\n\nhttps:\u002F\u002Fgithub.com\u002Falipay\u002FPyraformer\n\nhttps:\u002F\u002Fgithub.com\u002Fts-kim\u002FRevIN\n\nhttps:\u002F\u002Fgithub.com\u002FtimeseriesAI\u002Ftsai\n\n## 联系方式\n\n如有任何问题或建议，请联系我们：ynie@princeton.edu 或 nnguyen@us.ibm.com，或提交 issue。\n\n## 引用\n\n如果你在研究中使用了本仓库，请考虑引用我们的论文：\n\n```\n@inproceedings{Yuqietal-2023-PatchTST,\n  title     = {A Time Series is Worth 64 Words: Long-term Forecasting with Transformers},\n  author    = {Nie, Yuqi and\n               H. Nguyen, Nam and\n               Sinthong, Phanwadee and \n               Kalagnanam, Jayant},\n  booktitle = {International Conference on Learning Representations},\n  year      = {2023}\n}\n```","# PatchTST 快速上手指南\n\nPatchTST 是一种基于 Transformer 的长时序预测模型，通过将时间序列切分为“patch”（类似 NLP 中的词）提升建模效果。本指南帮助你快速运行官方代码。\n\n## 环境准备\n\n- **操作系统**：Linux \u002F macOS \u002F Windows（推荐 Linux）\n- **Python 版本**：≥ 3.7\n- **GPU 支持**：建议使用 CUDA 兼容 GPU（非必需，但训练会更快）\n- **依赖库**：PyTorch、NumPy、Pandas 等（详见 `requirements.txt`）\n\n> 💡 国内用户建议使用清华源或阿里源加速安装：\n> ```bash\n> pip install -i https:\u002F\u002Fpypi.tuna.tsinghua.edu.cn\u002Fsimple -r requirements.txt\n> ```\n\n## 安装步骤\n\n1. 克隆仓库：\n   ```bash\n   git clone https:\u002F\u002Fgithub.com\u002Fyuqinie98\u002FPatchTST.git\n   cd PatchTST\n   ```\n\n2. 安装依赖：\n   ```bash\n   pip install -r requirements.txt\n   ```\n\n3. 下载数据集：  \n   从 [Autoformer 数据集](https:\u002F\u002Fdrive.google.com\u002Fdrive\u002Ffolders\u002F1ZOYpTUa82_jCcxIdTmyr0LXQfvaM9vIy) 下载所需 `.csv` 文件（如 `weather.csv`、`ETTh1.csv` 等），并放入新建的 `.\u002Fdataset` 目录中：\n   ```bash\n   mkdir dataset\n   # 将下载的 CSV 文件放入 .\u002Fdataset\u002F\n   ```\n\n## 基本使用\n\n### 监督学习（Supervised Learning）\n\n以 `weather` 数据集为例，运行预设脚本进行多变量长时序预测：\n\n```bash\nsh .\u002Fscripts\u002FPatchTST\u002Fweather.sh\n```\n\n训练完成后，结果将输出到 `.\u002Fresult.txt`。\n\n> 📌 默认使用 PatchTST\u002F42 配置。如需调整 patch 长度、回看窗口（look-back window）或预测长度，请修改对应脚本中的参数。\n\n### 自监督学习（Self-supervised Learning）\n\n1. **预训练**（以 `ettm1` 数据集为例）：\n   ```bash\n   python PatchTST_self_supervised\u002Fpatchtst_pretrain.py --dset ettm1 --mask_ratio 0.4\n   ```\n   训练好的模型将保存在 `saved_model\u002F` 目录。\n\n2. **微调**（Fine-tuning）：\n   ```bash\n   python PatchTST_self_supervised\u002Fpatchtst_finetune.py --dset ettm1 --pretrained_model \u003Cmodel_name>\n   ```\n   其中 `\u003Cmodel_name>` 替换为实际保存的模型文件名（不含路径）。\n\n> ⚠️ 注意：自监督代码位于 `PatchTST_self_supervised\u002F` 目录，监督学习代码位于 `PatchTST_supervised\u002F`，请根据需求进入对应目录操作。","某省级电网调度中心需对全省未来7天的电力负荷进行高精度预测，以优化发电计划和跨区调度，数据包含数百个变电站的小时级负荷序列，具有强周期性和长期依赖特征。\n\n### 没有 PatchTST 时\n- 采用传统LSTM或早期Transformer模型（如Informer），在720小时（30天）回看窗口下训练不稳定，预测误差显著上升。\n- 长期预测（如168步）时，模型难以捕捉跨周季节模式，MAE高达8.2%，导致备用容量预留过多，增加运营成本。\n- 多变量联合建模导致参数爆炸，训练耗时长达数天，且不同站点间性能差异大，需逐站调参。\n- 自监督预训练效果有限，无法有效迁移到新接入的变电站数据上。\n\n### 使用 PatchTST 后\n- 利用“分片”（patching）机制将长序列切分为语义子序列，使Transformer能稳定处理长达720小时的输入，MSE降低21%。\n- 在相同硬件条件下，168步预测MAE降至6.8%，显著提升跨周负荷趋势把握能力，减少冗余备用约5%。\n- 采用通道独立设计，共享权重建模所有变电站，训练时间缩短40%，且新站点只需微调即可获得可靠预测。\n- 基于自监督预训练的PatchTST模型可直接迁移到新增站点，在无标签数据下仍优于监督训练的基线模型。\n\nPatchTST通过创新的序列分片与通道独立架构，在真实电力系统中实现了更准、更快、更具扩展性的长期时序预测。","https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002Fyuqinie98_PatchTST_57ecb5a1.png","yuqinie98","ynie","https:\u002F\u002Foss.gittoolsai.com\u002Favatars\u002Fyuqinie98_9cc57c1b.png",null,"https:\u002F\u002Fgithub.com\u002Fyuqinie98",[82,86],{"name":83,"color":84,"percentage":85},"Python","#3572A5",88.9,{"name":87,"color":88,"percentage":89},"Shell","#89e051",11.1,2504,427,"2026-04-05T08:37:22","Apache-2.0","Linux, macOS, Windows","未说明",{"notes":97,"python":95,"dependencies":98},"需手动下载数据集并放入 .\u002Fdataset 目录；代码分为监督学习和自监督学习两个独立目录，需分别配置；依赖库版本未明确指定，建议使用较新版本的 PyTorch 和相关生态库。",[99,100,101,102,103,104,105],"torch","numpy","pandas","scikit-learn","matplotlib","tqdm","einops",[13,54],20,"2026-03-27T02:49:30.150509","2026-04-06T08:45:16.448071",[111,116,121,126,131,136,141],{"id":112,"question_zh":113,"answer_zh":114,"source_url":115},1560,"PatchTST 是否支持多变量（multivariate）时间序列建模？不同通道之间是否存在信息交互？","PatchTST 默认采用通道独立（channel-independence）策略，即每个变量（通道）单独处理，预测时彼此独立。但模型是全局共享的：所有时间序列一起训练，共享 Transformer 的权重，因此能隐式学习变量间的时空关系。不过在推理阶段，各通道的预测结果仍是独立生成的，并不会显式地互相影响。","https:\u002F\u002Fgithub.com\u002Fyuqinie98\u002FPatchTST\u002Fissues\u002F29",{"id":117,"question_zh":118,"answer_zh":119,"source_url":120},1561,"训练时遇到 ValueError: __len__() should return >= 0 错误怎么办？","该错误通常是因为数据集太小，导致验证集或测试集长度为零。具体原因是 __len__ 方法返回 len(data_x) - seq_len - pred_len + 1，若该值小于 0 则报错。解决方法是减小 seq_len（输入序列长度）或 pred_len（预测长度），确保数据足够覆盖窗口。此外，使用 ETT_minute 等小数据集时需特别注意参数设置。","https:\u002F\u002Fgithub.com\u002Fyuqinie98\u002FPatchTST\u002Fissues\u002F32",{"id":122,"question_zh":123,"answer_zh":124,"source_url":125},1562,"如何对 PatchTST 进行消融实验以验证通道独立性（channel-independence）的作用？","默认情况下，PatchTST 将每个通道独立处理（channel-independent）。若要进行通道混合（channel-mixing）的对比实验，可将输入从 (B, M, seq_len) 转换为 (B, M·P, N)，其中 P 是 patch 数量，N 是 patch 内部维度。这样可将通道与 patch 维度合并后输入 Transformer，实现跨通道交互。通过比较 channel-independent 与 channel-mixed 版本的性能即可完成消融实验。","https:\u002F\u002Fgithub.com\u002Fyuqinie98\u002FPatchTST\u002Fissues\u002F19",{"id":127,"question_zh":128,"answer_zh":129,"source_url":130},1563,"如何获取反归一化（denormalized）的预测结果？","官方代码默认未提供反归一化输出功能，但用户已在监督学习模式中成功添加。实现方式是在预测后调用数据集所用的归一化器（如 StandardScaler）的 inverse_transform 方法。需要注意的是，自监督模式下可能存在两次归一化（分别在 pred_dataset.py 和 transforms.py 中），应检查并避免重复归一化以确保反归一化正确。","https:\u002F\u002Fgithub.com\u002Fyuqinie98\u002FPatchTST\u002Fissues\u002F60",{"id":132,"question_zh":133,"answer_zh":134,"source_url":135},1564,"PatchTST 能否用于空间序列预测（如1D空间上的多点特征预测）？","可以。虽然 PatchTST 主要面向时间序列，但其核心是 Transformer，适用于任何序列建模任务。对于1D空间上划分的 n 个段，每个段有4个输入特征、需预测2个目标特征的情况，可将每个段视为“时间步”，构建 (n, 4) 输入并通过 Transformer 学习段间关系，输出 (n, 2)。建议先尝试原始 Transformer，PatchTST 的主要区别在于引入 patching 和通道独立机制。","https:\u002F\u002Fgithub.com\u002Fyuqinie98\u002FPatchTST\u002Fissues\u002F47",{"id":137,"question_zh":138,"answer_zh":139,"source_url":140},1565,"在自定义数据集上预测效果不佳，如何调参？","建议：1）减小 forecasting length（预测长度），采用滚动预测（rolling window）方式逐步向前预测；2）重点调整学习率及其调度策略，这对 Transformer 性能影响较大；3）若数据量不足，考虑收集更多数据或使用数据增强。滚动预测指用固定模型对短窗口预测，然后滑动窗口继续预测，而非重新训练模型。","https:\u002F\u002Fgithub.com\u002Fyuqinie98\u002FPatchTST\u002Fissues\u002F44",{"id":142,"question_zh":143,"answer_zh":144,"source_url":145},1566,"PatchTST 单次运行大概需要多长时间？","运行时间因数据集大小、训练轮数（epochs）、GPU 型号等差异很大。最快约半小时，最大模型可能需要一天。具体时间无法统一估计，建议先在小规模数据或减少 epoch 下测试流程。","https:\u002F\u002Fgithub.com\u002Fyuqinie98\u002FPatchTST\u002Fissues\u002F30",[]]