[{"data":1,"prerenderedAt":-1},["ShallowReactive",2],{"similar-hudson-and-thames--mlfinlab":3,"tool-hudson-and-thames--mlfinlab":64},[4,17,27,35,43,56],{"id":5,"name":6,"github_repo":7,"description_zh":8,"stars":9,"difficulty_score":10,"last_commit_at":11,"category_tags":12,"status":16},3808,"stable-diffusion-webui","AUTOMATIC1111\u002Fstable-diffusion-webui","stable-diffusion-webui 是一个基于 Gradio 构建的网页版操作界面，旨在让用户能够轻松地在本地运行和使用强大的 Stable Diffusion 图像生成模型。它解决了原始模型依赖命令行、操作门槛高且功能分散的痛点，将复杂的 AI 绘图流程整合进一个直观易用的图形化平台。\n\n无论是希望快速上手的普通创作者、需要精细控制画面细节的设计师，还是想要深入探索模型潜力的开发者与研究人员，都能从中获益。其核心亮点在于极高的功能丰富度：不仅支持文生图、图生图、局部重绘（Inpainting）和外绘（Outpainting）等基础模式，还独创了注意力机制调整、提示词矩阵、负向提示词以及“高清修复”等高级功能。此外，它内置了 GFPGAN 和 CodeFormer 等人脸修复工具，支持多种神经网络放大算法，并允许用户通过插件系统无限扩展能力。即使是显存有限的设备，stable-diffusion-webui 也提供了相应的优化选项，让高质量的 AI 艺术创作变得触手可及。",162132,3,"2026-04-05T11:01:52",[13,14,15],"开发框架","图像","Agent","ready",{"id":18,"name":19,"github_repo":20,"description_zh":21,"stars":22,"difficulty_score":23,"last_commit_at":24,"category_tags":25,"status":16},1381,"everything-claude-code","affaan-m\u002Feverything-claude-code","everything-claude-code 是一套专为 AI 编程助手（如 Claude Code、Codex、Cursor 等）打造的高性能优化系统。它不仅仅是一组配置文件，而是一个经过长期实战打磨的完整框架，旨在解决 AI 代理在实际开发中面临的效率低下、记忆丢失、安全隐患及缺乏持续学习能力等核心痛点。\n\n通过引入技能模块化、直觉增强、记忆持久化机制以及内置的安全扫描功能，everything-claude-code 能显著提升 AI 在复杂任务中的表现，帮助开发者构建更稳定、更智能的生产级 AI 代理。其独特的“研究优先”开发理念和针对 Token 消耗的优化策略，使得模型响应更快、成本更低，同时有效防御潜在的攻击向量。\n\n这套工具特别适合软件开发者、AI 研究人员以及希望深度定制 AI 工作流的技术团队使用。无论您是在构建大型代码库，还是需要 AI 协助进行安全审计与自动化测试，everything-claude-code 都能提供强大的底层支持。作为一个曾荣获 Anthropic 黑客大奖的开源项目，它融合了多语言支持与丰富的实战钩子（hooks），让 AI 真正成长为懂上",138956,2,"2026-04-05T11:33:21",[13,15,26],"语言模型",{"id":28,"name":29,"github_repo":30,"description_zh":31,"stars":32,"difficulty_score":23,"last_commit_at":33,"category_tags":34,"status":16},2271,"ComfyUI","Comfy-Org\u002FComfyUI","ComfyUI 是一款功能强大且高度模块化的视觉 AI 引擎，专为设计和执行复杂的 Stable Diffusion 图像生成流程而打造。它摒弃了传统的代码编写模式，采用直观的节点式流程图界面，让用户通过连接不同的功能模块即可构建个性化的生成管线。\n\n这一设计巧妙解决了高级 AI 绘图工作流配置复杂、灵活性不足的痛点。用户无需具备编程背景，也能自由组合模型、调整参数并实时预览效果，轻松实现从基础文生图到多步骤高清修复等各类复杂任务。ComfyUI 拥有极佳的兼容性，不仅支持 Windows、macOS 和 Linux 全平台，还广泛适配 NVIDIA、AMD、Intel 及苹果 Silicon 等多种硬件架构，并率先支持 SDXL、Flux、SD3 等前沿模型。\n\n无论是希望深入探索算法潜力的研究人员和开发者，还是追求极致创作自由度的设计师与资深 AI 绘画爱好者，ComfyUI 都能提供强大的支持。其独特的模块化架构允许社区不断扩展新功能，使其成为当前最灵活、生态最丰富的开源扩散模型工具之一，帮助用户将创意高效转化为现实。",107662,"2026-04-03T11:11:01",[13,14,15],{"id":36,"name":37,"github_repo":38,"description_zh":39,"stars":40,"difficulty_score":23,"last_commit_at":41,"category_tags":42,"status":16},3704,"NextChat","ChatGPTNextWeb\u002FNextChat","NextChat 是一款轻量且极速的 AI 助手，旨在为用户提供流畅、跨平台的大模型交互体验。它完美解决了用户在多设备间切换时难以保持对话连续性，以及面对众多 AI 模型不知如何统一管理的痛点。无论是日常办公、学习辅助还是创意激发，NextChat 都能让用户随时随地通过网页、iOS、Android、Windows、MacOS 或 Linux 端无缝接入智能服务。\n\n这款工具非常适合普通用户、学生、职场人士以及需要私有化部署的企业团队使用。对于开发者而言，它也提供了便捷的自托管方案，支持一键部署到 Vercel 或 Zeabur 等平台。\n\nNextChat 的核心亮点在于其广泛的模型兼容性，原生支持 Claude、DeepSeek、GPT-4 及 Gemini Pro 等主流大模型，让用户在一个界面即可自由切换不同 AI 能力。此外，它还率先支持 MCP（Model Context Protocol）协议，增强了上下文处理能力。针对企业用户，NextChat 提供专业版解决方案，具备品牌定制、细粒度权限控制、内部知识库整合及安全审计等功能，满足公司对数据隐私和个性化管理的高标准要求。",87618,"2026-04-05T07:20:52",[13,26],{"id":44,"name":45,"github_repo":46,"description_zh":47,"stars":48,"difficulty_score":23,"last_commit_at":49,"category_tags":50,"status":16},2268,"ML-For-Beginners","microsoft\u002FML-For-Beginners","ML-For-Beginners 是由微软推出的一套系统化机器学习入门课程，旨在帮助零基础用户轻松掌握经典机器学习知识。这套课程将学习路径规划为 12 周，包含 26 节精炼课程和 52 道配套测验，内容涵盖从基础概念到实际应用的完整流程，有效解决了初学者面对庞大知识体系时无从下手、缺乏结构化指导的痛点。\n\n无论是希望转型的开发者、需要补充算法背景的研究人员，还是对人工智能充满好奇的普通爱好者，都能从中受益。课程不仅提供了清晰的理论讲解，还强调动手实践，让用户在循序渐进中建立扎实的技能基础。其独特的亮点在于强大的多语言支持，通过自动化机制提供了包括简体中文在内的 50 多种语言版本，极大地降低了全球不同背景用户的学习门槛。此外，项目采用开源协作模式，社区活跃且内容持续更新，确保学习者能获取前沿且准确的技术资讯。如果你正寻找一条清晰、友好且专业的机器学习入门之路，ML-For-Beginners 将是理想的起点。",84991,"2026-04-05T10:45:23",[14,51,52,53,15,54,26,13,55],"数据工具","视频","插件","其他","音频",{"id":57,"name":58,"github_repo":59,"description_zh":60,"stars":61,"difficulty_score":10,"last_commit_at":62,"category_tags":63,"status":16},3128,"ragflow","infiniflow\u002Fragflow","RAGFlow 是一款领先的开源检索增强生成（RAG）引擎，旨在为大语言模型构建更精准、可靠的上下文层。它巧妙地将前沿的 RAG 技术与智能体（Agent）能力相结合，不仅支持从各类文档中高效提取知识，还能让模型基于这些知识进行逻辑推理和任务执行。\n\n在大模型应用中，幻觉问题和知识滞后是常见痛点。RAGFlow 通过深度解析复杂文档结构（如表格、图表及混合排版），显著提升了信息检索的准确度，从而有效减少模型“胡编乱造”的现象，确保回答既有据可依又具备时效性。其内置的智能体机制更进一步，使系统不仅能回答问题，还能自主规划步骤解决复杂问题。\n\n这款工具特别适合开发者、企业技术团队以及 AI 研究人员使用。无论是希望快速搭建私有知识库问答系统，还是致力于探索大模型在垂直领域落地的创新者，都能从中受益。RAGFlow 提供了可视化的工作流编排界面和灵活的 API 接口，既降低了非算法背景用户的上手门槛，也满足了专业开发者对系统深度定制的需求。作为基于 Apache 2.0 协议开源的项目，它正成为连接通用大模型与行业专有知识之间的重要桥梁。",77062,"2026-04-04T04:44:48",[15,14,13,26,54],{"id":65,"github_repo":66,"name":67,"description_en":68,"description_zh":69,"ai_summary_zh":69,"readme_en":70,"readme_zh":71,"quickstart_zh":72,"use_case_zh":73,"hero_image_url":74,"owner_login":75,"owner_name":76,"owner_avatar_url":77,"owner_bio":78,"owner_company":79,"owner_location":79,"owner_email":80,"owner_twitter":81,"owner_website":82,"owner_url":83,"languages":84,"stars":89,"forks":90,"last_commit_at":91,"license":92,"difficulty_score":23,"env_os":93,"env_gpu":94,"env_ram":94,"env_deps":95,"category_tags":98,"github_topics":99,"view_count":23,"oss_zip_url":79,"oss_zip_packed_at":79,"status":16,"created_at":111,"updated_at":112,"faqs":113,"releases":142},1376,"hudson-and-thames\u002Fmlfinlab","mlfinlab","MlFinLab helps portfolio managers and traders who want to leverage the power of machine learning by providing reproducible, interpretable, and easy to use tools. ","MlFinLab 是一款专为金融机器学习领域打造的 Python 工具库，旨在帮助投资组合经理和交易员轻松驾驭机器学习技术。它覆盖了从数据构建、特征工程、模型训练到回测统计的策略开发全流程，有效解决了金融数据噪声大、策略易过拟合以及传统方法难以复现等痛点。\n\n这款工具特别适合量化研究员、金融数据科学家以及希望将前沿学术成果转化为实际交易策略的开发者使用。MlFinLab 的独特亮点在于其高度的可复现性与可解释性：代码库经过严格测试与详尽文档支持，确保每一步操作都有据可依。此外，它不仅提供算法实现，还配套了丰富的理论讲解视频、幻灯片及示例笔记，帮助用户快速掌握从数据导入到性能评估的完整管线。\n\n库内模块功能全面，涵盖背转过拟合检测、新型数据结构生成、标签化与采样技术、特征重要性分析、赌注规模优化以及合成数据生成等高级功能。通过 MlFinLab，原本需要庞大研发团队才能实现的复杂量化技术，现在也能被个人或小团队高效调用，让用户能更专注于核心策略的创新与验证。","\u003Cdiv align=\"center\">\n   \u003Ca href=\"https:\u002F\u002Fhudsonthames.org\u002Fmlfinlab\">\n   \u003Cimg src=\"https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002Fhudson-and-thames_mlfinlab_readme_b19fde5a4023.jpg\" width=\"100%\" \n   style=\"margin-left: auto; margin-right: auto; display:block;\">\n   \n   \u003C\u002Fa>\n  \u003C\u002Fbr>\n\u003C\u002Fdiv>\n\n\n# Welcome to Machine Learning Financial Laboratory! \n\n\u003Cdiv align=\"center\">\n    \u003Cbr>\n\u003C\u002Fdiv>\n\n>This repo is public facing and exists for the sole purpose of providing users with an easy way to raise bugs, feature requests, and other issues.\n\n\u003Cdiv align=\"center\">\n    \u003Cbr>\n\u003C\u002Fdiv>\n\n## What is MlFinLab?\nMlFinlab python library is a perfect toolbox that every financial machine learning researcher needs. \n\nIt covers every step of the ML strategy creation, starting from data structures generation and finishing with backtest statistics.\nWe pride ourselves in the robustness of our codebase - every line of code existing in the modules is extensively tested and \ndocumented.\n\n\n## Documentation, Example Notebooks and Lecture Videos\nFor every technique present in the library we not only provide extensive documentation, with both theoretical explanations\nand detailed descriptions of available functions, but also supplement the modules with ever-growing array of lecture videos and slides \non the implemented methods.\n \nWe want you to be able to use the tools right away. To achieve that, every module comes with a number of example notebooks \nwhich include detailed examples of the usage of the algorithms. Our goal is to show you the whole pipeline, starting from \nimporting the libraries and ending with strategy performance metrics so you can get the added value from the get-go.\n\n\u003Cdiv align=\"left\">\n   \u003Ca href=\"https:\u002F\u002Fportal.hudsonthames.org\u002Fsign-in\">\n   \u003Cimg src=\"https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002Fhudson-and-thames_mlfinlab_readme_ad1ec4a0dede.png\" height=\"100px\" \n   style=\"margin-left: auto; margin-right: auto; display:inline-block;\">\n   \u003C\u002Fa>\n   \u003Ca href=\"https:\u002F\u002Fhudsonthames.org\u002F\">\n   \u003Cimg src=\"https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002Fhudson-and-thames_mlfinlab_readme_e90007f0e15d.png\" height=\"100px\">\n   \u003C\u002Fa>\n   \u003Ca href=\"https:\u002F\u002Fwww.youtube.com\u002Fchannel\u002FUC8hI87gt0dmTAIEupEcsckA\">\n   \u003Cimg src=\"https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002Fhudson-and-thames_mlfinlab_readme_c854f679a10c.png\" height=\"100px\">\n   \u003C\u002Fa>\n\u003C\u002Fdiv>\n\n\n### Included modules:\n\n- Backtest Overfitting Tools\n- Data Structures\n- Labeling\n- Sampling\n- Feature Engineering\n- Models\n- Clustering\n- Cross-Validation\n- Hyper-Parameter Tuning\n- Feature Importance\n- Bet Sizing\n- Synthetic Data Generation\n- Networks\n- Measures of Codependence\n- Useful Financial Features\n\n\n## Licensing options\nThis project is licensed under an all rights reserved [licence](https:\u002F\u002Fgithub.com\u002Fhudson-and-thames\u002Fmlfinlab\u002Fblob\u002Fmaster\u002FLICENSE.txt).\n\n* Business\n* Enterprise\n\n\n## Community\nWith the purchase of the library, our clients get access to the Hudson & Thames Slack community, where our engineers and other quants \nare always ready to answer your questions.\n\nAlternatively, you can email us at: research@hudsonthames.org.\n\n\u003Cdiv align=\"center\">\n   \u003Ca>\n   \u003Cimg src=\"https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002Fhudson-and-thames_mlfinlab_readme_d86c49dfb6f7.jpg\" width=\"100%\" \n   style=\"margin-left: auto; margin-right: auto; display:block;\">\n   \u003C\u002Fa>\n\u003C\u002Fdiv>\n\n\n## Who is Hudson & Thames?\nHudson and Thames Quantitative Research is a company with the goal of bridging the gap between the advanced research developed in \nquantitative finance and its practical application. We have created three premium python libraries so you can effortlessly access the\nlatest techniques and focus on what matters most: **creating your own winning strategy**.\n\n\n### What was only possible with the help of huge R&D teams is now at your disposal, anywhere, anytime.\n","\u003Cdiv align=\"center\">\n   \u003Ca href=\"https:\u002F\u002Fhudsonthames.org\u002Fmlfinlab\">\n   \u003Cimg src=\"https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002Fhudson-and-thames_mlfinlab_readme_b19fde5a4023.jpg\" width=\"100%\" \n   style=\"margin-left: auto; margin-right: auto; display:block;\">\n   \n   \u003C\u002Fa>\n  \u003C\u002Fbr>\n\u003C\u002Fdiv>\n\n\n# 欢迎来到机器学习金融实验室！\n\n\u003Cdiv align=\"center\">\n    \u003Cbr>\n\u003C\u002Fdiv>\n\n本仓库面向公众开放，其唯一目的就是为用户提供一种便捷的方式，以提交错误报告、功能请求及其他各类问题。\n\n\u003Cdiv align=\"center\">\n    \u003Cbr>\n\u003C\u002Fdiv>\n\n## 什么是 MlFinLab？\nMlFinLab Python 库是每一位金融机器学习研究者必备的完美工具箱。\n\n它涵盖了从数据结构生成到回测统计分析的整个 ML 策略制定流程。\n我们以代码库的稳健性为荣——模块中每一条代码都经过了详尽的测试与文档化处理。\n\n## 文档、示例笔记本与讲座视频\n针对库中所包含的每一项技术，我们不仅提供了详尽的文档，既包括理论讲解，也对可用函数进行了细致的说明，还通过不断扩充的讲座视频和演示文稿，为各个模块增添了丰富的教学内容。\n\n我们希望您能立即上手使用这些工具。为此，每个模块都附带了一系列示例笔记本，其中详细展示了算法的使用方法。我们的目标是向您展示完整的开发流程：从导入相关库，到最终完成策略性能指标的评估，让您从一开始就获得真正的价值。\n\n\u003Cdiv align=\"left\">\n   \u003Ca href=\"https:\u002F\u002Fportal.hudsonthames.org\u002Fsign-in\">\n   \u003Cimg src=\"https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002Fhudson-and-thames_mlfinlab_readme_ad1ec4a0dede.png\" height=\"100px\" \n   style=\"margin-left: auto; margin-right: auto; display:inline-block;\">\n   \u003C\u002Fa>\n   \u003Ca href=\"https:\u002F\u002Fhudsonthames.org\u002F\">\n   \u003Cimg src=\"https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002Fhudson-and-thames_mlfinlab_readme_e90007f0e15d.png\" height=\"100px\">\n   \u003C\u002Fa>\n   \u003Ca href=\"https:\u002F\u002Fwww.youtube.com\u002Fchannel\u002FUC8hI87gt0dmTAIEupEcsckA\">\n   \u003Cimg src=\"https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002Fhudson-and-thames_mlfinlab_readme_c854f679a10c.png\" height=\"100px\">\n   \u003C\u002Fa>\n\u003C\u002Fdiv>\n\n\n### 包含的模块：\n\n- 回测过拟合工具\n- 数据结构\n- 标签标注\n- 采样\n- 特征工程\n- 模型\n- 聚类\n- 交叉验证\n- 超参数调优\n- 特征重要性\n- 投注规模\n- 合成数据生成\n- 网络\n- 相关性度量\n- 有用的金融特征\n\n## 许可选项\n本项目采用“全部权利保留”的许可协议 [许可证](https:\u002F\u002Fgithub.com\u002Fhudson-and-thames\u002Fmlfinlab\u002Fblob\u002Fmaster\u002FLICENSE.txt)。\n\n* 企业级\n* 专业级\n\n## 社区\n购买该库后，您的客户将获得 Hudson & Thames Slack 社区的访问权限，我们的工程师和其他量化分析师随时准备解答您的疑问。\n\n或者，您也可以发送邮件至：research@hudsonthames.org。\n\n\u003Cdiv align=\"center\">\n   \u003Ca>\n   \u003Cimg src=\"https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002Fhudson-and-thames_mlfinlab_readme_d86c49dfb6f7.jpg\" width=\"100%\" \n   style=\"margin-left: auto; margin-right: auto; display:block;\">\n   \u003C\u002Fa>\n\u003C\u002Fdiv>\n\n\n## Hudson & Thames 是谁？\nHudson and Thames Quantitative Research 是一家致力于弥合量化金融领域前沿研究与实际应用之间鸿沟的公司。我们推出了三款高端 Python 库，让您可以轻松获取最新技术，并专注于最重要的事情：**打造属于自己的高效策略**。\n\n### 曾经只有在庞大研发团队的助力下才得以实现的创新成果，如今已触手可及，随时随地皆可享用。","# MlFinLab 快速上手指南\n\nMlFinLab 是专为金融机器学习研究者打造的 Python 工具箱，涵盖从数据结构生成、特征工程、模型训练到回测统计的全流程。\n\n## 环境准备\n\n- **操作系统**：Linux, macOS, Windows\n- **Python 版本**：建议 Python 3.8 - 3.10\n- **前置依赖**：\n  - `numpy`\n  - `pandas`\n  - `scikit-learn`\n  - `scipy`\n  - `matplotlib`\n  - `statsmodels`\n\n> 注意：MlFinLab 为商业授权库（All Rights Reserved），需通过 Hudson & Thames 官网购买许可后方可使用全部功能。\n\n## 安装步骤\n\n1. 访问 [Hudson & Thames 官网](https:\u002F\u002Fhudsonthames.org\u002Fmlfinlab) 获取许可证并登录客户门户。\n2. 使用 pip 安装（需配置认证或下载离线包）：\n\n```bash\npip install mlfinlab\n```\n\n> 若处于国内网络环境，可尝试使用清华镜像源加速基础依赖安装（仅适用于公开依赖部分）：\n```bash\npip install -i https:\u002F\u002Fpypi.tuna.tsinghua.edu.cn\u002Fsimple numpy pandas scikit-learn scipy matplotlib statsmodels\n```\n\n> 核心库 `mlfinlab` 因涉及授权验证，暂不支持第三方镜像源，请确保网络可访问 PyPI 或通过企业内网部署私有源。\n\n## 基本使用\n\n以下示例展示如何使用 MlFinLab 生成美元条（Dollar Bars）数据结构并进行简单标签化：\n\n```python\nimport pandas as pd\nfrom mlfinlab.data_structures import DollarBars\nfrom mlfinlab.labeling import get_fixed_time_horizon\n\n# 假设已有原始交易数据（含 'date', 'price', 'volume' 列）\ndata = pd.read_csv('tick_data.csv')\n\n# 生成美元条结构（每 10000 美元成交量聚合为一根 K 线）\ndollar_bars = DollarBars(threshold=10000)\ndb_df = dollar_bars.batch_transform(data)\n\n# 固定时间 horizon 标签化（预测未来 5 根 K 线的收益率方向）\nlabels = get_fixed_time_horizon(db_df['close'], window=5)\n\nprint(db_df.head())\nprint(labels.head())\n```\n\n更多模块用法（如特征工程、交叉验证、赌注大小优化等）请参考官方提供的 Jupyter Notebook 示例及视频课程。","某量化对冲基金的策略研究员正在开发基于机器学习的股票多因子选股模型，试图从海量高频数据中挖掘超额收益。\n\n### 没有 mlfinlab 时\n- **数据标注随意**：团队使用固定的时间间隔（如每日收盘）进行标签划分，忽略了市场波动的不均匀性，导致模型难以捕捉真实的趋势启动点。\n- **过拟合风险高**：传统的交叉验证方法破坏了金融时间序列的结构，造成“未来函数”泄露，回测曲线完美但实盘大幅亏损。\n- **特征工程低效**：研究人员需手动编写复杂的代码来计算分数阶差分或构建正交特征，耗时数周且容易引入计算错误。\n- **仓位管理缺失**：模型仅输出买卖信号，缺乏科学的赌注大小（Bet Sizing）计算，导致资金利用率低下或风险敞口失控。\n\n### 使用 mlfinlab 后\n- **动态标签生成**：利用 Triple Barrier Method（三重屏障法）根据波动率动态设定止盈止损和时间退出点，显著提升了标签的市场适应性。\n- **严谨的回测验证**：通过 Purged K-Fold Cross-Validation（去污交叉验证）有效隔离训练集与测试集的信息泄露，确保策略统计显著性真实可靠。\n- **自动化特征构建**：直接调用库中封装好的分数阶差分和聚类分析模块，将原本数周的特征工程工作缩短至几天，并保证了算法的可复现性。\n- **科学资金管理**：集成 Bet Sizing 模块，依据模型预测置信度动态调整单笔交易仓位，在控制回撤的同时最大化了夏普比率。\n\nmlfinlab 将学术界前沿的金融机器学习理论转化为工业级代码，帮助团队从繁琐的基础设施搭建中解脱，专注于策略逻辑本身的迭代与优化。","https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002Fhudson-and-thames_mlfinlab_5e7e9940.png","hudson-and-thames","Hudson and Thames Quantitative Research","https:\u002F\u002Foss.gittoolsai.com\u002Favatars\u002Fhudson-and-thames_bd318d7e.png","Our mission is to promote the scientific method within investment management by codifying frameworks, algorithms, and best practices.",null,"research@hudsonthames.org","hudson_thames","https:\u002F\u002Fwww.hudsonthames.org\u002F","https:\u002F\u002Fgithub.com\u002Fhudson-and-thames",[85],{"name":86,"color":87,"percentage":88},"Python","#3572A5",100,4648,1250,"2026-04-05T06:13:04","NOASSERTION","","未说明",{"notes":96,"python":94,"dependencies":97},"README 主要介绍了工具的功能模块（如回测过拟合工具、数据结构、标签化、采样等）、文档资源及商业许可信息，未包含具体的运行环境需求（如操作系统、GPU、内存、Python 版本或依赖库列表）。该库为商业授权（All rights reserved），需购买后方可使用完整功能及访问社区支持。",[],[13,54],[100,101,102,103,104,105,106,107,108,109,110],"machine-learning","trading","investing","research","finance","python","algorithmic-trading","quantitative-finance","financial-machine-learning","portfolio-management","portfolio-optimization","2026-03-27T02:49:30.150509","2026-04-06T07:14:53.222012",[114,119,124,129,134,138],{"id":115,"question_zh":116,"answer_zh":117,"source_url":118},6324,"如何在生产环境中使用在线投资组合选择（Online Portfolio Selection）模块进行实时预测？","对于生产环境，通常有两种处理方式：1) 将整个历史数据集加上新数据作为最后一行传入 `.allocate()` 方法，然后获取 `weights` 属性（虽然效率较低但实现简单，适合数据提供商整体更新数据的场景）；2) 仅传入最后 X 个观测值（由 `window` 参数决定）进行计算（更实用但取决于具体算法）。生成的权重对应的是下一个交易日的开盘配置（例如，5 月 26 日的权重用于 5 月 27 日开盘的分配）。目前库中尚未内置专门处理新数据预测的后端方法，建议用户根据上述逻辑自行封装。","https:\u002F\u002Fgithub.com\u002Fhudson-and-thames\u002Fmlfinlab\u002Fissues\u002F408",{"id":120,"question_zh":121,"answer_zh":122,"source_url":123},6325,"为什么使用 tick\u002Fvolume\u002Fdollar bars 生成的最后一个条形图（bar）数据不完整？这对推理有什么影响？","这是一个已知行为：在批量处理数据时，如果剩余数据不足以填满一个完整的阈值（如 1000 个 tick），生成的最后一个 bar 会包含少于阈值数量的交易数据。这导致最后一个 bar 的信息量与训练时的 bar 不一致，可能影响机器学习推理的准确性。社区建议如果是为了实盘或模拟交易，需要自行修改源码以处理这种“重绘”问题，或者设计状态机机制，通过 `New tick` 事件增量计算特征，而不是一次性读取所有数据集。","https:\u002F\u002Fgithub.com\u002Fhudson-and-thames\u002Fmlfinlab\u002Fissues\u002F166",{"id":125,"question_zh":126,"answer_zh":127,"source_url":128},6326,"mlfinlab 是否收集个人身份信息（PII）？如何关闭数据分析追踪？","该库默认会收集匿名使用数据（如函数名称、IP 地理位置、MAC 地址等）并通过 segment.io 发送，旨在改进产品。维护者表示经过调查，这些数据不被视为个人身份信息，且与企业级 SaaS 产品的分析方式相同。如果您希望完全禁用此功能，可以购买企业许可证（enterprise license），或者在代码中将日志级别调整为 debug 以查看具体的数据请求。目前没有简单的配置开关供免费用户直接关闭，需通过企业版或修改源码实现。","https:\u002F\u002Fgithub.com\u002Fhudson-and-thames\u002Fmlfinlab\u002Fissues\u002F499",{"id":130,"question_zh":131,"answer_zh":132,"source_url":133},6327,"调用 get_feature_clusters 时遇到 'ValueError: Input contains NaN, infinity...' 错误怎么办？","即使您认为数据中没有缺失值，该错误也可能由隐藏的非有限数值引起。解决方案是在调用聚类函数前，显式地对数据进行清洗：使用 `df.replace([np.inf, -np.inf], np.nan)` 将无穷大替换为 NaN，然后使用 `df.dropna()` 删除包含 NaN 的行或列，或者使用 `df.fillna()` 填充缺失值。确保输入矩阵中没有任何 `NaN`、`inf` 或超出 `float64` 范围的数值后再运行 `get_feature_clusters`。","https:\u002F\u002Fgithub.com\u002Fhudson-and-thames\u002Fmlfinlab\u002Fissues\u002F405",{"id":135,"question_zh":136,"answer_zh":137,"source_url":118},6328,"mlfinlab 库目前的发布状态和安装方式是什么？","尽管团队正在探索开源核心（open-core）商业模式并计划对部分文档和笔记本收费，但目前所有代码仍可通过 PyPi 免费安装。您可以直接使用命令 `pip install mlfinlab` 获取最新版本的库。团队承诺继续支持金融机器学习社区的发展。",{"id":139,"question_zh":140,"answer_zh":141,"source_url":123},6329,"如何为实盘交易构建基于 mlfinlab 的实时数据处理流程？","标准的批量数据处理（读取整个数据集输出指标）不适合实盘。建议构建一个包含 `Init`（初始化）、`New tick`（新数据到来）、`Deinit`（结束）的状态机框架。在 `New tick` 回调中调用库函数增量计算新的特征，避免重复计算历史数据。此外，应设计“创建指标”和“移除指标”的机制，以便在不重复代码的情况下动态管理多个技术指标，最终对接订单发送系统。这需要用户在库的基础上进行二次开发以适应低延迟需求。",[]]