[{"data":1,"prerenderedAt":-1},["ShallowReactive",2],{"similar-LAMDA-NJU--Deep-Forest":3,"tool-LAMDA-NJU--Deep-Forest":61},[4,18,26,36,44,53],{"id":5,"name":6,"github_repo":7,"description_zh":8,"stars":9,"difficulty_score":10,"last_commit_at":11,"category_tags":12,"status":17},4358,"openclaw","openclaw\u002Fopenclaw","OpenClaw 是一款专为个人打造的本地化 AI 助手，旨在让你在自己的设备上拥有完全可控的智能伙伴。它打破了传统 AI 助手局限于特定网页或应用的束缚，能够直接接入你日常使用的各类通讯渠道，包括微信、WhatsApp、Telegram、Discord、iMessage 等数十种平台。无论你在哪个聊天软件中发送消息，OpenClaw 都能即时响应，甚至支持在 macOS、iOS 和 Android 设备上进行语音交互，并提供实时的画布渲染功能供你操控。\n\n这款工具主要解决了用户对数据隐私、响应速度以及“始终在线”体验的需求。通过将 AI 部署在本地，用户无需依赖云端服务即可享受快速、私密的智能辅助，真正实现了“你的数据，你做主”。其独特的技术亮点在于强大的网关架构，将控制平面与核心助手分离，确保跨平台通信的流畅性与扩展性。\n\nOpenClaw 非常适合希望构建个性化工作流的技术爱好者、开发者，以及注重隐私保护且不愿被单一生态绑定的普通用户。只要具备基础的终端操作能力（支持 macOS、Linux 及 Windows WSL2），即可通过简单的命令行引导完成部署。如果你渴望拥有一个懂你",349277,3,"2026-04-06T06:32:30",[13,14,15,16],"Agent","开发框架","图像","数据工具","ready",{"id":19,"name":20,"github_repo":21,"description_zh":22,"stars":23,"difficulty_score":10,"last_commit_at":24,"category_tags":25,"status":17},3808,"stable-diffusion-webui","AUTOMATIC1111\u002Fstable-diffusion-webui","stable-diffusion-webui 是一个基于 Gradio 构建的网页版操作界面，旨在让用户能够轻松地在本地运行和使用强大的 Stable Diffusion 图像生成模型。它解决了原始模型依赖命令行、操作门槛高且功能分散的痛点，将复杂的 AI 绘图流程整合进一个直观易用的图形化平台。\n\n无论是希望快速上手的普通创作者、需要精细控制画面细节的设计师，还是想要深入探索模型潜力的开发者与研究人员，都能从中获益。其核心亮点在于极高的功能丰富度：不仅支持文生图、图生图、局部重绘（Inpainting）和外绘（Outpainting）等基础模式，还独创了注意力机制调整、提示词矩阵、负向提示词以及“高清修复”等高级功能。此外，它内置了 GFPGAN 和 CodeFormer 等人脸修复工具，支持多种神经网络放大算法，并允许用户通过插件系统无限扩展能力。即使是显存有限的设备，stable-diffusion-webui 也提供了相应的优化选项，让高质量的 AI 艺术创作变得触手可及。",162132,"2026-04-05T11:01:52",[14,15,13],{"id":27,"name":28,"github_repo":29,"description_zh":30,"stars":31,"difficulty_score":32,"last_commit_at":33,"category_tags":34,"status":17},1381,"everything-claude-code","affaan-m\u002Feverything-claude-code","everything-claude-code 是一套专为 AI 编程助手（如 Claude Code、Codex、Cursor 等）打造的高性能优化系统。它不仅仅是一组配置文件，而是一个经过长期实战打磨的完整框架，旨在解决 AI 代理在实际开发中面临的效率低下、记忆丢失、安全隐患及缺乏持续学习能力等核心痛点。\n\n通过引入技能模块化、直觉增强、记忆持久化机制以及内置的安全扫描功能，everything-claude-code 能显著提升 AI 在复杂任务中的表现，帮助开发者构建更稳定、更智能的生产级 AI 代理。其独特的“研究优先”开发理念和针对 Token 消耗的优化策略，使得模型响应更快、成本更低，同时有效防御潜在的攻击向量。\n\n这套工具特别适合软件开发者、AI 研究人员以及希望深度定制 AI 工作流的技术团队使用。无论您是在构建大型代码库，还是需要 AI 协助进行安全审计与自动化测试，everything-claude-code 都能提供强大的底层支持。作为一个曾荣获 Anthropic 黑客大奖的开源项目，它融合了多语言支持与丰富的实战钩子（hooks），让 AI 真正成长为懂上",142651,2,"2026-04-06T23:34:12",[14,13,35],"语言模型",{"id":37,"name":38,"github_repo":39,"description_zh":40,"stars":41,"difficulty_score":32,"last_commit_at":42,"category_tags":43,"status":17},2271,"ComfyUI","Comfy-Org\u002FComfyUI","ComfyUI 是一款功能强大且高度模块化的视觉 AI 引擎，专为设计和执行复杂的 Stable Diffusion 图像生成流程而打造。它摒弃了传统的代码编写模式，采用直观的节点式流程图界面，让用户通过连接不同的功能模块即可构建个性化的生成管线。\n\n这一设计巧妙解决了高级 AI 绘图工作流配置复杂、灵活性不足的痛点。用户无需具备编程背景，也能自由组合模型、调整参数并实时预览效果，轻松实现从基础文生图到多步骤高清修复等各类复杂任务。ComfyUI 拥有极佳的兼容性，不仅支持 Windows、macOS 和 Linux 全平台，还广泛适配 NVIDIA、AMD、Intel 及苹果 Silicon 等多种硬件架构，并率先支持 SDXL、Flux、SD3 等前沿模型。\n\n无论是希望深入探索算法潜力的研究人员和开发者，还是追求极致创作自由度的设计师与资深 AI 绘画爱好者，ComfyUI 都能提供强大的支持。其独特的模块化架构允许社区不断扩展新功能，使其成为当前最灵活、生态最丰富的开源扩散模型工具之一，帮助用户将创意高效转化为现实。",107888,"2026-04-06T11:32:50",[14,15,13],{"id":45,"name":46,"github_repo":47,"description_zh":48,"stars":49,"difficulty_score":32,"last_commit_at":50,"category_tags":51,"status":17},4721,"markitdown","microsoft\u002Fmarkitdown","MarkItDown 是一款由微软 AutoGen 团队打造的轻量级 Python 工具，专为将各类文件高效转换为 Markdown 格式而设计。它支持 PDF、Word、Excel、PPT、图片（含 OCR）、音频（含语音转录）、HTML 乃至 YouTube 链接等多种格式的解析，能够精准提取文档中的标题、列表、表格和链接等关键结构信息。\n\n在人工智能应用日益普及的今天，大语言模型（LLM）虽擅长处理文本，却难以直接读取复杂的二进制办公文档。MarkItDown 恰好解决了这一痛点，它将非结构化或半结构化的文件转化为模型“原生理解”且 Token 效率极高的 Markdown 格式，成为连接本地文件与 AI 分析 pipeline 的理想桥梁。此外，它还提供了 MCP（模型上下文协议）服务器，可无缝集成到 Claude Desktop 等 LLM 应用中。\n\n这款工具特别适合开发者、数据科学家及 AI 研究人员使用，尤其是那些需要构建文档检索增强生成（RAG）系统、进行批量文本分析或希望让 AI 助手直接“阅读”本地文件的用户。虽然生成的内容也具备一定可读性，但其核心优势在于为机器",93400,"2026-04-06T19:52:38",[52,14],"插件",{"id":54,"name":55,"github_repo":56,"description_zh":57,"stars":58,"difficulty_score":10,"last_commit_at":59,"category_tags":60,"status":17},4487,"LLMs-from-scratch","rasbt\u002FLLMs-from-scratch","LLMs-from-scratch 是一个基于 PyTorch 的开源教育项目，旨在引导用户从零开始一步步构建一个类似 ChatGPT 的大型语言模型（LLM）。它不仅是同名技术著作的官方代码库，更提供了一套完整的实践方案，涵盖模型开发、预训练及微调的全过程。\n\n该项目主要解决了大模型领域“黑盒化”的学习痛点。许多开发者虽能调用现成模型，却难以深入理解其内部架构与训练机制。通过亲手编写每一行核心代码，用户能够透彻掌握 Transformer 架构、注意力机制等关键原理，从而真正理解大模型是如何“思考”的。此外，项目还包含了加载大型预训练权重进行微调的代码，帮助用户将理论知识延伸至实际应用。\n\nLLMs-from-scratch 特别适合希望深入底层原理的 AI 开发者、研究人员以及计算机专业的学生。对于不满足于仅使用 API，而是渴望探究模型构建细节的技术人员而言，这是极佳的学习资源。其独特的技术亮点在于“循序渐进”的教学设计：将复杂的系统工程拆解为清晰的步骤，配合详细的图表与示例，让构建一个虽小但功能完备的大模型变得触手可及。无论你是想夯实理论基础，还是为未来研发更大规模的模型做准备",90106,"2026-04-06T11:19:32",[35,15,13,14],{"id":62,"github_repo":63,"name":64,"description_en":65,"description_zh":66,"ai_summary_zh":66,"readme_en":67,"readme_zh":68,"quickstart_zh":69,"use_case_zh":70,"hero_image_url":71,"owner_login":72,"owner_name":73,"owner_avatar_url":74,"owner_bio":75,"owner_company":76,"owner_location":76,"owner_email":76,"owner_twitter":76,"owner_website":77,"owner_url":78,"languages":79,"stars":92,"forks":93,"last_commit_at":94,"license":95,"difficulty_score":96,"env_os":97,"env_gpu":97,"env_ram":97,"env_deps":98,"category_tags":105,"github_topics":106,"view_count":32,"oss_zip_url":76,"oss_zip_packed_at":76,"status":17,"created_at":112,"updated_at":113,"faqs":114,"releases":143},4736,"LAMDA-NJU\u002FDeep-Forest","Deep-Forest","An Efficient, Scalable and Optimized Python Framework for Deep Forest (2021.2.1)","Deep-Forest 是一个高效、可扩展且经过优化的 Python 框架，专为实现“深度森林”算法而设计。它旨在解决传统树模型在处理表格数据时精度受限或调参复杂的问题，为随机森林和梯度提升决策树（GBDT）等经典算法提供了一种强有力的替代方案。\n\n该工具的核心优势在于其卓越的预测性能，往往能超越现有的集成学习方法，同时大幅降低了参数调整的门槛，让用户无需耗费大量精力即可获得优异结果。在技术层面，Deep-Forest 结合了深度学习的层级结构与树模型的鲁棒性，不仅训练速度快、效率高，还能轻松应对大规模数据集的挑战。\n\nDeep-Forest 特别适合机器学习开发者、数据科学家以及科研人员使用，尤其是那些专注于表格数据分析、希望在不依赖深度神经网络复杂架构的前提下提升模型表现的用户。通过简洁的 API 接口，用户可以快速上手进行分类或回归任务，只需几行代码即可完成从数据加载到模型评估的全流程。如果你正在寻找一种既强大又易用的树基学习工具，Deep-Forest 值得尝试。","Deep Forest (DF) 21\n===================\n\n|github|_ |readthedocs|_ |codecov|_ |python|_ |pypi|_ |style|_\n\n.. |github| image:: https:\u002F\u002Fgithub.com\u002FLAMDA-NJU\u002FDeep-Forest\u002Fworkflows\u002FDeepForest-CI\u002Fbadge.svg\n.. _github: https:\u002F\u002Fgithub.com\u002FLAMDA-NJU\u002FDeep-Forest\u002Factions\n\n.. |readthedocs| image:: https:\u002F\u002Freadthedocs.org\u002Fprojects\u002Fdeep-forest\u002Fbadge\u002F?version=latest\n.. _readthedocs: https:\u002F\u002Fdeep-forest.readthedocs.io\n\n.. |codecov| image:: https:\u002F\u002Fcodecov.io\u002Fgh\u002FLAMDA-NJU\u002FDeep-Forest\u002Fbranch\u002Fmaster\u002Fgraph\u002Fbadge.svg?token=5BVXOT8RPO\n.. _codecov: https:\u002F\u002Fcodecov.io\u002Fgh\u002FLAMDA-NJU\u002FDeep-Forest\n    \n.. |python| image:: https:\u002F\u002Fimg.shields.io\u002Fpypi\u002Fpyversions\u002Fdeep-forest\n.. _python: https:\u002F\u002Fpypi.org\u002Fproject\u002Fdeep-forest\u002F\n\n.. |pypi| image:: https:\u002F\u002Fimg.shields.io\u002Fpypi\u002Fv\u002Fdeep-forest?color=blue\n.. _pypi: https:\u002F\u002Fpypi.org\u002Fproject\u002Fdeep-forest\u002F\n\n.. |style| image:: https:\u002F\u002Fimg.shields.io\u002Fbadge\u002Fcode%20style-black-000000.svg\n.. _style: https:\u002F\u002Fgithub.com\u002Fpsf\u002Fblack\n\n**DF21** is an implementation of `Deep Forest \u003Chttps:\u002F\u002Farxiv.org\u002Fpdf\u002F1702.08835.pdf>`__ 2021.2.1. It is designed to have the following advantages:\n\n- **Powerful**: Better accuracy than existing tree-based ensemble methods.\n- **Easy to Use**: Less efforts on tunning parameters.\n- **Efficient**: Fast training speed and high efficiency.\n- **Scalable**: Capable of handling large-scale data.\n\nDF21 offers an effective & powerful option to the tree-based machine learning algorithms such as Random Forest or GBDT.\n\nFor a quick start, please refer to `How to Get Started \u003Chttps:\u002F\u002Fdeep-forest.readthedocs.io\u002Fen\u002Flatest\u002Fhow_to_get_started.html>`__. For a detailed guidance on parameter tunning, please refer to `Parameters Tunning \u003Chttps:\u002F\u002Fdeep-forest.readthedocs.io\u002Fen\u002Flatest\u002Fparameters_tunning.html>`__.\n\nDF21 is optimized for what a tree-based ensemble excels at (i.e., tabular data), if you want to use the multi-grained scanning part to better handle structured data like images, please refer to the `origin implementation \u003Chttps:\u002F\u002Fgithub.com\u002Fkingfengji\u002FgcForest>`__ for details.\n\nInstallation\n------------\n\nDF21 can be installed using pip via `PyPI \u003Chttps:\u002F\u002Fpypi.org\u002Fproject\u002Fdeep-forest\u002F>`__  which is the package installer for Python. You can use pip to install packages from the Python Package Index and other indexes. Refer `this \u003Chttps:\u002F\u002Fpypi.org\u002Fproject\u002Fpip\u002F>`__ for the documentation of pip. Use this command to download DF21 :\n\n.. code-block:: bash\n\n    pip install deep-forest\n\nQuickstart\n----------\n\nClassification\n**************\n\n.. code-block:: python\n\n    from sklearn.datasets import load_digits\n    from sklearn.model_selection import train_test_split\n    from sklearn.metrics import accuracy_score\n\n    from deepforest import CascadeForestClassifier\n\n    X, y = load_digits(return_X_y=True)\n    X_train, X_test, y_train, y_test = train_test_split(X, y, random_state=1)\n    model = CascadeForestClassifier(random_state=1)\n    model.fit(X_train, y_train)\n    y_pred = model.predict(X_test)\n    acc = accuracy_score(y_test, y_pred) * 100\n    print(\"\\nTesting Accuracy: {:.3f} %\".format(acc))\n    >>> Testing Accuracy: 98.667 %\n\nRegression\n**********\n\n.. code-block:: python\n\n    from sklearn.datasets import load_boston\n    from sklearn.model_selection import train_test_split\n    from sklearn.metrics import mean_squared_error\n\n    from deepforest import CascadeForestRegressor\n\n    X, y = load_boston(return_X_y=True)\n    X_train, X_test, y_train, y_test = train_test_split(X, y, random_state=1)\n    model = CascadeForestRegressor(random_state=1)\n    model.fit(X_train, y_train)\n    y_pred = model.predict(X_test)\n    mse = mean_squared_error(y_test, y_pred)\n    print(\"\\nTesting MSE: {:.3f}\".format(mse))\n    >>> Testing MSE: 8.068\n\nResources\n---------\n\n* `Documentation \u003Chttps:\u002F\u002Fdeep-forest.readthedocs.io\u002F>`__\n* Deep Forest: `[Conference] \u003Chttps:\u002F\u002Fwww.ijcai.org\u002Fproceedings\u002F2017\u002F0497.pdf>`__ | `[Journal] \u003Chttps:\u002F\u002Facademic.oup.com\u002Fnsr\u002Farticle-pdf\u002F6\u002F1\u002F74\u002F30336169\u002Fnwy108.pdf>`__\n* Keynote at AISTATS 2019: `[Slides] \u003Chttps:\u002F\u002Faistats.org\u002Faistats2019\u002F0-AISTATS2019-slides-zhi-hua_zhou.pdf>`__\n\nReference\n---------\n\n.. code-block:: latex\n\n    @article{zhou2019deep,\n        title={Deep forest},\n        author={Zhi-Hua Zhou and Ji Feng},\n        journal={National Science Review},\n        volume={6},\n        number={1},\n        pages={74--86},\n        year={2019}}\n\n    @inproceedings{zhou2017deep,\n        title = {{Deep Forest:} Towards an alternative to deep neural networks},\n        author = {Zhi-Hua Zhou and Ji Feng},\n        booktitle = {IJCAI},\n        pages = {3553--3559},\n        year = {2017}}\n\nThanks to all our contributors\n------------------------------\n\n|contributors|\n\n.. |contributors| image:: https:\u002F\u002Fcontributors-img.web.app\u002Fimage?repo=LAMDA-NJU\u002FDeep-Forest\n.. _contributors: https:\u002F\u002Fgithub.com\u002FLAMDA-NJU\u002FDeep-Forest\u002Fgraphs\u002Fcontributors\n","深森林 (DF) 21\n===================\n\n|github|_ |readthedocs|_ |codecov|_ |python|_ |pypi|_ |style|_\n\n.. |github| image:: https:\u002F\u002Fgithub.com\u002FLAMDA-NJU\u002FDeep-Forest\u002Fworkflows\u002FDeepForest-CI\u002Fbadge.svg\n.. _github: https:\u002F\u002Fgithub.com\u002FLAMDA-NJU\u002FDeep-Forest\u002Factions\n\n.. |readthedocs| image:: https:\u002F\u002Freadthedocs.org\u002Fprojects\u002Fdeep-forest\u002Fbadge\u002F?version=latest\n.. _readthedocs: https:\u002F\u002Fdeep-forest.readthedocs.io\n\n.. |codecov| image:: https:\u002F\u002Fcodecov.io\u002Fgh\u002FLAMDA-NJU\u002FDeep-Forest\u002Fbranch\u002Fmaster\u002Fgraph\u002Fbadge.svg?token=5BVXOT8RPO\n.. _codecov: https:\u002F\u002Fcodecov.io\u002Fgh\u002FLAMDA-NJU\u002FDeep-Forest\n    \n.. |python| image:: https:\u002F\u002Fimg.shields.io\u002Fpypi\u002Fpyversions\u002Fdeep-forest\n.. _python: https:\u002F\u002Fpypi.org\u002Fproject\u002Fdeep-forest\u002F\n\n.. |pypi| image:: https:\u002F\u002Fimg.shields.io\u002Fpypi\u002Fv\u002Fdeep-forest?color=blue\n.. _pypi: https:\u002F\u002Fpypi.org\u002Fproject\u002Fdeep-forest\u002F\n\n.. |style| image:: https:\u002F\u002Fimg.shields.io\u002Fbadge\u002Fcode%20style-black-000000.svg\n.. _style: https:\u002F\u002Fgithub.com\u002Fpsf\u002Fblack\n\n**DF21** 是 `Deep Forest \u003Chttps:\u002F\u002Farxiv.org\u002Fpdf\u002F1702.08835.pdf>`__ 2021年2月1日版本的实现。它具有以下优势：\n\n- **强大**：比现有的基于树的集成方法具有更高的准确性。\n- **易用**：无需过多调参。\n- **高效**：训练速度快，效率高。\n- **可扩展**：能够处理大规模数据。\n\nDF21 为随机森林或 GBDT 等基于树的机器学习算法提供了一种有效且强大的选择。\n\n如需快速入门，请参阅 `如何开始使用 \u003Chttps:\u002F\u002Fdeep-forest.readthedocs.io\u002Fen\u002Flatest\u002Fhow_to_get_started.html>`__。有关参数调优的详细指南，请参阅 `参数调优 \u003Chttps:\u002F\u002Fdeep-forest.readthedocs.io\u002Fen\u002Flatest\u002Fparameters_tunning.html>`__。\n\nDF21 针对基于树的集成方法擅长处理的任务（即表格数据）进行了优化。如果您希望利用多粒度扫描部分更好地处理图像等结构化数据，请参阅 `原始实现 \u003Chttps:\u002F\u002Fgithub.com\u002Fkingfengji\u002FgcForest>`__ 以获取更多详情。\n\n安装\n----\n\nDF21 可以通过 Python 的包管理工具 `PyPI \u003Chttps:\u002F\u002Fpypi.org\u002Fproject\u002Fdeep-forest\u002F>`__ 使用 pip 安装。您可以使用 pip 从 Python 包索引及其他索引中安装软件包。有关 pip 的文档，请参阅 `此处 \u003Chttps:\u002F\u002Fpypi.org\u002Fproject\u002Fpip\u002F>`__。使用以下命令即可下载 DF21：\n\n.. code-block:: bash\n\n    pip install deep-forest\n\n快速入门\n--------\n\n分类\n**************\n\n.. code-block:: python\n\n    from sklearn.datasets import load_digits\n    from sklearn.model_selection import train_test_split\n    from sklearn.metrics import accuracy_score\n\n    from deepforest import CascadeForestClassifier\n\n    X, y = load_digits(return_X_y=True)\n    X_train, X_test, y_train, y_test = train_test_split(X, y, random_state=1)\n    model = CascadeForestClassifier(random_state=1)\n    model.fit(X_train, y_train)\n    y_pred = model.predict(X_test)\n    acc = accuracy_score(y_test, y_pred) * 100\n    print(\"\\n测试准确率：{:.3f}%\".format(acc))\n    >>> 测试准确率：98.667%\n\n回归\n**********\n\n.. code-block:: python\n\n    from sklearn.datasets import load_boston\n    from sklearn.model_selection import train_test_split\n    from sklearn.metrics import mean_squared_error\n\n    from deepforest import CascadeForestRegressor\n\n    X, y = load_boston(return_X_y=True)\n    X_train, X_test, y_train, y_test = train_test_split(X, y, random_state=1)\n    model = CascadeForestRegressor(random_state=1)\n    model.fit(X_train, y_train)\n    y_pred = model.predict(X_test)\n    mse = mean_squared_error(y_test, y_pred)\n    print(\"\\n测试均方误差：{:.3f}\".format(mse))\n    >>> 测试均方误差：8.068\n\n资源\n---------\n\n* `文档 \u003Chttps:\u002F\u002Fdeep-forest.readthedocs.io\u002F>`__\n* Deep Forest：`[会议] \u003Chttps:\u002F\u002Fwww.ijcai.org\u002Fproceedings\u002F2017\u002F0497.pdf>`__ | `[期刊] \u003Chttps:\u002F\u002Facademic.oup.com\u002Fnsr\u002Farticle-pdf\u002F6\u002F1\u002F74\u002F30336169\u002Fnwy108.pdf>`__\n* AISTATS 2019 主题演讲：`[幻灯片] \u003Chttps:\u002F\u002Faistats.org\u002Faistats2019\u002F0-AISTATS2019-slides-zhi-hua_zhou.pdf>`__\n\n参考文献\n---------\n\n.. code-block:: latex\n\n    @article{zhou2019deep,\n        title={Deep forest},\n        author={Zhi-Hua Zhou and Ji Feng},\n        journal={National Science Review},\n        volume={6},\n        number={1},\n        pages={74--86},\n        year={2019}}\n\n    @inproceedings{zhou2017deep,\n        title = {{Deep Forest:} Towards an alternative to deep neural networks},\n        author = {Zhi-Hua Zhou and Ji Feng},\n        booktitle = {IJCAI},\n        pages = {3553--3559},\n        year = {2017}}\n\n感谢所有贡献者\n--------------\n\n|contributors|\n\n.. |contributors| image:: https:\u002F\u002Fcontributors-img.web.app\u002Fimage?repo=LAMDA-NJU\u002FDeep-Forest\n.. _contributors: https:\u002F\u002Fgithub.com\u002FLAMDA-NJU\u002FDeep-Forest\u002Fgraphs\u002Fcontributors","# Deep-Forest (DF21) 快速上手指南\n\nDeep Forest (DF21) 是周志华教授团队提出的深度森林算法的 2021 年优化版本。相比传统的随机森林或 GBDT，它在表格数据上具有更高的准确率，且参数调节更简单、训练效率更高。\n\n## 环境准备\n\n在开始之前，请确保您的开发环境满足以下要求：\n\n*   **操作系统**：Linux, macOS 或 Windows\n*   **Python 版本**：支持 Python 3.x（具体兼容版本请参考 PyPI 页面）\n*   **前置依赖**：\n    *   `pip` (Python 包管理工具)\n    *   `scikit-learn` (Deep-Forest 基于 sklearn 接口构建)\n    *   `numpy`, `scipy`\n\n> **提示**：建议在使用前更新 `pip` 至最新版本，以确保安装顺利。\n> ```bash\n> python -m pip install --upgrade pip\n> ```\n\n## 安装步骤\n\n您可以直接通过 PyPI 使用 `pip` 进行安装。\n\n### 标准安装\n```bash\npip install deep-forest\n```\n\n### 国内加速安装（推荐）\n如果您在中国大陆地区，建议使用国内镜像源以加快下载速度：\n```bash\npip install deep-forest -i https:\u002F\u002Fpypi.tuna.tsinghua.edu.cn\u002Fsimple\n```\n\n## 基本使用\n\nDeep-Forest 提供了与 `scikit-learn` 高度一致的 API，主要分为分类器 (`CascadeForestClassifier`) 和回归器 (`CascadeForestRegressor`)。\n\n### 1. 分类任务示例\n\n以下示例使用手写数字数据集进行快速分类演示：\n\n```python\nfrom sklearn.datasets import load_digits\nfrom sklearn.model_selection import train_test_split\nfrom sklearn.metrics import accuracy_score\n\nfrom deepforest import CascadeForestClassifier\n\n# 加载数据\nX, y = load_digits(return_X_y=True)\nX_train, X_test, y_train, y_test = train_test_split(X, y, random_state=1)\n\n# 初始化并训练模型\nmodel = CascadeForestClassifier(random_state=1)\nmodel.fit(X_train, y_train)\n\n# 预测与评估\ny_pred = model.predict(X_test)\nacc = accuracy_score(y_test, y_pred) * 100\nprint(\"\\nTesting Accuracy: {:.3f} %\".format(acc))\n```\n\n**预期输出：**\n```text\nTesting Accuracy: 98.667 %\n```\n\n### 2. 回归任务示例\n\n以下示例使用波士顿房价数据集（注：新版 sklearn 可能需要手动加载或使用替代数据集，此处保留原文逻辑）进行回归演示：\n\n```python\nfrom sklearn.datasets import load_boston\nfrom sklearn.model_selection import train_test_split\nfrom sklearn.metrics import mean_squared_error\n\nfrom deepforest import CascadeForestRegressor\n\n# 加载数据\nX, y = load_boston(return_X_y=True)\nX_train, X_test, y_train, y_test = train_test_split(X, y, random_state=1)\n\n# 初始化并训练模型\nmodel = CascadeForestRegressor(random_state=1)\nmodel.fit(X_train, y_train)\n\n# 预测与评估\ny_pred = model.predict(X_test)\nmse = mean_squared_error(y_test, y_pred)\nprint(\"\\nTesting MSE: {:.3f}\".format(mse))\n```\n\n**预期输出：**\n```text\nTesting MSE: 8.068\n```\n\n> **注意**：DF21 专为表格数据（Tabular Data）优化。如果您需要处理图像等非结构化数据并使用多粒度扫描（Multi-Grained Scanning）功能，请参考原始的 gcForest 实现。","某金融风控团队正在构建信用卡欺诈检测模型，需要在海量结构化交易数据中快速识别异常行为并上线生产。\n\n### 没有 Deep-Forest 时\n- **调参耗时巨大**：传统 GBDT 或随机森林模型对超参数极其敏感，数据科学家需花费数天进行网格搜索以寻找最优组合。\n- **精度遭遇瓶颈**：面对复杂的非线性欺诈特征，现有树模型集成方法的准确率难以突破，导致漏报率居高不下。\n- **训练效率低下**：随着交易数据量激增，模型训练时间显著拉长，难以满足业务对每日增量更新的时效要求。\n- **扩展性受限**：在处理千万级样本的大规模数据集时，内存占用过高，常导致任务中断或需要昂贵硬件支持。\n\n### 使用 Deep-Forest 后\n- **开箱即用省心**：Deep-Forest 具备强大的自适应能力，大幅减少人工调参工作量，默认配置即可在多数场景下获得优异表现。\n- **预测精度跃升**：凭借独特的级联森林结构，Deep-Forest 在表格数据上的分类准确率显著超越传统集成算法，有效降低欺诈漏报。\n- **训练速度飞快**：优化的底层架构使得模型训练效率大幅提升，能在短时间内完成全量数据建模，支持高频迭代。\n- **轻松应对大规模数据**：Deep-Forest 具有良好的可扩展性，能够流畅处理千万级行数据，无需过度依赖硬件升级。\n\nDeep-Forest 通过“少调参、高精度、快训练”的特性，为结构化数据的建模任务提供了比传统树模型更高效的终极解决方案。","https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002FLAMDA-NJU_Deep-Forest_b7e50170.png","LAMDA-NJU","LAMDA Group, Nanjing University","https:\u002F\u002Foss.gittoolsai.com\u002Favatars\u002FLAMDA-NJU_b09114f5.png","LAMDA is affiliated with the National Key Laboratory for Novel Software Technology and the Department of Computer Science & Technology, Nanjing University. ",null,"http:\u002F\u002Fwww.lamda.nju.edu.cn\u002FMainPage.ashx","https:\u002F\u002Fgithub.com\u002FLAMDA-NJU",[80,84,88],{"name":81,"color":82,"percentage":83},"Python","#3572A5",53.3,{"name":85,"color":86,"percentage":87},"Cython","#fedf5b",46.6,{"name":89,"color":90,"percentage":91},"Shell","#89e051",0,962,167,"2026-03-20T11:47:02","NOASSERTION",1,"未说明",{"notes":99,"python":100,"dependencies":101},"该工具是基于树的集成学习方法（Deep Forest），主要针对表格数据优化，不依赖深度学习框架（如 PyTorch 或 TensorFlow），因此通常无需 GPU。安装方式为 pip install deep-forest。若需处理图像等非结构化数据以利用多粒度扫描功能，需参考原始的 gcForest 实现。","3.6+",[102,103,104],"scikit-learn","numpy","scipy",[14],[107,108,109,110,111],"machine-learning","ensemble-learning","deep-forest","random-forest","python","2026-03-27T02:49:30.150509","2026-04-07T09:50:08.647930",[115,120,125,130,135,139],{"id":116,"question_zh":117,"answer_zh":118,"source_url":119},21520,"如何在 Mac (Apple Silicon) 或 Ubuntu 上解决 Deep Forest 的安装问题？","如果在安装过程中遇到 Cython 相关错误（如 splitter.pyx），建议执行以下步骤：\n1. 卸载现有的 miniforge3 和 anaconda。\n2. 重新下载并安装 Anaconda（Intel 或 Apple Silicon 版本）。\n3. 创建新的 conda 环境，确保使用 Python 3.9 版本。\n4. 安装 Cython 0.29.X 版本（注意版本号匹配）。\n5. 确保使用该 conda 环境中的 pip 进行安装。\n维护者配置参考：Python 3.9.12, Cython 0.29.x, macOS 10.16 (x86_64 模拟或原生适配)。","https:\u002F\u002Fgithub.com\u002FLAMDA-NJU\u002FDeep-Forest\u002Fissues\u002F133",{"id":121,"question_zh":122,"answer_zh":123,"source_url":124},21521,"使用 CascadeForestRegressor 进行回归预测时，报错提示目标值类型不正确（binary），如何解决？","当标签数据只有 0 和 1 时，`type_of_target` 函数可能将其识别为 'binary' 从而阻止回归操作。解决方法有两种：\n1. 尝试将标签（label）的数据类型转换为 float（例如 `y = y.astype(float)`），以绕过类型判断。\n2. 如果第一种方法无效，可以直接修改源码：找到报错 traceback 指向的文件，注释掉对 `type_of_target(y)` 的判断逻辑。","https:\u002F\u002Fgithub.com\u002FLAMDA-NJU\u002FDeep-Forest\u002Fissues\u002F41",{"id":126,"question_zh":127,"answer_zh":128,"source_url":129},21522,"Deep Forest (DF21) 模型是否支持类似 SHAP 或 Graphviz 的可解释性分析？","是的，项目计划并已开始支持 SHAP 可解释性。维护者提供了实现思路：可以通过编写 `_explainer.py` 文件，利用 `shap.TreeExplainer` 对 Deep Forest 中的单个森林估计器（forest estimator）进行解释。虽然完整的全局解释器仍在开发中，但用户可以先针对模型内部的单个森林层使用 SHAP 进行分析。","https:\u002F\u002Fgithub.com\u002FLAMDA-NJU\u002FDeep-Forest\u002Fissues\u002F12",{"id":131,"question_zh":132,"answer_zh":133,"source_url":134},21523,"如何处理图像数据？是否可以用 CNN 提取特征后再接 Deep Forest？","虽然理论上可以使用 CNN 提取特征再输入 Deep Forest，但根据实验结果，这种组合的效果通常不如直接使用“CNN + 简单分类器（如线性层+Softmax）”端到端优化的效果好。此外，Deep Forest 仓库的主要设计目标是处理**表格数据（tabular datasets）**，树模型在处理结构化图像数据方面通常不如 CNN 有效，因此不建议将树方法作为处理图像数据的首选方案。","https:\u002F\u002Fgithub.com\u002FLAMDA-NJU\u002FDeep-Forest\u002Fissues\u002F26",{"id":136,"question_zh":137,"answer_zh":138,"source_url":134},21524,"如何自定义 CascadeForestClassifier 中的基分类器（如替换 RandomForest 或 ExtraTrees）？","虽然用户提出了自定义基分类器的需求，但根据维护者的回复，该库的核心重点是针对表格数据提供高效的 Deep Forest 实现。目前官方并未直接提供简单的接口来随意替换内部的 RandomForestClassifier 或 ExtraTreesClassifier 为其他任意模型。对于特殊需求，可能需要深入修改源码中的森林构建逻辑，或者考虑该库主要适用于标准树模型组合的场景。",{"id":140,"question_zh":141,"answer_zh":142,"source_url":124},21525,"遇到 MemoryError: could not allocate 0 bytes 错误怎么办？","该错误通常发生在构建树的过程中（`DepthFirstTreeBuilder`）。虽然报错显示内存不足，但有时即使系统有空闲内存也会触发。这可能与数据规模过大或特定版本的内存分配机制有关。建议检查输入数据的规模，尝试减少样本量或特征维度。如果问题持续，请确保使用的是最新版本的库，因为此类底层内存管理问题可能在后续更新中得到修复。",[144,149,154,159,164,169,174],{"id":145,"version":146,"summary_zh":147,"released_at":148},127526,"v0.1.7","快速修复 NumPy 兼容性问题。","2022-10-01T04:05:07",{"id":150,"version":151,"summary_zh":152,"released_at":153},127527,"v0.1.6","* 优化包兼容性 | @xuyxu \r\n* 增加对 Pandas DataFrame 和列表的支持 | @IncubatorShokuhou \r\n* 修复 minor bug | @xuyxu ","2022-09-17T16:25:07",{"id":155,"version":156,"summary_zh":157,"released_at":158},127528,"v0.1.5","本次发布包括：\n* 正式支持 Python 3.9\n* 修复自定义模式下深度森林的 bug","2021-04-16T10:58:06",{"id":160,"version":161,"summary_zh":162,"released_at":163},127529,"v0.1.4","## 新增\n* 添加对自定义估计器的支持 (#48) @xuyxu\n* 正式支持 ManyLinux-aarch64 (#47) @xuyxu\n\n## 修复\n* 修复仅有一个级联层时的预测流程 (#56) @xuyxu\n* 修复预测器名称不一致的问题 (#52) @xuyxu\n* 修复 `CascadeForestRegressor` 目标变量的接受类型问题 (#44) @xuyxu\n\n## 改进\n* 改进 `CascadeForestRegressor` 的目标变量检查 (#53) @chendingyan","2021-03-11T10:13:06",{"id":165,"version":166,"summary_zh":167,"released_at":168},127530,"v0.1.3","## 新增\n* 为 `CascadeForestRegressor` 添加多输出支持 (#40) @Alex-Medium\n* 添加逐层特征重要性 (#39) @xuyxu\n* 添加 scikit-learn 后端 (#36) @xuyxu\n* 添加对 Mac OS 的官方支持 (#34) @T-Allen-sudo\n* 添加可配置准则的支持 (#28) @tczhao","2021-02-22T16:25:48",{"id":170,"version":171,"summary_zh":172,"released_at":173},127531,"v0.1.2","## 新增\n* 添加用于回归问题的 `CascadeForestRegressor` (#25) @tczhao","2021-02-11T03:31:49",{"id":175,"version":176,"summary_zh":177,"released_at":178},127532,"v0.1.1","## 新增\n* 实现 `get_forest()` 方法，用于高效索引 (#22) @xuyxu\n* 支持类别标签编码 (#18) @NiMaZi\n* 在 `fit()` 中支持样本权重 (#7) @tczhao\n* 添加可配置的预测器参数 (#9) @tczhao\n* 添加基类 `BaseEstimator` 和 `ClassifierMixin` (#8) @pjgao\n\n## 修复\n* 修复分箱器接受的数据类型 (#23) @xuyxu","2021-02-07T08:03:21"]