[{"data":1,"prerenderedAt":-1},["ShallowReactive",2],{"similar-openml--OpenML":3,"tool-openml--OpenML":61},[4,18,28,37,45,53],{"id":5,"name":6,"github_repo":7,"description_zh":8,"stars":9,"difficulty_score":10,"last_commit_at":11,"category_tags":12,"status":17},4358,"openclaw","openclaw\u002Fopenclaw","OpenClaw 是一款专为个人打造的本地化 AI 助手，旨在让你在自己的设备上拥有完全可控的智能伙伴。它打破了传统 AI 助手局限于特定网页或应用的束缚，能够直接接入你日常使用的各类通讯渠道，包括微信、WhatsApp、Telegram、Discord、iMessage 等数十种平台。无论你在哪个聊天软件中发送消息，OpenClaw 都能即时响应，甚至支持在 macOS、iOS 和 Android 设备上进行语音交互，并提供实时的画布渲染功能供你操控。\n\n这款工具主要解决了用户对数据隐私、响应速度以及“始终在线”体验的需求。通过将 AI 部署在本地，用户无需依赖云端服务即可享受快速、私密的智能辅助，真正实现了“你的数据，你做主”。其独特的技术亮点在于强大的网关架构，将控制平面与核心助手分离，确保跨平台通信的流畅性与扩展性。\n\nOpenClaw 非常适合希望构建个性化工作流的技术爱好者、开发者，以及注重隐私保护且不愿被单一生态绑定的普通用户。只要具备基础的终端操作能力（支持 macOS、Linux 及 Windows WSL2），即可通过简单的命令行引导完成部署。如果你渴望拥有一个懂你",349277,3,"2026-04-06T06:32:30",[13,14,15,16],"Agent","开发框架","图像","数据工具","ready",{"id":19,"name":20,"github_repo":21,"description_zh":22,"stars":23,"difficulty_score":24,"last_commit_at":25,"category_tags":26,"status":17},9989,"n8n","n8n-io\u002Fn8n","n8n 是一款面向技术团队的公平代码（fair-code）工作流自动化平台，旨在让用户在享受低代码快速构建便利的同时，保留编写自定义代码的灵活性。它主要解决了传统自动化工具要么过于封闭难以扩展、要么完全依赖手写代码效率低下的痛点，帮助用户轻松连接 400 多种应用与服务，实现复杂业务流程的自动化。\n\nn8n 特别适合开发者、工程师以及具备一定技术背景的业务人员使用。其核心亮点在于“按需编码”：既可以通过直观的可视化界面拖拽节点搭建流程，也能随时插入 JavaScript 或 Python 代码、调用 npm 包来处理复杂逻辑。此外，n8n 原生集成了基于 LangChain 的 AI 能力，支持用户利用自有数据和模型构建智能体工作流。在部署方面，n8n 提供极高的自由度，支持完全自托管以保障数据隐私和控制权，也提供云端服务选项。凭借活跃的社区生态和数百个现成模板，n8n 让构建强大且可控的自动化系统变得简单高效。",184740,2,"2026-04-19T23:22:26",[16,14,13,15,27],"插件",{"id":29,"name":30,"github_repo":31,"description_zh":32,"stars":33,"difficulty_score":10,"last_commit_at":34,"category_tags":35,"status":17},10095,"AutoGPT","Significant-Gravitas\u002FAutoGPT","AutoGPT 是一个旨在让每个人都能轻松使用和构建 AI 的强大平台，核心功能是帮助用户创建、部署和管理能够自动执行复杂任务的连续型 AI 智能体。它解决了传统 AI 应用中需要频繁人工干预、难以自动化长流程工作的痛点，让用户只需设定目标，AI 即可自主规划步骤、调用工具并持续运行直至完成任务。\n\n无论是开发者、研究人员，还是希望提升工作效率的普通用户，都能从 AutoGPT 中受益。开发者可利用其低代码界面快速定制专属智能体；研究人员能基于开源架构探索多智能体协作机制；而非技术背景用户也可直接选用预置的智能体模板，立即投入实际工作场景。\n\nAutoGPT 的技术亮点在于其模块化“积木式”工作流设计——用户通过连接功能块即可构建复杂逻辑，每个块负责单一动作，灵活且易于调试。同时，平台支持本地自托管与云端部署两种模式，兼顾数据隐私与使用便捷性。配合完善的文档和一键安装脚本，即使是初次接触的用户也能在几分钟内启动自己的第一个 AI 智能体。AutoGPT 正致力于降低 AI 应用门槛，让人人都能成为 AI 的创造者与受益者。",183572,"2026-04-20T04:47:55",[13,36,27,14,15],"语言模型",{"id":38,"name":39,"github_repo":40,"description_zh":41,"stars":42,"difficulty_score":10,"last_commit_at":43,"category_tags":44,"status":17},3808,"stable-diffusion-webui","AUTOMATIC1111\u002Fstable-diffusion-webui","stable-diffusion-webui 是一个基于 Gradio 构建的网页版操作界面，旨在让用户能够轻松地在本地运行和使用强大的 Stable Diffusion 图像生成模型。它解决了原始模型依赖命令行、操作门槛高且功能分散的痛点，将复杂的 AI 绘图流程整合进一个直观易用的图形化平台。\n\n无论是希望快速上手的普通创作者、需要精细控制画面细节的设计师，还是想要深入探索模型潜力的开发者与研究人员，都能从中获益。其核心亮点在于极高的功能丰富度：不仅支持文生图、图生图、局部重绘（Inpainting）和外绘（Outpainting）等基础模式，还独创了注意力机制调整、提示词矩阵、负向提示词以及“高清修复”等高级功能。此外，它内置了 GFPGAN 和 CodeFormer 等人脸修复工具，支持多种神经网络放大算法，并允许用户通过插件系统无限扩展能力。即使是显存有限的设备，stable-diffusion-webui 也提供了相应的优化选项，让高质量的 AI 艺术创作变得触手可及。",162132,"2026-04-05T11:01:52",[14,15,13],{"id":46,"name":47,"github_repo":48,"description_zh":49,"stars":50,"difficulty_score":24,"last_commit_at":51,"category_tags":52,"status":17},1381,"everything-claude-code","affaan-m\u002Feverything-claude-code","everything-claude-code 是一套专为 AI 编程助手（如 Claude Code、Codex、Cursor 等）打造的高性能优化系统。它不仅仅是一组配置文件，而是一个经过长期实战打磨的完整框架，旨在解决 AI 代理在实际开发中面临的效率低下、记忆丢失、安全隐患及缺乏持续学习能力等核心痛点。\n\n通过引入技能模块化、直觉增强、记忆持久化机制以及内置的安全扫描功能，everything-claude-code 能显著提升 AI 在复杂任务中的表现，帮助开发者构建更稳定、更智能的生产级 AI 代理。其独特的“研究优先”开发理念和针对 Token 消耗的优化策略，使得模型响应更快、成本更低，同时有效防御潜在的攻击向量。\n\n这套工具特别适合软件开发者、AI 研究人员以及希望深度定制 AI 工作流的技术团队使用。无论您是在构建大型代码库，还是需要 AI 协助进行安全审计与自动化测试，everything-claude-code 都能提供强大的底层支持。作为一个曾荣获 Anthropic 黑客大奖的开源项目，它融合了多语言支持与丰富的实战钩子（hooks），让 AI 真正成长为懂上",161147,"2026-04-19T23:31:47",[14,13,36],{"id":54,"name":55,"github_repo":56,"description_zh":57,"stars":58,"difficulty_score":24,"last_commit_at":59,"category_tags":60,"status":17},2271,"ComfyUI","Comfy-Org\u002FComfyUI","ComfyUI 是一款功能强大且高度模块化的视觉 AI 引擎，专为设计和执行复杂的 Stable Diffusion 图像生成流程而打造。它摒弃了传统的代码编写模式，采用直观的节点式流程图界面，让用户通过连接不同的功能模块即可构建个性化的生成管线。\n\n这一设计巧妙解决了高级 AI 绘图工作流配置复杂、灵活性不足的痛点。用户无需具备编程背景，也能自由组合模型、调整参数并实时预览效果，轻松实现从基础文生图到多步骤高清修复等各类复杂任务。ComfyUI 拥有极佳的兼容性，不仅支持 Windows、macOS 和 Linux 全平台，还广泛适配 NVIDIA、AMD、Intel 及苹果 Silicon 等多种硬件架构，并率先支持 SDXL、Flux、SD3 等前沿模型。\n\n无论是希望深入探索算法潜力的研究人员和开发者，还是追求极致创作自由度的设计师与资深 AI 绘画爱好者，ComfyUI 都能提供强大的支持。其独特的模块化架构允许社区不断扩展新功能，使其成为当前最灵活、生态最丰富的开源扩散模型工具之一，帮助用户将创意高效转化为现实。",109154,"2026-04-18T11:18:24",[14,15,13],{"id":62,"github_repo":63,"name":64,"description_en":65,"description_zh":66,"ai_summary_zh":67,"readme_en":68,"readme_zh":69,"quickstart_zh":70,"use_case_zh":71,"hero_image_url":72,"owner_login":73,"owner_name":64,"owner_avatar_url":74,"owner_bio":75,"owner_company":76,"owner_location":76,"owner_email":77,"owner_twitter":78,"owner_website":79,"owner_url":80,"languages":81,"stars":119,"forks":120,"last_commit_at":121,"license":122,"difficulty_score":123,"env_os":124,"env_gpu":125,"env_ram":125,"env_deps":126,"category_tags":130,"github_topics":132,"view_count":24,"oss_zip_url":76,"oss_zip_packed_at":76,"status":17,"created_at":141,"updated_at":142,"faqs":143,"releases":179},10083,"openml\u002FOpenML","OpenML","Open Machine Learning","OpenML 是一个致力于推动开放科学的在线机器学习平台，旨在让数据、算法和实验的共享与协作变得简单高效。它构建了一个无缝连接的网络生态，允许全球研究者打破工具壁垒，直接基于他人的最新数据、思路和结果进行创新，从而实现人机之间最优的分工协作。\n\n在科研领域，重复搭建实验环境和手动整理数据往往耗费大量精力。OpenML 有效解决了这一痛点，它将分散的研究资源标准化并集中管理。研究人员无需再花费数天时间重新运行他人的实验或从头寻找数据集，只需几分钟即可复用已有的工作流，快速回答关于超参数调优、最佳分析路径或数据集相似性等关键问题。这不仅极大地节省了时间，还确保了新实验能即时与当前最高水平进行公平对比。\n\nOpenML 特别适合机器学习研究人员、数据科学家以及高校师生使用。无论是需要验证新算法的学者，还是希望复现经典实验的开发者，都能从中受益。其独特的技术亮点在于提供了灵活的 API 接口和广泛的集成方案（如与 scikit-learn 深度整合），让用户能够直接在熟悉的编程环境中调用平台资源。尽管其后端架构正在向更现代的 FastAPI 迁移，但 OpenML 始终保持着对开放数据和可复现","OpenML 是一个致力于推动开放科学的在线机器学习平台，旨在让数据、算法和实验的共享与协作变得简单高效。它构建了一个无缝连接的网络生态，允许全球研究者打破工具壁垒，直接基于他人的最新数据、思路和结果进行创新，从而实现人机之间最优的分工协作。\n\n在科研领域，重复搭建实验环境和手动整理数据往往耗费大量精力。OpenML 有效解决了这一痛点，它将分散的研究资源标准化并集中管理。研究人员无需再花费数天时间重新运行他人的实验或从头寻找数据集，只需几分钟即可复用已有的工作流，快速回答关于超参数调优、最佳分析路径或数据集相似性等关键问题。这不仅极大地节省了时间，还确保了新实验能即时与当前最高水平进行公平对比。\n\nOpenML 特别适合机器学习研究人员、数据科学家以及高校师生使用。无论是需要验证新算法的学者，还是希望复现经典实验的开发者，都能从中受益。其独特的技术亮点在于提供了灵活的 API 接口和广泛的集成方案（如与 scikit-learn 深度整合），让用户能够直接在熟悉的编程环境中调用平台资源。尽管其后端架构正在向更现代的 FastAPI 迁移，但 OpenML 始终保持着对开放数据和可复现性的坚定承诺，是促进跨学科合作与加速科学发现的得力助手。","\n[![License](https:\u002F\u002Fimg.shields.io\u002Fbadge\u002FLicense-BSD%203--Clause-blue.svg)](https:\u002F\u002Fopensource.org\u002Flicenses\u002FBSD-3-Clause)\n\n> [!WARNING]\n> This repository is in maintenance-only mode. We're phasing out the PHP-based REST API in favor of a much more modern [FastAPI-based API](https:\u002F\u002Fgithub.com\u002Fopenml\u002Fserver-api).\n> For more details, please check the [contribution guide](https:\u002F\u002Fgithub.com\u002Fopenml).\n\n\nOpenML: Open Machine Learning\n=============================\nWelcome to the OpenML GitHub page! :tada:\n\nContents:\n\u003C!-- TOC depthFrom:2 depthTo:6 withLinks:1 updateOnSave:1 orderedList:0 -->\n* [Who are we?](#who-are-we)\n* [What is OpenML?](#what-is-openml)\n     * [Benefits for Science](#benefits-for-science)\n     * [Benefits for Scientists](#benefits-for-scientists)\n     * [Benefits for Society](#benefits-for-society)\n* [Get involved](#get-involved)\n\u003C!-- \u002FTOC -->\n\n## Who are we?\nWe are a group of people who are excited about open science, open data and machine learning. \nWe want to make machine learning and data analysis **simple**, **accessible**, **collaborative** and **open** with an optimal **division of labour** between computers and humans. \n\n## What is OpenML?\nWant to learn about OpenML or get involved? Please do and [get in touch](openmlHQ@googlegroups.com) in case of questions or comments! :incoming_envelope:\n\n- Getting started:\n    - Check out the [OpenML Website](https:\u002F\u002Fwww.openml.org) to get a first impression of what OpenML is \n    - The OpenML [Documentation page](https:\u002F\u002Fopenml.github.io\u002FOpenML\u002F) gives an introduction in details and features, as well as\n    - OpenML's different [APIs](https:\u002F\u002Fopenml.github.io\u002FOpenML\u002FAPIs) and [integrations](https:\u002F\u002Fopenml.github.io\u002FOpenML\u002Fsklearn\u002F) so that everyone can work with their favorite tool. \n- How to contribute: https:\u002F\u002Fgithub.com\u002Fopenml\u002FOpenML\u002Fblob\u002Fmaster\u002FCONTRIBUTING.md \n- Citation and Honor Code: https:\u002F\u002Fwww.openml.org\u002Fterms\n- Communication \u002F Contact: https:\u002F\u002Fgithub.com\u002Fopenml\u002FOpenML\u002Fwiki\u002FCommunication-Channels\n\nOpenML is an online machine learning platform for sharing and organizing data, machine learning algorithms and experiments. It is designed to create a frictionless, networked ecosystem, that you can readily integrate into your existing processes\u002Fcode\u002Fenvironments, allowing people all over the world to collaborate and build directly on each other’s latest ideas, data and results, irrespective of the tools and infrastructure they happen to use. \n\nAs an open science platform, OpenML provides important benefits for the science community and beyond.\n\n### Benefits for Science\nMany sciences have made significant breakthroughs by adopting online tools that help organizing, structuring and analyzing scientific data\nonline. Indeed, any shared idea, question, observation or tool may be noticed by someone who has just the right expertise to spark new ideas, answer open questions, reinterpret observations or reuse data and tools in unexpected new ways. Therefore, sharing research results and collaborating online as a (possibly cross-disciplinary) team enables scientists to quickly build on and extend the results of others,\nfostering new discoveries.\n\nMoreover, ever larger studies become feasible as a lot of data are already available. Questions such as “Which hyperparameter is important to tune?”, “Which is the best known workflow for analyzing this data set?” or “Which data sets are similar in structure to my own?” can be answered in minutes by reusing prior experiments, instead of spending days setting up and running new experiments.\n\n### Benefits for Scientists\nScientists can also benefit personally from using OpenML. For example, they can save time, because OpenML assists in many routine and tedious duties: finding data sets, tasks, flows and prior results, setting up experiments and organizing all experiments for further analysis. Moreover, new experiments are immediately compared to the state of the art without always having to rerun other people’s\nexperiments. \n\nAnother benefit is that linking one’s results to those of others has a large potential for new discoveries (see, for instance, Feurer et al. 2015; Post et al. 2016; Probst et al. 2017), leading to more publications and more collaboration with other scientists all over the world.\n\nFinally, OpenML can help scientists to reinforce their reputation by making their work (published or not) visible to a wide group of people and by showing how often one’s data, code and experiments are downloaded or reused in the experiments of others.\n\n### Benefits for Society\nOpenML also provides a useful learning and working environment for students, citizen scientists and practitioners. Students and citizen scientist can easily explore the state of the art and work together with top minds by contributing their own algorithms and experiments. Teachers can challenge their students by letting them compete on OpenML tasks or by reusing OpenML data in assignments. Finally, machine learning practitioners can explore and reuse the best solutions for specific analysis problems, interact with the scientific community or efficiently try out many possible approaches.\n\n-------------------\n## Get involved\n\nOpenML has grown into quite a big project. We could use many more hands to help us out :wrench:. \n\n- **You want to contribute?**: Awesome! Check out our wiki page on [how to contribute](https:\u002F\u002Fgithub.com\u002Fopenml\u002FOpenML\u002Fwiki\u002FHow-to-contribute) or [get in touch](https:\u002F\u002Fgithub.com\u002Fopenml\u002FOpenML\u002Fwiki\u002FCommunication-Channels). There may be unexpected ways for how you could help. We are open for any ideas. \n- **You want to support us financially?**: YES! Getting funding through conventional channels is very competitive, and we are happy about every small contribution. Please send an email to openmlHQ@googlegroups.com!\n\n\n-------------------\n## GitHub organization structure\n\nOpenML's code distrubuted over different repositories to simplify development. Please see their individual readme's and issue trackers of you like to contribute. These are the most important ones:\n\n- **[openml\u002FOpenML](https:\u002F\u002Fgithub.com\u002Fopenml\u002Fopenml)**: The OpenML web application, including the REST API.\n- **[openml\u002Fopenml-python](https:\u002F\u002Fgithub.com\u002Fopenml\u002Fopenml-python)**: The Python API, to talk to OpenML from Python scripts (including scikit-learn).\n- **[openml\u002Fopenml-r](https:\u002F\u002Fgithub.com\u002Fopenml\u002Fopenml-r)**: The R API, to talk to OpenML from R scripts (inclusing mlr).\n- **[openml\u002Fjava](https:\u002F\u002Fgithub.com\u002Fopenml\u002Fjava)**: The Java API, to talk to OpenML from Java scripts.\n- **[openml\u002Fopenml-weka](https:\u002F\u002Fgithub.com\u002Fopenml\u002Fopenml-weka)**: The WEKA plugin, to talk to OpenML from the WEKA toolbox.\n\n\n\n\n\n","[![许可证](https:\u002F\u002Fimg.shields.io\u002Fbadge\u002FLicense-BSD%203--Clause-blue.svg)](https:\u002F\u002Fopensource.org\u002Flicenses\u002FBSD-3-Clause)\n\n> [!警告]\n> 本仓库目前仅处于维护模式。我们正逐步淘汰基于PHP的REST API，转而采用更为现代化的[基于FastAPI的API](https:\u002F\u002Fgithub.com\u002Fopenml\u002Fserver-api)。\n> 更多详情请参阅[贡献指南](https:\u002F\u002Fgithub.com\u002Fopenml)。\n\nOpenML：开放机器学习\n=====================\n欢迎来到OpenML的GitHub页面！ :tada:\n\n目录：\n\u003C!-- TOC depthFrom:2 depthTo:6 withLinks:1 updateOnSave:1 orderedList:0 -->\n* [我们是谁？](#who-are-we)\n* [什么是OpenML？](#what-is-openml)\n     * [对科学的好处](#benefits-for-science)\n     * [对科学家的好处](#benefits-for-scientists)\n     * [对社会的好处](#benefits-for-society)\n* [参与进来](#get-involved)\n\u003C!-- \u002FTOC -->\n\n## 我们是谁？\n我们是一群热衷于开放科学、开放数据和机器学习的人。我们希望通过计算机与人类之间的最佳**分工协作**，让机器学习和数据分析变得**简单**、**可及**、**协作性高**且**开放**。\n\n## 什么是OpenML？\n想了解OpenML或参与其中吗？请随时行动，并在有任何问题或意见时与我们[联系](openmlHQ@googlegroups.com)！ :incoming_envelope:\n\n- 入门：\n    - 访问[OpenML官网](https:\u002F\u002Fwww.openml.org)，初步了解OpenML是什么。\n    - OpenML的[文档页面](https:\u002F\u002Fopenml.github.io\u002FOpenML\u002F)提供了详细的介绍和功能说明，以及\n    - OpenML的不同[API](https:\u002F\u002Fopenml.github.io\u002FOpenML\u002FAPIs)和[集成](https:\u002F\u002Fopenml.github.io\u002FOpenML\u002Fsklearn\u002F)，以便每个人都能使用自己喜爱的工具。\n- 如何贡献：https:\u002F\u002Fgithub.com\u002Fopenml\u002FOpenML\u002Fblob\u002Fmaster\u002FCONTRIBUTING.md \n- 引用与荣誉准则：https:\u002F\u002Fwww.openml.org\u002Fterms\n- 沟通\u002F联系方式：https:\u002F\u002Fgithub.com\u002Fopenml\u002FOpenML\u002Fwiki\u002FCommunication-Channels\n\nOpenML是一个用于共享和组织数据、机器学习算法及实验的在线机器学习平台。它旨在创建一个无摩擦、网络化的生态系统，您可以轻松地将其集成到现有的流程、代码或环境中，使全球各地的人们能够协作并直接建立在他人的最新想法、数据和成果之上，无论他们使用何种工具和基础设施。\n\n作为开放科学平台，OpenML为科学界及其他领域带来了重要益处。\n\n### 对科学的好处\n许多学科通过采用在线工具来组织、结构化和分析科学数据，取得了重大突破。事实上，任何共享的想法、问题、观察或工具，都可能被恰好具备相关专业知识的人注意到，从而激发新思路、解答未解决问题、重新诠释观察结果，或以意想不到的方式重复利用数据和工具。因此，以团队形式（甚至跨学科）在线分享研究成果并开展协作，能够让科学家们迅速借鉴和扩展他人的成果，促进新的发现。\n\n此外，随着大量已有数据的可用，规模更大的研究也变得可行。诸如“哪个超参数需要调优？”、“分析该数据集的最佳已知工作流是什么？”或“哪些数据集与我的数据结构相似？”等问题，都可以通过复用先前的实验在几分钟内得到解答，而无需花费数天时间来搭建和运行新的实验。\n\n### 对科学家的好处\n科学家们也可以从使用OpenML中获得个人收益。例如，他们可以节省时间，因为OpenML协助处理许多常规且繁琐的任务：查找数据集、任务、流程和先前的研究成果，设置实验，并将所有实验整理好以供进一步分析。此外，新实验会立即与当前最先进的水平进行比较，而无需总是重新运行他人的实验。\n\n另一个好处是，将自己的研究成果与其他人的成果关联起来，具有巨大的潜在价值（例如，见Feurer等，2015年；Post等，2016年；Probst等，2017年），这将带来更多论文发表机会，并促进与世界各地其他科学家的合作。\n\n最后，OpenML还可以帮助科学家提升声誉，通过让其工作（无论是否已发表）被广泛人群所知晓，以及展示其数据、代码和实验被他人下载或重用的频率。\n\n### 对社会的好处\nOpenML也为学生、公民科学家和从业者提供了一个有用的学习和工作环境。学生和公民科学家可以通过贡献自己的算法和实验，轻松探索前沿技术并与顶尖专家合作。教师可以挑战学生，在OpenML任务上展开竞争，或将OpenML数据融入作业中。最后，机器学习从业者可以探索和重用针对特定分析问题的最佳解决方案，与科学界互动，或高效地尝试多种可能的方法。\n\n-------------------\n## 参与进来\n\nOpenML已经发展成为一个相当大的项目。我们非常需要更多人来帮忙 :wrench:。\n\n- **您想贡献吗？**：太棒了！请查看我们的维基页面上的[如何贡献](https:\u002F\u002Fgithub.com\u002Fopenml\u002FOpenML\u002Fwiki\u002FHow-to-contribute)说明，或[联系我们](https:\u002F\u002Fgithub.com\u002Fopenml\u002FOpenML\u002Fwiki\u002FCommunication-Channels)。您或许能以意想不到的方式提供帮助。我们欢迎任何创意。\n- **您想为我们提供资金支持吗？**：当然！通过传统渠道获得资助竞争非常激烈，我们对每一份小额捐助都深表感谢。请发送邮件至openmlHQ@googlegroups.com！\n\n\n-------------------\n## GitHub组织结构\n\n为了简化开发，OpenML的代码分布在不同的仓库中。如果您想参与贡献，请查看各个仓库的README文件和问题跟踪器。以下是其中最重要的几个：\n\n- **[openml\u002FOpenML](https:\u002F\u002Fgithub.com\u002Fopenml\u002Fopenml)**：OpenML Web应用，包括REST API。\n- **[openml\u002Fopenml-python](https:\u002F\u002Fgithub.com\u002Fopenml\u002Fopenml-python)**：Python API，用于从Python脚本（包括scikit-learn）与OpenML交互。\n- **[openml\u002Fopenml-r](https:\u002F\u002Fgithub.com\u002Fopenml\u002Fopenml-r)**：R API，用于从R脚本（包括mlr）与OpenML交互。\n- **[openml\u002Fjava](https:\u002F\u002Fgithub.com\u002Fopenml\u002Fjava)**：Java API，用于从Java脚本与OpenML交互。\n- **[openml\u002Fopenml-weka](https:\u002F\u002Fgithub.com\u002Fopenml\u002Fopenml-weka)**：WEKA插件，用于从WEKA工具箱与OpenML交互。","# OpenML 快速上手指南\n\n> **⚠️ 重要提示**\n> 当前主仓库（PHP 版 REST API）已进入仅维护模式。官方正逐步迁移至基于 **FastAPI** 的新版服务端 API。对于新开发项目，建议优先参考新版 API 文档及对应的客户端库。本指南主要介绍如何通过各语言客户端与 OpenML 平台交互。\n\nOpenML 是一个开放的机器学习平台，旨在共享和整理数据、算法及实验结果，促进全球协作。\n\n## 环境准备\n\n在开始之前，请确保您的开发环境满足以下基本要求：\n\n*   **操作系统**：Linux, macOS 或 Windows。\n*   **网络连接**：需要访问 `www.openml.org`（如遇网络延迟，可尝试配置代理）。\n*   **前置依赖**：根据您使用的编程语言，安装相应的运行时环境：\n    *   **Python 用户**：Python 3.7+ 及 `pip`。\n    *   **R 用户**：R 环境及 `CRAN` 包管理工具。\n    *   **Java 用户**：JDK 8+ 及 Maven\u002FGradle。\n*   **OpenML 账号（可选但推荐）**：访问 [openml.org](https:\u002F\u002Fwww.openml.org) 注册账号并获取 **API Key**，以便上传数据或提交实验结果。\n\n## 安装步骤\n\nOpenML 提供了多种语言的客户端库，请选择适合您技术栈的安装方式。\n\n### 1. Python (推荐，集成 scikit-learn)\n\n使用 pip 安装官方 Python 客户端：\n\n```bash\npip install openml\n```\n\n若需结合 scikit-learn 使用，确保已安装 scikit-learn：\n\n```bash\npip install scikit-learn\n```\n\n### 2. R 语言\n\n在 R 控制台或 RStudio 中运行：\n\n```R\ninstall.packages(\"OpenML\")\n```\n\n### 3. Java \u002F WEKA\n\n**Maven 项目**，在 `pom.xml` 中添加依赖：\n\n```xml\n\u003Cdependency>\n    \u003CgroupId>org.openml\u003C\u002FgroupId>\n    \u003CartifactId>openml-java\u003C\u002FartifactId>\n    \u003Cversion>0.13.0\u003C\u002Fversion> \u003C!-- 请检查最新版本号 -->\n\u003C\u002Fdependency>\n```\n\n**WEKA 用户**：可通过 WEKA 的包管理器安装 `OpenML` 插件，或将 jar 包放入 WEKA 的 `packages` 目录。\n\n## 基本使用\n\n以下以最常用的 **Python** 为例，展示如何下载数据集并运行一个简单的机器学习实验。\n\n### 第一步：配置 API Key (可选)\n\n如果您需要上传数据或提交结果，请在代码开头设置 API Key：\n\n```python\nimport openml\n\n# 替换为您在 openml.org 获取的 API Key\nopenml.config.apikey = 'YOUR_API_KEY_HERE'\n```\n\n### 第二步：下载数据集\n\n直接从 OpenML 服务器获取经典数据集（例如 Iris）：\n\n```python\nimport openml\n\n# 通过 ID 获取数据集 (Iris 数据集 ID 为 61)\ndataset = openml.datasets.get_dataset(61)\n\n# 将数据加载为 pandas DataFrame 和 numpy 数组\nX, y, categorical_indicator, attribute_names = dataset.get_data(\n    dataset_format='array', \n    target=dataset.default_target_attribute\n)\n\nprint(f\"数据集名称：{dataset.name}\")\nprint(f\"特征形状：{X.shape}\")\n```\n\n### 第三步：运行实验并上传结果\n\n结合 `scikit-learn` 构建模型，并在 OpenML 任务上运行实验：\n\n```python\nfrom sklearn import ensemble\nfrom sklearn.model_selection import cross_val_score\nimport openml\n\n# 获取一个分类任务 (例如 Iris 上的分类任务 ID 为 164020)\ntask = openml.tasks.get_task(164020)\n\n# 定义模型\nclf = ensemble.RandomForestClassifier(n_estimators=10, random_state=42)\n\n# 在 OpenML 任务上运行模型\nrun = openml.runs.run_model_on_task(clf, task)\n\n# 发布运行结果到 OpenML 服务器 (需配置 API Key)\n# run.publish() \n\nprint(f\"实验运行完成，本地评估分数：{run.data_content['predictions']}\")\n```\n\n### 第四步：探索现有流（工作流）\n\n查看其他人提交的优秀解决方案：\n\n```python\n# 搜索特定的机器学习流 (Flow)\nflows = openml.flows.list_flows(tag='study_14', output_format='dataframe')\nprint(flows.head())\n```\n\n---\n*更多语言（R\u002FJava）的详细用法及高级功能，请访问 [OpenML 官方文档](https:\u002F\u002Fopenml.github.io\u002FOpenML\u002F) 及各语言客户端仓库。*","某高校数据科学团队正在研究医疗影像分类算法，急需验证新模型在多个公开数据集上的泛化能力并复现前沿成果。\n\n### 没有 OpenML 时\n- 研究人员需花费数天时间在不同网站手动搜寻、下载并清洗格式各异的医疗数据集，且难以确认数据版本的一致性。\n- 复现论文结果时，因缺乏统一的实验环境和超参数记录，团队成员不得不反复猜测配置或重新运行他人代码，耗时耗力。\n- 每次实验产生的大量日志和模型文件散落在本地硬盘，缺乏集中管理，导致团队协作时难以快速对比不同策略的优劣。\n- 想要回答“哪些数据集结构与当前任务相似”或“该任务的最佳已知工作流是什么”等问题时，只能依靠人工查阅文献，效率极低。\n\n### 使用 OpenML 后\n- 通过 OpenML 的 API 直接调用已标准化清洗的医疗影像数据集，一键获取元数据，将数据准备时间从数天缩短至几分钟。\n- 直接复用平台上记录的完整实验流程（Flows）和超参数配置，无需重新调试即可在相同基准下立即对比新模型与现有最佳结果。\n- 所有实验自动上传至云端进行版本管理和结构化存储，团队成员可实时查看、筛选并可视化分析历史实验数据，协作效率大幅提升。\n- 利用平台的搜索与推荐功能，瞬间找到结构相似的数据集及该领域的最优工作流，为算法改进提供明确方向。\n\nOpenML 通过构建无缝协作的机器学习生态，让研究人员从繁琐的数据整理和实验复现中解放出来，专注于核心算法的创新与突破。","https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002Fopenml_OpenML_dfd7fc60.png","openml","https:\u002F\u002Foss.gittoolsai.com\u002Favatars\u002Fopenml_6732a915.png","Open, Networked Machine Learning ",null,"openmlhq@googlegroups.com","open_ml","http:\u002F\u002Fwww.openml.org","https:\u002F\u002Fgithub.com\u002Fopenml",[82,86,90,94,98,102,106,109,113,116],{"name":83,"color":84,"percentage":85},"PHP","#4F5D95",35.3,{"name":87,"color":88,"percentage":89},"CSS","#663399",33.2,{"name":91,"color":92,"percentage":93},"JavaScript","#f1e05a",29.4,{"name":95,"color":96,"percentage":97},"Processing","#0096D8",1.5,{"name":99,"color":100,"percentage":101},"Hack","#878787",0.3,{"name":103,"color":104,"percentage":105},"HTML","#e34c26",0.1,{"name":107,"color":108,"percentage":105},"Shell","#89e051",{"name":110,"color":111,"percentage":112},"Python","#3572A5",0,{"name":114,"color":115,"percentage":112},"Dockerfile","#384d54",{"name":117,"color":118,"percentage":112},"Batchfile","#C1F12E",731,125,"2026-04-12T08:49:22","BSD-3-Clause",4,"","未说明",{"notes":127,"python":128,"dependencies":129},"该仓库 (openml\u002FOpenML) 主要包含基于 PHP 的 Web 应用程序和 REST API，目前仅处于维护模式，官方正逐步淘汰此版本并转向基于 FastAPI 的新 API。具体的运行环境需求（如 Python 版本、依赖库等）需参考各语言独立的客户端仓库（如 openml-python, openml-r 等）。","未说明 (主仓库为 PHP 项目，另有独立的 openml-python, openml-r, openml-java 等客户端库)",[],[14,131,16],"其他",[133,134,135,136,137,138,139,140],"machine-learning","open-science","science","citizen-scientists","collaboration","opendata","datasets","hacktoberfest","2026-03-27T02:49:30.150509","2026-04-20T19:32:34.446549",[144,149,154,159,164,169,174],{"id":145,"question_zh":146,"answer_zh":147,"source_url":148},45282,"如何获取所有有效的任务（Task）和数据集（Dataset）ID 列表？","不再需要直接使用 SQL 查询。可以通过新的 API 函数 `openml.data.list` (在 R 包中) 或相应的 Python API 调用来获取数据集和任务列表。之前的 'safe' 状态字段已被移除，现在统一使用 'status' 字段来筛选有效数据。","https:\u002F\u002Fgithub.com\u002Fopenml\u002FOpenML\u002Fissues\u002F71",{"id":150,"question_zh":151,"answer_zh":152,"source_url":153},45283,"API 下载大文件（如任务列表）速度太慢，有没有加速方法？","服务器端已启用 HTTP 压缩（Gzip）。当客户端请求头中包含 `Accept-Encoding: gzip,deflate` 时，服务器返回的文件大小可显著减小（例如从 10MB 减至 1.1MB），从而大幅提升下载速度。大多数现代 HTTP 库默认会自动处理压缩，如果手动使用 curl 等工具，请确保添加 `-H 'Accept-Encoding: gzip,deflate'` 参数。","https:\u002F\u002Fgithub.com\u002Fopenml\u002FOpenML\u002Fissues\u002F268",{"id":155,"question_zh":156,"answer_zh":157,"source_url":158},45284,"本地安装 OpenML 后页面显示空白且无任何错误提示，该如何排查？","这通常与配置或权限有关。首先检查用户配置文件：登录后点击头像进入个人资料，找到 'API authentication' 按钮，确认 API Key 未被设置为“只读”（read-only），虽然默认不应是只读，但需核实。其次，如果网站运行在非标准端口，需确保 API 也配置了正确的端口，否则前后端通信会失败导致白屏。","https:\u002F\u002Fgithub.com\u002Fopenml\u002FOpenML\u002Fissues\u002F560",{"id":160,"question_zh":161,"answer_zh":162,"source_url":163},45285,"OpenML 是否支持除 ARFF 以外的其他数据格式（如 CSV 或 DSPL）？","目前 CSV 下载功能已完全支持。关于 DSPL 格式，社区倾向于使用更通用的 'Data Packages' 标准。虽然部分下载链接的文件扩展名可能仍显示为 .arff，但实际内容可以是 CSV。如果遇到扩展名与实际内容不符的情况（如下载 CSV 却得到 .arff 后缀），这属于已知问题，正在逐步修复中。","https:\u002F\u002Fgithub.com\u002Fopenml\u002FOpenML\u002Fissues\u002F218",{"id":165,"question_zh":166,"answer_zh":167,"source_url":168},45286,"遇到任务的数据分割文件（data_splits）下载返回 JSON 错误而非 ARFF 文件怎么办？","这是一个已知的服务端 Bug（例如任务 ID 261 曾出现此问题），表现为访问分割文件 URL 时返回 `{\"error\":\"For input string: \"\"\"}` 而不是 ARFF 内容。该问题通常需要服务端维护人员修复。如果是自动化测试因此失败，建议暂时跳过该特定任务或在代码中增加异常处理，待服务端修复后再恢复。","https:\u002F\u002Fgithub.com\u002Fopenml\u002FOpenML\u002Fissues\u002F240",{"id":170,"question_zh":171,"answer_zh":172,"source_url":173},45287,"OpenML 是否原生支持稀疏 ARFF (Sparse ARFF) 或 LibSVM 格式？","对于数值型特征，Web 界面已经可以处理稀疏数据。如果是为了在 R 语言中解析 LibSVM 稀疏格式，建议使用现有的解析器（如 e1071 包中的代码，虽简单但可用），或者直接在上传前转换为 OpenML 支持的格式。目前社区讨论认为专门重写 C 语言解析器的优先级不高，推荐直接上传转换后的文件到 OpenML。","https:\u002F\u002Fgithub.com\u002Fopenml\u002FOpenML\u002Fissues\u002F79",{"id":175,"question_zh":176,"answer_zh":177,"source_url":178},45288,"为什么某些数据集在没有设置默认目标属性（default_target_attribute）时，类别数（number of classes）显示异常？","这是一个数据元数据逻辑问题。如果数据集未指定 `default_target_attribute`，系统不应报告具体的“类别数量”，因为此时没有明确的目标变量。如果遇到此类情况（如随机列被误报为类别数），通常意味着该数据集的元数据不完整或有误，建议在分析时忽略该字段或手动指定目标属性。","https:\u002F\u002Fgithub.com\u002Fopenml\u002FOpenML\u002Fissues\u002F528",[180,185,190,195,199,203,207],{"id":181,"version":182,"summary_zh":183,"released_at":184},360156,"v1.2.4","将总的 POST 请求限制提高到 5GB，将最大文件大小限制提高到 4GB。","2026-01-22T13:44:08",{"id":186,"version":187,"summary_zh":188,"released_at":189},360157,"v1.2.3","允许在 Docker 启动时跳过 ES 索引。","2025-11-28T08:26:23",{"id":191,"version":192,"summary_zh":193,"released_at":194},360158,"v1.2.2","小幅编辑，修复 #1163","2025-11-27T16:02:12",{"id":196,"version":197,"summary_zh":76,"released_at":198},360159,"v1.2.1","2025-11-15T14:07:16",{"id":200,"version":201,"summary_zh":76,"released_at":202},360160,"v1.2.0","2025-11-14T17:41:08",{"id":204,"version":205,"summary_zh":76,"released_at":206},360161,"v1.1.0","2025-06-20T12:29:29",{"id":208,"version":209,"summary_zh":76,"released_at":210},360162,"v1.0.20241115","2024-11-15T11:46:45"]