ck

646 123 简单 1 次阅读 1周前Apache-2.0开发框架其他Agent

AI 解读由 AI 自动生成，仅供参考

ck（Collective Knowledge）是一个由社区驱动的开源项目，旨在推动开放科学，提升人工智能与机器学习研究的可复现性。它帮助用户在不同的模型、数据集、软件框架及硬件平台上，以更高效、低成本的方式运行各类新兴工作负载。

在 AI 研发中，环境配置复杂、实验难以复现、跨平台迁移困难是常见痛点。ck 通过其核心自动化框架 Collective Mind (CM) 及其新一代演进版本 CMX，将代码、数据、模型和脚本转化为可移植、可重用的标准化组件。用户只需通过统一的命令行接口或简单的 Python API，即可将这些组件灵活编排成自动化的工作流，轻松重现复杂的实验设置，甚至直接复用模块化的 MLPerf 基准测试。

该项目特别适合 AI 研究人员、系统工程师及开发者使用。无论是需要验证算法效果的科研人员，还是致力于优化推理性能的系统架构师，都能利用 ck 快速构建符合 FAIR 原则（可发现、可访问、可互操作、可重用）的研究环境。其独特的技术亮点在于“非侵入式”的项目转换能力，无需大幅修改原有代码即可实现自动化管理，同时支持从传统 CM 到新一代 CMX 的平滑过渡，为多样化的 AI 基础设施提供了稳健且灵活的协作基石。

使用场景

某 AI 芯片初创公司的基准测试团队，正面临在多种新硬件上复现并优化 MLPerf 图像分类模型的巨大压力。

没有 ck 时

环境配置繁琐：每次切换不同硬件（如 NVIDIA GPU 到国产 NPU）或软件栈（TensorFlow 转 ONNX），工程师需手动重写大量安装脚本和依赖配置，耗时数天且极易出错。
实验难以复现：由于缺乏统一的元数据管理，三个月前的最佳性能参数因记录缺失无法找回，导致团队在相同问题上反复“造轮子”。
协作壁垒高企：算法组与系统组的实验流程割裂，一方修改了数据集预处理逻辑，另一方毫不知情，导致基准测试结果不一致，沟通成本极高。
扩展性差：引入新的模型架构（如从 ResNet-50 升级到 BERT）时，需要从头构建整套测试流水线，无法复用现有资产。

使用 ck 后

自动化跨平台部署：利用 ck 的模块化自动化工作流，团队仅需一条命令即可在不同硬件和软件组合间自动适配并运行 MLPerf 基准测试，部署时间从数天缩短至分钟级。
可复现的知识沉淀：ck 将所有代码、数据、模型及环境参数封装为带有丰富元数据的可移植制品，确保任何历史实验都能被精确重现和追溯。
无缝协同研发：基于统一的命令行接口和 Python API，算法与系统团队共享同一套标准化流程，任何改动实时同步，彻底消除了“在我机器上是好的”这类争议。
灵活链式编排：面对新模型或新场景，只需像搭积木一样复用并组合现有的自动化组件，快速构建出定制化的评估流水线。

ck 通过将分散的实验资产转化为可复用、可协作的自动化工作流，让团队能以最低成本在多样化的软硬件生态中高效探索 AI 性能极限。

运行环境要求

操作系统

Linux
macOS
Windows

GPU

未说明

内存

未说明

依赖

notes该工具是一个自动化框架，用于运行和复现 AI/ML 基准测试（如 MLPerf）。它本身不强制要求特定 GPU，但具体运行的工作负载（如模型推理）可能依赖特定的硬件和软件后端（如 ONNX Runtime, PyTorch, DeepSparse 等）。支持在云环境或自动生成的容器中运行。

python3.8+

cmind

快速开始

Collective Knowledge项目（CK）

Collective Knowledge（CK）是一个由社区驱动的项目，致力于支持开放科学、提升研究的可重复性，并促进协作学习，以最高效、最具成本效益的方式在各种模型、数据集、软件和硬件上运行AI、ML及其他新兴工作负载： [ 白皮书 ]。

它包含以下子项目。

Collective Mind项目（MLCommons CM）

Collective Mind自动化框架（CM）旨在支持开放科学，并促进基于FAIR原则的协作式、可重复且可重用的研究、开发和实验。

它帮助用户以非侵入的方式将其软件项目转化为基于文件的可移植、可重用的工件库（代码、数据、模型、脚本），这些工件带有可扩展的元数据和可重用的自动化流程、统一的命令行界面以及简单的Python API。

此类工件可以轻松地串联成可移植且与技术无关的自动化工作流，使用户能够在多样且快速发展的模型、数据集、软件和硬件之间重新运行、重现和重用复杂的实验设置。

例如，CM有助于模块化、自动化和定制MLPerf基准测试。

旧版CM API和CLI（2021-2024）

更多详情请参阅项目页面。

旧版及简化的CM和MLPerf自动化由Grigori Fursin、cTuning基金会和OctoML捐赠给MLCommons。它们目前由MLCommons Infra WG（MLCFlow、MLC脚本、mlcr等）支持。

新版CM API和CLI（CMX，2025+）

Collective Mind扩展或通用元数据交换（CMX）是Collective Mind自动化框架（MLCommons CM）的下一代演进，旨在根据用户反馈提升自动化流程的简单性、灵活性和可扩展性。它与CM向后兼容，随CM一同发布于cmind包中，可作为CM及旧版MLPerf自动化的直接替代品，同时提供更简单、更稳健的接口。

更多详情请参阅项目页面和CMX4MLOps自动化。

MLOps和MLPerf自动化

我们开发了一套可移植、可扩展且与技术无关的自动化配方，配备通用的CLI和Python API（CM脚本），用于统一和自动化在不同平台上使用任何软件和硬件构建、运行、基准测试和优化复杂ML/AI应用所需的所有手动步骤。

其中两个关键自动化是脚本和缓存：详见CK游乐场在线目录，以及MLCommons在线目录。

CM脚本将cmake的概念扩展为简单的Python自动化、原生脚本和JSON/YAML元描述。它们需要Python 3.8及以上版本，依赖项极少，并且由社区和MLCommons成员持续扩展（参见贡献者列表），以便在Ubuntu、MacOS、Windows、RHEL、Debian、Amazon Linux 以及其他任何操作系统上原生运行，或在自动生成的容器内运行，同时保持向后兼容性。

有关如何使用CMX在不同系统上运行MLPerf推理基准测试，请参阅MLCommons的在线MLPerf文档。只需安装pip install cmx4mlperf，并将以下命令和标志替换为：

cm -> cmx
mlc -> cmlc
mlcr -> cmlcr
-v -> --v

Collective Knowledge游乐场

Collective Knowledge游乐场 - 一个统一且开源的平台，旨在索引所有CM/CMX自动化，类似于PYPI，并协助用户准备CM/CMX命令，以：

汇总、处理、可视化和比较AI和ML系统的MLPerf基准测试结果
运行MLPerf基准测试
组织开放且可重复的优化挑战和锦标赛。

工件评估和可重复性倡议

工件评估自动化 - 一项由社区驱动的倡议，利用CK、CM和CMX来自动化工件评估，并在ML和系统会议中支持可重复性工作。

历史项目

CM-MLOps（2021）
CM4MLOps（2022-2024）
CK自动化框架v1和v2

许可证

Apache 2.0

版权

Grigori Fursin、cTuning基金会和OctoML将该项目捐赠给MLCommons，以造福所有人。

作者

Grigori Fursin

维护者

旧版 CM、CM4MLOps、MLC 和 MLPerf 自动化工具：MLCommons 基础设施工作组
CMX（自 2025 年起的下一代 CM）：Grigori Fursin

概念

如需深入了解本项目的动机，请参阅以下文章和演示文稿：

HPCA'25 论文《MLPerf Power：从微瓦到兆瓦，对机器学习系统的能效进行基准测试，以实现可持续的人工智能》：[ Arxiv ]，[ 使用 CM/CMX 复现结果的教程 ]
NeuralMagic 的 vLLM MLPerf 推理 4.1 提交，由 CM 自动化完成： [README]
SDXL MLPerf 推理 4.1 提交，由 CM 自动化完成： [README]
“借助 Collective Mind、虚拟化 MLOps、MLPerf、Collective Knowledge Playground 和可重复优化锦标赛，打造更高效、更具成本效益的 AI/ML 系统”：[ ArXiv ]
ACM REP'23 主题演讲，介绍 MLCommons CM 自动化框架：[ 幻灯片 ]
ACM TechTalk'21 关于 Collective Knowledge 项目的演讲：[ YouTube ]，[ 幻灯片 ]
《皇家学会期刊》2020 年论文：[ 论文 ]

致谢

本开源项目由 Grigori Fursin 创建，并由 cTuning.org、OctoAI 和 HiPEAC 资助。Grigori 将该项目捐赠给 MLCommons，旨在模块化和自动化 MLPerf 基准测试，造福社区，并推动其作为一项协作性、社区驱动的努力不断发展。

我们感谢 MLCommons、FlexAI 和 cTuning 对本项目的大力支持，同时也感谢我们敬业的志愿者和合作者，感谢他们提供的反馈和贡献！

如果您觉得 CM、CMX 和 MLPerf 自动化工具有所帮助，请引用以下文献：[ ArXiv ]，[ BibTex ]。

欢迎您联系作者，探讨长期规划及潜在的合作机会。

Collective Knowledge (CK/CMX) 快速上手指南

Collective Knowledge (CK) 是一个社区驱动的项目，旨在支持开放科学和可复现研究。其核心组件 Collective Mind (CM) 及新一代 CMX 框架，帮助用户将软件项目转化为可移植、可复用的自动化工作流，特别适用于模块化运行和优化 MLPerf 基准测试及各类 AI/ML 负载。

环境准备

在开始之前，请确保您的系统满足以下要求：

操作系统：支持 Ubuntu, Debian, RHEL, Amazon Linux, MacOS, Windows 等主流操作系统。
Python 版本：需要安装 Python 3.8 或更高版本（推荐 Python 3.10+）。
前置依赖：
- pip (Python 包管理工具)
- git (用于克隆仓库，可选)
- 网络连接（用于下载自动化脚本和元数据）

提示：建议在虚拟环境（如 venv 或 conda）中安装，以避免依赖冲突。

安装步骤

CK 的核心功能通过 PyPI 上的 cmind 包提供。您可以使用以下命令进行安装。

1. 基础安装

使用官方 PyPI 源安装最新版本的 CM/CMX 框架：

pip install cmind

2. 国内加速安装（推荐中国开发者）

如果您在中国大陆，建议使用国内镜像源以加快下载速度：

pip install cmind -i https://pypi.tuna.tsinghua.edu.cn/simple

3. 安装 MLPerf 专用扩展

若您需要运行 MLPerf 基准测试或相关 MLOps 自动化任务，请额外安装 cmx4mlperf 包：

pip install cmx4mlperf -i https://pypi.tuna.tsinghua.edu.cn/simple

安装完成后，您可以在终端输入 cmx --help 验证安装是否成功。

基本使用

CMX 提供了统一的命令行接口（CLI），用于发现、运行和组合自动化脚本。

1. 查看可用自动化脚本

列出所有已索引的自动化脚本（类似于 cmake 的目标列表，但更丰富）：

cmx find script

或者访问在线目录查看完整列表：CK Playground Scripts Catalog

2. 运行一个简单的自动化任务

CMX 的核心逻辑是通过 run script 命令执行特定的自动化流程。以下是一个通用的执行模板：

cmx run script <script_name> [--tags=<tag1>,<tag2>] [--extra_args]

示例：运行一个帮助命令或查看特定脚本详情 假设我们要查找并运行与 "hello" 相关的示例脚本（如果环境中已索引）：

cmx run script --tags=hello

3. 运行 MLPerf 基准测试

如果您安装了 cmx4mlperf，可以使用简化的命令来运行基准测试。注意命令前缀的变化：

旧版 cm -> 新版 cmx
旧版 mlc -> 新版 cmlc

示例：运行 ResNet-50 图像分类推理测试（伪代码示例，具体参数需参考文档）

cmx run script --tags=app,mlperf,inference,resnet50 \
  --scenario=Offline \
  --backend=onnxruntime \
  --device=cpu

4. 缓存管理

CMX 自动管理软件、数据集和模型的缓存。您可以手动清理或查看缓存：

# 查看缓存状态
cmx find cache

# 清理特定缓存
cmx rm cache --tags=<specific_tag>

5. 下一步

探索更多命令：访问 Collective Knowledge Playground 获取可视化的命令生成器和实验结果对比。
查阅文档：详细的使用案例和 MLPerf 配置请参考 MLCommons 官方文档。

版本历史

cmx-v4.1.42025/03/13

cmind-v4.1.32025/02/20

cmx-v4.1.02025/02/17

cmx-v4.0.22025/02/05

cm-v3.5.32025/01/15

cm-v3.5.22024/12/20

cm-v3.5.12024/12/03

cm-v3.4.42024/11/29

cm-v3.4.32024/11/24

cm-v3.4.22024/11/22

cm-v3.4.12024/11/10

cm-v3.3.42024/11/06

cm-v3.3.32024/11/03

cm-v3.3.12024/11/01

cm-v3.2.92024/10/29

cm-v3.2.82024/10/28

cm-v3.2.52024/10/19

cm-v3.2.32024/10/16

cm-v3.2.02024/10/13

cm-v3.1.02024/10/10

常见问题

在运行 get-cuda-devices 或 BERT99 测试时遇到失败，特别是使用多张 RTX 6000 Ada 显卡时，该如何解决？

使用 rclone 复制文件时提示"directory not found"（目录未找到）错误怎么办？

在没有 sudo 权限的节点上运行 CUDA 安装脚本时遇到错误或选择困惑，如何处理？

在 Windows 11 上运行 CM 脚本时收到"Windows is not supported in this script yet"错误，如何解决？

如何正确生成带有自定义配置的 MLPerf 规格（spec），以避免 QPS 数值类型错误？

CM 脚本在执行过程中自动选择了错误的 CUDA 组件（如选了 lib 而不是 toolkit），如何手动干预？

相似工具推荐

openclaw

OpenClaw 是一款专为个人打造的本地化 AI 助手，旨在让你在自己的设备上拥有完全可控的智能伙伴。它打破了传统 AI 助手局限于特定网页或应用的束缚，能够直接接入你日常使用的各类通讯渠道，包括微信、WhatsApp、Telegram、Discord、iMessage 等数十种平台。无论你在哪个聊天软件中发送消息，OpenClaw 都能即时响应，甚至支持在 macOS、iOS 和 Android 设备上进行语音交互，并提供实时的画布渲染功能供你操控。这款工具主要解决了用户对数据隐私、响应速度以及“始终在线”体验的需求。通过将 AI 部署在本地，用户无需依赖云端服务即可享受快速、私密的智能辅助，真正实现了“你的数据，你做主”。其独特的技术亮点在于强大的网关架构，将控制平面与核心助手分离，确保跨平台通信的流畅性与扩展性。 OpenClaw 非常适合希望构建个性化工作流的技术爱好者、开发者，以及注重隐私保护且不愿被单一生态绑定的普通用户。只要具备基础的终端操作能力（支持 macOS、Linux 及 Windows WSL2），即可通过简单的命令行引导完成部署。如果你渴望拥有一个懂你

★ 349.3k|★★★☆☆|1周前

Agent开发框架图像

stable-diffusion-webui

stable-diffusion-webui 是一个基于 Gradio 构建的网页版操作界面，旨在让用户能够轻松地在本地运行和使用强大的 Stable Diffusion 图像生成模型。它解决了原始模型依赖命令行、操作门槛高且功能分散的痛点，将复杂的 AI 绘图流程整合进一个直观易用的图形化平台。无论是希望快速上手的普通创作者、需要精细控制画面细节的设计师，还是想要深入探索模型潜力的开发者与研究人员，都能从中获益。其核心亮点在于极高的功能丰富度：不仅支持文生图、图生图、局部重绘（Inpainting）和外绘（Outpainting）等基础模式，还独创了注意力机制调整、提示词矩阵、负向提示词以及“高清修复”等高级功能。此外，它内置了 GFPGAN 和 CodeFormer 等人脸修复工具，支持多种神经网络放大算法，并允许用户通过插件系统无限扩展能力。即使是显存有限的设备，stable-diffusion-webui 也提供了相应的优化选项，让高质量的 AI 艺术创作变得触手可及。

★ 162.1k|★★★☆☆|2周前

开发框架图像Agent

everything-claude-code

everything-claude-code 是一套专为 AI 编程助手（如 Claude Code、Codex、Cursor 等）打造的高性能优化系统。它不仅仅是一组配置文件，而是一个经过长期实战打磨的完整框架，旨在解决 AI 代理在实际开发中面临的效率低下、记忆丢失、安全隐患及缺乏持续学习能力等核心痛点。通过引入技能模块化、直觉增强、记忆持久化机制以及内置的安全扫描功能，everything-claude-code 能显著提升 AI 在复杂任务中的表现，帮助开发者构建更稳定、更智能的生产级 AI 代理。其独特的“研究优先”开发理念和针对 Token 消耗的优化策略，使得模型响应更快、成本更低，同时有效防御潜在的攻击向量。这套工具特别适合软件开发者、AI 研究人员以及希望深度定制 AI 工作流的技术团队使用。无论您是在构建大型代码库，还是需要 AI 协助进行安全审计与自动化测试，everything-claude-code 都能提供强大的底层支持。作为一个曾荣获 Anthropic 黑客大奖的开源项目，它融合了多语言支持与丰富的实战钩子（hooks），让 AI 真正成长为懂上

★ 160.8k|★★☆☆☆|今天

开发框架Agent语言模型

opencode

OpenCode 是一款开源的 AI 编程助手（Coding Agent），旨在像一位智能搭档一样融入您的开发流程。它不仅仅是一个代码补全插件，而是一个能够理解项目上下文、自主规划任务并执行复杂编码操作的智能体。无论是生成全新功能、重构现有代码，还是排查难以定位的 Bug，OpenCode 都能通过自然语言交互高效完成，显著减少开发者在重复性劳动和上下文切换上的时间消耗。这款工具专为软件开发者、工程师及技术研究人员设计，特别适合希望利用大模型能力来提升编码效率、加速原型开发或处理遗留代码维护的专业人群。其核心亮点在于完全开源的架构，这意味着用户可以审查代码逻辑、自定义行为策略，甚至私有化部署以保障数据安全，彻底打破了传统闭源 AI 助手的“黑盒”限制。在技术体验上，OpenCode 提供了灵活的终端界面（Terminal UI）和正在测试中的桌面应用程序，支持 macOS、Windows 及 Linux 全平台。它兼容多种包管理工具，安装便捷，并能无缝集成到现有的开发环境中。无论您是追求极致控制权的资深极客，还是渴望提升产出的独立开发者，OpenCode 都提供了一个透明、可信

★ 144.3k|★☆☆☆☆|3天前

Agent插件

ComfyUI

ComfyUI 是一款功能强大且高度模块化的视觉 AI 引擎，专为设计和执行复杂的 Stable Diffusion 图像生成流程而打造。它摒弃了传统的代码编写模式，采用直观的节点式流程图界面，让用户通过连接不同的功能模块即可构建个性化的生成管线。这一设计巧妙解决了高级 AI 绘图工作流配置复杂、灵活性不足的痛点。用户无需具备编程背景，也能自由组合模型、调整参数并实时预览效果，轻松实现从基础文生图到多步骤高清修复等各类复杂任务。ComfyUI 拥有极佳的兼容性，不仅支持 Windows、macOS 和 Linux 全平台，还广泛适配 NVIDIA、AMD、Intel 及苹果 Silicon 等多种硬件架构，并率先支持 SDXL、Flux、SD3 等前沿模型。无论是希望深入探索算法潜力的研究人员和开发者，还是追求极致创作自由度的设计师与资深 AI 绘画爱好者，ComfyUI 都能提供强大的支持。其独特的模块化架构允许社区不断扩展新功能，使其成为当前最灵活、生态最丰富的开源扩散模型工具之一，帮助用户将创意高效转化为现实。

★ 109.2k|★★☆☆☆|昨天

开发框架图像Agent

gemini-cli

gemini-cli 是一款由谷歌推出的开源 AI 命令行工具，它将强大的 Gemini 大模型能力直接集成到用户的终端环境中。对于习惯在命令行工作的开发者而言，它提供了一条从输入提示词到获取模型响应的最短路径，无需切换窗口即可享受智能辅助。这款工具主要解决了开发过程中频繁上下文切换的痛点，让用户能在熟悉的终端界面内直接完成代码理解、生成、调试以及自动化运维任务。无论是查询大型代码库、根据草图生成应用，还是执行复杂的 Git 操作，gemini-cli 都能通过自然语言指令高效处理。它特别适合广大软件工程师、DevOps 人员及技术研究人员使用。其核心亮点包括支持高达 100 万 token 的超长上下文窗口，具备出色的逻辑推理能力；内置 Google 搜索、文件操作及 Shell 命令执行等实用工具；更独特的是，它支持 MCP（模型上下文协议），允许用户灵活扩展自定义集成，连接如图像生成等外部能力。此外，个人谷歌账号即可享受免费的额度支持，且项目基于 Apache 2.0 协议完全开源，是提升终端工作效率的理想助手。

★ 100.8k|★★☆☆☆|1周前

插件Agent图像