oneDAL

645 224 简单 1 次阅读 3天前Apache-2.0数据工具插件其他开发框架

AI 解读由 AI 自动生成，仅供参考

oneDAL（oneAPI Data Analytics Library）是一个专为表格数据设计的高性能机器学习加速库，支持 C++ 和 DPC++ 语言。它内置了线性回归、K-means 聚类、随机森林等常用算法，能够显著提升数据处理速度。

在数据分析中，面对海量表格数据时，传统算法往往运行缓慢，成为效率瓶颈。oneDAL 通过深度优化底层计算，有效解决了这一痛点。它在 CPU 上利用 SIMD 指令集和现代缓存结构进行加速，在 GPU 上则依托 SYCL 框架和 oneMKL 库释放硬件潜能，同时还能轻松扩展到多节点分布式环境，实现大规模并行计算。

这款工具非常适合需要处理大规模数据的开发者、数据科学家以及研究人员。如果你正在使用 Python 的 scikit-learn 库，可以通过其专用扩展插件无缝调用 oneDAL，无需大幅修改代码即可让现有程序“提速”。对于追求极致性能的 C++ 开发者，oneDAL 也提供了灵活的底层接口。作为 UXL 基金会的一部分，oneDAL 致力于推动跨架构的统一开发标准，帮助你在不同硬件平台上构建高效、可移植的数据分析应用。

使用场景

某大型电商公司的数据科学团队正致力于构建实时用户行为分析系统，需要对海量日志数据进行快速的聚类分析和异常检测，以支持动态推荐策略。

没有 oneDAL 时

训练耗时过长：面对亿级行数的用户点击流数据，使用原生 Scikit-learn 进行 K-means 聚类往往需要数小时甚至更久，无法满足“准实时”的业务需求。
硬件资源闲置：算法仅能利用 CPU 的单核或少量核心，无法有效调用服务器配备的高性能 GPU 或多节点集群算力，导致昂贵的硬件资源大量浪费。
代码重构成本高：若要引入其他加速库，通常需要大幅重写现有的 Python 数据分析代码，不仅开发周期长，还容易引入新的 Bug。
扩展性受限：随着数据量激增，单机内存和算力迅速达到瓶颈，难以平滑扩展到分布式环境处理更大规模的数据集。

使用 oneDAL 后

速度显著提升：通过 scikit-learn-intelex 无缝接入 oneDAL，利用其优化的 SIMD 指令和缓存机制，将原本数小时的聚类任务缩短至几分钟内完成。
异构算力全开：自动调度 CPU、GPU 及多节点资源，充分发挥现代硬件的并行计算能力，使吞吐量提升数十倍。
零代码迁移：无需修改任何业务逻辑代码，仅需在导入环节增加一行配置，即可让现有的 Scikit-learn 模型后台调用 oneDAL 加速引擎。
弹性伸缩自如：轻松应对从单机到多节点分布式部署的平滑过渡，支撑起 PB 级数据的实时分析需求，保障业务高峰期的稳定性。

oneDAL 的核心价值在于让开发者无需重写代码，即可将传统机器学习算法的性能释放到极致，真正实现“一次编写，处处加速”。

运行环境要求

操作系统

Linux
Windows

GPU

非必需
支持通过 SYCL 框架和 oneMKL 库进行 GPU 加速（未明确指定具体显卡型号或显存要求，通常指支持 SYCL 的 Intel GPU 或其他兼容设备）

内存

未说明

依赖

notes该库主要提供 C++ 和 DPC++ 接口，也可通过 Scikit-learn 扩展在 Python 中使用。CPU 加速利用 SIMD 指令和现代硬件缓存结构。支持多节点分布式设置。详细系统要求需查阅官方文档链接。NuGet 包明确支持 linux-x64。

python未说明（提供 Scikit-learn 扩展包，具体版本需参考该扩展包要求）

oneMKL (用于 GPU 加速)

SYCL (用于 GPU 编程)

MPI (用于多节点分布式计算)

Scikit-learn (可选，用于 Python 接口)

快速开始

oneAPI 数据分析库

安装 | 文档 | 支持 | 示例 | 如何贡献

oneAPI 数据分析库（oneDAL）是一个 C++ 和 DPC++ 库（为 Python 中的 Scikit-learn 扩展提供支持），它实现了针对表格数据的加速机器学习算法（例如线性回归、K 均值聚类、随机森林等），适用于 CPU、GPU 以及多节点分布式环境。

在 CPU 上的加速是通过利用 SIMD 指令和现代硬件的缓存结构来实现的，而 GPU 加速则依赖于 SYCL 框架和 oneMKL 库。

OneDAL 是 UXL 基金会的一部分，也是 oneAPI 规范在 oneDAL 组件中的具体实现。

使用方法

您可以通过多种方式构建利用 oneDAL 优势的高性能数据科学应用程序：

使用 Scikit-learn* 扩展来加速现有的 scikit-learn 代码，使其在后台调用 oneDAL。
使用 oneDAL 的 C++ 接口，无论是否支持 SYCL（了解更多）。

安装

在安装之前，请查看系统要求，以确保与您的系统兼容。

有几种可用的 oneDAL 安装选项：

二进制分发：预编译的二进制包可从以下来源获取：
- Intel® oneAPI：
  - 可作为独立的 oneAPI 数据分析库下载
- Conda：
  
  渠道版本
  
  conda-forge
- NuGet
源码分发：克隆此 GitHub 仓库，或从 GitHub 发布页面下载特定版本的 oneDAL，并按照 INSTALL.md 文件中的说明进行操作。

渠道	版本
conda-forge

示例

C++ 示例：

Python 示例：

scikit-learn-intelex

其他示例

文档

oneDAL 文档：

其他相关文档：

Apache Spark MLlib

oneDAL 库被用于 Spark MLlib 的加速，作为 OAP MLlib 项目的一部分，与默认的 Apache Spark MLlib 相比，性能可提升 3 至 18 倍。

技术细节：FPType：double；硬件：7 台 m5.2xlarge AWS 实例；软件：Intel DAAL 2020 Gold、Apache Spark 2.4.4、emr-5.27.0；Spark 配置：执行器数量 12、每个执行器核心数 8、每个执行器内存 19GB、任务 CPU 数 8

扩展性

oneDAL 支持分布式计算模式，在强扩展性和弱扩展性方面均表现出色：

oneDAL K-Means 拟合，强扩展性结果	oneDAL K-Means 拟合，弱扩展性结果

技术细节：FPType：float32；硬件：Intel Xeon 处理器 E5-2698 v3 @2.3GHz，双插槽，每插槽 16 核；软件：Intel® DAAL (2019.3)、MPI4Py (3.0.0)、Intel® Distribution Of Python (IDP) 3.6.8；详情请参阅论文 https://arxiv.org/abs/1909.11822

治理

oneDAL 项目由 UXL 基金会管理，您可以通过多种方式参与其中。您可以加入 AI 特别兴趣小组 (SIG) 的会议，在这些会议上，小组成员会讨论并演示使用该项目的工作成果。成员也可以参加开源与规范工作组的会议。

此外，您还可以加入 UXL 基金会的邮件列表，以便及时了解会议安排，并获取最新资讯和讨论内容。

您既可以为本项目做出贡献，也可以参与该项目的规范制定。更多信息请参阅 CONTRIBUTING 页面。

支持

您可以通过以下渠道向 oneDAL 开发者、贡献者及其他用户提问并参与讨论：

如需私下联系项目维护人员，请发送邮件至 onedal.maintainers@intel.com。

安全

如需报告漏洞，请参考英特尔漏洞报告政策。

贡献

我们欢迎社区贡献。请查阅我们的贡献指南，了解更多详情。您也可以通过 UXL 基金会 Slack 的 #onedal 频道联系 oneDAL 团队。

许可证

oneDAL 根据 Apache License 2.0 许可证进行分发。更多信息请参阅 LICENSE 文件。

oneDAL 快速上手指南

oneAPI Data Analytics Library (oneDAL) 是一个高性能的 C++ 和 DPC++ 库，专为表格数据加速机器学习算法（如线性回归、K-means 聚类、随机森林等）。它支持 CPU（利用 SIMD 指令）、GPU（基于 SYCL）以及多节点分布式环境。

1. 环境准备

在开始之前，请确保您的系统满足以下要求：

操作系统：Linux (Ubuntu, CentOS, RHEL 等), Windows, macOS。
编译器：
- 推荐：Intel® oneAPI DPC++/C++ Compiler (用于完整功能及 GPU 加速)。
- 兼容：GCC, Clang, MSVC (仅用于 CPU 基础功能)。
依赖项：
- 若需 GPU 加速，需安装支持 SYCL 的后端（如 Intel GPU Driver 和 oneAPI Level Zero）。
- 若需分布式计算，需安装 MPI (如 Intel MPI, OpenMPI)。
Python 用户：若希望通过 Python 使用，建议安装 scikit-learn，oneDAL 可通过 scikit-learn-intelex 对其进行透明加速。

注意：详细系统要求请参考官方文档。

2. 安装步骤

您可以根据开发需求选择以下任一方式安装：

方式 A：通过 Conda 安装（推荐 Python/C++ 开发者）

这是最便捷的方式，适用于大多数 Linux 和 Windows 环境。

conda install -c conda-forge dal-devel

方式 B：通过 Intel oneAPI 工具包安装（适合需要完整生态的用户）

访问 Intel oneAPI 下载页面下载 standalone 安装包，或使用命令行工具安装：

# 示例：使用 apt (Ubuntu/Debian) 添加源并安装
wget -O- https://apt.repos.intel.com/intel-gpg-keys/GPG-PUB-KEY-INTEL-SW-PRODUCTS.PUB | gpg --dearmor | sudo tee /usr/share/keyrings/oneapi-archive-keyring.gpg > /dev/null
echo "deb [signed-by=/usr/share/keyrings/oneapi-archive-keyring.gpg] https://apt.repos.intel.com/oneapi all main" | sudo tee /etc/apt/sources.list.d/oneAPI.list
sudo apt update
sudo apt install intel-oneapi-daal

注：国内用户若遇到下载速度慢的问题，可尝试配置清华或中科大镜像源代理 Conda 通道，或手动下载离线包安装。

方式 C：源码编译（适合高级开发者）

git clone https://github.com/uxlfoundation/oneDAL.git
cd oneDAL
# 请参考根目录下的 INSTALL.md 文件进行具体编译配置

3. 基本使用

oneDAL 主要有两种使用模式：Python 透明加速（最简单）和 C++ 原生调用。

场景一：Python 用户（加速现有 Scikit-learn 代码）

无需修改算法逻辑，只需导入 daal4py 或启用 scikit-learn-intelex 即可自动将后端切换为 oneDAL。

安装扩展包：

pip install scikit-learn-intelex

使用示例：

from sklearnex import patch_sklearn
patch_sklearn()

# 现在所有的 scikit-learn 调用都将自动使用 oneDAL 加速
from sklearn.datasets import make_classification
from sklearn.ensemble import RandomForestClassifier

X, y = make_classification(n_samples=1000, n_features=20)
clf = RandomForestClassifier(n_estimators=100)
clf.fit(X, y)

print("训练完成，已自动加速")

场景二：C++ 用户（原生接口）

以下是一个使用 oneDAL C++ 接口进行 K-Means 聚类的最小化示例（需链接 oneDAL 库）。

#include "oneapi/dal.hpp"
#include <iostream>

int main() {
    // 1. 准备数据 (此处仅为示意，实际需填充数据)
    auto data = oneapi::dal::homogen_table::empty(); 
    // ... 加载数据到 data ...

    // 2. 描述算法参数
    auto desc = oneapi::dal::kmeans::descriptor<float>{
        3, // 聚类中心数量
        oneapi::dal::kmeans::method::lloyd,
        oneapi::dal::kmeans::init::random_dense
    };

    try {
        // 3. 执行训练
        auto result = oneapi::dal::train(desc, data);

        // 4. 获取结果
        auto centers = result.get_model().get_centroids();
        std::cout << "K-Means 训练完成，中心点行数：" << centers.get_row_count() << std::endl;
    } catch (const std::exception& e) {
        std::cerr << "Error: " << e.what() << std::endl;
        return 1;
    }

    return 0;

编译命令示例 (使用 icpx):

icpx -std=c++17 -I${ONEAPI_ROOT}/dal/latest/include your_code.cpp -L${ONEAPI_ROOT}/dal/latest/lib/intel64 -ldal -o kmeans_app

更多详细示例代码请访问 GitHub Examples。

版本历史

2025.11.02026/03/09

2025.10.12026/01/23

2025.4.02025/04/02

2025.2.02025/02/24

2025.1.02025/01/17

2024.1.02024/01/24

2024.0.12023/11/30

2025.10.02025/12/10

2025.9.02025/10/27

2025.8.02025/08/20

2025.7.02025/07/10

2025.6.02025/06/26

2025.5.02025/04/23

2025.0.02024/11/04

2024.7.02024/09/18

2024.6.02024/08/13

2024.5.02024/07/02

2024.4.02024/05/16

2024.3.02024/04/11

2024.2.02024/04/02

常见问题

如何在 FreeBSD 上编译和移植 oneDAL？

是否支持在 C++ 中使用由 Python (LightGBM/XGBoost) 训练的模型进行推理？

如何在 HiBench 中构建并运行基于 DAAL 的 Spark KMeans 测试？

makefile 不支持交叉编译（如 Yocto 框架）怎么办？

不同分类器（如 Decision Forest 和 KNN）的构造函数接口不一致，如何处理类数量参数？

如何正确序列化和反序列化逻辑回归、决策森林等分类模型？

相似工具推荐

openclaw

OpenClaw 是一款专为个人打造的本地化 AI 助手，旨在让你在自己的设备上拥有完全可控的智能伙伴。它打破了传统 AI 助手局限于特定网页或应用的束缚，能够直接接入你日常使用的各类通讯渠道，包括微信、WhatsApp、Telegram、Discord、iMessage 等数十种平台。无论你在哪个聊天软件中发送消息，OpenClaw 都能即时响应，甚至支持在 macOS、iOS 和 Android 设备上进行语音交互，并提供实时的画布渲染功能供你操控。这款工具主要解决了用户对数据隐私、响应速度以及“始终在线”体验的需求。通过将 AI 部署在本地，用户无需依赖云端服务即可享受快速、私密的智能辅助，真正实现了“你的数据，你做主”。其独特的技术亮点在于强大的网关架构，将控制平面与核心助手分离，确保跨平台通信的流畅性与扩展性。 OpenClaw 非常适合希望构建个性化工作流的技术爱好者、开发者，以及注重隐私保护且不愿被单一生态绑定的普通用户。只要具备基础的终端操作能力（支持 macOS、Linux 及 Windows WSL2），即可通过简单的命令行引导完成部署。如果你渴望拥有一个懂你

★ 349.3k|★★★☆☆|昨天

Agent开发框架图像

stable-diffusion-webui

stable-diffusion-webui 是一个基于 Gradio 构建的网页版操作界面，旨在让用户能够轻松地在本地运行和使用强大的 Stable Diffusion 图像生成模型。它解决了原始模型依赖命令行、操作门槛高且功能分散的痛点，将复杂的 AI 绘图流程整合进一个直观易用的图形化平台。无论是希望快速上手的普通创作者、需要精细控制画面细节的设计师，还是想要深入探索模型潜力的开发者与研究人员，都能从中获益。其核心亮点在于极高的功能丰富度：不仅支持文生图、图生图、局部重绘（Inpainting）和外绘（Outpainting）等基础模式，还独创了注意力机制调整、提示词矩阵、负向提示词以及“高清修复”等高级功能。此外，它内置了 GFPGAN 和 CodeFormer 等人脸修复工具，支持多种神经网络放大算法，并允许用户通过插件系统无限扩展能力。即使是显存有限的设备，stable-diffusion-webui 也提供了相应的优化选项，让高质量的 AI 艺术创作变得触手可及。

★ 162.1k|★★★☆☆|2天前

开发框架图像Agent

everything-claude-code

everything-claude-code 是一套专为 AI 编程助手（如 Claude Code、Codex、Cursor 等）打造的高性能优化系统。它不仅仅是一组配置文件，而是一个经过长期实战打磨的完整框架，旨在解决 AI 代理在实际开发中面临的效率低下、记忆丢失、安全隐患及缺乏持续学习能力等核心痛点。通过引入技能模块化、直觉增强、记忆持久化机制以及内置的安全扫描功能，everything-claude-code 能显著提升 AI 在复杂任务中的表现，帮助开发者构建更稳定、更智能的生产级 AI 代理。其独特的“研究优先”开发理念和针对 Token 消耗的优化策略，使得模型响应更快、成本更低，同时有效防御潜在的攻击向量。这套工具特别适合软件开发者、AI 研究人员以及希望深度定制 AI 工作流的技术团队使用。无论您是在构建大型代码库，还是需要 AI 协助进行安全审计与自动化测试，everything-claude-code 都能提供强大的底层支持。作为一个曾荣获 Anthropic 黑客大奖的开源项目，它融合了多语言支持与丰富的实战钩子（hooks），让 AI 真正成长为懂上

★ 143.9k|★★☆☆☆|今天

开发框架Agent语言模型

ComfyUI

ComfyUI 是一款功能强大且高度模块化的视觉 AI 引擎，专为设计和执行复杂的 Stable Diffusion 图像生成流程而打造。它摒弃了传统的代码编写模式，采用直观的节点式流程图界面，让用户通过连接不同的功能模块即可构建个性化的生成管线。这一设计巧妙解决了高级 AI 绘图工作流配置复杂、灵活性不足的痛点。用户无需具备编程背景，也能自由组合模型、调整参数并实时预览效果，轻松实现从基础文生图到多步骤高清修复等各类复杂任务。ComfyUI 拥有极佳的兼容性，不仅支持 Windows、macOS 和 Linux 全平台，还广泛适配 NVIDIA、AMD、Intel 及苹果 Silicon 等多种硬件架构，并率先支持 SDXL、Flux、SD3 等前沿模型。无论是希望深入探索算法潜力的研究人员和开发者，还是追求极致创作自由度的设计师与资深 AI 绘画爱好者，ComfyUI 都能提供强大的支持。其独特的模块化架构允许社区不断扩展新功能，使其成为当前最灵活、生态最丰富的开源扩散模型工具之一，帮助用户将创意高效转化为现实。

★ 107.9k|★★☆☆☆|昨天

开发框架图像Agent

markitdown

MarkItDown 是一款由微软 AutoGen 团队打造的轻量级 Python 工具，专为将各类文件高效转换为 Markdown 格式而设计。它支持 PDF、Word、Excel、PPT、图片（含 OCR）、音频（含语音转录）、HTML 乃至 YouTube 链接等多种格式的解析，能够精准提取文档中的标题、列表、表格和链接等关键结构信息。在人工智能应用日益普及的今天，大语言模型（LLM）虽擅长处理文本，却难以直接读取复杂的二进制办公文档。MarkItDown 恰好解决了这一痛点，它将非结构化或半结构化的文件转化为模型“原生理解”且 Token 效率极高的 Markdown 格式，成为连接本地文件与 AI 分析 pipeline 的理想桥梁。此外，它还提供了 MCP（模型上下文协议）服务器，可无缝集成到 Claude Desktop 等 LLM 应用中。这款工具特别适合开发者、数据科学家及 AI 研究人员使用，尤其是那些需要构建文档检索增强生成（RAG）系统、进行批量文本分析或希望让 AI 助手直接“阅读”本地文件的用户。虽然生成的内容也具备一定可读性，但其核心优势在于为机器

★ 93.4k|★★☆☆☆|昨天

插件开发框架

LLMs-from-scratch

LLMs-from-scratch 是一个基于 PyTorch 的开源教育项目，旨在引导用户从零开始一步步构建一个类似 ChatGPT 的大型语言模型（LLM）。它不仅是同名技术著作的官方代码库，更提供了一套完整的实践方案，涵盖模型开发、预训练及微调的全过程。该项目主要解决了大模型领域“黑盒化”的学习痛点。许多开发者虽能调用现成模型，却难以深入理解其内部架构与训练机制。通过亲手编写每一行核心代码，用户能够透彻掌握 Transformer 架构、注意力机制等关键原理，从而真正理解大模型是如何“思考”的。此外，项目还包含了加载大型预训练权重进行微调的代码，帮助用户将理论知识延伸至实际应用。 LLMs-from-scratch 特别适合希望深入底层原理的 AI 开发者、研究人员以及计算机专业的学生。对于不满足于仅使用 API，而是渴望探究模型构建细节的技术人员而言，这是极佳的学习资源。其独特的技术亮点在于“循序渐进”的教学设计：将复杂的系统工程拆解为清晰的步骤，配合详细的图表与示例，让构建一个虽小但功能完备的大模型变得触手可及。无论你是想夯实理论基础，还是为未来研发更大规模的模型做准备

★ 90.1k|★★★☆☆|昨天

语言模型图像Agent