smartcore

901 92 简单 2 次阅读 3天前Apache-2.0开发框架

AI 解读由 AI 自动生成，仅供参考

smartcore 是一个功能全面的机器学习与数值计算库，专为 Rust 语言打造。它旨在帮助开发者在不牺牲性能的前提下，利用 Rust 的安全性和并发优势进行机器学习开发。smartcore 解决了传统机器学习框架往往依赖 Python 或 C++ 底层，难以直接融入 Rust 工程体系的问题。

smartcore 覆盖了广泛的算法，包括线性模型、树集成、支持向量机、聚类和降维等，并提供模块化线性代数抽象。对于需要高性能推理或跨平台部署的场景，smartcore 特别友好，默认支持 WebAssembly，方便在浏览器端运行模型。同时，它也提供了丰富的实用工具，如数据预处理、模型评估和内置数据集。

smartcore 非常适合 Rust 开发者、算法研究人员以及追求系统稳定性的后端工程师使用。通过强类型系统和简洁的 API，它能显著降低机器学习项目的维护成本，让从原型验证到生产部署的流程更加顺畅可靠。

使用场景

某金融科技公司正在开发基于 Rust 的高性能实时交易风控系统，需要集成机器学习模型进行欺诈检测。

没有 smartcore 时

必须依赖 Python 微服务处理模型推理，导致网络延迟高且增加了系统架构复杂度。
需自行封装底层线性代数库，代码重复率高，难以保证数值计算的稳定性与精度。
缺乏统一的 API 规范，不同算法间的接口不一致，大幅降低了模型迭代与实验的效率。
生产环境部署需捆绑庞大的 Python 解释器及依赖包，容器镜像体积过大，启动缓慢。

使用 smartcore 后

直接在 Rust 中调用智能核心提供的分类器，消除了跨语言通信开销，推理速度显著提升。
利用其强类型矩阵抽象与可选 ndarray 支持，编译期即可捕获类型错误，确保计算过程安全。
内置丰富的预处理与评估模块，统一了从数据清洗到模型选择的开发流程，加速实验落地。
编译为单一静态二进制文件，无需外部运行时依赖，极大优化了内存占用并简化了 CI/CD 流程。

smartcore 让 Rust 开发者能够以原生方式构建高性能、可信赖的机器学习应用，彻底摆脱对 Python 生态的依赖。

运行环境要求

操作系统

未说明

GPU

未说明

内存

未说明

依赖

notes本工具为 Rust 语言开发的机器学习库，非 Python 项目。安装需配置 Rust 环境（Cargo）。默认支持 WebAssembly 架构，部分功能（如数据集、序列化）需启用可选特性。推荐使用 Rust 2021 及以上版本。

python不适用 (Rust 库)

smartcore

ndarray

快速开始

用户指南 | API | 笔记本

Rust 中的机器学习 (Machine Learning)

为了开始熟悉新的 smartcore v0.4 API，现在有一个 Jupyter Notebook 环境仓库。请查看那里的说明，欢迎贡献，参见 CONTRIBUTING。

smartcore 是一个快速、易用的 Rust 机器学习库，涵盖经典的监督和无监督方法，具有模块化线性代数抽象和可选的 ndarray 支持。它旨在提供适合生产的 API、强类型和良好的默认值，同时保持对研究和实验的灵活性。

亮点

广泛的算法覆盖：线性模型、基于树的方法、集成学习、SVM（支持向量机）、邻居、聚类、分解和预处理。
强大的线性代数特质 (traits)，为偏好数组优先工作流的用户提供可选的 ndarray 集成。
WASM 优先默认设置，注重可移植性；serde 和数据集等功能为可选开启。
实用的工具用于模型选择、评估、读取器（CSV）、数据集生成器和内置示例数据集。

安装

添加到 Cargo.toml：

[dependencies]
smartcore = "^0.4.3"

对于最新的开发分支：

[dependencies]
smartcore = { git = "https://github.com/smartcorelib/smartcore", branch = "development" }

可选功能（示例）：

datasets
serde
ndarray-bindings（根据近期更改，已弃用以让位于仅 ndarray 支持）

请检查 Cargo.toml 以获取可用功能和兼容性说明。

快速开始

这里是一个使用 DenseMatrix 从原生 Rust 向量拟合 KNN（K-近邻）分类器的最小示例：

use smartcore::linalg::basic::matrix::DenseMatrix;
use smartcore::neighbors::knn_classifier::KNNClassifier;

// Turn vector slices into a matrix
let x = DenseMatrix::from_2d_array(&[
    &[1., 2.],
    &[3., 4.],
    &[5., 6.],
    &[7., 8.],
    &[9., 10.],
]).unwrap;

// Class labels
let y = vec![2, 2, 2, 3, 3];

// Train classifier
let knn = KNNClassifier::fit(&x, &y, Default::default()).unwrap();

// Predict
let yhat = knn.predict(&x).unwrap();

此示例对应于 crate 文档中的“第一个示例”部分，并展示了 smartcore 的易用 API 界面。

算法

smartcore 将算法组织成清晰的模块，具有统一的特质 (traits)：

聚类：K-Means, DBSCAN, 凝聚式（包括单链接），带有 K-Means++ 初始化和实用工具。
矩阵分解：SVD, EVD, Cholesky, LU, QR，以及相关的线性代数辅助函数。
线性模型：OLS, Ridge, Lasso, ElasticNet, Logistic Regression（逻辑回归）。
集成和基于树的方法：随机森林（分类器和回归器），Extra Trees，跨树和森林的共享可重用组件。
SVM（支持向量机）：SVC/SVR 带内核枚举支持和多类扩展。
邻居：KNN 分类和回归，带距离度量和快速选择辅助函数。
朴素贝叶斯：高斯型、伯努利型、类别型、多项式型。
预处理：编码器、拆分工具和常见转换。
模型选择和指标：K-fold（K 折）、搜索参数和评估工具。

最近的强化强调树/森林中的可重用组件和扩展的多类 SVM 能力。添加了 XGBoost 风格回归和单链接聚类。参见 CHANGELOG 了解 API 变更和迁移说明。

数据访问和读取器

CSV 读取器：从 CSV 读取矩阵，支持可配置的定界符和标题行，带有友好的错误消息和测试工具（包括非 IO 读取器抽象）。
数据集生成器：make_blobs, make_circles, make_moons 用于快速实验。
内置数据集（功能门控）：digits, diabetes, breast cancer, boston，带有序列化实用工具以持久化或刷新 .xy bundles。

WebAssembly 和可移植性

smartcore 在默认设置中采用 WASM/WASI 优先姿态，以简化浏览器和嵌入式部署。某些文件系统操作在 wasm 目标中受限；测试和 IO 工具的结构旨在尽可能避免不支持的调用。选择性启用 serde 等功能以最小化占用空间。查阅模块级文档和 CHANGELOG 以获取特定目标的注意事项。

笔记本

通过配套仓库提供一组精选的 Jupyter 笔记本，用于交互式探索 smartcore。要在本地运行，请使用 EVCXR 启用 Rust 笔记本。这是快速实验 v0.4 API 的推荐路径。

路线图和近期变更

特质系统重构，更少的结构体 (structs) 和更多的对象安全特质，大型代码库重组。
移至 Rust 2021 版本并清理重复代码路径。
使用 RNG（随机数生成器）机制在所有算法中使用种子和确定性控制。
搜索参数 API 用于 K-Means 和 SVM 家族中的超参数 (hyperparameter) 探索。
树和森林组件重构以实现重用；添加 Extra Trees。
SVM 多类支持；SVR 内核枚举及相关改进。
引入 XGBoost 风格回归；实现单链接聚类。

参见 CHANGELOG.md 获取精确细节、弃用和破坏性变更。像 nalgebra-bindings 这样的功能已被放弃，转而采用仅 ndarray 路径。默认功能针对 WASM/WASI 构建进行了调整；根据需要启用 serde/datasets。

贡献

欢迎贡献：

打开一个描述变更的问题并在 PR 中链接它。
保持 PR 与开发分支同步，并确保测试在稳定版 Rust 上通过。
提供或更新测试；运行 clippy 并应用格式化。覆盖率和 linting 是工作流程的一部分。
使用提供的 PR 和问题模板来描述行为变更、新功能及预期。

如果添加 IO，首选使非 IO 测试直截了当的抽象（参见 readers/iotesting）。对于数据集，在测试中适当门控序列化辅助函数，以避免在 wasm 目标中意外写入文件。

许可证

smartcore 在宽松许可证 (license) 下开源；详情见 Cargo.toml 和 LICENSE。crate 元数据标识“smartcore Developers”为作者；社区贡献通过 Git 历史和发布记录致谢。

致谢

smartcore 的设计融合了众所周知的机器学习（ML）模式，同时保持地道的 Rust 风格。感谢所有贡献者，你们帮助扩展了算法、改进了文档、实现了 trait（特质）的现代化，并增强了代码库的健壮性以适用于生产环境。

smartcore 快速上手指南

smartcore 是一个面向 Rust 语言的高效、易用的机器学习库，涵盖经典监督与无监督学习方法，支持模块化线性代数抽象及可选的 ndarray 集成。

1. 环境准备

操作系统: Linux, macOS, Windows (支持跨平台部署)。
开发语言: Rust。
版本要求: 推荐使用 Rust 2021 Edition 或更高版本。
前置依赖: 确保已安装 Rust 工具链（包含 cargo 和 rustc）。

2. 安装步骤

在您的 Rust 项目根目录下的 Cargo.toml 文件中添加 smartcore 依赖：

[dependencies]
smartcore = "^0.4.3"

如需使用最新开发分支，可使用以下配置：

[dependencies]
smartcore = { git = "https://github.com/smartcorelib/smartcore", branch = "development" }

可选功能特性（按需启用）：

datasets: 内置数据集支持
serde: 序列化支持

3. 基本使用

以下示例演示了如何使用原生 Rust 向量配合 DenseMatrix 训练一个 KNN 分类器。

use smartcore::linalg::basic::matrix::DenseMatrix;
use smartcore::neighbors::knn_classifier::KNNClassifier;

// 将向量切片转换为矩阵
let x = DenseMatrix::from_2d_array(&[
    &[1., 2.],
    &[3., 4.],
    &[5., 6.],
    &[7., 8.],
    &[9., 10.],
]).unwrap();

// 类别标签
let y = vec![2, 2, 2, 3, 3];

// 训练分类器
let knn = KNNClassifier::fit(&x, &y, Default::default()).unwrap();

// 预测
let yhat = knn.predict(&x).unwrap();

运行上述代码即可体验 smartcore 简洁的 API 接口。更多算法（如聚类、回归、SVM 等）可参考官方文档。

版本历史

v0.4.102026/04/02

v0.4.92026/01/09

v0.4.82025/11/29

v0.4.62025/11/15

v0.4.52025/10/09

v0.4.32025/09/28

v0.4.22025/07/15

v0.4.12025/05/01

v0.4.02024/11/26

v0.3.12023/03/20

v0.3.02022/11/08

常见问题

Wasm 构建时遇到 `deserialize_data` 类型不匹配错误怎么办？

如何安装 SmartCore 的开发版本以获取最新功能？

SmartCore 的随机森林（Random Forest）训练是否支持并行计算？

如何在 SmartCore 中手动实现随机森林树的并行训练？

反序列化后的 SVC 和 SVR 模型为何无法执行推理？

在 Wasm 目标平台上如何处理随机数生成？

相似工具推荐

stable-diffusion-webui

stable-diffusion-webui 是一个基于 Gradio 构建的网页版操作界面，旨在让用户能够轻松地在本地运行和使用强大的 Stable Diffusion 图像生成模型。它解决了原始模型依赖命令行、操作门槛高且功能分散的痛点，将复杂的 AI 绘图流程整合进一个直观易用的图形化平台。无论是希望快速上手的普通创作者、需要精细控制画面细节的设计师，还是想要深入探索模型潜力的开发者与研究人员，都能从中获益。其核心亮点在于极高的功能丰富度：不仅支持文生图、图生图、局部重绘（Inpainting）和外绘（Outpainting）等基础模式，还独创了注意力机制调整、提示词矩阵、负向提示词以及“高清修复”等高级功能。此外，它内置了 GFPGAN 和 CodeFormer 等人脸修复工具，支持多种神经网络放大算法，并允许用户通过插件系统无限扩展能力。即使是显存有限的设备，stable-diffusion-webui 也提供了相应的优化选项，让高质量的 AI 艺术创作变得触手可及。

★ 162.1k|★★★☆☆|今天

开发框架图像Agent

everything-claude-code

everything-claude-code 是一套专为 AI 编程助手（如 Claude Code、Codex、Cursor 等）打造的高性能优化系统。它不仅仅是一组配置文件，而是一个经过长期实战打磨的完整框架，旨在解决 AI 代理在实际开发中面临的效率低下、记忆丢失、安全隐患及缺乏持续学习能力等核心痛点。通过引入技能模块化、直觉增强、记忆持久化机制以及内置的安全扫描功能，everything-claude-code 能显著提升 AI 在复杂任务中的表现，帮助开发者构建更稳定、更智能的生产级 AI 代理。其独特的“研究优先”开发理念和针对 Token 消耗的优化策略，使得模型响应更快、成本更低，同时有效防御潜在的攻击向量。这套工具特别适合软件开发者、AI 研究人员以及希望深度定制 AI 工作流的技术团队使用。无论您是在构建大型代码库，还是需要 AI 协助进行安全审计与自动化测试，everything-claude-code 都能提供强大的底层支持。作为一个曾荣获 Anthropic 黑客大奖的开源项目，它融合了多语言支持与丰富的实战钩子（hooks），让 AI 真正成长为懂上

★ 139k|★★☆☆☆|今天

开发框架Agent语言模型

ComfyUI

ComfyUI 是一款功能强大且高度模块化的视觉 AI 引擎，专为设计和执行复杂的 Stable Diffusion 图像生成流程而打造。它摒弃了传统的代码编写模式，采用直观的节点式流程图界面，让用户通过连接不同的功能模块即可构建个性化的生成管线。这一设计巧妙解决了高级 AI 绘图工作流配置复杂、灵活性不足的痛点。用户无需具备编程背景，也能自由组合模型、调整参数并实时预览效果，轻松实现从基础文生图到多步骤高清修复等各类复杂任务。ComfyUI 拥有极佳的兼容性，不仅支持 Windows、macOS 和 Linux 全平台，还广泛适配 NVIDIA、AMD、Intel 及苹果 Silicon 等多种硬件架构，并率先支持 SDXL、Flux、SD3 等前沿模型。无论是希望深入探索算法潜力的研究人员和开发者，还是追求极致创作自由度的设计师与资深 AI 绘画爱好者，ComfyUI 都能提供强大的支持。其独特的模块化架构允许社区不断扩展新功能，使其成为当前最灵活、生态最丰富的开源扩散模型工具之一，帮助用户将创意高效转化为现实。

★ 107.7k|★★☆☆☆|2天前

开发框架图像Agent

NextChat

NextChat 是一款轻量且极速的 AI 助手，旨在为用户提供流畅、跨平台的大模型交互体验。它完美解决了用户在多设备间切换时难以保持对话连续性，以及面对众多 AI 模型不知如何统一管理的痛点。无论是日常办公、学习辅助还是创意激发，NextChat 都能让用户随时随地通过网页、iOS、Android、Windows、MacOS 或 Linux 端无缝接入智能服务。这款工具非常适合普通用户、学生、职场人士以及需要私有化部署的企业团队使用。对于开发者而言，它也提供了便捷的自托管方案，支持一键部署到 Vercel 或 Zeabur 等平台。 NextChat 的核心亮点在于其广泛的模型兼容性，原生支持 Claude、DeepSeek、GPT-4 及 Gemini Pro 等主流大模型，让用户在一个界面即可自由切换不同 AI 能力。此外，它还率先支持 MCP（Model Context Protocol）协议，增强了上下文处理能力。针对企业用户，NextChat 提供专业版解决方案，具备品牌定制、细粒度权限控制、内部知识库整合及安全审计等功能，满足公司对数据隐私和个性化管理的高标准要求。

★ 87.6k|★★☆☆☆|今天

开发框架语言模型

ML-For-Beginners

ML-For-Beginners 是由微软推出的一套系统化机器学习入门课程，旨在帮助零基础用户轻松掌握经典机器学习知识。这套课程将学习路径规划为 12 周，包含 26 节精炼课程和 52 道配套测验，内容涵盖从基础概念到实际应用的完整流程，有效解决了初学者面对庞大知识体系时无从下手、缺乏结构化指导的痛点。无论是希望转型的开发者、需要补充算法背景的研究人员，还是对人工智能充满好奇的普通爱好者，都能从中受益。课程不仅提供了清晰的理论讲解，还强调动手实践，让用户在循序渐进中建立扎实的技能基础。其独特的亮点在于强大的多语言支持，通过自动化机制提供了包括简体中文在内的 50 多种语言版本，极大地降低了全球不同背景用户的学习门槛。此外，项目采用开源协作模式，社区活跃且内容持续更新，确保学习者能获取前沿且准确的技术资讯。如果你正寻找一条清晰、友好且专业的机器学习入门之路，ML-For-Beginners 将是理想的起点。

★ 85k|★★☆☆☆|今天

图像数据工具视频

ragflow

RAGFlow 是一款领先的开源检索增强生成（RAG）引擎，旨在为大语言模型构建更精准、可靠的上下文层。它巧妙地将前沿的 RAG 技术与智能体（Agent）能力相结合，不仅支持从各类文档中高效提取知识，还能让模型基于这些知识进行逻辑推理和任务执行。在大模型应用中，幻觉问题和知识滞后是常见痛点。RAGFlow 通过深度解析复杂文档结构（如表格、图表及混合排版），显著提升了信息检索的准确度，从而有效减少模型“胡编乱造”的现象，确保回答既有据可依又具备时效性。其内置的智能体机制更进一步，使系统不仅能回答问题，还能自主规划步骤解决复杂问题。这款工具特别适合开发者、企业技术团队以及 AI 研究人员使用。无论是希望快速搭建私有知识库问答系统，还是致力于探索大模型在垂直领域落地的创新者，都能从中受益。RAGFlow 提供了可视化的工作流编排界面和灵活的 API 接口，既降低了非算法背景用户的上手门槛，也满足了专业开发者对系统深度定制的需求。作为基于 Apache 2.0 协议开源的项目，它正成为连接通用大模型与行业专有知识之间的重要桥梁。

★ 77.1k|★★★☆☆|昨天

Agent图像开发框架