cli
gws 是一款专为 Google Workspace 打造的命令行工具,旨在通过单一接口统一管理 Drive、Gmail、日历、表格、文档及聊天等全套服务。它解决了开发者以往需要查阅繁琐的 REST API 文档、手动编写 curl 请求或处理复杂分页逻辑的痛点,让操作谷歌云服务变得像执行本地命令一样简单直观。
这款工具特别适合后端开发者、DevOps 工程师以及正在构建 AI 智能体的技术人员使用。其核心亮点在于“动态构建”机制:gws 不依赖静态命令列表,而是运行时直接读取谷歌的 Discovery Service,这意味着任何新增的 API 端点都能被自动支持,无需等待工具更新。此外,gws 原生输出结构化 JSON 数据,并内置了 40 多项专为 AI 代理设计的技能(Skills),使得大语言模型能够直接调用它来执行复杂的办公自动化任务,而无需定制额外的中间件。无论是想快速脚本化日常管理工作流的人类用户,还是希望赋予 AI 操作谷歌全家桶能力的开发者,gws 都提供了一个零样板代码的高效解决方案。
使用场景
某初创公司的运维工程师需要每日自动汇总团队在 Google Drive 的项目文档、检查 Gmail 中的紧急告警,并将摘要同步至 Google Chat 群组。
没有 cli 时
- 接口对接繁琐:必须手动查阅 Google REST API 文档,编写大量
curl命令或 Python 脚本来处理复杂的 OAuth 认证和 HTTP 请求头。 - 数据格式混乱:不同 API 返回的数据结构各异,需编写额外的解析代码才能统一格式,供后续脚本或 AI 模型使用。
- 维护成本高昂:一旦 Google 更新 API 端点或参数,原有脚本立即失效,工程师需频繁跟进变更并重新适配代码。
- AI 集成困难:若想接入 AI Agent 自动执行任务,需专门开发自定义工具函数(Tool Functions)来桥接大模型与 Workspace 服务。
使用 cli 后
- 零样板代码:直接通过
gws drive files list或gws chat spaces messages create等直观命令操作,无需关心底层 HTTP 细节。 - 标准化输出:所有命令默认输出结构化 JSON,配合
jq即可轻松提取数据,天然适合作为 AI Agent 的输入源。 - 动态自适应:cli 运行时动态读取 Google Discovery Service,新 API 功能发布后无需安装更新即可直接使用,彻底消除维护焦虑。
- 原生 AI 支持:内置 40+ 种 Agent 技能,大模型可直接调用 cli 完成“查找未读邮件”或“创建日程”等复杂任务,无需额外开发中间件。
cli 将原本需要数小时开发的集成工作简化为单行命令,让人类和 AI 代理都能以最低成本高效驾驭整个 Google Workspace 生态。
运行环境要求
- Linux
- macOS
- Windows
不需要 GPU
未说明

快速开始
gws
一套 CLI,适用于所有 Google Workspace——专为人类与 AI 代理打造。
Drive、Gmail、日历,以及所有 Workspace API 都可轻松使用。零样板代码,结构化 JSON 输出,内置 40 多项代理技能。
[!注意] 这并非官方支持的 Google 产品。
npm install -g @googleworkspace/cli
gws 并不提供预装的命令列表。它在运行时会读取 Google 自己的 Discovery Service,并动态构建其完整的命令集。当 Google Workspace 添加了新的 API 端点或方法时,gws 会自动将其纳入支持范围。
[!重要] 本项目正处于积极开发阶段。随着我们迈向 v1.0,预计会频繁出现破坏性变更。
目录
前提条件
- Node.js 18+ — 用于执行
npm install(或从 GitHub 发布版 下载预编译二进制文件) - Google Cloud 项目 — 需要 OAuth 凭据。您可以通过 Google Cloud 控制台 创建一个,或使用
gcloudCLI,亦或通过gws auth setup命令完成配置。 - Google 账号,且拥有 Google Workspace 的访问权限
安装
npm install -g @googleworkspace/cli
npm 包会为您根据操作系统和架构预编译好原生二进制文件。 无需使用 Rust 工具链。
预编译二进制文件也可在 GitHub 发布版 页面中获取。
或者,您也可以从源代码构建:
cargo install --git https://github.com/googleworkspace/cli --locked
此外,还提供了 Nix Flake 文件,可在 github:googleworkspace/cli 中找到:
nix run github:googleworkspace/cli
在 macOS 和 Linux 上,您还可以通过 Homebrew 安装:
brew install googleworkspace-cli
快速入门
gws auth setup # 介绍 Google Cloud 项目配置流程
gws auth login # 后续进行 OAuth 登录
gws drive files list --params '{"pageSize": 5}'
为什么选择 gws?
面向人类 — 停止手动编写针对 REST 文档的 curl 请求。gws 会在每个资源上显示 --help 选项,提供 --dry-run 以预览请求,并支持自动分页。
面向 AI 代理 — 每个响应均采用结构化 JSON 格式。将此功能与附带的代理技能结合使用,您的大语言模型便能无缝管理 Google Workspace,而无需自定义工具。
# 列出最近的 10 个文件
gws drive files list --params '{"pageSize": 10}'
# 创建电子表格
gws sheets spreadsheets create --json '{"properties": {"title": "Q1 Budget"}}'
# 发送聊天消息
gws chat spaces messages create \
--params '{"parent": "spaces/xyz"}' \
--json '{"text": "部署完成."}' \
--dry-run
# 了解任意方法的请求/响应模式
gws schema drive.files.list
# 以 NDJSON 格式流式输出分页结果
gws drive files list --params '{"pageSize": 100}' --page-all | jq -r '.files[].name'
身份验证
CLI 支持多种身份验证流程,因此无论是在笔记本电脑上、在 CI 环境中,还是在服务器上,都能轻松使用。
我该选择哪种设置?
| 我有… | 使用 |
|---|---|
已安装并完成 OAuth 身份验证的 gcloud |
gws auth setup(最快) |
有一个 GCP 项目,但未安装 gcloud |
[手动 OAuth 配置](#手动 OAuth 配置 Google Cloud 控制台) |
| 已经拥有 OAuth 访问令牌 | GOOGLE_WORKSPACE_CLI_TOKEN |
| 已有的凭据 | [GOOGLE_WORKSPACE_CLI_CREDENTIALS_FILE](#服务账号到服务账号) |
交互式(本地桌面)
凭据在静止状态下经过加密处理(AES-256-GCM),密钥存储于您的操作系统密钥环中(或在 ~/.config/gws/.encryption_key 中,当 GOOGLE_WORKSPACE_CLI_KEYRING_BACKEND=file 时)。
gws auth setup # 一次性操作:创建 Cloud 项目、启用 API、登录用户
gws auth login # 后续进行权限范围选择与登录
gws auth setup需要gcloudCLI(Cloud SDK 安装指南)。如果您尚未安装gcloud,请改用下方的 [手动 OAuth 配置](#手动 OAuth 配置 Google Cloud 控制台)。
[!警告] 测试模式下的权限范围限制: 如果您的 OAuth 应用未经过验证(处于测试模式),Google 对同意范围的限制约为 25 个。推荐的默认权限范围包含 85 多个权限,但对于未经过验证的应用(尤其是
@gmail.com账户),这些权限可能会导致失败。 请优先选择单独的服务,以进一步筛选权限选择器:gws auth login -s drive,gmail,sheets
手动 OAuth 配置(Google Cloud 控制台)
当 gws auth setup 无法自动完成项目或客户端的创建,或您希望获得更精细的控制时,请使用此方式。
- 在目标项目中打开 Google Cloud 控制台:
- OAuth 同意页面:
https://console.cloud.google.com/apis/credentials/consent?project=<PROJECT_ID> - 凭据页面:
https://console.cloud.google.com/apis/credentials?project=<PROJECT_ID>
- OAuth 同意页面:
- 如系统提示,请配置 OAuth 品牌化与受众信息:
- 应用类型:外部应用(测试模式完全适用)
- 将您的账户添加至 测试用户 一栏
- 创建 OAuth 客户端:
- 类型:桌面应用
- 下载客户端 JSON 文件,并保存至:
~/.config/gws/client_secret.json
[!重要] 您必须将自己添加为测试用户。 在 OAuth 同意页面中,点击 测试用户 → 添加用户,并输入您的 Google 账号邮箱。若未完成此操作,登录时将收到通用的“访问被阻止”错误提示。
随后运行:
gws auth login
浏览器辅助身份验证(人工或代理)
您可以手动完成 OAuth 身份验证,也可以通过浏览器自动化完成。
- 人工流程:运行
gws auth login,打开打印出的 URL,并对权限范围进行授权。 - 代理辅助流程:代理用户打开 URL,选择账户,处理同意提示,并在本地主机回调成功后将控制权返回。
如果在同意页面显示“Google 未验证此应用”(测试模式),请点击“继续”。 如果出现权限范围复选框,请在继续前选择所需的权限范围(或选择全部)。
无头/CI 流程(导出流程)
- 在配备浏览器的机器上完成交互式身份验证。
- 导出凭据:
gws auth export --unmasked > credentials.json - 在无头机器上:
export GOOGLE_WORKSPACE_CLI_CREDENTIALS_FILE=/path/to/credentials.json gws drive files list # 一切正常
服务账号(服务器到服务器)
指向您的密钥文件即可,无需登录。
export GOOGLE_WORKSPACE_CLI_CREDENTIALS_FILE=/path/to/service-account.json
gws drive files list
预先获取的访问令牌
当其他工具(如 gcloud)已为您环境生成令牌时,此方法非常实用。
export GOOGLE_WORKSPACE_CLI_TOKEN=$(gcloud auth print-access-token)
优先级
| 优先级 | 源 | 设置方式 |
|---|---|---|
| 1 | 访问令牌 | GOOGLE_WORKSPACE_CLI_TOKEN |
| 2 | 凭据文件 | GOOGLE_WORKSPACE_CLI_CREDENTIALS_FILE |
| 3 | 加密凭据 | gws auth login |
| 4 | 明文凭据 | ~/.config/gws/credentials.json |
环境变量也可以存储在 .env 文件中。
AI 代理技能
该仓库提供了 100 多种代理技能(SKILL.md 文件)——每种 API 都对应一种技能,此外还提供面向常见工作流的高级助手,以及针对 Gmail、Drive、Docs、Calendar 和 Sheets 的 50 个精选配方。完整列表请参阅 技能索引。
# 一次性安装所有技能
npx skills add https://github.com/googleworkspace/cli
# 或者仅选择您需要的技能
npx skills add https://github.com/googleworkspace/cli/tree/main/skills/gws-drive
npx skills add https://github.com/googleworkspace/cli/tree/main/skills/gws-gmail
OpenClaw 设置
# 链接所有技能(与仓库保持同步)
ln -s $(pwd)/skills/gws-* ~/.openclaw/skills/
# 或者复制特定技能
cp -r skills/gws-drive skills/gws-gmail ~/.openclaw/skills/
gws-shared 技能包含一个 install 块,因此如果 gws 未添加到 PATH 中,OpenClaw 将自动通过 npm 安装 CLI。
Gemini CLI 扩展
首先对 CLI 进行身份验证:
gws auth setup将扩展安装至 Gemini CLI:
gemini extensions install https://github.com/googleworkspace/cli
安装此扩展可让您的 Gemini CLI 代理直接访问所有 gws 命令和 Google Workspace 代理技能。由于 gws 会安全地处理自身身份验证,您只需在使用代理之前在终端进行一次身份验证,扩展便会自动继承您的凭据。
高级用法
多部分上传
gws drive files create --json '{"name": "report.pdf"}' --upload ./report.pdf
分页
| 标志 | 描述 | 默认值 |
|---|---|---|
--page-all |
自动分页,每页显示一行 JSON 数据(NDJSON) | 关闭 |
--page-limit <N> |
最大可获取的页数 | 10 |
--page-delay <MS> |
页面之间的延迟时间 | 100 ms |
Google 表格 — Shell 转义
表格中的单元格范围使用 !,而 Bash 会将其解释为历史扩展。务必始终将值用 单引号 包裹:
# 从“Sheet1”中读取 A1:C10 单元格
gws sheets spreadsheets values get \
--params '{"spreadsheetId": "SPREADSHEET_ID", "range": "Sheet1!A1:C10"}'
# 追加行
gws sheets spreadsheets values append \
--params '{"spreadsheetId": "ID", "range": "Sheet1!A1", "valueInputOption": "USER_ENTERED"}' \
--json '{"values": [["Name", "Score"], ["Alice", 95]]}'
辅助命令
部分服务会随自动生成的 Discovery 界面一同提供手工编写的辅助命令。这些辅助命令以 + 为前缀,以便在视觉上与 Discovery 生成的方法名称区分开来,并且绝不会与 Discovery 生成的方法名发生冲突。
时间感知型辅助命令(如 +agenda、+standup-report、+weekly-digest、+meeting-prep)会自动使用您的 Google 账户时区(从 Calendar 设置 API 中获取并缓存 24 小时)。您可以通过在 +agenda 中添加 --timezone 或 --tz 参数来覆盖此设置,或者通过指定 --timezone 标志来实现显式控制。
运行 gws <service> --help 命令,即可同时查看 Discovery 方法和辅助命令。
gws gmail --help # 显示 +send、+reply、+reply-all、+forward、+triage、+watch 等方法
gws calendar --help # 显示 +insert、+agenda 等方法
gws drive --help # 显示 +upload 等方法
完整辅助命令参考:
| 服务 | 命令 | 描述 |
|---|---|---|
gmail |
+send |
发送电子邮件 |
gmail |
+reply |
回复消息(自动处理消息线程) |
gmail |
+reply-all |
向所有收件人回复消息 |
gmail |
+forward |
将消息转发给新收件人 |
gmail |
+triage |
显示未读收件箱摘要(发件人、主题、日期) |
gmail |
+watch |
监听新邮件,并以 NDJSON 格式实时流式传输 |
sheets |
+append |
向电子表格中追加一行数据 |
sheets |
+read |
从电子表格中读取数据 |
docs |
+write |
向文档中追加文本 |
chat |
+send |
向聊天空间发送消息 |
drive |
+upload |
上传文件并自动附加元数据 |
calendar |
+insert |
创建新的事件 |
calendar |
+agenda |
显示即将发生的活动(使用 Google 账户时区;可通过 --timezone 参数进行覆盖) |
script |
+push |
使用本地文件替换 Apps Script 项目中的所有文件 |
workflow |
+standup-report |
将今天的会议及待办事项汇总为 Standup 汇报 |
workflow |
+meeting-prep |
为下一次会议做准备:制定议程、确定与会人员,并关联相关文档 |
workflow |
+email-to-task |
将 Gmail 消息转换为 Google Tasks 条目 |
workflow |
+weekly-digest |
每周总结:本周的会议情况以及未读邮件数量 |
workflow |
+file-announce |
在聊天空间中宣布 Drive 文件 |
events |
+subscribe |
订阅 Workspace 事件,并以 NDJSON 格式实时流式传输 |
events |
+renew |
续订或重新激活 Workspace 事件订阅 |
modelarmor |
+sanitize-prompt |
通过 Model Armor 模板对用户提示进行安全清理 |
modelarmor |
+sanitize-response |
通过 Model Armor 模板对模型响应进行安全清理 |
modelarmor |
+create-template |
创建新的 Model Armor 模板 |
示例:
# 发送电子邮件
gws gmail +send --to alice@example.com --subject "Hello" --body "Hi there"
# 回复消息
gws gmail +reply --message-id MESSAGE_ID --body "Thanks!"
# 向电子表格中追加一行数据
gws sheets +append --spreadsheet SPREADSHEET_ID --values "Alice,95"
# 显示今天的日历议程
gws calendar +agenda
# 上传文件到 Drive
gws drive +upload ./report.pdf --name "Q1 Report"
# 今日的 Standup 汇报
gws workflow +standup-report
# 在特定时区显示今天的议程
gws calendar +agenda --today --timezone America/New_York
Model Armor(响应安全化)
集成 Google Cloud Model Armor 以在 API 响应到达您的代理之前,对其内容进行检测,防止提示注入攻击。
gws gmail users messages get --params '...' \
--sanitize "projects/P/locations/L/templates/T"
| 变量 | 描述 |
|---|---|
GOOGLE_WORKSPACE_CLI_SANITIZE_TEMPLATE |
默认的 Model Armor 模板 |
GOOGLE_WORKSPACE_CLI_SANITIZE_MODE |
warn(默认)或 block |
环境变量
所有变量均为可选。请参阅 .env.example 以获取一个复制粘贴模板。
| 变量 | 描述 |
|---|---|
GOOGLE_WORKSPACE_CLI_TOKEN |
预先获取的 OAuth2 访问令牌(优先级最高) |
GOOGLE_WORKSPACE_CLI_CREDENTIALS_FILE |
OAuth 凭据 JSON 文件的路径(用户或服务账号) |
GOOGLE_WORKSPACE_CLI_CLIENT_ID |
OAuth 客户端 ID(可替代 client_secret.json) |
GOOGLE_WORKSPACE_CLI_CLIENT_SECRET |
OAuth 客户端密钥(与 CLIENT_ID 配对) |
GOOGLE_WORKSPACE_CLI_CONFIG_DIR |
覆盖配置目录(默认为 ~/.config/gws) |
GOOGLE_WORKSPACE_CLI_SANITIZE_TEMPLATE |
默认的 Model Armor 模板 |
GOOGLE_WORKSPACE_CLI_SANITIZE_MODE |
warn(默认)或 block |
GOOGLE_WORKSPACE_CLI_LOG |
用于 stderr 的日志级别(例如:gws=debug)。默认关闭。 |
GOOGLE_WORKSPACE_CLI_LOG_FILE |
用于每日轮换的 JSON 日志文件的目录。默认关闭。 |
GOOGLE_WORKSPACE_PROJECT_ID |
GCP 项目 ID,用于配额/计费的覆盖,以及辅助命令的备用选项 |
环境变量也可以在 .env 文件中设置(通过 dotenvy 加载)。
退出码
gws 采用结构化的退出码,因此脚本可以根据失败类型进行分支处理,而无需解析错误输出。
| 代码 | 含义 | 示例原因 |
|---|---|---|
0 |
成功 | 命令正常完成 |
1 |
API 错误 | Google 返回了 4xx/5xx 响应 |
2 |
身份验证错误 | 凭据缺失、已过期或无效 |
3 |
验证错误 | 参数错误、服务未知、标志无效 |
4 |
Discovery 错误 | 无法获取 API 架构文档 |
5 |
内部错误 | 意外失败 |
gws drive files list --params '{"fileId": "bad"}'
echo $? # 1 — API 错误
gws unknown-service files list
echo $? # 3 — 验证错误(服务未知)
架构
gws 采用 两阶段解析 策略:
- 读取
argv[1]以识别服务类型(例如:drive) - 获取服务的 Discovery 文档(缓存 24 小时)
- 从文档的资源和方法构建
clap::Command树 - 重新解析剩余的参数
- 进行身份验证、构建 HTTP 请求并执行
所有输出——成功信息、错误信息、下载元数据——均采用结构化 JSON 格式。
排查故障
登录时出现“访问被阻止”或 403 错误
您的 OAuth 应用处于 测试模式,且您的账户并未被列入测试用户名单。
解决方法: 打开 GCP 项目中的 OAuth 同意页面 → 测试用户 → 添加用户 → 输入您的 Google 账户邮箱。然后重试 gws auth login。
“Google 未验证此应用”
通常在您的应用处于测试模式时会出现此提示。点击 高级 → 前往 <应用名称>(不安全) 以继续操作。此操作适用于个人使用;只有在将应用发布给其他用户时才需要进行验证。
范围过多 / 同意屏幕错误
未经验证(测试模式)的应用程序仅能使用约 25 个 OAuth 范围。预设的“推荐”范围包含众多范围,将超出此限制。
解决方法: 仅选择您所需的范围:
gws auth login --scopes drive,gmail,calendar
未找到 gcloud CLI
gws auth setup 需要 gcloud CLI 来自动创建项目。您有以下三种选择:
- 安装 gcloud,并直接使用
gcloud。 - 重新运行
gws auth setup,该命令会自动包裹gcloud的调用。 - 完全跳过
gcloud——在 Cloud Console 中手动设置 OAuth 凭证。
重定向 URI 不匹配
OAuth 客户端并非以 桌面应用 类型创建。在 凭据 页面中,删除现有客户端,创建一个新的客户端,并将其类型设置为 桌面应用,然后下载新的 JSON 文件。
API 未启用 — accessNotConfigured
如果您的 GCP 项目未启用所需 Google API,您将看到一个 403 错误,错误原因显示为 accessNotConfigured:
{
"error": {
"code": 403,
"message": "Gmail API 已未在项目 549352339482 中使用...",
"reason": "accessNotConfigured",
"enable_url": "https://console.developers.google.com/apis/api/gmail.googleapis.com/overview?project=549352339482"
}
}
gws 也会在 stderr 中打印一条可操作的提示信息:
💡 未为您的 GCP 项目启用 API。
请前往:https://console.developers.google.com/apis/api/gmail.googleapis.com/overview?project=549352339482
启用后,请等待几秒钟,然后重试您的命令。
解决步骤:
- 点击
enable_url链接(或从enable_urlJSON 字段中复制该链接)。 - 在 GCP 控制台中,点击 启用。
- 等待约 10 秒,然后重试您的
gws命令。
[!提示] 您也可以运行
gws auth setup,该命令会自动为您完成项目中所有必需 API 的启用流程。
开发
cargo build # 开发构建
cargo clippy -- -D warnings # 代码检查
cargo test # 单元测试
./scripts/coverage.sh # HTML 盖度报告 → target/llvm-cov/html/
许可证
Apache-2.0
免责声明
[!注意] 这并非官方支持的 Google 产品。
版本历史
v0.22.52026/03/31v0.22.42026/03/31v0.22.32026/03/26v0.22.12026/03/25v0.22.02026/03/24v0.21.12026/03/24v0.20.02026/03/24v0.19.02026/03/23v0.18.12026/03/18v0.18.02026/03/18v0.17.02026/03/17v0.16.02026/03/13v0.15.02026/03/13v0.14.02026/03/13v0.13.32026/03/13v0.13.22026/03/12v0.13.12026/03/12v0.12.02026/03/12v0.11.12026/03/10v0.11.02026/03/10常见问题
相似工具推荐
stable-diffusion-webui
stable-diffusion-webui 是一个基于 Gradio 构建的网页版操作界面,旨在让用户能够轻松地在本地运行和使用强大的 Stable Diffusion 图像生成模型。它解决了原始模型依赖命令行、操作门槛高且功能分散的痛点,将复杂的 AI 绘图流程整合进一个直观易用的图形化平台。 无论是希望快速上手的普通创作者、需要精细控制画面细节的设计师,还是想要深入探索模型潜力的开发者与研究人员,都能从中获益。其核心亮点在于极高的功能丰富度:不仅支持文生图、图生图、局部重绘(Inpainting)和外绘(Outpainting)等基础模式,还独创了注意力机制调整、提示词矩阵、负向提示词以及“高清修复”等高级功能。此外,它内置了 GFPGAN 和 CodeFormer 等人脸修复工具,支持多种神经网络放大算法,并允许用户通过插件系统无限扩展能力。即使是显存有限的设备,stable-diffusion-webui 也提供了相应的优化选项,让高质量的 AI 艺术创作变得触手可及。
everything-claude-code
everything-claude-code 是一套专为 AI 编程助手(如 Claude Code、Codex、Cursor 等)打造的高性能优化系统。它不仅仅是一组配置文件,而是一个经过长期实战打磨的完整框架,旨在解决 AI 代理在实际开发中面临的效率低下、记忆丢失、安全隐患及缺乏持续学习能力等核心痛点。 通过引入技能模块化、直觉增强、记忆持久化机制以及内置的安全扫描功能,everything-claude-code 能显著提升 AI 在复杂任务中的表现,帮助开发者构建更稳定、更智能的生产级 AI 代理。其独特的“研究优先”开发理念和针对 Token 消耗的优化策略,使得模型响应更快、成本更低,同时有效防御潜在的攻击向量。 这套工具特别适合软件开发者、AI 研究人员以及希望深度定制 AI 工作流的技术团队使用。无论您是在构建大型代码库,还是需要 AI 协助进行安全审计与自动化测试,everything-claude-code 都能提供强大的底层支持。作为一个曾荣获 Anthropic 黑客大奖的开源项目,它融合了多语言支持与丰富的实战钩子(hooks),让 AI 真正成长为懂上
ComfyUI
ComfyUI 是一款功能强大且高度模块化的视觉 AI 引擎,专为设计和执行复杂的 Stable Diffusion 图像生成流程而打造。它摒弃了传统的代码编写模式,采用直观的节点式流程图界面,让用户通过连接不同的功能模块即可构建个性化的生成管线。 这一设计巧妙解决了高级 AI 绘图工作流配置复杂、灵活性不足的痛点。用户无需具备编程背景,也能自由组合模型、调整参数并实时预览效果,轻松实现从基础文生图到多步骤高清修复等各类复杂任务。ComfyUI 拥有极佳的兼容性,不仅支持 Windows、macOS 和 Linux 全平台,还广泛适配 NVIDIA、AMD、Intel 及苹果 Silicon 等多种硬件架构,并率先支持 SDXL、Flux、SD3 等前沿模型。 无论是希望深入探索算法潜力的研究人员和开发者,还是追求极致创作自由度的设计师与资深 AI 绘画爱好者,ComfyUI 都能提供强大的支持。其独特的模块化架构允许社区不断扩展新功能,使其成为当前最灵活、生态最丰富的开源扩散模型工具之一,帮助用户将创意高效转化为现实。
NextChat
NextChat 是一款轻量且极速的 AI 助手,旨在为用户提供流畅、跨平台的大模型交互体验。它完美解决了用户在多设备间切换时难以保持对话连续性,以及面对众多 AI 模型不知如何统一管理的痛点。无论是日常办公、学习辅助还是创意激发,NextChat 都能让用户随时随地通过网页、iOS、Android、Windows、MacOS 或 Linux 端无缝接入智能服务。 这款工具非常适合普通用户、学生、职场人士以及需要私有化部署的企业团队使用。对于开发者而言,它也提供了便捷的自托管方案,支持一键部署到 Vercel 或 Zeabur 等平台。 NextChat 的核心亮点在于其广泛的模型兼容性,原生支持 Claude、DeepSeek、GPT-4 及 Gemini Pro 等主流大模型,让用户在一个界面即可自由切换不同 AI 能力。此外,它还率先支持 MCP(Model Context Protocol)协议,增强了上下文处理能力。针对企业用户,NextChat 提供专业版解决方案,具备品牌定制、细粒度权限控制、内部知识库整合及安全审计等功能,满足公司对数据隐私和个性化管理的高标准要求。
ML-For-Beginners
ML-For-Beginners 是由微软推出的一套系统化机器学习入门课程,旨在帮助零基础用户轻松掌握经典机器学习知识。这套课程将学习路径规划为 12 周,包含 26 节精炼课程和 52 道配套测验,内容涵盖从基础概念到实际应用的完整流程,有效解决了初学者面对庞大知识体系时无从下手、缺乏结构化指导的痛点。 无论是希望转型的开发者、需要补充算法背景的研究人员,还是对人工智能充满好奇的普通爱好者,都能从中受益。课程不仅提供了清晰的理论讲解,还强调动手实践,让用户在循序渐进中建立扎实的技能基础。其独特的亮点在于强大的多语言支持,通过自动化机制提供了包括简体中文在内的 50 多种语言版本,极大地降低了全球不同背景用户的学习门槛。此外,项目采用开源协作模式,社区活跃且内容持续更新,确保学习者能获取前沿且准确的技术资讯。如果你正寻找一条清晰、友好且专业的机器学习入门之路,ML-For-Beginners 将是理想的起点。
ragflow
RAGFlow 是一款领先的开源检索增强生成(RAG)引擎,旨在为大语言模型构建更精准、可靠的上下文层。它巧妙地将前沿的 RAG 技术与智能体(Agent)能力相结合,不仅支持从各类文档中高效提取知识,还能让模型基于这些知识进行逻辑推理和任务执行。 在大模型应用中,幻觉问题和知识滞后是常见痛点。RAGFlow 通过深度解析复杂文档结构(如表格、图表及混合排版),显著提升了信息检索的准确度,从而有效减少模型“胡编乱造”的现象,确保回答既有据可依又具备时效性。其内置的智能体机制更进一步,使系统不仅能回答问题,还能自主规划步骤解决复杂问题。 这款工具特别适合开发者、企业技术团队以及 AI 研究人员使用。无论是希望快速搭建私有知识库问答系统,还是致力于探索大模型在垂直领域落地的创新者,都能从中受益。RAGFlow 提供了可视化的工作流编排界面和灵活的 API 接口,既降低了非算法背景用户的上手门槛,也满足了专业开发者对系统深度定制的需求。作为基于 Apache 2.0 协议开源的项目,它正成为连接通用大模型与行业专有知识之间的重要桥梁。