cli

GitHub
23.8k 1.2k 简单 8 次阅读 今天Apache-2.0语言模型插件Agent
AI 解读 由 AI 自动生成,仅供参考

gws 是一款专为 Google Workspace 打造的命令行工具,旨在通过单一接口统一管理 Drive、Gmail、日历、表格、文档及聊天等全套服务。它解决了开发者以往需要查阅繁琐的 REST API 文档、手动编写 curl 请求或处理复杂分页逻辑的痛点,让操作谷歌云服务变得像执行本地命令一样简单直观。

这款工具特别适合后端开发者、DevOps 工程师以及正在构建 AI 智能体的技术人员使用。其核心亮点在于“动态构建”机制:gws 不依赖静态命令列表,而是运行时直接读取谷歌的 Discovery Service,这意味着任何新增的 API 端点都能被自动支持,无需等待工具更新。此外,gws 原生输出结构化 JSON 数据,并内置了 40 多项专为 AI 代理设计的技能(Skills),使得大语言模型能够直接调用它来执行复杂的办公自动化任务,而无需定制额外的中间件。无论是想快速脚本化日常管理工作流的人类用户,还是希望赋予 AI 操作谷歌全家桶能力的开发者,gws 都提供了一个零样板代码的高效解决方案。

使用场景

某初创公司的运维工程师需要每日自动汇总团队在 Google Drive 的项目文档、检查 Gmail 中的紧急告警,并将摘要同步至 Google Chat 群组。

没有 cli 时

  • 接口对接繁琐:必须手动查阅 Google REST API 文档,编写大量 curl 命令或 Python 脚本来处理复杂的 OAuth 认证和 HTTP 请求头。
  • 数据格式混乱:不同 API 返回的数据结构各异,需编写额外的解析代码才能统一格式,供后续脚本或 AI 模型使用。
  • 维护成本高昂:一旦 Google 更新 API 端点或参数,原有脚本立即失效,工程师需频繁跟进变更并重新适配代码。
  • AI 集成困难:若想接入 AI Agent 自动执行任务,需专门开发自定义工具函数(Tool Functions)来桥接大模型与 Workspace 服务。

使用 cli 后

  • 零样板代码:直接通过 gws drive files listgws chat spaces messages create 等直观命令操作,无需关心底层 HTTP 细节。
  • 标准化输出:所有命令默认输出结构化 JSON,配合 jq 即可轻松提取数据,天然适合作为 AI Agent 的输入源。
  • 动态自适应:cli 运行时动态读取 Google Discovery Service,新 API 功能发布后无需安装更新即可直接使用,彻底消除维护焦虑。
  • 原生 AI 支持:内置 40+ 种 Agent 技能,大模型可直接调用 cli 完成“查找未读邮件”或“创建日程”等复杂任务,无需额外开发中间件。

cli 将原本需要数小时开发的集成工作简化为单行命令,让人类和 AI 代理都能以最低成本高效驾驭整个 Google Workspace 生态。

运行环境要求

操作系统
  • Linux
  • macOS
  • Windows
GPU

不需要 GPU

内存

未说明

依赖
notes该工具主要基于 Node.js 运行,也可通过 Rust (cargo) 从源码编译。支持通过 npm、Homebrew、Nix 或直接下载预编译二进制文件安装。需要配置 Google Cloud 项目以获取 OAuth 凭证。若使用交互式设置需安装 gcloud CLI。AI Agent 技能可通过 npx 安装。
python不需要 Python
Node.js 18+
npm 或 cargo (可选用于源码编译)
cli hero image

快速开始

gws

一套 CLI,适用于所有 Google Workspace——专为人类与 AI 代理打造。
Drive、Gmail、日历,以及所有 Workspace API 都可轻松使用。零样板代码,结构化 JSON 输出,内置 40 多项代理技能。

[!注意] 这并非官方支持的 Google 产品。

npm 版本 许可证 CI 状态 安装大小


npm install -g @googleworkspace/cli

gws 并不提供预装的命令列表。它在运行时会读取 Google 自己的 Discovery Service,并动态构建其完整的命令集。当 Google Workspace 添加了新的 API 端点或方法时,gws 会自动将其纳入支持范围。

[!重要] 本项目正处于积极开发阶段。随着我们迈向 v1.0,预计会频繁出现破坏性变更。

目录

前提条件

  • Node.js 18+ — 用于执行 npm install(或从 GitHub 发布版 下载预编译二进制文件)
  • Google Cloud 项目 — 需要 OAuth 凭据。您可以通过 Google Cloud 控制台 创建一个,或使用 gcloud CLI,亦或通过 gws auth setup 命令完成配置。
  • Google 账号,且拥有 Google Workspace 的访问权限

安装

npm install -g @googleworkspace/cli

npm 包会为您根据操作系统和架构预编译好原生二进制文件。 无需使用 Rust 工具链。

预编译二进制文件也可在 GitHub 发布版 页面中获取。

或者,您也可以从源代码构建:

cargo install --git https://github.com/googleworkspace/cli --locked

此外,还提供了 Nix Flake 文件,可在 github:googleworkspace/cli 中找到:

nix run github:googleworkspace/cli

在 macOS 和 Linux 上,您还可以通过 Homebrew 安装:

brew install googleworkspace-cli

快速入门

gws auth setup     # 介绍 Google Cloud 项目配置流程
gws auth login     # 后续进行 OAuth 登录
gws drive files list --params '{"pageSize": 5}'

为什么选择 gws?

面向人类 — 停止手动编写针对 REST 文档的 curl 请求。gws 会在每个资源上显示 --help 选项,提供 --dry-run 以预览请求,并支持自动分页。

面向 AI 代理 — 每个响应均采用结构化 JSON 格式。将此功能与附带的代理技能结合使用,您的大语言模型便能无缝管理 Google Workspace,而无需自定义工具。

# 列出最近的 10 个文件
gws drive files list --params '{"pageSize": 10}'

# 创建电子表格
gws sheets spreadsheets create --json '{"properties": {"title": "Q1 Budget"}}'

# 发送聊天消息
gws chat spaces messages create \
  --params '{"parent": "spaces/xyz"}' \
  --json '{"text": "部署完成."}' \
  --dry-run

# 了解任意方法的请求/响应模式
gws schema drive.files.list

# 以 NDJSON 格式流式输出分页结果
gws drive files list --params '{"pageSize": 100}' --page-all | jq -r '.files[].name'

身份验证

CLI 支持多种身份验证流程,因此无论是在笔记本电脑上、在 CI 环境中,还是在服务器上,都能轻松使用。

我该选择哪种设置?

我有… 使用
已安装并完成 OAuth 身份验证的 gcloud gws auth setup(最快)
有一个 GCP 项目,但未安装 gcloud [手动 OAuth 配置](#手动 OAuth 配置 Google Cloud 控制台)
已经拥有 OAuth 访问令牌 GOOGLE_WORKSPACE_CLI_TOKEN
已有的凭据 [GOOGLE_WORKSPACE_CLI_CREDENTIALS_FILE](#服务账号到服务账号)

交互式(本地桌面)

凭据在静止状态下经过加密处理(AES-256-GCM),密钥存储于您的操作系统密钥环中(或在 ~/.config/gws/.encryption_key 中,当 GOOGLE_WORKSPACE_CLI_KEYRING_BACKEND=file 时)。

gws auth setup       # 一次性操作:创建 Cloud 项目、启用 API、登录用户
gws auth login       # 后续进行权限范围选择与登录

gws auth setup 需要 gcloud CLI(Cloud SDK 安装指南)。如果您尚未安装 gcloud,请改用下方的 [手动 OAuth 配置](#手动 OAuth 配置 Google Cloud 控制台)。

[!警告] 测试模式下的权限范围限制: 如果您的 OAuth 应用未经过验证(处于测试模式),Google 对同意范围的限制约为 25 个。推荐的默认权限范围包含 85 多个权限,但对于未经过验证的应用(尤其是 @gmail.com 账户),这些权限可能会导致失败。 请优先选择单独的服务,以进一步筛选权限选择器:

gws auth login -s drive,gmail,sheets

手动 OAuth 配置(Google Cloud 控制台)

gws auth setup 无法自动完成项目或客户端的创建,或您希望获得更精细的控制时,请使用此方式。

  1. 在目标项目中打开 Google Cloud 控制台:
    • OAuth 同意页面:https://console.cloud.google.com/apis/credentials/consent?project=<PROJECT_ID>
    • 凭据页面:https://console.cloud.google.com/apis/credentials?project=<PROJECT_ID>
  2. 如系统提示,请配置 OAuth 品牌化与受众信息:
    • 应用类型:外部应用(测试模式完全适用)
  3. 将您的账户添加至 测试用户 一栏
  4. 创建 OAuth 客户端:
    • 类型:桌面应用
  5. 下载客户端 JSON 文件,并保存至:
    • ~/.config/gws/client_secret.json

[!重要] 您必须将自己添加为测试用户。 在 OAuth 同意页面中,点击 测试用户 → 添加用户,并输入您的 Google 账号邮箱。若未完成此操作,登录时将收到通用的“访问被阻止”错误提示。

随后运行:

gws auth login

浏览器辅助身份验证(人工或代理)

您可以手动完成 OAuth 身份验证,也可以通过浏览器自动化完成。

  • 人工流程:运行 gws auth login,打开打印出的 URL,并对权限范围进行授权。
  • 代理辅助流程:代理用户打开 URL,选择账户,处理同意提示,并在本地主机回调成功后将控制权返回。

如果在同意页面显示“Google 未验证此应用”(测试模式),请点击“继续”。 如果出现权限范围复选框,请在继续前选择所需的权限范围(或选择全部)。

无头/CI 流程(导出流程)

  1. 在配备浏览器的机器上完成交互式身份验证。
  2. 导出凭据:
    gws auth export --unmasked > credentials.json
    
  3. 在无头机器上:
    export GOOGLE_WORKSPACE_CLI_CREDENTIALS_FILE=/path/to/credentials.json
    gws drive files list   # 一切正常
    

服务账号(服务器到服务器)

指向您的密钥文件即可,无需登录。

export GOOGLE_WORKSPACE_CLI_CREDENTIALS_FILE=/path/to/service-account.json
gws drive files list

预先获取的访问令牌

当其他工具(如 gcloud)已为您环境生成令牌时,此方法非常实用。

export GOOGLE_WORKSPACE_CLI_TOKEN=$(gcloud auth print-access-token)

优先级

优先级 设置方式
1 访问令牌 GOOGLE_WORKSPACE_CLI_TOKEN
2 凭据文件 GOOGLE_WORKSPACE_CLI_CREDENTIALS_FILE
3 加密凭据 gws auth login
4 明文凭据 ~/.config/gws/credentials.json

环境变量也可以存储在 .env 文件中。

AI 代理技能

该仓库提供了 100 多种代理技能(SKILL.md 文件)——每种 API 都对应一种技能,此外还提供面向常见工作流的高级助手,以及针对 Gmail、Drive、Docs、Calendar 和 Sheets 的 50 个精选配方。完整列表请参阅 技能索引

# 一次性安装所有技能
npx skills add https://github.com/googleworkspace/cli

# 或者仅选择您需要的技能
npx skills add https://github.com/googleworkspace/cli/tree/main/skills/gws-drive
npx skills add https://github.com/googleworkspace/cli/tree/main/skills/gws-gmail
OpenClaw 设置
# 链接所有技能(与仓库保持同步)
ln -s $(pwd)/skills/gws-* ~/.openclaw/skills/

# 或者复制特定技能
cp -r skills/gws-drive skills/gws-gmail ~/.openclaw/skills/

gws-shared 技能包含一个 install 块,因此如果 gws 未添加到 PATH 中,OpenClaw 将自动通过 npm 安装 CLI。

Gemini CLI 扩展

  1. 首先对 CLI 进行身份验证:

    gws auth setup
    
  2. 将扩展安装至 Gemini CLI:

    gemini extensions install https://github.com/googleworkspace/cli
    

安装此扩展可让您的 Gemini CLI 代理直接访问所有 gws 命令和 Google Workspace 代理技能。由于 gws 会安全地处理自身身份验证,您只需在使用代理之前在终端进行一次身份验证,扩展便会自动继承您的凭据。

高级用法

多部分上传

gws drive files create --json '{"name": "report.pdf"}' --upload ./report.pdf

分页

标志 描述 默认值
--page-all 自动分页,每页显示一行 JSON 数据(NDJSON) 关闭
--page-limit <N> 最大可获取的页数 10
--page-delay <MS> 页面之间的延迟时间 100 ms

Google 表格 — Shell 转义

表格中的单元格范围使用 !,而 Bash 会将其解释为历史扩展。务必始终将值用 单引号 包裹:

# 从“Sheet1”中读取 A1:C10 单元格
gws sheets spreadsheets values get \
  --params '{"spreadsheetId": "SPREADSHEET_ID", "range": "Sheet1!A1:C10"}'

# 追加行
gws sheets spreadsheets values append \
  --params '{"spreadsheetId": "ID", "range": "Sheet1!A1", "valueInputOption": "USER_ENTERED"}' \
  --json '{"values": [["Name", "Score"], ["Alice", 95]]}'

辅助命令

部分服务会随自动生成的 Discovery 界面一同提供手工编写的辅助命令。这些辅助命令以 + 为前缀,以便在视觉上与 Discovery 生成的方法名称区分开来,并且绝不会与 Discovery 生成的方法名发生冲突。

时间感知型辅助命令(如 +agenda+standup-report+weekly-digest+meeting-prep)会自动使用您的 Google 账户时区(从 Calendar 设置 API 中获取并缓存 24 小时)。您可以通过在 +agenda 中添加 --timezone--tz 参数来覆盖此设置,或者通过指定 --timezone 标志来实现显式控制。

运行 gws <service> --help 命令,即可同时查看 Discovery 方法和辅助命令。

gws gmail --help      # 显示 +send、+reply、+reply-all、+forward、+triage、+watch 等方法
gws calendar --help   # 显示 +insert、+agenda 等方法
gws drive --help      # 显示 +upload 等方法

完整辅助命令参考:

服务 命令 描述
gmail +send 发送电子邮件
gmail +reply 回复消息(自动处理消息线程)
gmail +reply-all 向所有收件人回复消息
gmail +forward 将消息转发给新收件人
gmail +triage 显示未读收件箱摘要(发件人、主题、日期)
gmail +watch 监听新邮件,并以 NDJSON 格式实时流式传输
sheets +append 向电子表格中追加一行数据
sheets +read 从电子表格中读取数据
docs +write 向文档中追加文本
chat +send 向聊天空间发送消息
drive +upload 上传文件并自动附加元数据
calendar +insert 创建新的事件
calendar +agenda 显示即将发生的活动(使用 Google 账户时区;可通过 --timezone 参数进行覆盖)
script +push 使用本地文件替换 Apps Script 项目中的所有文件
workflow +standup-report 将今天的会议及待办事项汇总为 Standup 汇报
workflow +meeting-prep 为下一次会议做准备:制定议程、确定与会人员,并关联相关文档
workflow +email-to-task 将 Gmail 消息转换为 Google Tasks 条目
workflow +weekly-digest 每周总结:本周的会议情况以及未读邮件数量
workflow +file-announce 在聊天空间中宣布 Drive 文件
events +subscribe 订阅 Workspace 事件,并以 NDJSON 格式实时流式传输
events +renew 续订或重新激活 Workspace 事件订阅
modelarmor +sanitize-prompt 通过 Model Armor 模板对用户提示进行安全清理
modelarmor +sanitize-response 通过 Model Armor 模板对模型响应进行安全清理
modelarmor +create-template 创建新的 Model Armor 模板

示例:

# 发送电子邮件
gws gmail +send --to alice@example.com --subject "Hello" --body "Hi there"

# 回复消息
gws gmail +reply --message-id MESSAGE_ID --body "Thanks!"

# 向电子表格中追加一行数据
gws sheets +append --spreadsheet SPREADSHEET_ID --values "Alice,95"

# 显示今天的日历议程
gws calendar +agenda

# 上传文件到 Drive
gws drive +upload ./report.pdf --name "Q1 Report"

# 今日的 Standup 汇报
gws workflow +standup-report

# 在特定时区显示今天的议程
gws calendar +agenda --today --timezone America/New_York

Model Armor(响应安全化)

集成 Google Cloud Model Armor 以在 API 响应到达您的代理之前,对其内容进行检测,防止提示注入攻击。

gws gmail users messages get --params '...' \
  --sanitize "projects/P/locations/L/templates/T"
变量 描述
GOOGLE_WORKSPACE_CLI_SANITIZE_TEMPLATE 默认的 Model Armor 模板
GOOGLE_WORKSPACE_CLI_SANITIZE_MODE warn(默认)或 block

环境变量

所有变量均为可选。请参阅 .env.example 以获取一个复制粘贴模板。

变量 描述
GOOGLE_WORKSPACE_CLI_TOKEN 预先获取的 OAuth2 访问令牌(优先级最高)
GOOGLE_WORKSPACE_CLI_CREDENTIALS_FILE OAuth 凭据 JSON 文件的路径(用户或服务账号)
GOOGLE_WORKSPACE_CLI_CLIENT_ID OAuth 客户端 ID(可替代 client_secret.json
GOOGLE_WORKSPACE_CLI_CLIENT_SECRET OAuth 客户端密钥(与 CLIENT_ID 配对)
GOOGLE_WORKSPACE_CLI_CONFIG_DIR 覆盖配置目录(默认为 ~/.config/gws
GOOGLE_WORKSPACE_CLI_SANITIZE_TEMPLATE 默认的 Model Armor 模板
GOOGLE_WORKSPACE_CLI_SANITIZE_MODE warn(默认)或 block
GOOGLE_WORKSPACE_CLI_LOG 用于 stderr 的日志级别(例如:gws=debug)。默认关闭。
GOOGLE_WORKSPACE_CLI_LOG_FILE 用于每日轮换的 JSON 日志文件的目录。默认关闭。
GOOGLE_WORKSPACE_PROJECT_ID GCP 项目 ID,用于配额/计费的覆盖,以及辅助命令的备用选项

环境变量也可以在 .env 文件中设置(通过 dotenvy 加载)。

退出码

gws 采用结构化的退出码,因此脚本可以根据失败类型进行分支处理,而无需解析错误输出。

代码 含义 示例原因
0 成功 命令正常完成
1 API 错误 Google 返回了 4xx/5xx 响应
2 身份验证错误 凭据缺失、已过期或无效
3 验证错误 参数错误、服务未知、标志无效
4 Discovery 错误 无法获取 API 架构文档
5 内部错误 意外失败
gws drive files list --params '{"fileId": "bad"}'
echo $?   # 1 — API 错误

gws unknown-service files list
echo $?   # 3 — 验证错误(服务未知)

架构

gws 采用 两阶段解析 策略:

  1. 读取 argv[1] 以识别服务类型(例如:drive
  2. 获取服务的 Discovery 文档(缓存 24 小时)
  3. 从文档的资源和方法构建 clap::Command
  4. 重新解析剩余的参数
  5. 进行身份验证、构建 HTTP 请求并执行

所有输出——成功信息、错误信息、下载元数据——均采用结构化 JSON 格式。

排查故障

登录时出现“访问被阻止”或 403 错误

您的 OAuth 应用处于 测试模式,且您的账户并未被列入测试用户名单。

解决方法: 打开 GCP 项目中的 OAuth 同意页面测试用户添加用户 → 输入您的 Google 账户邮箱。然后重试 gws auth login

“Google 未验证此应用”

通常在您的应用处于测试模式时会出现此提示。点击 高级前往 <应用名称>(不安全) 以继续操作。此操作适用于个人使用;只有在将应用发布给其他用户时才需要进行验证。

范围过多 / 同意屏幕错误

未经验证(测试模式)的应用程序仅能使用约 25 个 OAuth 范围。预设的“推荐”范围包含众多范围,将超出此限制。

解决方法: 仅选择您所需的范围:

gws auth login --scopes drive,gmail,calendar

未找到 gcloud CLI

gws auth setup 需要 gcloud CLI 来自动创建项目。您有以下三种选择:

  1. 安装 gcloud,并直接使用 gcloud
  2. 重新运行 gws auth setup,该命令会自动包裹 gcloud 的调用。
  3. 完全跳过 gcloud——在 Cloud Console 中手动设置 OAuth 凭证。

重定向 URI 不匹配

OAuth 客户端并非以 桌面应用 类型创建。在 凭据 页面中,删除现有客户端,创建一个新的客户端,并将其类型设置为 桌面应用,然后下载新的 JSON 文件。

API 未启用 — accessNotConfigured

如果您的 GCP 项目未启用所需 Google API,您将看到一个 403 错误,错误原因显示为 accessNotConfigured

{
  "error": {
    "code": 403,
    "message": "Gmail API 已未在项目 549352339482 中使用...",
    "reason": "accessNotConfigured",
    "enable_url": "https://console.developers.google.com/apis/api/gmail.googleapis.com/overview?project=549352339482"
  }
}

gws 也会在 stderr 中打印一条可操作的提示信息:

💡 未为您的 GCP 项目启用 API。
   请前往:https://console.developers.google.com/apis/api/gmail.googleapis.com/overview?project=549352339482
   启用后,请等待几秒钟,然后重试您的命令。

解决步骤:

  1. 点击 enable_url 链接(或从 enable_url JSON 字段中复制该链接)。
  2. 在 GCP 控制台中,点击 启用
  3. 等待约 10 秒,然后重试您的 gws 命令。

[!提示] 您也可以运行 gws auth setup,该命令会自动为您完成项目中所有必需 API 的启用流程。

开发

cargo build                       # 开发构建
cargo clippy -- -D warnings       # 代码检查
cargo test                        # 单元测试
./scripts/coverage.sh             # HTML 盖度报告 → target/llvm-cov/html/

许可证

Apache-2.0

免责声明

[!注意] 这并非官方支持的 Google 产品。

版本历史

v0.22.52026/03/31
v0.22.42026/03/31
v0.22.32026/03/26
v0.22.12026/03/25
v0.22.02026/03/24
v0.21.12026/03/24
v0.20.02026/03/24
v0.19.02026/03/23
v0.18.12026/03/18
v0.18.02026/03/18
v0.17.02026/03/17
v0.16.02026/03/13
v0.15.02026/03/13
v0.14.02026/03/13
v0.13.32026/03/13
v0.13.22026/03/12
v0.13.12026/03/12
v0.12.02026/03/12
v0.11.12026/03/10
v0.11.02026/03/10

常见问题

相似工具推荐

stable-diffusion-webui

stable-diffusion-webui 是一个基于 Gradio 构建的网页版操作界面,旨在让用户能够轻松地在本地运行和使用强大的 Stable Diffusion 图像生成模型。它解决了原始模型依赖命令行、操作门槛高且功能分散的痛点,将复杂的 AI 绘图流程整合进一个直观易用的图形化平台。 无论是希望快速上手的普通创作者、需要精细控制画面细节的设计师,还是想要深入探索模型潜力的开发者与研究人员,都能从中获益。其核心亮点在于极高的功能丰富度:不仅支持文生图、图生图、局部重绘(Inpainting)和外绘(Outpainting)等基础模式,还独创了注意力机制调整、提示词矩阵、负向提示词以及“高清修复”等高级功能。此外,它内置了 GFPGAN 和 CodeFormer 等人脸修复工具,支持多种神经网络放大算法,并允许用户通过插件系统无限扩展能力。即使是显存有限的设备,stable-diffusion-webui 也提供了相应的优化选项,让高质量的 AI 艺术创作变得触手可及。

162.1k|★★★☆☆|今天
开发框架图像Agent

everything-claude-code

everything-claude-code 是一套专为 AI 编程助手(如 Claude Code、Codex、Cursor 等)打造的高性能优化系统。它不仅仅是一组配置文件,而是一个经过长期实战打磨的完整框架,旨在解决 AI 代理在实际开发中面临的效率低下、记忆丢失、安全隐患及缺乏持续学习能力等核心痛点。 通过引入技能模块化、直觉增强、记忆持久化机制以及内置的安全扫描功能,everything-claude-code 能显著提升 AI 在复杂任务中的表现,帮助开发者构建更稳定、更智能的生产级 AI 代理。其独特的“研究优先”开发理念和针对 Token 消耗的优化策略,使得模型响应更快、成本更低,同时有效防御潜在的攻击向量。 这套工具特别适合软件开发者、AI 研究人员以及希望深度定制 AI 工作流的技术团队使用。无论您是在构建大型代码库,还是需要 AI 协助进行安全审计与自动化测试,everything-claude-code 都能提供强大的底层支持。作为一个曾荣获 Anthropic 黑客大奖的开源项目,它融合了多语言支持与丰富的实战钩子(hooks),让 AI 真正成长为懂上

139k|★★☆☆☆|今天
开发框架Agent语言模型

ComfyUI

ComfyUI 是一款功能强大且高度模块化的视觉 AI 引擎,专为设计和执行复杂的 Stable Diffusion 图像生成流程而打造。它摒弃了传统的代码编写模式,采用直观的节点式流程图界面,让用户通过连接不同的功能模块即可构建个性化的生成管线。 这一设计巧妙解决了高级 AI 绘图工作流配置复杂、灵活性不足的痛点。用户无需具备编程背景,也能自由组合模型、调整参数并实时预览效果,轻松实现从基础文生图到多步骤高清修复等各类复杂任务。ComfyUI 拥有极佳的兼容性,不仅支持 Windows、macOS 和 Linux 全平台,还广泛适配 NVIDIA、AMD、Intel 及苹果 Silicon 等多种硬件架构,并率先支持 SDXL、Flux、SD3 等前沿模型。 无论是希望深入探索算法潜力的研究人员和开发者,还是追求极致创作自由度的设计师与资深 AI 绘画爱好者,ComfyUI 都能提供强大的支持。其独特的模块化架构允许社区不断扩展新功能,使其成为当前最灵活、生态最丰富的开源扩散模型工具之一,帮助用户将创意高效转化为现实。

107.7k|★★☆☆☆|2天前
开发框架图像Agent

NextChat

NextChat 是一款轻量且极速的 AI 助手,旨在为用户提供流畅、跨平台的大模型交互体验。它完美解决了用户在多设备间切换时难以保持对话连续性,以及面对众多 AI 模型不知如何统一管理的痛点。无论是日常办公、学习辅助还是创意激发,NextChat 都能让用户随时随地通过网页、iOS、Android、Windows、MacOS 或 Linux 端无缝接入智能服务。 这款工具非常适合普通用户、学生、职场人士以及需要私有化部署的企业团队使用。对于开发者而言,它也提供了便捷的自托管方案,支持一键部署到 Vercel 或 Zeabur 等平台。 NextChat 的核心亮点在于其广泛的模型兼容性,原生支持 Claude、DeepSeek、GPT-4 及 Gemini Pro 等主流大模型,让用户在一个界面即可自由切换不同 AI 能力。此外,它还率先支持 MCP(Model Context Protocol)协议,增强了上下文处理能力。针对企业用户,NextChat 提供专业版解决方案,具备品牌定制、细粒度权限控制、内部知识库整合及安全审计等功能,满足公司对数据隐私和个性化管理的高标准要求。

87.6k|★★☆☆☆|今天
开发框架语言模型

ML-For-Beginners

ML-For-Beginners 是由微软推出的一套系统化机器学习入门课程,旨在帮助零基础用户轻松掌握经典机器学习知识。这套课程将学习路径规划为 12 周,包含 26 节精炼课程和 52 道配套测验,内容涵盖从基础概念到实际应用的完整流程,有效解决了初学者面对庞大知识体系时无从下手、缺乏结构化指导的痛点。 无论是希望转型的开发者、需要补充算法背景的研究人员,还是对人工智能充满好奇的普通爱好者,都能从中受益。课程不仅提供了清晰的理论讲解,还强调动手实践,让用户在循序渐进中建立扎实的技能基础。其独特的亮点在于强大的多语言支持,通过自动化机制提供了包括简体中文在内的 50 多种语言版本,极大地降低了全球不同背景用户的学习门槛。此外,项目采用开源协作模式,社区活跃且内容持续更新,确保学习者能获取前沿且准确的技术资讯。如果你正寻找一条清晰、友好且专业的机器学习入门之路,ML-For-Beginners 将是理想的起点。

85k|★★☆☆☆|今天
图像数据工具视频

ragflow

RAGFlow 是一款领先的开源检索增强生成(RAG)引擎,旨在为大语言模型构建更精准、可靠的上下文层。它巧妙地将前沿的 RAG 技术与智能体(Agent)能力相结合,不仅支持从各类文档中高效提取知识,还能让模型基于这些知识进行逻辑推理和任务执行。 在大模型应用中,幻觉问题和知识滞后是常见痛点。RAGFlow 通过深度解析复杂文档结构(如表格、图表及混合排版),显著提升了信息检索的准确度,从而有效减少模型“胡编乱造”的现象,确保回答既有据可依又具备时效性。其内置的智能体机制更进一步,使系统不仅能回答问题,还能自主规划步骤解决复杂问题。 这款工具特别适合开发者、企业技术团队以及 AI 研究人员使用。无论是希望快速搭建私有知识库问答系统,还是致力于探索大模型在垂直领域落地的创新者,都能从中受益。RAGFlow 提供了可视化的工作流编排界面和灵活的 API 接口,既降低了非算法背景用户的上手门槛,也满足了专业开发者对系统深度定制的需求。作为基于 Apache 2.0 协议开源的项目,它正成为连接通用大模型与行业专有知识之间的重要桥梁。

77.1k|★★★☆☆|昨天
Agent图像开发框架