clui-cc

GitHub
1.1k 157 较难 1 次阅读 今天MIT语言模型Agent插件
AI 解读 由 AI 自动生成,仅供参考

clui-cc 是一款专为 macOS 设计的轻量级桌面悬浮工具,旨在为 Anthropic 的命令行助手 Claude Code 提供直观的图形化操作界面。它巧妙地在保留命令行强大功能的同时,通过一个透明、可穿透的“药丸状”悬浮窗,解决了纯文本交互在权限审批、多任务管理和历史记录回溯上的不便。

这款工具特别适合希望提升效率的开发者和技术研究人员。用户无需离开代码环境,即可通过快捷键随时呼出界面,利用多标签页功能并行处理多个独立的编程会话。其核心亮点在于“人机协同”的安全机制:当 AI 尝试执行文件修改等敏感操作时,clui-cc 会立即拦截并弹出可视化确认窗口,让用户在批准前清晰审查每一步动作。此外,它还集成了本地语音输入(基于 Whisper)、截图与文件拖拽上传、以及一键安装技能插件的市场功能。所有数据均在本地运行,不依赖云端遥测,既保障了隐私安全,又实现了流畅的原生应用体验,让复杂的命令行交互变得简单可控。

使用场景

资深后端工程师李明正在 macOS 上利用 Claude Code 重构一个遗留的微服务模块,需要频繁执行文件读取、代码修改及终端命令等高风险操作。

没有 clui-cc 时

  • 审批流程割裂:每次 Claude 提议修改文件或运行命令时,必须在纯文本终端中手动输入"y"或"n"确认,无法直观预览变更详情,容易误操作。
  • 多任务切换低效:同时处理“数据库迁移”和"API 接口优化”两个独立任务时,需在多个终端窗口间反复切换,上下文极易混淆且难以恢复中断的会话。
  • 交互方式单一:在双手忙于查阅文档或绘制架构图时,无法通过语音快速下达指令或记录思路,必须停下手头工作敲击键盘。
  • 历史回溯困难:想要找回半小时前某个被否决的代码生成方案,只能在冗长的终端滚屏中费力查找,缺乏可视化的会话历史记录。

使用 clui-cc 后

  • 可视化安全管控:clui-cc 以悬浮胶囊窗形式拦截工具调用,提供清晰的权限审批界面,李明明晰地看到每个文件变更差异后再点击批准,杜绝了盲目执行。
  • 标签页隔离会话:利用多标签功能,他为不同任务开启独立会话标签,随时在不同上下文间无缝切换,甚至隔天还能直接恢复之前的编程状态。
  • 语音驱动开发:借助集成的 Whisper 语音输入,李明口述需求即可让 clui-cc 自动转译并发送给 Claude,实现了真正的“眼不离屏、手不离图”流畅开发。
  • 一键追溯历史:通过内置的会话浏览器,他能像浏览网页标签一样快速定位并重启过去的对话,瞬间找回之前的灵感片段。

clui-cc 将原本枯燥且高风险的命令行交互升级为直观、安全且支持多模态的桌面原生工作流,让人类专家真正掌控 AI 编码的节奏。

运行环境要求

操作系统
  • macOS
GPU

未说明(语音功能依赖本地 Whisper,Apple Silicon 推荐安装 whisperkit-cli,Intel Mac 或备选方案安装 whisper-cpp,无独立 GPU 显存要求)

内存

未说明

依赖
notes该工具仅支持 macOS 13+ 系统,不支持 Windows 和 Linux。必须预先安装并认证 Anthropic 的 Claude Code CLI(需 Pro/Team/Enterprise 订阅)。首次运行若遇到 macOS 安全拦截,需在“系统设置 -> 隐私与安全性”中点击“仍然打开”。语音输入功能会自动安装本地 Whisper 模型,无需 API 密钥。
python3.12+ (需安装 setuptools)
Node.js 18+ (推荐 20.x 或 22.x LTS)
@anthropic-ai/claude-code CLI
Electron 33.x
whisperkit-cli (Apple Silicon) 或 whisper-cpp (Intel/备选)
Xcode Command Line Tools
clui-cc hero image

快速开始

Clui CC — Claude Code 的命令行用户界面

一款轻量级、透明的桌面叠加层,适用于 macOS 上的 Claude Code。Clui CC 将 Claude Code CLI 包装在一个浮动药丸式界面中,支持多标签会话、权限审批 UI、语音输入以及技能市场。

演示

观看演示

▶ 在 YouTube 上观看完整演示

功能

  • 浮动叠加层 — 透明、可穿透的窗口,始终位于最上层。可通过 ⌥ + Space 切换(备用快捷键:Cmd+Shift+K)。
  • 多标签会话 — 每个标签页都会启动一个独立的 claude -p 进程,拥有独立的会话状态。
  • 权限审批 UI — 通过 PreToolUse HTTP 钩子拦截工具调用,以便您可以在界面上审查并批准或拒绝。
  • 对话历史 — 浏览并恢复过去的 Claude Code 会话。
  • 技能市场 — 无需离开 Clui CC 即可从 Anthropic 的 GitHub 仓库安装插件。
  • 语音输入 — 使用 Whisper 进行本地语音转文本(必需,会自动安装)。
  • 文件与截图附件 — 直接粘贴图片或附加文件。
  • 双主题模式 — 暗色/亮色模式,并支持跟随系统设置。

为什么选择 Clui CC

  • Claude Code,但更直观 — 保留 CLI 的强大功能,同时获得用于审批、历史记录和多任务处理的快速桌面用户体验。
  • 人机协作安全性 — 工具调用会在执行前于应用内进行审查和批准。
  • 会话原生工作流 — 每个标签页运行一个独立的 Claude 会话,您可以稍后继续使用。
  • 本地优先 — 所有操作都通过您本地的 Claude CLI 运行。无遥测数据,无云端依赖。

工作原理

UI 提示 → 主进程启动 claude -p → NDJSON 流 → 实时渲染
                                         → 是否调用工具? → 权限 UI → 批准/拒绝

完整的深入解析请参阅 docs/ARCHITECTURE.md

安装应用(推荐)

以常规 Mac 应用程序形式运行 Clui CC 的最快方式。此方法会安装依赖项、语音支持(Whisper)、构建应用程序、将其复制到 /Applications 并启动它。

1) 克隆仓库

git clone https://github.com/lcoutodemos/clui-cc.git

2) 双击 install-app.command

在 Finder 中打开 clui-cc 文件夹,然后双击 install-app.command

首次启动: macOS 可能会阻止该应用,因为它未签名。请前往 系统设置 → 隐私与安全性 → 仍要打开。您只需执行此操作一次。 清理文件夹: 安装程序会在成功安装后删除临时的 dist/release/ 文件夹,以保持仓库整洁。

按 Option + Space 显示或隐藏 Clui CC

首次安装完成后,只需从“应用程序”文件夹或 Spotlight 中打开 Clui CC 即可。

终端 / 开发者命令

仅将 install-app.command 保留在根目录是为了方便非技术人员使用。开发人员脚本位于 commands/ 目录中。

快速开始(终端)

git clone https://github.com/lcoutodemos/clui-cc.git
cd clui-cc
./commands/setup.command
./commands/start.command

⌥ + Space 可显示/隐藏叠加层。如果您使用的 macOS 输入源占用了该组合键,请使用 Cmd+Shift+K

停止运行:

./commands/stop.command

开发者工作流程

npm install
npm run dev

渲染器的更改会立即更新。主进程的更改则需要重启 npm run dev

其他命令

命令 用途
./commands/setup.command 环境检查 + 安装依赖
./commands/start.command 从源代码构建并启动
./commands/stop.command 停止所有 Clui CC 进程
npm run build 生产构建(不打包)
npm run dist 打包为 macOS .app 文件,存入 release/
npm run doctor 运行环境诊断
设置前提条件(详细)

您需要 macOS 13 或更高版本。然后依次安装以下内容——将每条命令复制并粘贴到终端中。

步骤 1. 安装 Xcode 命令行工具(编译原生模块所需):

xcode-select --install

步骤 2. 安装 Node.js(推荐使用当前 LTS 版本,如 20 或 22;最低支持版本为 18)。可从 nodejs.org 下载,或使用 Homebrew:

brew install node

确认已添加到 PATH:

node --version

步骤 3. 确保 Python 安装了 setuptools(原生模块编译器所需)。在 Python 3.12 及以上版本中,默认情况下可能缺少此组件:

python3 -m pip install --upgrade pip setuptools

步骤 4. 安装 Claude Code CLI:

npm install -g @anthropic-ai/claude-code

步骤 5. 认证 Claude Code(按照出现的提示操作):

claude

步骤 6. 安装 Whisper 以实现语音输入:

# Apple Silicon(M1/M2/M3/M4)— 推荐:
brew install whisperkit-cli
# Apple Silicon 备用方案,或 Intel Mac:
brew install whisper-cpp

无需 API 密钥或 .env 文件。 Clui CC 使用您现有的 Claude Code CLI 认证(Pro/Team/Enterprise 订阅)。

架构与内部机制

项目结构

src/
├── main/                   # Electron 主进程
│   ├── claude/             # 控制平面、运行管理器、事件归一化器
│   ├── hooks/              # 权限服务器(PreToolUse HTTP 钩子)
│   ├── marketplace/        # 插件目录获取 + 安装
│   ├── skills/             # 技能自动安装程序
│   └── index.ts            # 窗口创建、IPC 处理程序、系统托盘
├── renderer/               # React 前端
│   ├── components/         # 标签栏、对话视图、输入栏等
│   ├── stores/             # Zustand 会话存储
│   ├── hooks/              # 事件监听器、健康状态同步
│   └── theme.ts            # 双色板 + CSS 自定义属性
├── preload/                # 安全 IPC 桥(window.clui API)
└── shared/                 # 统一类型、IPC 通道定义

工作原理

  1. 每个标签页会创建一个 claude -p --output-format stream-json 子进程。
  2. NDJSON 事件由 RunManager 解析,并由 EventNormalizer 归一化。
  3. ControlPlane 管理标签页的生命周期(连接 → 空闲 → 运行 → 完成/失败/终止)。
  4. 工具权限请求通过 HTTP 钩子到达 PermissionServer(仅限本地)。
  5. 渲染器每 1.5 秒轮询一次后端健康状况,并同步标签页状态。
  6. 会话可通过 --resume <session-id> 恢复,以确保连续性。

网络行为

Clui CC 几乎完全离线运行。唯一的出站网络请求如下:

终端地址 用途 是否必需
raw.githubusercontent.com/anthropics/* 市场目录(缓存 5 分钟) 否 — 可优雅降级
api.github.com/repos/anthropics/*/tarball/* 启动时自动安装技能 否 — 失败时跳过

无遥测、分析或自动更新机制。所有 Claude Code 核心交互均通过本地 CLI 进行。

故障排除

有关设置问题和恢复命令,请参阅 docs/TROUBLESHOOTING.md

快速自检命令:

npm run doctor

测试环境

组件 版本
macOS 15.x (Sequoia)
Node.js 20.x LTS、22.x
Python 3.12(已安装 setuptools)
Electron 33.x
Claude Code CLI 2.1.71

已知限制

  • 仅支持 macOS — 透明叠加层、系统托盘图标和 node-pty 均为 macOS 特有功能。目前尚未实现 Windows 和 Linux 支持。
  • 需要 Claude Code CLI — Clui CC 是一个 UI 层,而非独立的 AI 客户端。您需要一个已认证的 claude CLI。
  • 权限模式 — 使用 --permission-mode default。PTY 交互式传输属于遗留功能,默认已禁用。

许可证

MIT

常见问题

相似工具推荐

openclaw

OpenClaw 是一款专为个人打造的本地化 AI 助手,旨在让你在自己的设备上拥有完全可控的智能伙伴。它打破了传统 AI 助手局限于特定网页或应用的束缚,能够直接接入你日常使用的各类通讯渠道,包括微信、WhatsApp、Telegram、Discord、iMessage 等数十种平台。无论你在哪个聊天软件中发送消息,OpenClaw 都能即时响应,甚至支持在 macOS、iOS 和 Android 设备上进行语音交互,并提供实时的画布渲染功能供你操控。 这款工具主要解决了用户对数据隐私、响应速度以及“始终在线”体验的需求。通过将 AI 部署在本地,用户无需依赖云端服务即可享受快速、私密的智能辅助,真正实现了“你的数据,你做主”。其独特的技术亮点在于强大的网关架构,将控制平面与核心助手分离,确保跨平台通信的流畅性与扩展性。 OpenClaw 非常适合希望构建个性化工作流的技术爱好者、开发者,以及注重隐私保护且不愿被单一生态绑定的普通用户。只要具备基础的终端操作能力(支持 macOS、Linux 及 Windows WSL2),即可通过简单的命令行引导完成部署。如果你渴望拥有一个懂你

349.3k|★★★☆☆|1周前
Agent开发框架图像

stable-diffusion-webui

stable-diffusion-webui 是一个基于 Gradio 构建的网页版操作界面,旨在让用户能够轻松地在本地运行和使用强大的 Stable Diffusion 图像生成模型。它解决了原始模型依赖命令行、操作门槛高且功能分散的痛点,将复杂的 AI 绘图流程整合进一个直观易用的图形化平台。 无论是希望快速上手的普通创作者、需要精细控制画面细节的设计师,还是想要深入探索模型潜力的开发者与研究人员,都能从中获益。其核心亮点在于极高的功能丰富度:不仅支持文生图、图生图、局部重绘(Inpainting)和外绘(Outpainting)等基础模式,还独创了注意力机制调整、提示词矩阵、负向提示词以及“高清修复”等高级功能。此外,它内置了 GFPGAN 和 CodeFormer 等人脸修复工具,支持多种神经网络放大算法,并允许用户通过插件系统无限扩展能力。即使是显存有限的设备,stable-diffusion-webui 也提供了相应的优化选项,让高质量的 AI 艺术创作变得触手可及。

162.1k|★★★☆☆|1周前
开发框架图像Agent

everything-claude-code

everything-claude-code 是一套专为 AI 编程助手(如 Claude Code、Codex、Cursor 等)打造的高性能优化系统。它不仅仅是一组配置文件,而是一个经过长期实战打磨的完整框架,旨在解决 AI 代理在实际开发中面临的效率低下、记忆丢失、安全隐患及缺乏持续学习能力等核心痛点。 通过引入技能模块化、直觉增强、记忆持久化机制以及内置的安全扫描功能,everything-claude-code 能显著提升 AI 在复杂任务中的表现,帮助开发者构建更稳定、更智能的生产级 AI 代理。其独特的“研究优先”开发理念和针对 Token 消耗的优化策略,使得模型响应更快、成本更低,同时有效防御潜在的攻击向量。 这套工具特别适合软件开发者、AI 研究人员以及希望深度定制 AI 工作流的技术团队使用。无论您是在构建大型代码库,还是需要 AI 协助进行安全审计与自动化测试,everything-claude-code 都能提供强大的底层支持。作为一个曾荣获 Anthropic 黑客大奖的开源项目,它融合了多语言支持与丰富的实战钩子(hooks),让 AI 真正成长为懂上

152.6k|★★☆☆☆|今天
开发框架Agent语言模型

ComfyUI

ComfyUI 是一款功能强大且高度模块化的视觉 AI 引擎,专为设计和执行复杂的 Stable Diffusion 图像生成流程而打造。它摒弃了传统的代码编写模式,采用直观的节点式流程图界面,让用户通过连接不同的功能模块即可构建个性化的生成管线。 这一设计巧妙解决了高级 AI 绘图工作流配置复杂、灵活性不足的痛点。用户无需具备编程背景,也能自由组合模型、调整参数并实时预览效果,轻松实现从基础文生图到多步骤高清修复等各类复杂任务。ComfyUI 拥有极佳的兼容性,不仅支持 Windows、macOS 和 Linux 全平台,还广泛适配 NVIDIA、AMD、Intel 及苹果 Silicon 等多种硬件架构,并率先支持 SDXL、Flux、SD3 等前沿模型。 无论是希望深入探索算法潜力的研究人员和开发者,还是追求极致创作自由度的设计师与资深 AI 绘画爱好者,ComfyUI 都能提供强大的支持。其独特的模块化架构允许社区不断扩展新功能,使其成为当前最灵活、生态最丰富的开源扩散模型工具之一,帮助用户将创意高效转化为现实。

108.3k|★★☆☆☆|3天前
开发框架图像Agent

gemini-cli

gemini-cli 是一款由谷歌推出的开源 AI 命令行工具,它将强大的 Gemini 大模型能力直接集成到用户的终端环境中。对于习惯在命令行工作的开发者而言,它提供了一条从输入提示词到获取模型响应的最短路径,无需切换窗口即可享受智能辅助。 这款工具主要解决了开发过程中频繁上下文切换的痛点,让用户能在熟悉的终端界面内直接完成代码理解、生成、调试以及自动化运维任务。无论是查询大型代码库、根据草图生成应用,还是执行复杂的 Git 操作,gemini-cli 都能通过自然语言指令高效处理。 它特别适合广大软件工程师、DevOps 人员及技术研究人员使用。其核心亮点包括支持高达 100 万 token 的超长上下文窗口,具备出色的逻辑推理能力;内置 Google 搜索、文件操作及 Shell 命令执行等实用工具;更独特的是,它支持 MCP(模型上下文协议),允许用户灵活扩展自定义集成,连接如图像生成等外部能力。此外,个人谷歌账号即可享受免费的额度支持,且项目基于 Apache 2.0 协议完全开源,是提升终端工作效率的理想助手。

100.8k|★★☆☆☆|3天前
插件Agent图像

markitdown

MarkItDown 是一款由微软 AutoGen 团队打造的轻量级 Python 工具,专为将各类文件高效转换为 Markdown 格式而设计。它支持 PDF、Word、Excel、PPT、图片(含 OCR)、音频(含语音转录)、HTML 乃至 YouTube 链接等多种格式的解析,能够精准提取文档中的标题、列表、表格和链接等关键结构信息。 在人工智能应用日益普及的今天,大语言模型(LLM)虽擅长处理文本,却难以直接读取复杂的二进制办公文档。MarkItDown 恰好解决了这一痛点,它将非结构化或半结构化的文件转化为模型“原生理解”且 Token 效率极高的 Markdown 格式,成为连接本地文件与 AI 分析 pipeline 的理想桥梁。此外,它还提供了 MCP(模型上下文协议)服务器,可无缝集成到 Claude Desktop 等 LLM 应用中。 这款工具特别适合开发者、数据科学家及 AI 研究人员使用,尤其是那些需要构建文档检索增强生成(RAG)系统、进行批量文本分析或希望让 AI 助手直接“阅读”本地文件的用户。虽然生成的内容也具备一定可读性,但其核心优势在于为机器

93.4k|★★☆☆☆|6天前
插件开发框架