gemini-cli

100.8k 13k 简单 5 次阅读今天Apache-2.0插件Agent图像开发框架

AI 解读由 AI 自动生成，仅供参考

gemini-cli 是一款由谷歌推出的开源 AI 命令行工具，它将强大的 Gemini 大模型能力直接集成到用户的终端环境中。对于习惯在命令行工作的开发者而言，它提供了一条从输入提示词到获取模型响应的最短路径，无需切换窗口即可享受智能辅助。

这款工具主要解决了开发过程中频繁上下文切换的痛点，让用户能在熟悉的终端界面内直接完成代码理解、生成、调试以及自动化运维任务。无论是查询大型代码库、根据草图生成应用，还是执行复杂的 Git 操作，gemini-cli 都能通过自然语言指令高效处理。

它特别适合广大软件工程师、DevOps 人员及技术研究人员使用。其核心亮点包括支持高达 100 万 token 的超长上下文窗口，具备出色的逻辑推理能力；内置 Google 搜索、文件操作及 Shell 命令执行等实用工具；更独特的是，它支持 MCP（模型上下文协议），允许用户灵活扩展自定义集成，连接如图像生成等外部能力。此外，个人谷歌账号即可享受免费的额度支持，且项目基于 Apache 2.0 协议完全开源，是提升终端工作效率的理想助手。

使用场景

资深后端工程师小李正在处理一个遗留的单体项目，需要紧急重构一段复杂的数据库迁移脚本并修复关联的单元测试。

没有 gemini-cli 时

上下文切换频繁：必须手动复制代码片段到网页版 AI 对话框，再将生成的代码粘贴回终端编辑器，打断心流。
本地文件操作受限：AI 无法直接读取本地数千行的旧代码库或执行 Shell 命令验证环境，只能靠人工描述报错信息。
调试效率低下：遇到复杂的依赖冲突或重基（rebase）问题时，需反复在浏览器和文档间搜索解决方案，耗时且易出错。
多模态支持缺失：无法直接将架构草图或错误日志截图拖入对话让 AI 分析，只能转为文字描述，丢失关键细节。

使用 gemini-cli 后

终端内闭环开发：直接在命令行调用 gemini-cli，它能读取当前目录代码并原地修改文件，实现“提问即执行”。
原生工具链集成：利用内置的 Shell 命令和文件操作能力，自动运行测试脚本、查询 Git 状态甚至处理复杂的重基操作。
智能故障排查：遇到报错时，gemini-cli 可结合 1M token 上下文窗口分析整个项目结构，直接给出修复方案并应用。
多模态即时交互：直接在终端传入截图或 PDF 文档，gemini-cli 利用 Gemini 3 的多模态能力瞬间理解意图并生成对应代码。

gemini-cli 将强大的 AI 推理能力无缝融入开发者最熟悉的终端环境，彻底消除了上下文切换成本，让代码重构与自动化任务变得像输入一行命令般简单高效。

运行环境要求

操作系统

Linux
macOS
Windows

GPU

未说明

内存

未说明

依赖

notes该工具是基于 Node.js 的命令行应用，无需本地 GPU 或大型模型下载（通过 API 调用云端 Gemini 模型）。支持通过 npm、Homebrew、MacPorts 或 Anaconda (需先安装 nodejs) 进行安装。使用时需要配置 Google 账号 OAuth、Gemini API Key 或 Vertex AI 凭证。

python未说明

Node.js

npm

快速开始

Gemini CLI

Gemini CLI 截图

Gemini CLI 是一款开源的 AI 助手，它将 Gemini 的强大功能直接带入您的终端。通过轻量级的方式访问 Gemini，让您能够以最直接的方式从输入提示直达我们的模型。

您可以在我们的文档中了解关于 Gemini CLI 的所有信息。

🚀 为什么选择 Gemini CLI？

🎯 免费层级：使用个人 Google 账号时，每分钟可进行 60 次请求，每日上限为 1,000 次。
🧠 强大的 Gemini 3 模型：支持更出色的推理能力，并拥有 100 万 token 的上下文窗口。
🔧 内置工具：包括 Google 搜索增强、文件操作、Shell 命令以及网页抓取等功能。
🔌 可扩展性：支持 MCP（模型上下文协议），便于自定义集成。
💻 终端优先：专为习惯在命令行中工作的开发者设计。
🛡️ 开源：采用 Apache 2.0 许可证。

📦 安装

请参阅 Gemini CLI 的安装、运行与发布说明，以获取推荐的系统配置及详细的安装指南。

快速安装

使用 npx 即刻运行

# 使用 npx（无需安装）
npx @google/gemini-cli

使用 npm 全局安装

npm install -g @google/gemini-cli

使用 Homebrew（macOS/Linux）全局安装

brew install gemini-cli

使用 MacPorts（macOS）全局安装

sudo port install gemini-cli

在受限环境中使用 Anaconda 安装

# 创建并激活新环境
conda create -y -n gemini_env -c conda-forge nodejs
conda activate gemini_env

# 在该环境中通过 npm 全局安装 Gemini CLI
npm install -g @google/gemini-cli

发布渠道

更多详情请参阅发布记录。

预览版

每周二 UTC 时间 23:59 将发布新的预览版本。这些版本尚未经过全面测试，可能包含回归或其他未解决的问题。欢迎您帮助我们测试，并使用 preview 标签进行安装。

npm install -g @google/gemini-cli@preview

稳定版

每周二 UTC 时间 20:00 将发布新的稳定版本，这将是上周预览版的完整升级版本，同时包含所有修复和验证内容。请使用 latest 标签。

npm install -g @google/gemini-cli@latest

夜间版

每天 UTC 时间 00:00 将发布新的夜间版本。此版本包含了主分支在发布时刻的所有更改，但可能存在尚未完成的验证和问题。请使用 nightly 标签。

npm install -g @google/gemini-cli@nightly

📋 核心功能

代码理解与生成

查询和编辑大型代码库
利用多模态能力，从 PDF、图片或草图生成新应用
使用自然语言调试问题并进行故障排除

自动化与集成

自动执行操作任务，例如查询拉取请求或处理复杂的变基操作
使用 MCP 服务器连接新功能，包括使用 Imagen、Veo 或 Lyria 进行媒体生成
在脚本中非交互式运行，实现工作流自动化

高级功能

通过内置的 Google 搜索增强查询，获取实时信息
对话检查点功能，可保存并恢复复杂会话
自定义上下文文件（GEMINI.md），以便根据您的项目需求调整行为

GitHub 集成

通过 Gemini CLI GitHub Action，您可以将 Gemini CLI 直接集成到 GitHub 工作流中：

拉取请求评审：基于上下文的反馈和建议，自动进行代码评审
问题分类：根据内容分析，自动对 GitHub 问题进行标记和优先级排序
按需协助：在问题和拉取请求中提及 @gemini-cli，即可获得调试、解释或任务委派方面的帮助
自定义工作流：构建适合您团队需求的自动化、定时及按需工作流

🔐 身份验证选项

请选择最适合您的身份验证方式：

选项 1：使用 Google 账号登录（OAuth）

✨ 适用人群：个人开发者以及拥有 Gemini Code Assist 许可证的用户。（详情请参阅配额限制与服务条款）

优势：

免费层级：每分钟 60 次请求，每日 1,000 次请求
Gemini 3 模型，具备 100 万 token 的上下文窗口
无需管理 API 密钥——只需使用您的 Google 账号登录即可
自动更新至最新模型

启动 Gemini CLI 后，选择“使用 Google 登录”，并在提示时按照浏览器中的认证流程操作。

gemini

如果您使用的是组织提供的付费 Code Assist 许可证，请务必设置 Google Cloud 项目。

# 设置您的 Google Cloud 项目
export GOOGLE_CLOUD_PROJECT="YOUR_PROJECT_ID"
gemini

选项 2：Gemini API 密钥

✨ 适用人群：需要特定模型控制或付费层级访问权限的开发者

优势：

免费层级：每天 1,000 次请求，使用 Gemini 3 模型（混合 flash 和 pro 版本）
模型选择：可以选择特定的 Gemini 模型
按用量计费：当需要更高限额时可进行升级

# 从 https://aistudio.google.com/apikey 获取您的密钥
export GEMINI_API_KEY="YOUR_API_KEY"
gemini

选项 3：Vertex AI

✨ 适用人群：企业团队和生产工作负载

优势：

企业级特性：高级安全性和合规性
可扩展性：通过计费账户可获得更高的速率限制
集成性：可与现有的 Google Cloud 基础设施无缝对接

# 从 Google Cloud 控制台获取您的密钥
export GOOGLE_API_KEY="YOUR_API_KEY"
export GOOGLE_GENAI_USE_VERTEXAI=true
gemini

有关 Google Workspace 账号及其他身份验证方法，请参阅身份验证指南。

🚀 入门

基本用法

在当前目录启动

gemini

包含多个目录

gemini --include-directories ../lib,../docs

使用特定模型

gemini -m gemini-2.5-flash

非交互模式用于脚本

获取简单的文本响应：

gemini -p "解释这个代码库的架构"

对于更高级的脚本编写，包括如何解析 JSON 和处理错误，请使用 --output-format json 标志来获取结构化输出：

gemini -p "解释这个代码库的架构" --output-format json

对于实时事件流（适用于监控长时间运行的操作），可以使用 --output-format stream-json 来获取以换行符分隔的 JSON 事件：

gemini -p "运行测试并部署" --output-format stream-json

快速示例

开始一个新项目

cd new-project/
gemini
> 写一个 Discord 机器人，使用我提供的 FAQ.md 文件回答问题

分析现有代码

git clone https://github.com/google-gemini/gemini-cli
cd gemini-cli
gemini
> 给我总结一下昨天的所有更改

📚 文档

入门

快速入门指南 - 快速上手。
认证设置 - 详细的认证配置。
配置指南 - 设置与自定义。
快捷键 - 提高效率的小技巧。

核心功能

命令参考 - 所有斜杠命令（/help、/chat 等）。
自定义命令 - 创建您自己的可重复使用命令。
上下文文件 (GEMINI.md) - 为 Gemini CLI 提供持久化的上下文。
检查点功能 - 保存和恢复对话。
令牌缓存 - 优化令牌使用。

工具与扩展

内置工具概览
MCP 服务器集成 - 通过自定义工具进行扩展。
自定义扩展 - 构建并分享您自己的命令。

进阶主题

无头模式（脚本化） - 在自动化工作流中使用 Gemini CLI。
IDE 集成 - VS Code 的伴侣。
沙盒与安全 - 安全的执行环境。
受信任的文件夹 - 按照文件夹控制执行策略。
企业指南 - 在企业环境中部署和管理。
遥测与监控 - 使用情况跟踪。
工具参考 - 内置工具概览。
本地开发 - 本地开发工具。

故障排除与支持

故障排除指南 - 常见问题及解决方案。
常见问题解答 - 常见问题。
使用 /bug 命令可以直接从 CLI 报告问题。

使用 MCP 服务器

在 ~/.gemini/settings.json 中配置 MCP 服务器，以通过自定义工具扩展 Gemini CLI：

> @github 列出我的未合并拉取请求
> @slack 将今天的提交摘要发送到 #dev 频道
> @database 执行查询以查找不活跃用户

请参阅 MCP 服务器集成指南以获取设置说明。

🤝 贡献

我们欢迎所有贡献！Gemini CLI 是完全开源的（Apache 2.0），我们鼓励社区：

报告 bug 并提出功能建议。
改善文档。
提交代码改进。
分享您的 MCP 服务器和扩展。

请参阅我们的贡献指南了解开发设置、编码规范以及如何提交拉取请求。

查看我们的官方路线图以了解计划中的功能和优先级。

📖 资源

官方路线图 - 查看接下来的计划。
变更日志 - 查看最近的重要更新。
NPM 包 - 包注册表。
GitHub 问题 - 报告 bug 或请求功能。
安全公告 - 安全更新。

卸载

请参阅卸载指南以获取移除说明。

📄 法律声明

许可证: Apache 许可证 2.0
服务条款: 条款与隐私
安全: 安全政策

由 Google 和开源社区用心打造

Gemini CLI 快速上手指南

Gemini CLI 是一款开源的 AI 命令行工具，让您直接在终端中调用强大的 Gemini 模型，进行代码理解、生成、调试及自动化任务。

环境准备

在开始之前，请确保您的系统满足以下基本要求：

操作系统：支持 macOS、Linux 或 Windows（需配置相应终端环境）。
前置依赖：
- Node.js：推荐安装最新 LTS 版本（用于 npm/npx 安装方式）。
- 包管理器（可选）：
  - macOS/Linux: npm 或 Homebrew
  - macOS: MacPorts
  - 受限环境：Anaconda (需包含 nodejs)
网络环境：由于服务由 Google 提供，中国大陆用户可能需要配置网络代理才能正常连接 API 或使用 OAuth 登录。

安装步骤

您可以根据习惯选择以下任意一种方式进行安装：

方式一：免安装运行（推荐尝试）

无需全局安装，直接使用 npx 运行：

npx @google/gemini-cli

方式二：全局安装 (npm)

适合频繁使用的开发者：

npm install -g @google/gemini-cli

方式三：使用 Homebrew (macOS/Linux)

brew install gemini-cli

方式四：使用 MacPorts (macOS)

sudo port install gemini-cli

方式五：Anaconda 环境（适用于受限环境）

# 创建并激活新环境
conda create -y -n gemini_env -c conda-forge nodejs
conda activate gemini_env

# 在环境中全局安装
npm install -g @google/gemini-cli

提示：如需体验最新预览版或每日构建版，可在上述 npm 命令后添加 @preview 或 @nightly 标签。

基本使用

1. 认证登录

启动工具后，首选通过 Google 账号登录（免费额度：60 次/分钟，1000 次/天）：

gemini

启动后选择 Sign in with Google，按提示在浏览器完成授权即可。

替代方案：使用 API Key 如果您更倾向于使用 API Key，请先设置环境变量：

export GEMINI_API_KEY="YOUR_API_KEY"
gemini

2. 交互式对话

进入当前目录并启动交互模式，可直接询问代码库或请求生成代码：

cd your-project-folder
gemini

示例对话：

> Write me a Discord bot that answers questions using a FAQ.md file I will provide
> Give me a summary of all of the changes that went in yesterday

3. 指定目录与模型

您可以包含多个目录或使用特定模型版本：

# 包含多个目录
gemini --include-directories ../lib,../docs

# 指定模型
gemini -m gemini-2.5-flash

4. 脚本化与非交互模式

在 Shell 脚本中直接获取结果，支持纯文本或 JSON 格式输出：

# 获取纯文本回答
gemini -p "Explain the architecture of this codebase"

# 获取结构化 JSON 输出（便于程序解析）
gemini -p "Explain the architecture of this codebase" --output-format json

# 实时事件流输出（适合监控长任务）
gemini -p "Run tests and deploy" --output-format stream-json

版本历史

v0.37.12026/04/09

v0.39.0-nightly.20260409.615e078342026/04/09

v0.39.0-nightly.20260408.a394617182026/04/08

v0.37.02026/04/08

v0.38.0-preview.02026/04/08

v0.37.0-preview.22026/04/07

v0.36.0-nightly.20260407.1c22c5b372026/04/07

v0.36.0-nightly.20260406.15298b28c2026/04/06

v0.37.0-preview.12026/04/02

v0.36.0-nightly.20260402.13ccc16452026/04/02

v0.36.02026/04/01

v0.37.0-preview.02026/04/01

v0.36.0-preview.82026/04/01

v0.36.0-preview.72026/03/31

v0.35.32026/03/28

v0.36.0-preview.62026/03/28

v0.36.0-preview.52026/03/27

v0.35.22026/03/26

v0.36.0-preview.42026/03/26

v0.35.12026/03/26

相似工具推荐

openclaw

OpenClaw 是一款专为个人打造的本地化 AI 助手，旨在让你在自己的设备上拥有完全可控的智能伙伴。它打破了传统 AI 助手局限于特定网页或应用的束缚，能够直接接入你日常使用的各类通讯渠道，包括微信、WhatsApp、Telegram、Discord、iMessage 等数十种平台。无论你在哪个聊天软件中发送消息，OpenClaw 都能即时响应，甚至支持在 macOS、iOS 和 Android 设备上进行语音交互，并提供实时的画布渲染功能供你操控。这款工具主要解决了用户对数据隐私、响应速度以及“始终在线”体验的需求。通过将 AI 部署在本地，用户无需依赖云端服务即可享受快速、私密的智能辅助，真正实现了“你的数据，你做主”。其独特的技术亮点在于强大的网关架构，将控制平面与核心助手分离，确保跨平台通信的流畅性与扩展性。 OpenClaw 非常适合希望构建个性化工作流的技术爱好者、开发者，以及注重隐私保护且不愿被单一生态绑定的普通用户。只要具备基础的终端操作能力（支持 macOS、Linux 及 Windows WSL2），即可通过简单的命令行引导完成部署。如果你渴望拥有一个懂你

★ 349.3k|★★★☆☆|4天前

Agent开发框架图像

stable-diffusion-webui

stable-diffusion-webui 是一个基于 Gradio 构建的网页版操作界面，旨在让用户能够轻松地在本地运行和使用强大的 Stable Diffusion 图像生成模型。它解决了原始模型依赖命令行、操作门槛高且功能分散的痛点，将复杂的 AI 绘图流程整合进一个直观易用的图形化平台。无论是希望快速上手的普通创作者、需要精细控制画面细节的设计师，还是想要深入探索模型潜力的开发者与研究人员，都能从中获益。其核心亮点在于极高的功能丰富度：不仅支持文生图、图生图、局部重绘（Inpainting）和外绘（Outpainting）等基础模式，还独创了注意力机制调整、提示词矩阵、负向提示词以及“高清修复”等高级功能。此外，它内置了 GFPGAN 和 CodeFormer 等人脸修复工具，支持多种神经网络放大算法，并允许用户通过插件系统无限扩展能力。即使是显存有限的设备，stable-diffusion-webui 也提供了相应的优化选项，让高质量的 AI 艺术创作变得触手可及。

★ 162.1k|★★★☆☆|5天前

开发框架图像Agent

everything-claude-code

everything-claude-code 是一套专为 AI 编程助手（如 Claude Code、Codex、Cursor 等）打造的高性能优化系统。它不仅仅是一组配置文件，而是一个经过长期实战打磨的完整框架，旨在解决 AI 代理在实际开发中面临的效率低下、记忆丢失、安全隐患及缺乏持续学习能力等核心痛点。通过引入技能模块化、直觉增强、记忆持久化机制以及内置的安全扫描功能，everything-claude-code 能显著提升 AI 在复杂任务中的表现，帮助开发者构建更稳定、更智能的生产级 AI 代理。其独特的“研究优先”开发理念和针对 Token 消耗的优化策略，使得模型响应更快、成本更低，同时有效防御潜在的攻击向量。这套工具特别适合软件开发者、AI 研究人员以及希望深度定制 AI 工作流的技术团队使用。无论您是在构建大型代码库，还是需要 AI 协助进行安全审计与自动化测试，everything-claude-code 都能提供强大的底层支持。作为一个曾荣获 Anthropic 黑客大奖的开源项目，它融合了多语言支持与丰富的实战钩子（hooks），让 AI 真正成长为懂上

★ 148.6k|★★☆☆☆|今天

开发框架Agent语言模型

ComfyUI

ComfyUI 是一款功能强大且高度模块化的视觉 AI 引擎，专为设计和执行复杂的 Stable Diffusion 图像生成流程而打造。它摒弃了传统的代码编写模式，采用直观的节点式流程图界面，让用户通过连接不同的功能模块即可构建个性化的生成管线。这一设计巧妙解决了高级 AI 绘图工作流配置复杂、灵活性不足的痛点。用户无需具备编程背景，也能自由组合模型、调整参数并实时预览效果，轻松实现从基础文生图到多步骤高清修复等各类复杂任务。ComfyUI 拥有极佳的兼容性，不仅支持 Windows、macOS 和 Linux 全平台，还广泛适配 NVIDIA、AMD、Intel 及苹果 Silicon 等多种硬件架构，并率先支持 SDXL、Flux、SD3 等前沿模型。无论是希望深入探索算法潜力的研究人员和开发者，还是追求极致创作自由度的设计师与资深 AI 绘画爱好者，ComfyUI 都能提供强大的支持。其独特的模块化架构允许社区不断扩展新功能，使其成为当前最灵活、生态最丰富的开源扩散模型工具之一，帮助用户将创意高效转化为现实。

★ 108.1k|★★☆☆☆|昨天

开发框架图像Agent

markitdown

MarkItDown 是一款由微软 AutoGen 团队打造的轻量级 Python 工具，专为将各类文件高效转换为 Markdown 格式而设计。它支持 PDF、Word、Excel、PPT、图片（含 OCR）、音频（含语音转录）、HTML 乃至 YouTube 链接等多种格式的解析，能够精准提取文档中的标题、列表、表格和链接等关键结构信息。在人工智能应用日益普及的今天，大语言模型（LLM）虽擅长处理文本，却难以直接读取复杂的二进制办公文档。MarkItDown 恰好解决了这一痛点，它将非结构化或半结构化的文件转化为模型“原生理解”且 Token 效率极高的 Markdown 格式，成为连接本地文件与 AI 分析 pipeline 的理想桥梁。此外，它还提供了 MCP（模型上下文协议）服务器，可无缝集成到 Claude Desktop 等 LLM 应用中。这款工具特别适合开发者、数据科学家及 AI 研究人员使用，尤其是那些需要构建文档检索增强生成（RAG）系统、进行批量文本分析或希望让 AI 助手直接“阅读”本地文件的用户。虽然生成的内容也具备一定可读性，但其核心优势在于为机器

★ 93.4k|★★☆☆☆|3天前

插件开发框架

LLMs-from-scratch

LLMs-from-scratch 是一个基于 PyTorch 的开源教育项目，旨在引导用户从零开始一步步构建一个类似 ChatGPT 的大型语言模型（LLM）。它不仅是同名技术著作的官方代码库，更提供了一套完整的实践方案，涵盖模型开发、预训练及微调的全过程。该项目主要解决了大模型领域“黑盒化”的学习痛点。许多开发者虽能调用现成模型，却难以深入理解其内部架构与训练机制。通过亲手编写每一行核心代码，用户能够透彻掌握 Transformer 架构、注意力机制等关键原理，从而真正理解大模型是如何“思考”的。此外，项目还包含了加载大型预训练权重进行微调的代码，帮助用户将理论知识延伸至实际应用。 LLMs-from-scratch 特别适合希望深入底层原理的 AI 开发者、研究人员以及计算机专业的学生。对于不满足于仅使用 API，而是渴望探究模型构建细节的技术人员而言，这是极佳的学习资源。其独特的技术亮点在于“循序渐进”的教学设计：将复杂的系统工程拆解为清晰的步骤，配合详细的图表与示例，让构建一个虽小但功能完备的大模型变得触手可及。无论你是想夯实理论基础，还是为未来研发更大规模的模型做准备

★ 90.1k|★★★☆☆|4天前

语言模型图像Agent