generative-ai-go

856 101 简单 1 次阅读 2周前Apache-2.0开发框架语言模型

AI 解读由 AI 自动生成，仅供参考

generative-ai-go 是谷歌官方推出的 Go 语言开发工具包，旨在帮助开发者便捷地调用 Gemini、Veo、Imagen 等生成式 AI 模型。它通过封装复杂的 API 交互细节，让程序员能够用简洁的 Go 代码快速实现文本生成、图像分析等多模态功能，从而大幅降低接入谷歌前沿 AI 能力的门槛。

这款工具主要面向熟悉 Go 语言的软件工程师和技术研究人员，特别适合需要在后端服务中集成智能对话、内容创作或数据分析功能的团队。其设计初衷是提供一条清晰、简单的开发路径，让技术构建者能专注于业务逻辑而非底层通信协议。

需要特别注意的是，随着谷歌推出统一的新一代 Google Gen AI SDK，generative-ai-go 目前已进入维护模式。虽然它依然稳定可用，但官方将不再为其添加新功能，仅保留关键漏洞修复直至 2025 年 11 月 30 日。因此，对于启动新项目或追求最新特性的用户，建议直接迁移至全新的 go-genai 库以获得持续的性能优化和功能支持；而对于正在使用旧版的用户，现在正是规划平滑过渡的最佳时机。

使用场景

某电商初创公司的后端团队正致力于用 Go 语言重构其智能客服系统，希望集成谷歌最新的 Gemini 模型来自动处理用户咨询。

没有 generative-ai-go 时

开发人员必须手动构建复杂的 HTTP REST 请求，包括繁琐的鉴权头、JSON 序列化及错误重试逻辑，代码冗余且易出错。
缺乏原生的流式响应（Streaming）支持，导致用户等待完整回复的时间过长，无法实现类似打字机的实时交互体验。
多模态功能（如上传图片让 AI 分析商品瑕疵）需要自行处理二进制编码和 API 协议细节，开发门槛极高。
社区缺乏针对 Go 语言的官方最佳实践参考，团队在参数调优和上下文管理上耗费了大量试错时间。

使用 generative-ai-go 后

通过简洁的链式调用即可发起对话，SDK 自动封装了鉴权与网络细节，使核心业务代码行数减少约 60%。
原生支持流式输出接口，轻松实现首字秒级响应，显著提升了终端用户的对话流畅度和满意度。
内置多模态数据类型支持，仅需几行代码即可将图片直接传入模型进行视觉分析，快速上线“拍照识货”功能。
依托官方维护的示例和类型定义，团队能迅速掌握上下文窗口管理及安全过滤设置，大幅缩短研发周期。

注：鉴于该仓库已标记为遗留版本并将于 2025 年停止支持，建议新项目直接迁移至全新的 go-genai SDK 以获取持续的性能优化与新特性。

generative-ai-go 通过将复杂的 API 交互抽象为直观的 Go 惯用代码，让开发者能从底层协议中解放出来，专注于构建高价值的智能应用逻辑。

运行环境要求

GPU

未说明

内存

未说明

依赖

notes该仓库已弃用（Legacy），仅进行关键错误修复，支持将于 2025 年 11 月 30 日终止。强烈建议迁移至新的 'Google Generative AI SDK for Go' (github.com/googleapis/go-genai)。作为 Go 语言库，其运行依赖于 Go 环境而非 Python，具体系统要求通常跟随标准 Go 工具链。

python不适用 (此为 Go 语言 SDK)

google.golang.org/api

快速开始

[已弃用] 适用于 Gemini API 的 Google AI Go SDK

随着 Gemini 2.0 的发布，我们抓住机会为所有希望使用 Google GenAI 模型（Gemini、Veo、Imagen 等）的开发者打造了一个统一的 SDK。在此过程中，我们综合了来自本 SDK 的反馈，以及开发者对生态系统中其他 SDK 的好评，从而创建了 Google Gen AI SDK。

Gemini API 文档已全面更新，展示了新版 Google Gen AI SDK 的示例：快速入门。

我们深知 SDK 更改可能带来的影响，并不会轻率做出这一决定。然而，我们的目标是为开发者构建与我们的模型集成的应用程序提供一条极其简单明了的路径，因此我们认为进行此次更改十分必要。

感谢您使用 Gemini 进行开发！如果您需要任何帮助，请随时告诉我们：点击这里。

请注意，此代码仓库现已被视为遗留项目。 为了获得最新功能、性能优化及持续的开发支持，我们强烈建议您迁移到官方的 Google Generative AI SDK for Go。

本仓库的支持计划：

有限维护： 目前仅限于修复关键性缺陷，不再添加新功能。
目的： 此有限支持旨在为用户提供稳定性保障，以便顺利完成向新 SDK 的迁移。
终止支持日期： 本仓库的所有支持工作（包括缺陷修复）将于 2025年11月30日 彻底停止。

我们鼓励所有用户尽早规划向 Google Generative AI SDK 的迁移，以确保能够持续使用最新的功能并获得相应的技术支持。

generative-ai-go 快速上手指南

⚠️ 重要提示：本项目已弃用（Deprecated）

随着 Gemini 2.0 的发布，Google 推出了统一的 Google Gen AI SDK。

本仓库 (generative-ai-go) 仅进行关键漏洞修复，不再添加新功能。

停止支持日期：2025 年 11 月 30 日。

强烈建议：新开发项目或现有项目迁移请直接使用官方新版 SDK (go-genai)。

以下指南仅供维护旧代码参考。

环境准备

在开始之前，请确保您的开发环境满足以下要求：

操作系统：Linux, macOS, 或 Windows
Go 版本：Go 1.21 或更高版本
依赖项：
- 已初始化的 Go 模块 (go mod init)
- 有效的 Google Cloud API Key (需启用 Gemini API)

安装步骤

由于网络原因，国内开发者建议使用 GOPROXY 加速依赖下载。

配置国内镜像源（可选但推荐）：
```
export GOPROXY=https://goproxy.cn,direct
```
安装旧版 SDK：在项目目录下运行以下命令安装此弃用版本的库：
```
go get github.com/google/generative-ai-go
```

基本使用

以下是最简单的文本生成示例。请注意，实际生产中应使用新版 SDK。

package main

import (
	"context"
	"fmt"
	"log"
	"os"

	"github.com/google/generative-ai-go/genai"
	"google.golang.org/api/option"
)

func main() {
	ctx := context.Background()

	// 从环境变量获取 API Key
	apiKey := os.Getenv("GEMINI_API_KEY")
	if apiKey == "" {
		log.Fatal("请设置 GEMINI_API_KEY 环境变量")
	}

	// 初始化客户端
	client, err := genai.NewClient(ctx, option.WithAPIKey(apiKey))
	if err != nil {
		log.Fatal(err)
	}
	defer client.Close()

	// 选择模型
	model := client.GenerativeModel("gemini-pro")

	// 生成内容
	resp, err := model.GenerateContent(ctx, genai.Text("你好，请简单介绍一下你自己。"))
	if err != nil {
		log.Fatal(err)
	}

	// 输出结果
	for _, candidate := range resp.Candidates {
		for _, part := range candidate.Content.Parts {
			fmt.Println(part)
		}
	}
}

下一步行动：请尽快查阅 Google Gen AI SDK for Go 文档以完成迁移，确保持续获得最新功能和安全支持。

版本历史

v0.20.12025/05/02

v0.20.02025/05/01

v0.19.02024/12/04

v0.18.02024/09/09

v0.17.02024/07/19

v0.16.02024/07/01

v0.15.12024/06/28

v0.15.02024/06/26

v0.14.02024/06/10

v0.13.02024/05/29

v0.12.02024/05/10

v0.11.22024/05/07

v0.11.12024/05/03

v0.11.02024/04/15

v0.10.02024/03/15

常见问题

调用 StartChat() 或 SendMessage() 时遇到 "proto: unknown field usageMetadata" 错误怎么办？

如何从 GenerateContentResponse 的 Parts 接口中提取文本数据？

如何在生成式 AI Go SDK 中配置 HTTP 代理？

遇到 "Unsupported MIME type: text/plain; charset=utf-8" 错误该如何解决？

调用 ChatSession.SendMessage 时偶尔出现 panic (nil pointer dereference) 是什么原因？

为什么在使用 Part 类型时没有智能提示或直观的方法来获取内容？

相似工具推荐

openclaw

OpenClaw 是一款专为个人打造的本地化 AI 助手，旨在让你在自己的设备上拥有完全可控的智能伙伴。它打破了传统 AI 助手局限于特定网页或应用的束缚，能够直接接入你日常使用的各类通讯渠道，包括微信、WhatsApp、Telegram、Discord、iMessage 等数十种平台。无论你在哪个聊天软件中发送消息，OpenClaw 都能即时响应，甚至支持在 macOS、iOS 和 Android 设备上进行语音交互，并提供实时的画布渲染功能供你操控。这款工具主要解决了用户对数据隐私、响应速度以及“始终在线”体验的需求。通过将 AI 部署在本地，用户无需依赖云端服务即可享受快速、私密的智能辅助，真正实现了“你的数据，你做主”。其独特的技术亮点在于强大的网关架构，将控制平面与核心助手分离，确保跨平台通信的流畅性与扩展性。 OpenClaw 非常适合希望构建个性化工作流的技术爱好者、开发者，以及注重隐私保护且不愿被单一生态绑定的普通用户。只要具备基础的终端操作能力（支持 macOS、Linux 及 Windows WSL2），即可通过简单的命令行引导完成部署。如果你渴望拥有一个懂你

★ 349.3k|★★★☆☆|2周前

Agent开发框架图像

n8n

n8n 是一款面向技术团队的公平代码（fair-code）工作流自动化平台，旨在让用户在享受低代码快速构建便利的同时，保留编写自定义代码的灵活性。它主要解决了传统自动化工具要么过于封闭难以扩展、要么完全依赖手写代码效率低下的痛点，帮助用户轻松连接 400 多种应用与服务，实现复杂业务流程的自动化。 n8n 特别适合开发者、工程师以及具备一定技术背景的业务人员使用。其核心亮点在于“按需编码”：既可以通过直观的可视化界面拖拽节点搭建流程，也能随时插入 JavaScript 或 Python 代码、调用 npm 包来处理复杂逻辑。此外，n8n 原生集成了基于 LangChain 的 AI 能力，支持用户利用自有数据和模型构建智能体工作流。在部署方面，n8n 提供极高的自由度，支持完全自托管以保障数据隐私和控制权，也提供云端服务选项。凭借活跃的社区生态和数百个现成模板，n8n 让构建强大且可控的自动化系统变得简单高效。

★ 184.7k|★★☆☆☆|今天

数据工具开发框架Agent

AutoGPT

AutoGPT 是一个旨在让每个人都能轻松使用和构建 AI 的强大平台，核心功能是帮助用户创建、部署和管理能够自动执行复杂任务的连续型 AI 智能体。它解决了传统 AI 应用中需要频繁人工干预、难以自动化长流程工作的痛点，让用户只需设定目标，AI 即可自主规划步骤、调用工具并持续运行直至完成任务。无论是开发者、研究人员，还是希望提升工作效率的普通用户，都能从 AutoGPT 中受益。开发者可利用其低代码界面快速定制专属智能体；研究人员能基于开源架构探索多智能体协作机制；而非技术背景用户也可直接选用预置的智能体模板，立即投入实际工作场景。 AutoGPT 的技术亮点在于其模块化“积木式”工作流设计——用户通过连接功能块即可构建复杂逻辑，每个块负责单一动作，灵活且易于调试。同时，平台支持本地自托管与云端部署两种模式，兼顾数据隐私与使用便捷性。配合完善的文档和一键安装脚本，即使是初次接触的用户也能在几分钟内启动自己的第一个 AI 智能体。AutoGPT 正致力于降低 AI 应用门槛，让人人都能成为 AI 的创造者与受益者。

★ 183.6k|★★★☆☆|今天

Agent语言模型插件

stable-diffusion-webui

stable-diffusion-webui 是一个基于 Gradio 构建的网页版操作界面，旨在让用户能够轻松地在本地运行和使用强大的 Stable Diffusion 图像生成模型。它解决了原始模型依赖命令行、操作门槛高且功能分散的痛点，将复杂的 AI 绘图流程整合进一个直观易用的图形化平台。无论是希望快速上手的普通创作者、需要精细控制画面细节的设计师，还是想要深入探索模型潜力的开发者与研究人员，都能从中获益。其核心亮点在于极高的功能丰富度：不仅支持文生图、图生图、局部重绘（Inpainting）和外绘（Outpainting）等基础模式，还独创了注意力机制调整、提示词矩阵、负向提示词以及“高清修复”等高级功能。此外，它内置了 GFPGAN 和 CodeFormer 等人脸修复工具，支持多种神经网络放大算法，并允许用户通过插件系统无限扩展能力。即使是显存有限的设备，stable-diffusion-webui 也提供了相应的优化选项，让高质量的 AI 艺术创作变得触手可及。

★ 162.1k|★★★☆☆|2周前

开发框架图像Agent

everything-claude-code

everything-claude-code 是一套专为 AI 编程助手（如 Claude Code、Codex、Cursor 等）打造的高性能优化系统。它不仅仅是一组配置文件，而是一个经过长期实战打磨的完整框架，旨在解决 AI 代理在实际开发中面临的效率低下、记忆丢失、安全隐患及缺乏持续学习能力等核心痛点。通过引入技能模块化、直觉增强、记忆持久化机制以及内置的安全扫描功能，everything-claude-code 能显著提升 AI 在复杂任务中的表现，帮助开发者构建更稳定、更智能的生产级 AI 代理。其独特的“研究优先”开发理念和针对 Token 消耗的优化策略，使得模型响应更快、成本更低，同时有效防御潜在的攻击向量。这套工具特别适合软件开发者、AI 研究人员以及希望深度定制 AI 工作流的技术团队使用。无论您是在构建大型代码库，还是需要 AI 协助进行安全审计与自动化测试，everything-claude-code 都能提供强大的底层支持。作为一个曾荣获 Anthropic 黑客大奖的开源项目，它融合了多语言支持与丰富的实战钩子（hooks），让 AI 真正成长为懂上

★ 161.7k|★★☆☆☆|今天

开发框架Agent语言模型

ComfyUI

ComfyUI 是一款功能强大且高度模块化的视觉 AI 引擎，专为设计和执行复杂的 Stable Diffusion 图像生成流程而打造。它摒弃了传统的代码编写模式，采用直观的节点式流程图界面，让用户通过连接不同的功能模块即可构建个性化的生成管线。这一设计巧妙解决了高级 AI 绘图工作流配置复杂、灵活性不足的痛点。用户无需具备编程背景，也能自由组合模型、调整参数并实时预览效果，轻松实现从基础文生图到多步骤高清修复等各类复杂任务。ComfyUI 拥有极佳的兼容性，不仅支持 Windows、macOS 和 Linux 全平台，还广泛适配 NVIDIA、AMD、Intel 及苹果 Silicon 等多种硬件架构，并率先支持 SDXL、Flux、SD3 等前沿模型。无论是希望深入探索算法潜力的研究人员和开发者，还是追求极致创作自由度的设计师与资深 AI 绘画爱好者，ComfyUI 都能提供强大的支持。其独特的模块化架构允许社区不断扩展新功能，使其成为当前最灵活、生态最丰富的开源扩散模型工具之一，帮助用户将创意高效转化为现实。

★ 109.2k|★★☆☆☆|2天前

开发框架图像Agent