genkit

5.8k 707 简单 1 次阅读今天Apache-2.0开发框架图像Agent语言模型数据工具其他

AI 解读由 AI 自动生成，仅供参考

Genkit 是由 Google 打造并用于生产环境的开源框架，旨在帮助开发者使用 JavaScript、Go 和 Python 轻松构建全栈 AI 应用。它主要解决了 AI 开发中模型接入复杂、多模态处理繁琐以及工作流难以标准化等痛点，让团队能更专注于业务逻辑而非底层细节。

这款工具非常适合希望快速落地 AI 功能的软件工程师和技术团队，无论是构建智能聊天机器人、自动化流程还是推荐系统，都能游刃有余。Genkit 的核心亮点在于其统一的接口设计，支持无缝集成 Google、OpenAI、Anthropic 及 Ollama 等主流大模型，让用户可以灵活切换或对比不同模型效果。同时，它内置了对结构化输出、智能体工具调用（Tool Calling）、检索增强生成（RAG）及多模态内容处理的原生支持，极大简化了复杂 AI 功能的实现难度。

此外，Genkit 提供了专为 Web 和移动端优化的客户端 SDK，可轻松与 Next.js、React 等流行框架结合，并配套了功能强大的本地命令行工具和可视化调试界面，帮助开发者高效测试提示词、监控数据流及排查问题。无论你将应用部署在 Firebase、Google Cloud Run 还是其他第三方平台，Genkit 都能提供一致且稳定的开发体验，是连接创意与生产级 AI 应用的理想桥梁。

使用场景

一家电商初创团队正在开发一个能根据用户评论自动生成结构化产品改进建议的智能客服系统。

没有 genkit 时

模型切换成本极高：想要对比 Google Gemini 和 OpenAI 的效果，需要重写大量底层 API 调用代码，甚至重构整个后端逻辑。
数据格式处理繁琐：大模型返回的非结构化文本难以直接入库，开发者需手动编写复杂的正则表达式或解析逻辑来提取关键字段，极易出错。
多语言协作困难：前端团队用 TypeScript，后端核心用 Go，两边需要维护两套完全不同的 AI 集成方案，导致功能迭代不同步。
调试流程低效：缺乏本地可视化工具，测试提示词（Prompt）效果只能靠反复部署到云端查看日志，反馈周期长达数小时。

使用 genkit 后

统一接口无缝切换：通过 genkit 标准化的插件架构，仅需修改一行配置即可在 Gemini、OpenAI 或 Ollama 之间自由切换，快速验证最佳模型。
原生支持结构化输出：利用 genkit 内置的模式定义功能，直接让模型返回标准的 JSON 对象，省去了手动解析步骤，数据可直接存入数据库。
跨语言一致体验：TypeScript 和 Go 团队使用完全相同的 API 规范和逻辑结构，实现了前后端 AI 功能的同步开发与维护。
本地可视化调试：借助 genkit 自带的开发者 UI 和 CLI，团队成员可在本地实时测试提示词、对比不同模型的输出结果，将调试时间从小时级缩短至分钟级。

genkit 通过统一的抽象层和本地工具链，让团队从繁琐的模型适配中解放出来，专注于构建真正有价值的业务逻辑。

运行环境要求

操作系统

未说明

GPU

未说明

内存

未说明

依赖

notesGenkit 是一个全栈 AI 应用开发框架，主要支持 JavaScript/TypeScript 和 Go（生产就绪），Python 支持尚处于 Alpha 早期开发阶段。该工具旨在部署在任何支持所选编程语言的环境中（如 Cloud Functions, Cloud Run 等），而非特定的本地硬件环境。需要通过 npm 安装 CLI 工具 (`npm install -g genkit-cli`) 来使用开发者界面和评估功能。具体运行时资源需求取决于所调用的 AI 模型提供商（如 Google Gemini, OpenAI 等）及部署架构，框架本身未规定具体的 GPU 或内存硬性指标。

python未说明 (Python SDK 处于 Alpha 阶段)

genkit

@genkit-ai/google-genai

genkit-cli

快速开始

Genkit 是一个用于构建全栈 AI 驱动应用的开源框架，由 Google 的 Firebase 构建并应用于生产环境。它提供多种编程语言的 SDK，稳定性和功能支持程度各不相同：

JavaScript/TypeScript：已达到生产就绪状态，具备完整功能支持。
Go：已达到生产就绪状态，具备完整功能支持。
Python（Alpha）：处于早期开发阶段，仅提供核心功能。

Genkit 提供统一的接口，可集成来自 Google、OpenAI、Anthropic、Ollama 等多家供应商的 AI 模型。通过简化的 API，您可以快速构建并部署适用于生产的聊天机器人、自动化流程和推荐系统，支持多模态内容处理、结构化输出、工具调用以及代理式工作流等功能。

只需几行代码即可开始使用：

import { genkit } from 'genkit';
import { googleAI } from '@genkit-ai/google-genai';

const ai = genkit({ plugins: [googleAI()] });

const { text } = await ai.generate({
    model: googleAI.model('gemini-2.5-flash'),
    prompt: 'Why is Firebase awesome?'
});

使用 Genkit 探索与构建

您可以免费试用 AI 示例应用，并查看驱动这些应用的 Genkit 代码可视化。

通过示例探索 Genkit

核心能力

广泛的 AI 模型支持	使用统一的接口，轻松集成来自 [Google](https://genkit.dev/docs/plugins/google-genai)、[OpenAI](https://genkit.dev/docs/plugins/openai)、[Anthropic](https://thefireco.github.io/genkit-plugins/docs/plugins/genkitx-anthropic)、[Ollama](https://genkit.dev/docs/plugins/ollama) 等众多供应商的数百种模型。您可以自由探索、比较并选择最适合您需求的模型。
简化 AI 开发	借助简化的 API，您可以构建具有结构化输出、代理式工具调用、上下文感知生成、多模态输入输出等功能的 AI 应用。Genkit 将复杂的 AI 开发过程抽象化，让您能够更快地构建和迭代。
兼容 Web 和移动平台	通过专门构建的客户端 SDK 和辅助工具，可无缝集成到 Next.js、React、Angular、iOS、Android 等框架和平台中。
跨语言支持	您可以根据项目需求选择最适合的编程语言进行开发。Genkit 提供 JavaScript/TypeScript、Go 和 Python（Alpha）版本的 SDK，所有支持的语言均采用一致的 API 和功能。
部署灵活	将 AI 逻辑部署到任何支持您所选编程语言的环境中，例如 Firebase Cloud Functions、Google Cloud Run 或第三方平台,无论是否依赖 Google 服务均可。
开发者工具	借助专门设计的本地 CLI 和开发者 UI,加速 AI 开发。您可以针对单个输入或数据集测试提示和流程，比较不同模型的输出，利用详细的执行跟踪进行调试，并通过即时的视觉反馈快速迭代提示内容。
生产监控	借助全面的生产监控功能，您可以放心地发布 AI 功能。在专门构建的仪表板中，跟踪模型性能、请求量、延迟和错误率。通过详尽的可观测性指标，快速定位问题，确保您的 AI 功能在实际使用中达到质量和性能目标。

工作原理

Genkit 通过开源 SDK 和统一的 API，简化了 AI 集成流程，使其能够在不同的模型提供商和编程语言之间无缝运行。它抽象掉了复杂性，让您可以专注于打造出色的用户体验。

Genkit 提供的一些关键功能包括：

Genkit 专为服务器端部署而设计，支持多种语言环境；同时，它还通过专用助手和客户端 SDK 提供流畅的客户端集成。

实施路径

1	选择语言和模型提供商	选择适合您偏好的语言版本的 Genkit SDK（JavaScript/TypeScript、Go 或 Python（Alpha））。然后选择一家模型提供商，如 Google Gemini 或 Anthropic，并获取 API 密钥。部分提供商，例如 Vertex AI,可能需要使用不同的身份验证方式。
2	安装 SDK 并初始化	安装 Genkit SDK、您选择的模型提供商包以及 Genkit CLI。导入 Genkit 和提供商的相关包，并使用提供商的 API 密钥初始化 Genkit。
3	编写并测试 AI 功能	利用 Genkit SDK，根据您的应用场景构建 AI 功能，从基础的文本生成到复杂的多步骤工作流和智能代理。借助 CLI 和开发者 UI，您可以快速测试和迭代。
4	部署并监控	将您的 AI 功能部署到 Firebase、Google Cloud Run 或其他支持您所选编程语言的环境中。将其集成到您的应用中，并在 Firebase 控制台中进行生产监控。

开始使用

开发工具

Genkit 提供 CLI 和本地 UI，以简化您的 AI 开发工作流。

CLI

Genkit CLI 包含用于运行和评估 Genkit 函数（流程）以及收集遥测数据和日志的命令。

安装： npm install -g genkit-cli
运行命令，并附带遥测、交互式开发者界面等： genkit start -- <运行代码的命令>

开发者 UI

Genkit 开发者 UI 是一个本地界面，用于测试、调试和迭代您的 AI 应用程序。

主要功能：

运行： 在专用的 Playground 中执行并试验 Genkit 流程、提示词、查询等。
检查： 分析过去执行的详细跟踪信息，包括复杂流程的逐步分解。
评估： 查看针对您的流程运行的评估结果，包括性能指标和相关跟踪链接。

Genkit 开发者 UI 截图，显示跟踪信息

与我们联系

加入我们的 Discord 社区 – 获取帮助、分享想法并与其他开发者交流。
在 GitHub 上贡献 – 报告问题、提出功能建议或探索源代码。
参与文档和示例的编写 – 向 Genkit 的文档仓库提交问题，或为示例项目做出贡献。

贡献

欢迎并非常感谢您对 Genkit 的贡献！请参阅我们的贡献指南，开始您的贡献之旅。

作者

Genkit 由 Firebase 构建，并得到了开源社区的支持。

Genkit 快速上手指南

Genkit 是由 Google Firebase 团队打造的全栈 AI 应用开发框架。它提供统一的接口来集成 Google Gemini、OpenAI、Anthropic、Ollama 等多种大模型，支持结构化输出、工具调用（Tool Calling）、RAG 及多模态处理，帮助开发者快速构建生产级 AI 应用。

环境准备

在开始之前，请确保您的开发环境满足以下要求：

操作系统：Windows, macOS, 或 Linux
运行时环境（任选其一，根据您选择的语言）：
- Node.js: 版本 18.0 或更高（推荐用于 JavaScript/TypeScript）
- Go: 版本 1.21 或更高
- Python: 版本 3.9 或更高（注：Python SDK 目前处于 Alpha 阶段）
API 密钥：已注册并获取所选模型提供商的 API Key（如 Google AI Studio、OpenAI 等）。

国内开发者提示：如果访问 npm 或 GitHub 较慢，建议配置国内镜像源（如腾讯云、阿里云或清华大学镜像源）以加速依赖安装。

安装步骤

以下以 JavaScript/TypeScript 为例（生产就绪版本），其他语言请参考官方文档。

1. 初始化项目

创建新项目并安装核心依赖：

npm init -y
npm install genkit @genkit-ai/google-genai

2. 安装开发工具 (CLI)

安装全局 CLI 工具，用于启动本地开发界面和调试：

npm install -g genkit-cli

3. 配置环境变量

在项目中创建 .env 文件，填入您的模型 API 密钥：

GOOGLE_GENAI_API_KEY=your_api_key_here

基本使用

Genkit 的核心在于通过插件初始化 AI 实例，然后调用 generate 方法。以下是一个最简单的文本生成示例：

代码示例 (`index.ts`)

import { genkit } from 'genkit';
import { googleAI } from '@genkit-ai/google-genai';

// 1. 初始化 Genkit 并加载插件
const ai = genkit({ plugins: [googleAI()] });

// 2. 调用模型生成内容
async function run() {
  const { text } = await ai.generate({
    model: googleAI.model('gemini-2.5-flash'),
    prompt: 'Why is Firebase awesome?'
  });

  console.log(text);
}

run();

运行与调试

使用 Genkit CLI 启动开发服务器，这将自动打开本地的 Developer UI，您可以在其中可视化地测试 Prompt、查看执行轨迹和对比模型输出：

genkit start -- npx ts-node index.ts

运行模式：上述命令会执行您的代码，并在本地网页界面中展示结果。
迭代开发：在 Developer UI 中修改 Prompt 或切换模型，无需重启服务即可实时看到效果。

完成开发后，您可以将应用部署到 Cloud Functions for Firebase、Google Cloud Run 或任何支持 Node.js 的环境中。

版本历史

go/v1.6.12026/04/06

go/v1.6.02026/04/02

go/v1.5.12026/03/31

py/v0.5.22026/03/27

v1.31.02026/03/27

go/v1.5.02026/03/19

py/v0.5.2-rc.22026/03/18

py/v0.5.2-rc.12026/03/18

v1.30.12026/03/13

v1.30.0-rc.02026/03/03

py/v0.5.12026/02/20

v1.29.02026/02/20

v1.29.0-rc.02026/02/11

py/v0.5.02026/02/04

v1.28.02026/01/22

go/v1.4.02026/01/15

go/v1.3.02026/01/07

v1.27.02025/12/19

v1.27.0-rc.22025/12/19

v1.27.0-rc.12025/12/18

常见问题

应该使用 definePrompt 还是 defineDotPrompt？它们有什么区别？

在使用 Gemini 1.5 Pro 时，同时启用工具调用（Tools）和输出模式（Output Schema/JSON Mode）报错怎么办？

迁移到 Genkit 0.9 后，Genkit UI 显示"Waiting to connect to Genkit runtime"且无法连接，如何解决？

如何在 Go 语言中将图片作为输入参数传递给模型？

相似工具推荐

openclaw

OpenClaw 是一款专为个人打造的本地化 AI 助手，旨在让你在自己的设备上拥有完全可控的智能伙伴。它打破了传统 AI 助手局限于特定网页或应用的束缚，能够直接接入你日常使用的各类通讯渠道，包括微信、WhatsApp、Telegram、Discord、iMessage 等数十种平台。无论你在哪个聊天软件中发送消息，OpenClaw 都能即时响应，甚至支持在 macOS、iOS 和 Android 设备上进行语音交互，并提供实时的画布渲染功能供你操控。这款工具主要解决了用户对数据隐私、响应速度以及“始终在线”体验的需求。通过将 AI 部署在本地，用户无需依赖云端服务即可享受快速、私密的智能辅助，真正实现了“你的数据，你做主”。其独特的技术亮点在于强大的网关架构，将控制平面与核心助手分离，确保跨平台通信的流畅性与扩展性。 OpenClaw 非常适合希望构建个性化工作流的技术爱好者、开发者，以及注重隐私保护且不愿被单一生态绑定的普通用户。只要具备基础的终端操作能力（支持 macOS、Linux 及 Windows WSL2），即可通过简单的命令行引导完成部署。如果你渴望拥有一个懂你

★ 349.3k|★★★☆☆|昨天

Agent开发框架图像

stable-diffusion-webui

stable-diffusion-webui 是一个基于 Gradio 构建的网页版操作界面，旨在让用户能够轻松地在本地运行和使用强大的 Stable Diffusion 图像生成模型。它解决了原始模型依赖命令行、操作门槛高且功能分散的痛点，将复杂的 AI 绘图流程整合进一个直观易用的图形化平台。无论是希望快速上手的普通创作者、需要精细控制画面细节的设计师，还是想要深入探索模型潜力的开发者与研究人员，都能从中获益。其核心亮点在于极高的功能丰富度：不仅支持文生图、图生图、局部重绘（Inpainting）和外绘（Outpainting）等基础模式，还独创了注意力机制调整、提示词矩阵、负向提示词以及“高清修复”等高级功能。此外，它内置了 GFPGAN 和 CodeFormer 等人脸修复工具，支持多种神经网络放大算法，并允许用户通过插件系统无限扩展能力。即使是显存有限的设备，stable-diffusion-webui 也提供了相应的优化选项，让高质量的 AI 艺术创作变得触手可及。

★ 162.1k|★★★☆☆|2天前

开发框架图像Agent

everything-claude-code

everything-claude-code 是一套专为 AI 编程助手（如 Claude Code、Codex、Cursor 等）打造的高性能优化系统。它不仅仅是一组配置文件，而是一个经过长期实战打磨的完整框架，旨在解决 AI 代理在实际开发中面临的效率低下、记忆丢失、安全隐患及缺乏持续学习能力等核心痛点。通过引入技能模块化、直觉增强、记忆持久化机制以及内置的安全扫描功能，everything-claude-code 能显著提升 AI 在复杂任务中的表现，帮助开发者构建更稳定、更智能的生产级 AI 代理。其独特的“研究优先”开发理念和针对 Token 消耗的优化策略，使得模型响应更快、成本更低，同时有效防御潜在的攻击向量。这套工具特别适合软件开发者、AI 研究人员以及希望深度定制 AI 工作流的技术团队使用。无论您是在构建大型代码库，还是需要 AI 协助进行安全审计与自动化测试，everything-claude-code 都能提供强大的底层支持。作为一个曾荣获 Anthropic 黑客大奖的开源项目，它融合了多语言支持与丰富的实战钩子（hooks），让 AI 真正成长为懂上

★ 143.9k|★★☆☆☆|今天

开发框架Agent语言模型

ComfyUI

ComfyUI 是一款功能强大且高度模块化的视觉 AI 引擎，专为设计和执行复杂的 Stable Diffusion 图像生成流程而打造。它摒弃了传统的代码编写模式，采用直观的节点式流程图界面，让用户通过连接不同的功能模块即可构建个性化的生成管线。这一设计巧妙解决了高级 AI 绘图工作流配置复杂、灵活性不足的痛点。用户无需具备编程背景，也能自由组合模型、调整参数并实时预览效果，轻松实现从基础文生图到多步骤高清修复等各类复杂任务。ComfyUI 拥有极佳的兼容性，不仅支持 Windows、macOS 和 Linux 全平台，还广泛适配 NVIDIA、AMD、Intel 及苹果 Silicon 等多种硬件架构，并率先支持 SDXL、Flux、SD3 等前沿模型。无论是希望深入探索算法潜力的研究人员和开发者，还是追求极致创作自由度的设计师与资深 AI 绘画爱好者，ComfyUI 都能提供强大的支持。其独特的模块化架构允许社区不断扩展新功能，使其成为当前最灵活、生态最丰富的开源扩散模型工具之一，帮助用户将创意高效转化为现实。

★ 107.9k|★★☆☆☆|昨天

开发框架图像Agent

markitdown

MarkItDown 是一款由微软 AutoGen 团队打造的轻量级 Python 工具，专为将各类文件高效转换为 Markdown 格式而设计。它支持 PDF、Word、Excel、PPT、图片（含 OCR）、音频（含语音转录）、HTML 乃至 YouTube 链接等多种格式的解析，能够精准提取文档中的标题、列表、表格和链接等关键结构信息。在人工智能应用日益普及的今天，大语言模型（LLM）虽擅长处理文本，却难以直接读取复杂的二进制办公文档。MarkItDown 恰好解决了这一痛点，它将非结构化或半结构化的文件转化为模型“原生理解”且 Token 效率极高的 Markdown 格式，成为连接本地文件与 AI 分析 pipeline 的理想桥梁。此外，它还提供了 MCP（模型上下文协议）服务器，可无缝集成到 Claude Desktop 等 LLM 应用中。这款工具特别适合开发者、数据科学家及 AI 研究人员使用，尤其是那些需要构建文档检索增强生成（RAG）系统、进行批量文本分析或希望让 AI 助手直接“阅读”本地文件的用户。虽然生成的内容也具备一定可读性，但其核心优势在于为机器

★ 93.4k|★★☆☆☆|昨天

插件开发框架

LLMs-from-scratch

LLMs-from-scratch 是一个基于 PyTorch 的开源教育项目，旨在引导用户从零开始一步步构建一个类似 ChatGPT 的大型语言模型（LLM）。它不仅是同名技术著作的官方代码库，更提供了一套完整的实践方案，涵盖模型开发、预训练及微调的全过程。该项目主要解决了大模型领域“黑盒化”的学习痛点。许多开发者虽能调用现成模型，却难以深入理解其内部架构与训练机制。通过亲手编写每一行核心代码，用户能够透彻掌握 Transformer 架构、注意力机制等关键原理，从而真正理解大模型是如何“思考”的。此外，项目还包含了加载大型预训练权重进行微调的代码，帮助用户将理论知识延伸至实际应用。 LLMs-from-scratch 特别适合希望深入底层原理的 AI 开发者、研究人员以及计算机专业的学生。对于不满足于仅使用 API，而是渴望探究模型构建细节的技术人员而言，这是极佳的学习资源。其独特的技术亮点在于“循序渐进”的教学设计：将复杂的系统工程拆解为清晰的步骤，配合详细的图表与示例，让构建一个虽小但功能完备的大模型变得触手可及。无论你是想夯实理论基础，还是为未来研发更大规模的模型做准备

★ 90.1k|★★★☆☆|昨天

语言模型图像Agent

使用场景

没有 genkit 时

使用 genkit 后

运行环境要求

快速开始

使用 Genkit 探索与构建

核心能力

工作原理

实施路径

开始使用

开发工具

CLI

开发者 UI

与我们联系

贡献

作者

Genkit 快速上手指南

环境准备

安装步骤

1. 初始化项目

2. 安装开发工具 (CLI)

3. 配置环境变量

基本使用

代码示例 (index.ts)

运行与调试

版本历史

常见问题

相似工具推荐

openclaw

stable-diffusion-webui

everything-claude-code

ComfyUI

markitdown

LLMs-from-scratch

代码示例 (`index.ts`)