openai-responses-starter-app

810 288 简单 1 次阅读 2天前NOASSERTION语言模型Agent

AI 解读由 AI 自动生成，仅供参考

openai-responses-starter-app 是一个基于 NextJS 构建的开源启动项目，旨在帮助开发者快速上手并构建基于 OpenAI Responses API 的智能对话应用。它解决了从零搭建复杂 AI 助手时面临的环境配置、多轮对话管理以及工具集成等技术难题，让开发者能将精力集中在业务逻辑定制上。

该项目非常适合希望利用最新 OpenAI 接口开发定制化聊天机器人或智能助理的软件开发者和工程师。其核心亮点在于不仅支持流式响应和函数调用，还深度集成了多种实用工具：包括让模型能联网检索信息的“网络搜索”、基于向量存储的“文件搜索”，以及可执行 Python 代码的“代码解释器”。此外，它还展示了如何通过 MCP 服务器扩展能力，并利用官方连接器安全地集成 Google 日历与 Gmail 等第三方服务。作为一个功能完备的模板，openai-responses-starter-app 提供了清晰的代码结构和配置示例，是探索现代 AI 应用开发的理想起点。

使用场景

某初创公司的产品经理希望快速构建一个能自动查阅内部文档、搜索最新行业动态并同步个人日程的智能助手，以辅助日常决策。

没有 openai-responses-starter-app 时

开发周期漫长：团队需从零搭建 NextJS 框架，手动编写多轮对话状态管理逻辑，耗时数周才能跑通基础聊天功能。
工具集成困难：想要让 AI 具备联网搜索或读取内部 PDF 文档的能力，需要自行研究复杂的 API 参数配置和向量存储创建流程，技术门槛极高。
外部服务对接繁琐：若需助手访问 Google 日历或 Gmail，开发者必须独立处理 OAuth 2.0 认证流、令牌存储及安全回调，极易出现安全漏洞。
实时体验缺失：默认实现往往不支持流式输出，用户只能等待完整响应生成，导致交互延迟高，体验生硬。

使用 openai-responses-starter-app 后

即刻启动开发：直接克隆基于 NextJS 的成熟模板，内置完善的多轮对话处理和流式响应机制，几分钟内即可在本地运行起可交互的聊天界面。
开箱即用的强大工具：通过 UI 面板即可一键配置文件搜索和网络搜索工具，轻松挂载向量存储，让助手瞬间具备查阅私有文档和获取全网信息的能力。
无缝连接生态服务：利用内置的 Google 原生连接器，只需简单配置 OAuth 客户端，助手便能安全地读取日历行程和邮件内容，无需重复造轮子。
灵活扩展自定义功能：提供清晰的函数调用示例（如查询天气），开发者可在配置文件中快速添加业务专属逻辑，满足特定场景需求。

openai-responses-starter-app 将原本数周的复杂全栈开发工作压缩至几小时，让开发者能专注于业务逻辑创新而非底层架构搭建。

运行环境要求

操作系统

未说明

GPU

未说明

内存

未说明

依赖

notes该项目是一个基于 NextJS 的前端应用，主要通过 npm 安装依赖并运行。需要配置 OpenAI API 密钥。若使用 Google 日历和 Gmail 集成功能，需额外配置 Google OAuth 2.0 客户端 ID、密钥及重定向 URI。无需本地 GPU 或特定 Python 环境，运行依赖于 Node.js 环境（具体版本未在文中注明，通常 NextJS 需要较新版本）。

python未说明

NextJS

OpenAI API

快速开始

Responses 入门应用

此仓库包含一个基于 Responses API 构建的 NextJS 入门应用。它利用内置工具（网页搜索和文件搜索）并实现了一个支持多轮对话的聊天界面。

特性：

多轮对话处理
流式响应与工具调用
函数调用
显示注释
网页搜索工具配置
向量存储创建及文件上传，用于文件搜索工具
MCP 服务器配置
通过第一方连接器实现 Google 日历和 Gmail 集成

该应用旨在作为构建对话式助手的起点，您可以根据自身需求进行定制。

使用方法

设置 OpenAI API：
- 如果您是 OpenAI API 的新用户，请注册账户。
- 按照快速入门指南获取您的 API 密钥。
设置 OpenAI API 密钥：

两种方式：
- 在您的系统中全局设置 OPENAI_API_KEY 环境变量参考文档
- 在项目中设置 OPENAI_API_KEY 环境变量：在项目根目录下创建 .env 文件，并添加以下行（请参考 .env.example）：
```
OPENAI_API_KEY=<your_api_key>
```

克隆仓库：

git clone https://github.com/openai/openai-responses-starter-app.git

安装依赖：

在项目根目录下运行：
```
npm install
```
运行应用：
```
npm run dev
```
应用将可在 http://localhost:3000 访问。

工具

此入门应用展示了如何使用内置工具、MCP 服务器以及第一方连接器与 Responses API 配合使用。

您可以通过 UI 直接配置这些工具，但某些工具需要额外的设置（例如 Google OAuth）。

内置工具

Responses API 提供了多种开箱即用的工具可供使用。此演示应用实现了以下工具，并允许您直接从 UI 进行配置：

文件搜索：使模型能够访问向量存储中的文件
网页搜索：使模型能够搜索互联网
代码解释器：使模型能够运行 Python 代码解决问题

其他内置工具，如计算机操作或图像生成，并未在此演示应用中实现。

MCP 服务器

UI 允许您配置一个公共 MCP 服务器以与 Responses API 配合使用。如果您希望使用需要身份验证的 MCP 服务器，可以更新 lib/tools/tools.ts 文件以添加您自己的逻辑。您可以参考 Google 连接器集成示例，了解如何使用访问令牌。

自定义函数

此演示应用附带示例函数 get_weather 和 get_joke。您可以将自己的函数添加到 config/functions.ts 文件中。

Google 集成

此应用展示了如何使用 OpenAI 的第一方连接器与 Google 集成，让助手读取您的日历和邮箱。应用会在您的浏览器中执行安全的 OAuth 流程，按会话存储令牌，并使用您的访问令牌将 Google 连接器附加到 Responses API 工具列表中。

要测试此功能，请按照以下说明设置 Google OAuth 2.0 客户端，并启用 Google 日历和 Gmail API。

有关可用的第一方连接器的更多信息，请参阅我们的文档。

设置（Google OAuth）

在您的 Google Cloud 项目中为 Web 应用创建一个 OAuth 2.0 客户端（请参阅文档以了解如何使用 OAuth 2.0 访问 Google API）。
- 在 Google Cloud 中，前往“API 和服务”>“Google 身份验证平台”>“客户端”>“创建客户端”> Web。
- 添加您的重定向 URI：http://localhost:3000/api/google/callback。
- 复制客户端 ID。创建并复制客户端密钥。
在同一项目中启用以下 API：
- Google 日历 API
- Gmail API
在 Google 身份验证平台中配置数据访问范围，以匹配您的需求。此演示使用：
- openid
- email
- profile
- https://www.googleapis.com/auth/calendar.events
- https://www.googleapis.com/auth/gmail.modify

在项目根目录下创建 .env.local 文件（可复制 .env.example），并添加：

GOOGLE_CLIENT_ID="your-google-client-id"
GOOGLE_CLIENT_SECRET="your-google-client-secret"
GOOGLE_REDIRECT_URI="http://localhost:3000/api/google/callback"

演示流程

尝试网页搜索 + 代码解释器

在 UI 中启用网页搜索和代码解释器后，向模型提问：

“你能获取旧金山八月份的气温，并生成一张绘制这些气温的图表吗？”

模型应使用网页搜索工具获取气温数据，然后使用代码解释器工具生成图表，并在 UI 中显示。

尝试文件搜索

保存 PDF 文件，例如博客文章（您可以使用这篇文章），然后打印页面并选择“另存为 PDF”选项。
创建一个新的向量存储，并上传 PDF 文件。
启用文件搜索功能，然后向模型提出一个可以用 PDF 文件回答的问题，例如：

“Responses API 有哪些新功能？”
模型应使用文件搜索工具在 PDF 文件中找到相关信息，并显示答案。

尝试 Google 集成

在 UI 中点击“连接 Google 集成”，完成 OAuth 流程；您将被重定向回页面，并显示 connected=1。
让助手执行一些任务——例如，“显示我接下来的五个日历事件”，或者“总结最近的 Wirecutter 邮件”。
应用将使用您的访问令牌，通过 MCP 将 Google 日历和 Gmail 连接器附加到工具列表中，并将结果流式传输回 UI。
若要使 OAuth 会话失效，请清除应用的 Cookie（Chrome 开发工具 > 应用程序 > 存储 > Cookie）。如果您只清除 gc_access_token，应用将使用 gc_refresh_token 进行刷新，而无需重新认证。

贡献

欢迎您提出问题或提交 PR 来改进此应用，但请注意，我们可能不会审核所有建议。

许可证

本项目采用 MIT 许可证授权。详情请参阅 LICENSE 文件。

相似工具推荐

openclaw

OpenClaw 是一款专为个人打造的本地化 AI 助手，旨在让你在自己的设备上拥有完全可控的智能伙伴。它打破了传统 AI 助手局限于特定网页或应用的束缚，能够直接接入你日常使用的各类通讯渠道，包括微信、WhatsApp、Telegram、Discord、iMessage 等数十种平台。无论你在哪个聊天软件中发送消息，OpenClaw 都能即时响应，甚至支持在 macOS、iOS 和 Android 设备上进行语音交互，并提供实时的画布渲染功能供你操控。这款工具主要解决了用户对数据隐私、响应速度以及“始终在线”体验的需求。通过将 AI 部署在本地，用户无需依赖云端服务即可享受快速、私密的智能辅助，真正实现了“你的数据，你做主”。其独特的技术亮点在于强大的网关架构，将控制平面与核心助手分离，确保跨平台通信的流畅性与扩展性。 OpenClaw 非常适合希望构建个性化工作流的技术爱好者、开发者，以及注重隐私保护且不愿被单一生态绑定的普通用户。只要具备基础的终端操作能力（支持 macOS、Linux 及 Windows WSL2），即可通过简单的命令行引导完成部署。如果你渴望拥有一个懂你

★ 349.3k|★★★☆☆|1周前

Agent开发框架图像

stable-diffusion-webui

stable-diffusion-webui 是一个基于 Gradio 构建的网页版操作界面，旨在让用户能够轻松地在本地运行和使用强大的 Stable Diffusion 图像生成模型。它解决了原始模型依赖命令行、操作门槛高且功能分散的痛点，将复杂的 AI 绘图流程整合进一个直观易用的图形化平台。无论是希望快速上手的普通创作者、需要精细控制画面细节的设计师，还是想要深入探索模型潜力的开发者与研究人员，都能从中获益。其核心亮点在于极高的功能丰富度：不仅支持文生图、图生图、局部重绘（Inpainting）和外绘（Outpainting）等基础模式，还独创了注意力机制调整、提示词矩阵、负向提示词以及“高清修复”等高级功能。此外，它内置了 GFPGAN 和 CodeFormer 等人脸修复工具，支持多种神经网络放大算法，并允许用户通过插件系统无限扩展能力。即使是显存有限的设备，stable-diffusion-webui 也提供了相应的优化选项，让高质量的 AI 艺术创作变得触手可及。

★ 162.1k|★★★☆☆|1周前

开发框架图像Agent

everything-claude-code

everything-claude-code 是一套专为 AI 编程助手（如 Claude Code、Codex、Cursor 等）打造的高性能优化系统。它不仅仅是一组配置文件，而是一个经过长期实战打磨的完整框架，旨在解决 AI 代理在实际开发中面临的效率低下、记忆丢失、安全隐患及缺乏持续学习能力等核心痛点。通过引入技能模块化、直觉增强、记忆持久化机制以及内置的安全扫描功能，everything-claude-code 能显著提升 AI 在复杂任务中的表现，帮助开发者构建更稳定、更智能的生产级 AI 代理。其独特的“研究优先”开发理念和针对 Token 消耗的优化策略，使得模型响应更快、成本更低，同时有效防御潜在的攻击向量。这套工具特别适合软件开发者、AI 研究人员以及希望深度定制 AI 工作流的技术团队使用。无论您是在构建大型代码库，还是需要 AI 协助进行安全审计与自动化测试，everything-claude-code 都能提供强大的底层支持。作为一个曾荣获 Anthropic 黑客大奖的开源项目，它融合了多语言支持与丰富的实战钩子（hooks），让 AI 真正成长为懂上

★ 160k|★★☆☆☆|今天

开发框架Agent语言模型

opencode

OpenCode 是一款开源的 AI 编程助手（Coding Agent），旨在像一位智能搭档一样融入您的开发流程。它不仅仅是一个代码补全插件，而是一个能够理解项目上下文、自主规划任务并执行复杂编码操作的智能体。无论是生成全新功能、重构现有代码，还是排查难以定位的 Bug，OpenCode 都能通过自然语言交互高效完成，显著减少开发者在重复性劳动和上下文切换上的时间消耗。这款工具专为软件开发者、工程师及技术研究人员设计，特别适合希望利用大模型能力来提升编码效率、加速原型开发或处理遗留代码维护的专业人群。其核心亮点在于完全开源的架构，这意味着用户可以审查代码逻辑、自定义行为策略，甚至私有化部署以保障数据安全，彻底打破了传统闭源 AI 助手的“黑盒”限制。在技术体验上，OpenCode 提供了灵活的终端界面（Terminal UI）和正在测试中的桌面应用程序，支持 macOS、Windows 及 Linux 全平台。它兼容多种包管理工具，安装便捷，并能无缝集成到现有的开发环境中。无论您是追求极致控制权的资深极客，还是渴望提升产出的独立开发者，OpenCode 都提供了一个透明、可信

★ 144.3k|★☆☆☆☆|2天前

Agent插件

ComfyUI

ComfyUI 是一款功能强大且高度模块化的视觉 AI 引擎，专为设计和执行复杂的 Stable Diffusion 图像生成流程而打造。它摒弃了传统的代码编写模式，采用直观的节点式流程图界面，让用户通过连接不同的功能模块即可构建个性化的生成管线。这一设计巧妙解决了高级 AI 绘图工作流配置复杂、灵活性不足的痛点。用户无需具备编程背景，也能自由组合模型、调整参数并实时预览效果，轻松实现从基础文生图到多步骤高清修复等各类复杂任务。ComfyUI 拥有极佳的兼容性，不仅支持 Windows、macOS 和 Linux 全平台，还广泛适配 NVIDIA、AMD、Intel 及苹果 Silicon 等多种硬件架构，并率先支持 SDXL、Flux、SD3 等前沿模型。无论是希望深入探索算法潜力的研究人员和开发者，还是追求极致创作自由度的设计师与资深 AI 绘画爱好者，ComfyUI 都能提供强大的支持。其独特的模块化架构允许社区不断扩展新功能，使其成为当前最灵活、生态最丰富的开源扩散模型工具之一，帮助用户将创意高效转化为现实。

★ 109.2k|★★☆☆☆|今天