openai-responses-starter-app
openai-responses-starter-app 是一个基于 NextJS 构建的开源启动项目,旨在帮助开发者快速上手并构建基于 OpenAI Responses API 的智能对话应用。它解决了从零搭建复杂 AI 助手时面临的环境配置、多轮对话管理以及工具集成等技术难题,让开发者能将精力集中在业务逻辑定制上。
该项目非常适合希望利用最新 OpenAI 接口开发定制化聊天机器人或智能助理的软件开发者和工程师。其核心亮点在于不仅支持流式响应和函数调用,还深度集成了多种实用工具:包括让模型能联网检索信息的“网络搜索”、基于向量存储的“文件搜索”,以及可执行 Python 代码的“代码解释器”。此外,它还展示了如何通过 MCP 服务器扩展能力,并利用官方连接器安全地集成 Google 日历与 Gmail 等第三方服务。作为一个功能完备的模板,openai-responses-starter-app 提供了清晰的代码结构和配置示例,是探索现代 AI 应用开发的理想起点。
使用场景
某初创公司的产品经理希望快速构建一个能自动查阅内部文档、搜索最新行业动态并同步个人日程的智能助手,以辅助日常决策。
没有 openai-responses-starter-app 时
- 开发周期漫长:团队需从零搭建 NextJS 框架,手动编写多轮对话状态管理逻辑,耗时数周才能跑通基础聊天功能。
- 工具集成困难:想要让 AI 具备联网搜索或读取内部 PDF 文档的能力,需要自行研究复杂的 API 参数配置和向量存储创建流程,技术门槛极高。
- 外部服务对接繁琐:若需助手访问 Google 日历或 Gmail,开发者必须独立处理 OAuth 2.0 认证流、令牌存储及安全回调,极易出现安全漏洞。
- 实时体验缺失:默认实现往往不支持流式输出,用户只能等待完整响应生成,导致交互延迟高,体验生硬。
使用 openai-responses-starter-app 后
- 即刻启动开发:直接克隆基于 NextJS 的成熟模板,内置完善的多轮对话处理和流式响应机制,几分钟内即可在本地运行起可交互的聊天界面。
- 开箱即用的强大工具:通过 UI 面板即可一键配置文件搜索和网络搜索工具,轻松挂载向量存储,让助手瞬间具备查阅私有文档和获取全网信息的能力。
- 无缝连接生态服务:利用内置的 Google 原生连接器,只需简单配置 OAuth 客户端,助手便能安全地读取日历行程和邮件内容,无需重复造轮子。
- 灵活扩展自定义功能:提供清晰的函数调用示例(如查询天气),开发者可在配置文件中快速添加业务专属逻辑,满足特定场景需求。
openai-responses-starter-app 将原本数周的复杂全栈开发工作压缩至几小时,让开发者能专注于业务逻辑创新而非底层架构搭建。
运行环境要求
- 未说明
未说明
未说明

快速开始
Responses 入门应用
此仓库包含一个基于 Responses API 构建的 NextJS 入门应用。它利用内置工具(网页搜索 和 文件搜索)并实现了一个支持多轮对话的聊天界面。
特性:
- 多轮对话处理
- 流式响应与工具调用
- 函数调用
- 显示注释
- 网页搜索工具配置
- 向量存储创建及文件上传,用于文件搜索工具
- MCP 服务器配置
- 通过第一方连接器实现 Google 日历和 Gmail 集成
该应用旨在作为构建对话式助手的起点,您可以根据自身需求进行定制。
使用方法
设置 OpenAI API:
设置 OpenAI API 密钥:
两种方式:
- 在您的系统中全局设置
OPENAI_API_KEY环境变量 参考文档 - 在项目中设置
OPENAI_API_KEY环境变量:在项目根目录下创建.env文件,并添加以下行(请参考.env.example):
OPENAI_API_KEY=<your_api_key>- 在您的系统中全局设置
克隆仓库:
git clone https://github.com/openai/openai-responses-starter-app.git安装依赖:
在项目根目录下运行:
npm install运行应用:
npm run dev应用将可在
http://localhost:3000访问。
工具
此入门应用展示了如何使用内置工具、MCP 服务器以及第一方连接器与 Responses API 配合使用。
您可以通过 UI 直接配置这些工具,但某些工具需要额外的设置(例如 Google OAuth)。
内置工具
Responses API 提供了多种开箱即用的工具可供使用。此演示应用实现了以下工具,并允许您直接从 UI 进行配置:
- 文件搜索:使模型能够访问向量存储中的文件
- 网页搜索:使模型能够搜索互联网
- 代码解释器:使模型能够运行 Python 代码解决问题
其他内置工具,如计算机操作或图像生成,并未在此演示应用中实现。
MCP 服务器
UI 允许您配置一个公共 MCP 服务器以与 Responses API 配合使用。如果您希望使用需要身份验证的 MCP 服务器,可以更新 lib/tools/tools.ts 文件以添加您自己的逻辑。您可以参考 Google 连接器集成示例,了解如何使用访问令牌。
自定义函数
此演示应用附带示例函数 get_weather 和 get_joke。您可以将自己的函数添加到 config/functions.ts 文件中。
Google 集成
此应用展示了如何使用 OpenAI 的第一方连接器与 Google 集成,让助手读取您的日历和邮箱。应用会在您的浏览器中执行安全的 OAuth 流程,按会话存储令牌,并使用您的访问令牌将 Google 连接器附加到 Responses API 工具列表中。
要测试此功能,请按照以下说明设置 Google OAuth 2.0 客户端,并启用 Google 日历和 Gmail API。
有关可用的第一方连接器的更多信息,请参阅 我们的文档。
设置(Google OAuth)
在您的 Google Cloud 项目中为 Web 应用创建一个 OAuth 2.0 客户端(请参阅 文档 以了解如何使用 OAuth 2.0 访问 Google API)。
- 在 Google Cloud 中,前往“API 和服务”>“Google 身份验证平台”>“客户端”>“创建客户端”> Web。
- 添加您的重定向 URI:
http://localhost:3000/api/google/callback。 - 复制客户端 ID。创建并复制客户端密钥。
在同一项目中启用以下 API:
- Google 日历 API
- Gmail API
在 Google 身份验证平台中配置数据访问范围,以匹配您的需求。此演示使用:
openidemailprofilehttps://www.googleapis.com/auth/calendar.eventshttps://www.googleapis.com/auth/gmail.modify
在项目根目录下创建
.env.local文件(可复制.env.example),并添加:GOOGLE_CLIENT_ID="your-google-client-id" GOOGLE_CLIENT_SECRET="your-google-client-secret" GOOGLE_REDIRECT_URI="http://localhost:3000/api/google/callback"
演示流程
尝试网页搜索 + 代码解释器
在 UI 中启用网页搜索和代码解释器后,向模型提问:
“你能获取旧金山八月份的气温,并生成一张绘制这些气温的图表吗?”
模型应使用网页搜索工具获取气温数据,然后使用代码解释器工具生成图表,并在 UI 中显示。
尝试文件搜索
- 保存 PDF 文件,例如博客文章(您可以使用 这篇文章),然后打印页面并选择“另存为 PDF”选项。
- 创建一个新的向量存储,并上传 PDF 文件。
- 启用文件搜索功能,然后向模型提出一个可以用 PDF 文件回答的问题,例如:
“Responses API 有哪些新功能?”
- 模型应使用文件搜索工具在 PDF 文件中找到相关信息,并显示答案。
尝试 Google 集成
- 在 UI 中点击“连接 Google 集成”,完成 OAuth 流程;您将被重定向回页面,并显示
connected=1。 - 让助手执行一些任务——例如,“显示我接下来的五个日历事件”,或者“总结最近的 Wirecutter 邮件”。
- 应用将使用您的访问令牌,通过 MCP 将 Google 日历和 Gmail 连接器附加到工具列表中,并将结果流式传输回 UI。
- 若要使 OAuth 会话失效,请清除应用的 Cookie(Chrome 开发工具 > 应用程序 > 存储 > Cookie)。如果您只清除
gc_access_token,应用将使用gc_refresh_token进行刷新,而无需重新认证。
贡献
欢迎您提出问题或提交 PR 来改进此应用,但请注意,我们可能不会审核所有建议。
许可证
本项目采用 MIT 许可证授权。详情请参阅 LICENSE 文件。
相似工具推荐
openclaw
OpenClaw 是一款专为个人打造的本地化 AI 助手,旨在让你在自己的设备上拥有完全可控的智能伙伴。它打破了传统 AI 助手局限于特定网页或应用的束缚,能够直接接入你日常使用的各类通讯渠道,包括微信、WhatsApp、Telegram、Discord、iMessage 等数十种平台。无论你在哪个聊天软件中发送消息,OpenClaw 都能即时响应,甚至支持在 macOS、iOS 和 Android 设备上进行语音交互,并提供实时的画布渲染功能供你操控。 这款工具主要解决了用户对数据隐私、响应速度以及“始终在线”体验的需求。通过将 AI 部署在本地,用户无需依赖云端服务即可享受快速、私密的智能辅助,真正实现了“你的数据,你做主”。其独特的技术亮点在于强大的网关架构,将控制平面与核心助手分离,确保跨平台通信的流畅性与扩展性。 OpenClaw 非常适合希望构建个性化工作流的技术爱好者、开发者,以及注重隐私保护且不愿被单一生态绑定的普通用户。只要具备基础的终端操作能力(支持 macOS、Linux 及 Windows WSL2),即可通过简单的命令行引导完成部署。如果你渴望拥有一个懂你
stable-diffusion-webui
stable-diffusion-webui 是一个基于 Gradio 构建的网页版操作界面,旨在让用户能够轻松地在本地运行和使用强大的 Stable Diffusion 图像生成模型。它解决了原始模型依赖命令行、操作门槛高且功能分散的痛点,将复杂的 AI 绘图流程整合进一个直观易用的图形化平台。 无论是希望快速上手的普通创作者、需要精细控制画面细节的设计师,还是想要深入探索模型潜力的开发者与研究人员,都能从中获益。其核心亮点在于极高的功能丰富度:不仅支持文生图、图生图、局部重绘(Inpainting)和外绘(Outpainting)等基础模式,还独创了注意力机制调整、提示词矩阵、负向提示词以及“高清修复”等高级功能。此外,它内置了 GFPGAN 和 CodeFormer 等人脸修复工具,支持多种神经网络放大算法,并允许用户通过插件系统无限扩展能力。即使是显存有限的设备,stable-diffusion-webui 也提供了相应的优化选项,让高质量的 AI 艺术创作变得触手可及。
everything-claude-code
everything-claude-code 是一套专为 AI 编程助手(如 Claude Code、Codex、Cursor 等)打造的高性能优化系统。它不仅仅是一组配置文件,而是一个经过长期实战打磨的完整框架,旨在解决 AI 代理在实际开发中面临的效率低下、记忆丢失、安全隐患及缺乏持续学习能力等核心痛点。 通过引入技能模块化、直觉增强、记忆持久化机制以及内置的安全扫描功能,everything-claude-code 能显著提升 AI 在复杂任务中的表现,帮助开发者构建更稳定、更智能的生产级 AI 代理。其独特的“研究优先”开发理念和针对 Token 消耗的优化策略,使得模型响应更快、成本更低,同时有效防御潜在的攻击向量。 这套工具特别适合软件开发者、AI 研究人员以及希望深度定制 AI 工作流的技术团队使用。无论您是在构建大型代码库,还是需要 AI 协助进行安全审计与自动化测试,everything-claude-code 都能提供强大的底层支持。作为一个曾荣获 Anthropic 黑客大奖的开源项目,它融合了多语言支持与丰富的实战钩子(hooks),让 AI 真正成长为懂上
opencode
OpenCode 是一款开源的 AI 编程助手(Coding Agent),旨在像一位智能搭档一样融入您的开发流程。它不仅仅是一个代码补全插件,而是一个能够理解项目上下文、自主规划任务并执行复杂编码操作的智能体。无论是生成全新功能、重构现有代码,还是排查难以定位的 Bug,OpenCode 都能通过自然语言交互高效完成,显著减少开发者在重复性劳动和上下文切换上的时间消耗。 这款工具专为软件开发者、工程师及技术研究人员设计,特别适合希望利用大模型能力来提升编码效率、加速原型开发或处理遗留代码维护的专业人群。其核心亮点在于完全开源的架构,这意味着用户可以审查代码逻辑、自定义行为策略,甚至私有化部署以保障数据安全,彻底打破了传统闭源 AI 助手的“黑盒”限制。 在技术体验上,OpenCode 提供了灵活的终端界面(Terminal UI)和正在测试中的桌面应用程序,支持 macOS、Windows 及 Linux 全平台。它兼容多种包管理工具,安装便捷,并能无缝集成到现有的开发环境中。无论您是追求极致控制权的资深极客,还是渴望提升产出的独立开发者,OpenCode 都提供了一个透明、可信
ComfyUI
ComfyUI 是一款功能强大且高度模块化的视觉 AI 引擎,专为设计和执行复杂的 Stable Diffusion 图像生成流程而打造。它摒弃了传统的代码编写模式,采用直观的节点式流程图界面,让用户通过连接不同的功能模块即可构建个性化的生成管线。 这一设计巧妙解决了高级 AI 绘图工作流配置复杂、灵活性不足的痛点。用户无需具备编程背景,也能自由组合模型、调整参数并实时预览效果,轻松实现从基础文生图到多步骤高清修复等各类复杂任务。ComfyUI 拥有极佳的兼容性,不仅支持 Windows、macOS 和 Linux 全平台,还广泛适配 NVIDIA、AMD、Intel 及苹果 Silicon 等多种硬件架构,并率先支持 SDXL、Flux、SD3 等前沿模型。 无论是希望深入探索算法潜力的研究人员和开发者,还是追求极致创作自由度的设计师与资深 AI 绘画爱好者,ComfyUI 都能提供强大的支持。其独特的模块化架构允许社区不断扩展新功能,使其成为当前最灵活、生态最丰富的开源扩散模型工具之一,帮助用户将创意高效转化为现实。
gemini-cli
gemini-cli 是一款由谷歌推出的开源 AI 命令行工具,它将强大的 Gemini 大模型能力直接集成到用户的终端环境中。对于习惯在命令行工作的开发者而言,它提供了一条从输入提示词到获取模型响应的最短路径,无需切换窗口即可享受智能辅助。 这款工具主要解决了开发过程中频繁上下文切换的痛点,让用户能在熟悉的终端界面内直接完成代码理解、生成、调试以及自动化运维任务。无论是查询大型代码库、根据草图生成应用,还是执行复杂的 Git 操作,gemini-cli 都能通过自然语言指令高效处理。 它特别适合广大软件工程师、DevOps 人员及技术研究人员使用。其核心亮点包括支持高达 100 万 token 的超长上下文窗口,具备出色的逻辑推理能力;内置 Google 搜索、文件操作及 Shell 命令执行等实用工具;更独特的是,它支持 MCP(模型上下文协议),允许用户灵活扩展自定义集成,连接如图像生成等外部能力。此外,个人谷歌账号即可享受免费的额度支持,且项目基于 Apache 2.0 协议完全开源,是提升终端工作效率的理想助手。