ChatGPT-Siri

GitHub
3.7k 164 简单 1 次阅读 昨天MIT语言模型插件
AI 解读 由 AI 自动生成,仅供参考

ChatGPT-Siri 是一款基于苹果“快捷指令”(Shortcuts)打造的智能助手工具,旨在将传统的 Siri 升级为具备连续对话能力的 AI 聊天伙伴。它通过调用 ChatGPT API,让用户只需对着 Siri 说话,即可获得流畅、自然的智能回复,彻底打破了原生 Siri 在复杂语境理解上的局限。

这款工具主要解决了用户希望在不切换应用的前提下,随时随地与高性能大模型进行深度交互的需求。无论是日常问答、创意构思还是多轮逻辑探讨,ChatGPT-Siri 都能提供即时支持。它非常适合广大 iPhone、iPad、Mac 及 HomePod 的普通用户使用,无需具备编程基础,仅需配置个人 API Key 即可轻松上手。

其技术亮点在于支持高度自定义的系统提示词(Prompt)和模型选择(包括 GPT-4),并能自动将聊天记录按天保存至 iCloud Drive 的 TXT 文件中,详细记录时间戳与 Token 消耗统计,方便后续回顾与管理。此外,它还支持通过分享菜单快速启动,并将最新回复自动复制到剪贴板,极大提升了移动端的使用效率。对于希望低成本体验定制化 AI 服务的苹果生态用户而言,这是一个实用且高效的解决方案。

使用场景

一位经常需要在外勤跑业务的销售经理,在驾车途中突然接到客户关于复杂产品技术参数的咨询,急需快速获得准确且专业的回复话术。

没有 ChatGPT-Siri 时

  • 操作繁琐且危险:必须停车或冒险手动解锁手机、打开浏览器或独立 App 输入问题,严重分散驾驶注意力。
  • 对话缺乏连贯性:传统语音助手无法理解上下文,每次提问都需重新陈述背景,难以进行多轮深入的技术探讨。
  • 回复机械生硬:Siri 原生回答仅能检索固定信息,无法根据客户特定痛点生成具有销售技巧的定制化话术。
  • 关键信息易丢失:生成的优质回复无法自动留存,下车后难以找回刚才的灵感或数据,导致后续跟进断层。

使用 ChatGPT-Siri 后

  • 语音即达更安全:只需唤醒 Siri 说出指令,ChatGPT-Siri 即刻通过后台快捷指令调用 API,全程无需手眼配合,保障行车安全。
  • 支持连续深度对话:利用其连续对话功能,可像与真人专家交流一样追问细节(如“再简化一点”、“对比竞品优势”),逻辑流畅自然。
  • 智能生成专业话术:基于预设的系统 Prompt,它能瞬间将枯燥的技术参数转化为极具说服力的销售语言,精准击中客户需求。
  • 自动归档便于复盘:对话结束后,ChatGPT-Siri 自动将包含时间戳和 Token 消耗的完整记录保存至 iCloud 文本文件,方便回公司后整理录入 CRM 系统。

ChatGPT-Siri 将原本割裂的语音交互升级为随时随地的智能业务参谋,让碎片化时间转化为高效的生产力时刻。

运行环境要求

操作系统
  • iOS
  • iPadOS
  • macOS
GPU

未说明

内存

未说明

依赖
notes该工具并非传统软件,而是基于 Apple 生态的‘快捷指令’脚本。1. 运行环境需为 iPhone、iPad、Mac、HomePod 或 CarPlay;2. 必须配置 Siri 并开启‘始终显示对 Siri 说的话’以确保识别准确;3. 版本 1.2 及以上需开启 iCloud Drive 功能以保存聊天记录到文件;4. 需自行获取 OpenAI 或兼容服务商的 API Key 并在快捷指令中配置;5. 建议重命名快捷指令以便 Siri 更准确地通过语音唤醒;6. 网络需能访问 api.openai.com 或自定义的 API 域名。
python未说明
Apple Shortcuts App (快捷指令)
Siri
OpenAI API Key (或兼容的第三方 API Key)
ChatGPT-Siri hero image

快速开始

🤖️ ChatGPT Siri

👉 简体中文文档

通过 Siri 启动“快捷指令”来连接 ChatGPT API,将 Siri 变成一个 AI 聊天助手。你可以直接对 Siri 说出你的问题,Siri 就会为你解答。现在我们的 Siri 终于变得智能了,能够流利地与我们对话!而这一切只需要一条快捷指令和一个 API 密钥即可实现。

准备工作

  • 确保网络可以访问域名 https://api.openai.com。
  • 确保 API 账户中有足够的余额:https://platform.openai.com/account/usage。
  • 使用 Siri 启动快捷指令:打开“设置”->“Siri 与搜索”->“自动”。勾选“始终显示我对 Siri 所说的话”,以查看识别是否准确。确保 Siri 的语言设置与你使用的语言一致。
  • 对于 1.2 版本及以上,需要开启“设置”-“Apple ID”-“iCloud”-“iCloud 云盘”功能,才能使用保存为 TXT 文件的功能。

其他相关问题

快捷指令下载

点击下方链接下载快捷指令,支持 iPhone、iPad、Mac、HomePod、CarPlay。

ChatGPT Siri 1.0

支持连续聊天、退出聊天、开始新聊天、自定义 API 密钥、自定义提示系统消息、自定义提示信息。

ChatGPT Siri 1.1

我建议安装 1.2 版本,它会将包含更多聊天细节的聊天记录保存到 txt 文件中,便于管理。

支持连续聊天、退出聊天、开始新聊天、自定义 API 密钥、自定义提示系统消息、自定义提示信息。

新增功能:支持自动将聊天记录保存到“备忘录”应用。

ChatGPT Siri 1.2

支持连续聊天、退出聊天、开始新聊天、自定义 API 密钥、自定义提示系统消息、自定义提示信息。

新增功能:自动将聊天数据保存到 txt 文件中,记录包括每次对话的发送和接收时间、Token 消耗统计。

聊天记录路径:打开“文件”应用,找到路径:iCloud 云盘/快捷指令/ChatGPT-log 查看聊天文件,支持 iCloud 同步。

需要打开“设置”-“Apple ID”-“iCloud”-“iCloud 云盘”功能,才能启用保存为 txt 文件的功能。

ChatGPT Siri 1.2.1

功能与 1.2 相同,额外支持在 iPad 和 iPhone 上通过分享表单将文本分享到快捷指令,以及在 Mac 上通过快速操作将文本发送到快捷指令,以便快速启动快捷指令。

ChatGPT Siri 1.2.2

功能与 1.2.1 相同,但修复了新聊天中的一个 bug。

ChatGPT Siri 1.2.3

功能与 1.2.2 相同,增加了以下内容:

  1. 可以选择模型并支持 GPT-4;
  2. 自动将最后一次回复复制到剪贴板;
  3. 按天将聊天记录保存到不同的文件夹;
  4. 恢复默认系统消息。

ChatGPT Siri 1.2.4

功能与 1.2.3 相同,修复了不同语言系统中聊天记录目录可能出现的问题。

ChatGPT Siri 1.2.5

功能与 1.2.4 相同,进行了以下修改:

  1. 添加了未找到选项时的错误提示;
  2. 移除了聊天日志文件名中的冒号,以避免潜在的目录问题。

ChatGPT Siri 1.3

模型已升级至 gpt-5.2,并新增了配置自定义 OpenAI 兼容 API URL 的功能。

注意:快捷指令不支持版本管理,因此我在名称中添加了版本号以作区分。如果你希望通过语音启动此快捷指令,请将其重命名为去掉版本号的形式。你也可以将其重命名为你喜欢且更易于语音识别的名字。

自定义 URL 示例:

自定义 URL、模型和 API 密钥必须匹配——请确保它们来自同一服务提供商。如果进行复制粘贴,请确保你的 URL、模型名称和 API 密钥中没有多余的空格、换行符或隐藏字符。它们必须完全一致,否则会导致请求错误。

1️⃣ 默认 OpenAI URL:https://api.openai.com/v1/chat/completions,模型:gpt-5.2gpt-5gpt-5-minigpt-5-nanogpt-4o 等,模型列表:https://developers.openai.com/api/docs/pricing#text-tokens;API 密钥:https://platform.openai.com/api-keys。

2️⃣ DeepSeek URL:https://api.deepseek.com/v1/chat/completions,模型:deepseek-chat 等。API 密钥:https://platform.deepseek.com/api_keys。

3️⃣ OpenRouter URL:https://openrouter.ai/api/v1/chat/completions,模型:openai/gpt-5.2openai/gpt-4o-miniopenrouter/autoopenrouter/free 等。模型列表:https://openrouter.ai/models;API 密钥:https://openrouter.ai/settings/keys。

4️⃣ 其他兼容 OpenAI 的 URL 也应能正常工作。

下载链接:


ChatGPT Siri 1.3.1

功能与1.3版本相同。

  • 修复了使用最新OpenAI模型时导致错误的bug #170
  • 新增:现在“新对话”和“结束对话”指令支持匹配多个关键词。(只要包含其中一个关键词,指令就会成功触发。)

下载链接:


API密钥获取

要使用该快捷指令调用ChatGPT API,需要一个OpenAI API密钥。您可以前往OpenAI官网免费获取,具体步骤如下:

  1. 访问 https://platform.openai.com 注册并登录账户。
  2. 点击右上角的头像,选择“查看API密钥”。
  3. 在页面右侧点击“创建新的密钥”按钮,生成API密钥。
  4. 复制API密钥并妥善保存。请注意,API密钥仅显示一次,若忘记需重新生成。

注意:使用该API会产生费用,价格为每1000个token 0.0020美元。1000个token大约相当于750个英文单词或500个中文字符。OpenAI的新用户在前3个月内可获得5美元的免费额度。因此,建议不要与他人共享API密钥。如果API密钥泄露,您可以在OpenAI后台将其删除并重新生成一个新的。

编辑快捷指令以替换API密钥

打开“快捷指令”应用,找到已下载的“ChatGPT”快捷指令,长按选择“编辑”,并将上述API密钥粘贴到下方的文本框中。

使用方法

通过Siri启动该“快捷指令”,只需说“嘿,Siri,ChatGPT”,即可开始与Siri对话。我们的Siri已经变得非常聪明,尽情享受吧!🎉

更新:建议您更改默认名称,因为Siri无法准确识别“ChatGPT”。

如果您不喜欢这个名称,可以重命名该快捷指令,改成任何您喜欢的名字,然后只需对Siri说“嘿,Siri,xxx”,其中xxx为您选择的新名称。最好不要在名称中添加特殊符号,因为这些符号难以被Siri识别 😂。如果Siri无法匹配快捷指令的名称,它将无法正常工作!

当然,您也可以直接点击快捷指令来使用。此时,它将以对话框的形式运行,不会朗读内容。您可以将其添加到主屏幕以便快速访问。完 🎉

高级用法

该快捷指令支持iPhone、iPad和Mac,支持连续对话、结束对话和新建对话。使用方法如下:

  • 默认情况下支持连续对话,能够记录上下文并持续讨论问题。
  • 如果想开始新的对话,在轮到您发言时说出“新对话”,Siri将开启新一轮对话,这意味着之前的上下文将被清除,您无法继续基于先前的信息进行交流。
  • 如果想退出ChatGPT而使用系统自带的Siri,可以在轮到您发言时说“结束对话”。当然,您也可以直接关闭Siri再重新打开,但在这里提供明确的退出指令会显得更加自然。

自定义名称、图标和提示信息。

  • img1:重命名并选择图标
  • img2:欢迎及继续提示
img1 img2

自定义提示信息。

  • img1:结束对话指令及提示
  • img2:新对话指令及欢迎提示
img1 img2

自定义系统消息

您还可以自定义系统消息,这有助于设定助手的行为模式。在此“快捷指令”中使用的默认系统消息是ChatGPT的默认设置之一:

你是ChatGPT,由OpenAI训练的大型语言模型。请尽可能简洁地回答。知识截止日期:2021年9月。

修改方法:编辑“快捷指令”,向下滚动,找到如图所示的位置:

例如,您可以将系统消息替换为以下内容:

我将让你扮演一名翻译。你的目标是将任何语言翻译成英语。请不要使用口译员式的腔调,而是要用优美、流畅且地道的语言自然地进行翻译。

当然,您也可以自行编写,比如让ChatGPT扮演一个幽默家、作家、厨师等角色。玩法无穷无尽。您还可以在网上找到别人编写的提示词,稍作修改后填入此处。这里建议复制一份“快捷指令”,并为副本取一个不同的名字。例如,将翻译专用的快捷指令命名为“我的翻译器”,这样您只需说“嘿,Siri,我的翻译器”,就能启动专用于翻译的ChatGPT。

此外,您也可以在轮到自己发言时直接告诉ChatGPT您希望它扮演的角色。比如请求它帮助您进行翻译。不过,这种方式不如上面专门修改系统消息以实现翻译功能的“快捷指令”那样方便。那个“翻译器”可以直接工作,非常实用!这也正是Prompt的意义所在——您可以先根据自己的使用场景定制提示词,从而更高效地利用ChatGPT。这就是为什么网上有如此多优秀的Prompt教程。我们完全可以构建适合自己的Prompt,让ChatGPT发挥更大的作用!

AI图像

1.0

1.1

自动将图片保存到相册。

联系方式

常见问题解答

👉 问题讨论

星标历史

星标历史图表

版本历史

v1.3.12026/02/27
v1.32026/02/15

相似工具推荐

n8n

n8n 是一款面向技术团队的公平代码(fair-code)工作流自动化平台,旨在让用户在享受低代码快速构建便利的同时,保留编写自定义代码的灵活性。它主要解决了传统自动化工具要么过于封闭难以扩展、要么完全依赖手写代码效率低下的痛点,帮助用户轻松连接 400 多种应用与服务,实现复杂业务流程的自动化。 n8n 特别适合开发者、工程师以及具备一定技术背景的业务人员使用。其核心亮点在于“按需编码”:既可以通过直观的可视化界面拖拽节点搭建流程,也能随时插入 JavaScript 或 Python 代码、调用 npm 包来处理复杂逻辑。此外,n8n 原生集成了基于 LangChain 的 AI 能力,支持用户利用自有数据和模型构建智能体工作流。在部署方面,n8n 提供极高的自由度,支持完全自托管以保障数据隐私和控制权,也提供云端服务选项。凭借活跃的社区生态和数百个现成模板,n8n 让构建强大且可控的自动化系统变得简单高效。

184.7k|★★☆☆☆|今天
数据工具开发框架Agent

everything-claude-code

everything-claude-code 是一套专为 AI 编程助手(如 Claude Code、Codex、Cursor 等)打造的高性能优化系统。它不仅仅是一组配置文件,而是一个经过长期实战打磨的完整框架,旨在解决 AI 代理在实际开发中面临的效率低下、记忆丢失、安全隐患及缺乏持续学习能力等核心痛点。 通过引入技能模块化、直觉增强、记忆持久化机制以及内置的安全扫描功能,everything-claude-code 能显著提升 AI 在复杂任务中的表现,帮助开发者构建更稳定、更智能的生产级 AI 代理。其独特的“研究优先”开发理念和针对 Token 消耗的优化策略,使得模型响应更快、成本更低,同时有效防御潜在的攻击向量。 这套工具特别适合软件开发者、AI 研究人员以及希望深度定制 AI 工作流的技术团队使用。无论您是在构建大型代码库,还是需要 AI 协助进行安全审计与自动化测试,everything-claude-code 都能提供强大的底层支持。作为一个曾荣获 Anthropic 黑客大奖的开源项目,它融合了多语言支持与丰富的实战钩子(hooks),让 AI 真正成长为懂上

161.1k|★★☆☆☆|今天
开发框架Agent语言模型

opencode

OpenCode 是一款开源的 AI 编程助手(Coding Agent),旨在像一位智能搭档一样融入您的开发流程。它不仅仅是一个代码补全插件,而是一个能够理解项目上下文、自主规划任务并执行复杂编码操作的智能体。无论是生成全新功能、重构现有代码,还是排查难以定位的 Bug,OpenCode 都能通过自然语言交互高效完成,显著减少开发者在重复性劳动和上下文切换上的时间消耗。 这款工具专为软件开发者、工程师及技术研究人员设计,特别适合希望利用大模型能力来提升编码效率、加速原型开发或处理遗留代码维护的专业人群。其核心亮点在于完全开源的架构,这意味着用户可以审查代码逻辑、自定义行为策略,甚至私有化部署以保障数据安全,彻底打破了传统闭源 AI 助手的“黑盒”限制。 在技术体验上,OpenCode 提供了灵活的终端界面(Terminal UI)和正在测试中的桌面应用程序,支持 macOS、Windows 及 Linux 全平台。它兼容多种包管理工具,安装便捷,并能无缝集成到现有的开发环境中。无论您是追求极致控制权的资深极客,还是渴望提升产出的独立开发者,OpenCode 都提供了一个透明、可信

144.3k|★☆☆☆☆|3天前
Agent插件

gemini-cli

gemini-cli 是一款由谷歌推出的开源 AI 命令行工具,它将强大的 Gemini 大模型能力直接集成到用户的终端环境中。对于习惯在命令行工作的开发者而言,它提供了一条从输入提示词到获取模型响应的最短路径,无需切换窗口即可享受智能辅助。 这款工具主要解决了开发过程中频繁上下文切换的痛点,让用户能在熟悉的终端界面内直接完成代码理解、生成、调试以及自动化运维任务。无论是查询大型代码库、根据草图生成应用,还是执行复杂的 Git 操作,gemini-cli 都能通过自然语言指令高效处理。 它特别适合广大软件工程师、DevOps 人员及技术研究人员使用。其核心亮点包括支持高达 100 万 token 的超长上下文窗口,具备出色的逻辑推理能力;内置 Google 搜索、文件操作及 Shell 命令执行等实用工具;更独特的是,它支持 MCP(模型上下文协议),允许用户灵活扩展自定义集成,连接如图像生成等外部能力。此外,个人谷歌账号即可享受免费的额度支持,且项目基于 Apache 2.0 协议完全开源,是提升终端工作效率的理想助手。

100.8k|★★☆☆☆|1周前
插件Agent图像

markitdown

MarkItDown 是一款由微软 AutoGen 团队打造的轻量级 Python 工具,专为将各类文件高效转换为 Markdown 格式而设计。它支持 PDF、Word、Excel、PPT、图片(含 OCR)、音频(含语音转录)、HTML 乃至 YouTube 链接等多种格式的解析,能够精准提取文档中的标题、列表、表格和链接等关键结构信息。 在人工智能应用日益普及的今天,大语言模型(LLM)虽擅长处理文本,却难以直接读取复杂的二进制办公文档。MarkItDown 恰好解决了这一痛点,它将非结构化或半结构化的文件转化为模型“原生理解”且 Token 效率极高的 Markdown 格式,成为连接本地文件与 AI 分析 pipeline 的理想桥梁。此外,它还提供了 MCP(模型上下文协议)服务器,可无缝集成到 Claude Desktop 等 LLM 应用中。 这款工具特别适合开发者、数据科学家及 AI 研究人员使用,尤其是那些需要构建文档检索增强生成(RAG)系统、进行批量文本分析或希望让 AI 助手直接“阅读”本地文件的用户。虽然生成的内容也具备一定可读性,但其核心优势在于为机器

93.4k|★★☆☆☆|1周前
插件开发框架

LLMs-from-scratch

LLMs-from-scratch 是一个基于 PyTorch 的开源教育项目,旨在引导用户从零开始一步步构建一个类似 ChatGPT 的大型语言模型(LLM)。它不仅是同名技术著作的官方代码库,更提供了一套完整的实践方案,涵盖模型开发、预训练及微调的全过程。 该项目主要解决了大模型领域“黑盒化”的学习痛点。许多开发者虽能调用现成模型,却难以深入理解其内部架构与训练机制。通过亲手编写每一行核心代码,用户能够透彻掌握 Transformer 架构、注意力机制等关键原理,从而真正理解大模型是如何“思考”的。此外,项目还包含了加载大型预训练权重进行微调的代码,帮助用户将理论知识延伸至实际应用。 LLMs-from-scratch 特别适合希望深入底层原理的 AI 开发者、研究人员以及计算机专业的学生。对于不满足于仅使用 API,而是渴望探究模型构建细节的技术人员而言,这是极佳的学习资源。其独特的技术亮点在于“循序渐进”的教学设计:将复杂的系统工程拆解为清晰的步骤,配合详细的图表与示例,让构建一个虽小但功能完备的大模型变得触手可及。无论你是想夯实理论基础,还是为未来研发更大规模的模型做准备

90.1k|★★★☆☆|2周前
语言模型图像Agent