awesome-chatgpt
awesome-chatgpt 是一个全面且精心整理的 ChatGPT 资源导航库,旨在帮助用户一站式获取与 ChatGPT 及大语言模型相关的所有优质信息。面对当前 AI 领域信息爆炸、资源分散的痛点,它将零散的知识系统化,涵盖了从基础原理、提示词(Prompts)最佳实践,到官方文档、开源项目、浏览器插件、应用工具及专业课程等全方位内容。
无论是希望快速上手的普通用户、寻求高效工作流的设计师,还是深入钻研技术的开发者与研究人员,都能在这里找到所需资源。普通用户可借此学习如何编写高质量提示词以激发模型潜力;开发者能发现各类基于 API 的创新项目和开发工具;研究人员则可获取最新的论文解读、技术原理分析及行业研究报告。
其独特亮点在于不仅罗列资源,更构建了完整的知识体系:从“元资源”入门,深入探讨技术原理与社会影响,甚至包含向量数据库、投融资动态及竞品分析等深度内容。作为一个社区驱动的开源项目,awesome-chatgpt 持续更新,确保用户能紧跟 AI 技术发展的最新步伐,是探索 ChatGPT 生态不可或缺的指南针。
使用场景
某初创公司的 AI 产品经理正急需为团队搭建一套基于 ChatGPT 的客服系统,同时需要快速掌握提示词工程(Prompt Engineering)的核心技巧以优化回答质量。
没有 awesome-chatgpt 时
- 资源分散难寻:需要在谷歌、GitHub 和各类论坛中盲目搜索,难以区分高质量的开源项目与过时教程,耗费大量时间筛选。
- 技术原理模糊:面对 Stephen Wolfram 等深度技术文章或复杂的 LLM 论文,缺乏系统的导读入口,导致团队对模型底层逻辑理解浅尝辄止。
- 提示词靠猜:缺乏权威的提示词最佳实践库,只能凭经验反复试错,生成的客服回复经常不够精准或风格不统一。
- 工具选型困难:不知道有哪些成熟的 Chrome 插件、API 封装工具或本地部署方案,容易重复造轮子或选到不稳定的第三方应用。
使用 awesome-chatgpt 后
- 一站式资源聚合:直接通过分类目录找到经过社区验证的 GitHub 项目、Chrome 扩展及 Web 应用,瞬间锁定适合客服场景的开源底座。
- 深度学习路径清晰:利用"Meta Resources"和"Literature Analysis"板块,快速获取从基础原理到最新论文的精读指南,团队迅速建立起对模型能力的边界认知。
- 提示词效率倍增:参考"Prompts"章节中的最佳实践与案例,直接复用成熟的提示词模板,将客服回答的准确率和自然度提升了 40%。
- 生态全景掌握:通过"Developer Tools"和"Vector Database"等板块,快速对接向量数据库与开发工具链,将原本预计两周的系统搭建周期缩短至三天。
awesome-chatgpt 将碎片化的 ChatGPT 生态整合为结构化知识地图,让开发者从“大海捞针”转变为“按图索骥”,极大加速了 AI 应用的落地进程。
运行环境要求
未说明
未说明

快速开始
令人惊叹的ChatGPT
目录
元资源
通用
- 令人惊叹的 ChatGPT - OpenAI 提供的关于 ChatGPT 和 GPT-3 的精选资源列表。
- 令人惊叹的 ChatGPT API - 精选的应用和工具列表,不仅使用新的 ChatGPT API,还允许用户配置自己的 API 密钥,从而实现免费且按需使用自己的配额。
- Aihub - 发现并探索全球高质量、用户友好的 AI 产品。
- 使用 AI 查找 AI 工具 - 每日更新的 AI 工具。
- 在自定义数据集上微调 ChatGPT(如
sql、csv、excel等)
ChatGPT 的原理
- ChatGPT 在做什么?为什么它能起作用? - WolframAlpha 之父 Stephen Wolfram 撰写的关于 ChatGPT 原理的长文。
- 深度学习论文精读 - Mu Li 整理的深度学习论文精读资源合集。
- OpenAI 研究索引 - 此页面列出了 OpenAI 在人工智能各个领域的研究论文。
- HellaSwag (rowanzellers.com) 机器真的能完成你的句子吗? AI 是否具备人类常识?数据集下载地址及各大型模型的得分。
提示词
- 使用 OpenAI API 进行提示工程的最佳实践:OpenAI 官方工作人员教你如何向 GPT 提供清晰有效的指令。
- 令人惊叹的 ChatGPT 提示词 - 这是一个用于 ChatGPT 模型的提示词示例集合。
- ChatGPT 中文调教指南 - 这是一个中文提示词示例集合。
- ChatGPT 快捷方式 - 按领域和功能划分的 ChatGPT 快捷方式参考表,用户可以通过标签筛选、关键词搜索,并一键复制以使用提示词。即使是初学者,只需简单复制提示语句,稍作修改后发送给 ChatGPT,即可获得所需输出。
- 提示工程指南 - 提示工程相关的指南、论文、讲座和资源。
- 提示词市场 - PromptBase 是一个买卖优质提示词的市场。
- 提示词编写模式:如何将思维框架赋予机器(中文) - 介绍一系列提示词编写模式,以便更好地将提示词应用于 AI 编程。
- ChatGPT 500 个提示词 - 对写作者有帮助的 500 个提示词。
OpenAI 官方资源
版本
- ChatGPT - 官网。这是 OpenAI 提供的官方在线聊天工具,可与 ChatGPT 进行 AI 对话。
- ChatGPT 插件:ChatGPT 插件使 ChatGPT 能够访问最新信息、执行计算或使用第三方服务。
- OpenAI API - OpenAI API,一个允许任何人访问 OpenAI 开发的新 AI 模型的平台。
- VisualChatGPT - 这是在 ChatGPT 基础上添加视觉功能的版本。Visual ChatGPT 是由微软开发的一个项目,可在对话中交换图像。它是 ChatGPT 与一系列视觉模型的结合。
OpenAI产品及其他
- OpenAI - OpenAI的官方网站。
- OpenAI产品页面 - 该页面展示了OpenAI提供的各类产品,如GPT模型、DALL·E 2和Whisper等。
- OpenAI API文档 - OpenAI API的官方文档。这是学习和使用OpenAI API的重要资源。
- ChatGPT博客 - OpenAI官方博客上的一篇文章,介绍了ChatGPT。
- New Bing - New Bing是由微软开发的新一代搜索引擎,基于OpenAI的大语言模型,能够提供智能聊天、创作和助理功能。
- Microsoft 365 Copilot:它将大语言模型(包括GPT-4)与Microsoft Graph中的数据以及Microsoft 365应用相结合。
社交媒体
渠道资源
GitHub项目
- mariocandela/beelzebub - 基于Go语言的低代码蜜罐框架,具有增强的安全性,利用OpenAI GPT进行系统虚拟化。
- lencx/ChatGPT - ChatGPT桌面应用程序。
- manno/chatgpt-linux-assistant - 一个在命令行界面中运行的AI助手。
- arc53/DocsGPT - DocsGPT是一款前沿的开源解决方案,可简化在项目文档中查找信息的过程。
- GanymedeNil/document.ai - 基于向量数据库和GPT-3.5的通用本地知识库解决方案。
- yihong0618/bilingual_book_maker - 使用OpenAI API翻译EPUB电子书。
- ChatPaper - ChatPaper是一款论文摘要工具。AI可在一分钟内总结论文,用户也可在一分钟内阅读AI总结的论文。
- bob-plugin-openai-translator - Bob的翻译插件,调用API实现翻译功能。
- xiaowuc2/chatgpt-python-applicatins - 利用Python结合第三方扩展和与其他工具集成,开发的ChatGPT相关应用。
- Autosubtitle - 使用GPT自动生成并翻译字幕。
- AnotiaWang/open-assistant-helper - 使用ChatGPT解决Open Assistant任务。
- chatgpt.js 🤖 - 一款功能强大的客户端JavaScript库,用于与ChatGPT交互。
- ChatGPT Widescreen 🖥️ - 为ChatGPT添加宽屏和全屏模式,提升观看体验。
- ChatGPT Infinity ∞ - 从无所不知的ChatGPT生成无尽的回答(支持任何语言!)。
- ChatGPT Auto-Continue ⏩ - 当回复被截断时,自动点击“继续生成”。
- Autoclear ChatGPT History 🕶️ - 为ChatGPT添加自动清除聊天记录功能,以增强隐私保护。
- ChatGPT Auto Refresh ↻ - 通过后台请求保持ChatGPT会话的最新状态,避免网络错误和Cloudflare检测问题。
Chrome扩展程序
- 42share 由中国开发者制作,用于与他人分享ChatGPT的聊天记录。
- sharegpt-google - 可以将ChatGPT的聊天记录分享给他人,并生成链接、图片和PDF等多种格式。
- chatgpt-writer-google - 使用ChatGPT生成完整的邮件和消息。该扩展支持所有网站,并且对Gmail的支持更好。
- chatgpt-prompt-genius-google - 发现、分享、导入并使用最适合ChatGPT的提示词。
- ChatGPT for Google - 可以让搜索引擎页面直接显示ChatGPT的回答。
- AIPRM for ChatGPT - AIPRM 是一款拥有多种提示模板和可定制提示模板的工具。在Google Chrome中直接搜索ChatGPT时,它是排名第二的工具。
- immersive-translator - 使用OpenAI API的翻译插件。
- https://www.fluentify.io/ Fluentify是一款免费开源的“网页Copilot”。与ChatGPT不同,无需聊天或切换页面,也不需要复制粘贴。只需选中文本,其余操作都会自动完成。
- ChatGPT Widescreen 🖥️ - 为ChatGPT添加宽屏和全屏模式,以提升观看体验。
- ChatGPT Infinity ∞ - 从无所不知的ChatGPT生成无尽的回答(支持任何语言!)。
Greasemonkey用户脚本
- ChatGPT Widescreen 🖥️ - 为ChatGPT添加宽屏和全屏模式,以提升观看体验。
- ChatGPT Infinity ∞ - 从无所不知的ChatGPT生成无尽的回答(支持任何语言!)。
- ChatGPT Auto-Continue ⏩ - 当回复被截断时,自动点击“继续生成”。
- Autoclear ChatGPT History 🕶️ - 为ChatGPT添加自动清除聊天记录功能,以增强隐私。
- ChatGPT Auto Refresh ↻ - 通过后台请求保持ChatGPT会话的最新状态,避免网络错误和Cloudflare检测问题。
应用程序
- Raycast AI - 一款允许您通过自然语言命令控制计算机的工具。
- MindMac - 一款直观的 macOS 应用程序,借助 ChatGPT API 助力高效工作,可轻松管理聊天记录和文件夹,并监控使用成本。内置提示模板,支持 GPT-3.5 和 GPT-4。目前提供 15 种语言版本。
- Bolt AI - 在任何 Mac 应用中即时访问 ChatGPT。BoltAI 是一款原生 macOS 的 ChatGPT 客户端,旨在帮助创业者、开发者、营销人员、学生及其他用户将 AI 辅助融入日常工作。
书签小工具
- ChatGPT Export - 一个浏览器书签小工具,用于将与 ChatGPT 的对话导出为 Markdown 文件。
网页应用
- Poe - Quora 推出了类似 ChatGPT 的 AI 聊天机器人工具。该产品目前包含四种不同的机器人:Sage、Claude、ChatGPT 和 Dragonfly,它们在功能上与 Character AI 的产品有些相似。这些机器人分别基于 OpenAI、Anthropic 的 Claude 以及其他 AI 模型的能力,是一款整合了多种 AI 模型的产品。
- OpenGPT - 几秒钟创建 ChatGPT 应用 - 访问广泛的 ChatGPT 应用,或在几秒钟内创建属于您自己的应用。
- Mindshow.fun - 结合 ChatGPT,您可以在一分钟内生成 PPT。支持从 Markdown 和 Logseq 导入内容。
- Chatpdf - 智能革命已经到来,而 ChatGPT 只是开始!
- YouChat - YouChat 是由 AI 专家 Richard Socher 创立的 You.com 公司推出的一款聊天机器人。与 ChatGPT 不同的是,YouChat 的回复会附带引用来源,帮助用户追踪每条信息的出处。
- Perplexity AI - Perplexity.AI 将大规模语言模型与搜索引擎相结合,通过持续对话满足用户需求。相比 ChatGPT,Perplexity AI 能够提供信息来源,但其回答的流畅性和完整性略逊于 ChatGPT。
- Chat Simplifier - 聊天简化器,可提取对话中的关键要点。
- PandaGPT - 帮助阅读 PDF 文件并自动回答问题。
- ChatMind 输入问题文章/数据,一键生成思维导图,支持上下文改写和扩展对话。
- ClipRecaps ClipRecaps:ChatGPT 遇见 YouTube。总结长视频的终极工具。
- Poet.ly - Poet.ly 是一款简单快速的文章生成器,专为您的博客生成对搜索引擎友好的内容。它基于 OpenAI GPT-4 API。
- VoiceSphere 使用 VoiceSphere 的 AI 驱动聊天技术,彻底改变您与文档和视频的交互方式。您可以直接从各种文档格式(包括 PDF、DOC、PPT 和视频)中获取快速、智能的响应。VoiceSphere 非常适合各行各业的专业人士,它能够提升信息检索效率,通过更智能、更具上下文感知的文档管理来提高生产力。
开发者工具
- chatgpt.js 🤖 - 一个功能强大的客户端 JavaScript 库,用于 ChatGPT。
- Horizon AI Template - 最流行的开源 ChatGPT AI 模板及 React 和 NextJS 的入门套件。
课程
英文视频
- 终极 Chat GPT 课程 - 本指南课程包含超过 1000+ 条资源,帮助您学习如何利用 Chat GPT 改善生活。(免费!)
- 高级 ChatGPT:完整指南: - 他的指南包括初级和高级 ChatGPT 教程,以及一些实用技巧和示例。(免费!)
- ChatGPT 教程 - 针对初学者的 Chat GPT 快速入门课程: - 本视频解释了 ChatGPT 的基本概念和使用方法。您将学习如何使用 ChatGPT 生成各种类型的文本,例如购物清单、JavaScript 代码、短篇小说、简历等。(免费!)
- 完整的 ChatGPT 教程 - [30 分钟成为高级用户] - 您可以学习 10 大类命令,让 ChatGPT 为您提供各种有用的信息和服务。(免费!)
- 面向开发者的 ChatGPT 教程 - 38 种方法让您的生产力提升 10 倍: - 提供 38 个 ChatGPT 示例,帮助您学习如何使用 Python、JavaScript、HTML、CSS、React、SQL 等技术。(免费!)
- ChatGPT 大师班:针对初学者的完整 ChatGPT 指南 - 您将学习如何使用 ChatGPT 和 OpenAI 创建各种类型的内容,以及如何利用 OpenAI API 构建应用程序和编写代码。
- ChatGPT 101:学习 ChatGPT 提示词与智能技巧 - 您将学习如何利用 ChatGPT 的提示词和命令来自动化任务、产生创意并优化工作流程。同时,还将了解 AI 对社会及未来工作的影响。
- ChatGPT:2023 年职场版完整 ChatGPT 课程(伦理导向) - 您将学习如何使用 ChatGPT 生成内容、自动化流程、有效沟通,以及在不同主题上进行自我教育。
- ChatGPT 大师班:智能技巧、ChatGPT 派见解与未来展望 - 您将学习如何提升 ChatGPT 提示词技能。此外,本课程还将介绍 ChatGPT 的背景、发展历程、伦理考量、应用场景及未来走向。
- ChatGPT 大师班:用 ChatGPT 构建解决方案和应用 - 本课程教授您如何使用无代码方式,结合 OpenAI 和 ChatGPT 构建应用程序和解决方案。
- 面向程序员的 ChatGPT:几秒钟构建 Python 应用程序 - 本课程教您如何利用 ChatGPT 构建应用程序、修复错误并自动化 Python 或其他编程语言的工作流程。
- 更多课程:Udemy → ChatGPT
中文视频
- ChatGPT 保姆级使用教程:注册、体验、底层逻辑原理解读! ChatGPT介绍,偏向底层技术,偏向底层原理。
- 【渐构】万字科普 ChatGPT-4 为什么会颠覆人类社会:在视频的前25分钟里,以通俗易懂的方式解释了GPT的工作原理。
英文图文资料
- The-Ultimate-ChatGPT-Guide
- GPT是如何获得其能力的?追溯语言模型的涌现能力来源 - 有中译版
- 如何在Python中使用ChatGPT API
- 完整的ChatGPT提示词+资源
中文图文资料
- ChatGPT 终极指南 - 中译版
- 理解大语言模型——10篇论文的简明清单
- 拆解追溯 GPT-3.5 各项能力的起源 - 中译版
- 如何用 ChatGPT 构建你的专属知识问答机器人
- ChatGPT 商务速成 - 中译版
- 如何使用 Python 快速集成 ChatGPT API
- 追赶 ChatGPT 的难点与平替
向量数据库
风险投资机构
OpenAI的投资方
- Pre Seed轮:Y Combinator
- Seed轮:Reid Hoffman基金会
- Seed轮:Khosla Ventures
- 公司轮融资:微软
- 第二市场:Tiger Global Management
- 第二市场:Andreessen Horowitz
- 第二市场:Sequoia Capital
- 第二市场:Bedrock Capital
- 第二市场:Matthew Brown Companies
- 公司轮融资:微软
OpenAI的投资项目
- edgedb - EdgeDB是一个开源数据库,旨在成为SQL和关系范式的“精神继承者”。它致力于解决一些使现有数据库使用起来过于繁琐的设计难题。
- Descript - Descript是一款协作式音频和视频编辑器,能够将音频转录为文本文档以便编辑。
- Ambience Healthcare - Ambience AutoScribe是一款全自动的AI医疗记录员,可实时捕捉医患对话中的细微之处,并将其整合到电子病历工作流中。
- Harvey - Harvey正在利用强大的生成式语言模型开发适用于所有法律工作流程的直观界面。
- Mem - Mem正在构建全球首个自组织工作空间。
- Speak - Speak致力于帮助更多人掌握新语言,首先从英语开始。
受到OpenAI支持的企业
- Virtuzone - 阿联酋领先的企业成立专家及屡获殊荣的公司服务提供商,推出了SWYFT计划,这是一款由OpenAI的ChatGPT驱动的自动化商业计划书生成工具,用户可在不到10分钟内生成一份完整的商业计划书。
- https://openai.com/product/gpt-4 我们已与多家利用GPT-4打造创新产品的机构展开合作。
OpenAI的产品
- 文本
- ChatGPT - 一种能够进行对话式交互的模型。其对话形式使其可以回答后续问题、承认错误、质疑不正确的前提,并拒绝不当请求。
- GPT - GPT模型能够执行自然语言处理任务,如文本生成、摘要和分析。
- 嵌入模型 - 新的text-embedding-ada-002模型取代了用于文本搜索、文本相似度和代码搜索的五个独立模型,在大多数任务上表现优于我们之前最强大的Davinci模型,但价格却低了99.8%。
- 图像
- DALL·E - DALL·E是一种可以根据自然语言描述生成逼真图像和艺术作品的AI系统。
- CLIP - CLIP只需提供要识别的视觉类别名称,即可应用于任何视觉分类基准,类似于GPT-2和GPT-3的“零样本”能力。
- Point-E - 一种可根据复杂提示生成3D点云的系统。
- 音频
- Whisper - Whisper是一款多功能语音识别模型,能够转录、识别并翻译多种语言。
- Jukebox - 一种神经网络,能够以原始音频形式生成各种流派和艺术家风格的音乐。
- MuseNet - 一种深度神经网络,可以生成包含10种不同乐器的4分钟长音乐作品。
竞争对手:AI聊天机器人
- OpenChatKit - 一个类似于ChatGPT的工具包,基于EleutherAI的GPT-NeoX-20B,包含一个经过4300万条提示微调的200亿参数大型模型。
- Jasper Chat - Jasper AI生态系统中的一项功能,与ChatGPT不同的是,它是一项付费服务。
- Character ai - 与ChatGPT不同,它将聊天机器人划分为多个子领域。通过一个平台让人们参与创建过程,而不是仅仅依赖自我创作和模型训练。
- Bard - Bard是谷歌推出的新一代AI聊天机器人服务,使用LaMDA语言模型,能够生成自然且信息丰富的回答。Bard可以帮助用户完成创意任务、解释复杂主题以及学习新知识。Bard是谷歌对ChatGPT——微软热门AI聊天机器人的回应。
- YouChat - YouChat是由You.com推出的聊天机器人,由语言和人工智能专家Richard Socher创立,基于GPT-3的文本生成器,可用于撰写邮件和其他文档。与ChatGPT相比,YouChat的回答会附带引用来源,这有助于用户追踪每条消息的出处。
- Perplexity AI - 这款AI的核心是将大规模语言模型与搜索引擎结合,以问答形式为用户提供所需答案,并以连续对话的方式呈现。相较于ChatGPT,Perplexity AI能够提供信息来源,但其回答的流畅性和完整性稍逊于ChatGPT。
- MOSS - 能够执行对话生成、编程、事实问答等一系列任务。
- ChatGLM 这是一个具备基础问答和对话能力的数十亿参数中英双语语言模型,专为中文场景优化。
- 澜舟认知智能平台 基于孟子预训练技术,可解锁文本图像生成、文学辅助创作、营销文案撰写、论文辅助写作等全方位的AIGC能力。
竞争对手:大语言模型
- LaMDA:对话应用语言模型是由谷歌开发的一系列对话型大型语言模型。LaMDA采用仅解码器的Transformer语言模型。
- LLaMA:由Meta AI开发,是一款具有650亿参数的基础性大型语言模型。LLaMA(Large Language Model Meta AI)是一种最先进的基础性大型语言模型,旨在帮助研究人员推进该领域的AI研究。
- Gopher - 由DeepMind开发,名为Gopher的2800亿参数Transformer语言模型,是一种基于自回归Transformer的密集型LLM。
- GLM - GLM是由清华大学开发的通用语言模型。GLM-130B是GLM的一个开放的中英双语版本,拥有1300亿参数,专为配备单台A100或V100服务器的用户设计。
- GPT-NeoXT-Chat-Base-20B - 一个开源的语言模型,能够进行对话并生成图像。由EleutherAI创建。
- BLOOM - 由BigScience开发,BLOOM是一个自回归大型语言模型(LLM),利用工业级计算资源在海量文本数据上进行训练,能够根据提示继续生成文本。因此,它可以以46种语言和13种编程语言输出与人类撰写的文本几乎无差别的连贯内容。此外,BLOOM还可以通过将其转化为文本生成任务来执行未明确训练过的文本任务。
- OPT - 由Meta开发,OPT模型是在Meta AI发布的“开放预训练Transformer语言模型”中提出的。OPT是一系列开源的大规模因果语言模型,性能与GPT3相当。
研究报告
文献分析
术语表
- 大型语言模型
- 指令微调
- 上下文学习
- 零样本学习
- 少样本学习
- 提示工程
- 思维链(COT)
- 强化学习
- 人类反馈强化学习(RLHF)
ChatGPT的技术原理
- 2014年《通过联合学习对齐与翻译实现神经机器翻译》(arXiv:1409.0473)——该论文在RNN中引入了注意力机制,以提升RNN对长序列的建模能力。这使得RNN能够更准确地翻译较长的句子。
- 2017年《注意力就是你所需要的》(arXiv:1706.03762)——该论文提出了原始Transformer的结构,是整个Transformer家族的基础。
- 2018年《BERT:用于语言理解的深度双向Transformer预训练》(arXiv:1810.04805)——这篇论文开启了自然语言处理领域的预训练时代。BERT横空出世。
- 2018年《通过生成式预训练提升语言理解能力》(OpenAI官网)——该论文介绍了另一种流行的预训练模型,也就是后来被称为GPT-1的模型。
- 2019年《语言模型是无监督的多任务学习者》(Semantic Scholar)——该论文介绍了GPT-2。
- 2020年《语言模型是少样本学习者》(arXiv:2005.14165)——该论文介绍了GPT-3。
- 2022年《利用人类反馈训练语言模型遵循指令》(arXiv:2203.02155)——该论文提出了一种基于强化学习的人类反馈微调方法,也被认为是揭示ChatGPT核心思路的重要文献。可以推测,ChatGPT是InstructGPT的扩展版本,能够在更大的数据集上进行微调。
- 2023年《GPT-4技术报告》(arXiv:2303.08774)——我们报告了GPT-4的开发情况,这是一种大规模多模态模型,可接受图像和文本输入,并生成文本输出。
- awesome-chatgpt-papers 阿里云盘链接,提取码:5y6m
提示工程的最新进展
- 2021年《针对常识推理的生成知识提示》(arXiv:2110.08387)
- 2021年《多任务提示训练实现零样本任务泛化》(arXiv:2110.08207)
- 2021年《预训练、提示与预测:自然语言处理中提示方法的系统综述》(arXiv:2107.13586)
- 2021年《大型语言模型的提示编程:超越少样本范式》(arXiv:2102.07350)
- 2022年《思维链提示激发大型语言模型的推理能力》(arXiv:2201.11903)
- 2022年《自洽性提升语言模型的思维链推理能力》(arXiv:2203.11171)
大型语言模型的最新进展
- 2023年《视觉ChatGPT:与视觉基础模型对话、绘图和编辑》(arXiv:2303.04671)
社会影响
- 2023年《GPT就是GPT:大型语言模型对劳动力市场影响潜力的早期观察》(arXiv:2303.10130)——我们的研究发现,美国约80%的劳动力至少有10%的工作任务会受到GPT的影响,而大约19%的工作者则可能面临超过50%的任务被改变。这种影响遍及所有薪资水平,高收入岗位受到的冲击可能更大。
贡献
欢迎贡献!请先阅读贡献指南,然后在Fork本仓库后提交Pull Request。
贡献者
感谢所有贡献者(不分先后顺序,按字母排序):
联系方式
请使用GitHub上的Issues与我们联系。
致谢
感谢Yang Zhiping先生和OpenMindClub对本项目的大力支持。
许可证
常见问题
相似工具推荐
everything-claude-code
everything-claude-code 是一套专为 AI 编程助手(如 Claude Code、Codex、Cursor 等)打造的高性能优化系统。它不仅仅是一组配置文件,而是一个经过长期实战打磨的完整框架,旨在解决 AI 代理在实际开发中面临的效率低下、记忆丢失、安全隐患及缺乏持续学习能力等核心痛点。 通过引入技能模块化、直觉增强、记忆持久化机制以及内置的安全扫描功能,everything-claude-code 能显著提升 AI 在复杂任务中的表现,帮助开发者构建更稳定、更智能的生产级 AI 代理。其独特的“研究优先”开发理念和针对 Token 消耗的优化策略,使得模型响应更快、成本更低,同时有效防御潜在的攻击向量。 这套工具特别适合软件开发者、AI 研究人员以及希望深度定制 AI 工作流的技术团队使用。无论您是在构建大型代码库,还是需要 AI 协助进行安全审计与自动化测试,everything-claude-code 都能提供强大的底层支持。作为一个曾荣获 Anthropic 黑客大奖的开源项目,它融合了多语言支持与丰富的实战钩子(hooks),让 AI 真正成长为懂上
gemini-cli
gemini-cli 是一款由谷歌推出的开源 AI 命令行工具,它将强大的 Gemini 大模型能力直接集成到用户的终端环境中。对于习惯在命令行工作的开发者而言,它提供了一条从输入提示词到获取模型响应的最短路径,无需切换窗口即可享受智能辅助。 这款工具主要解决了开发过程中频繁上下文切换的痛点,让用户能在熟悉的终端界面内直接完成代码理解、生成、调试以及自动化运维任务。无论是查询大型代码库、根据草图生成应用,还是执行复杂的 Git 操作,gemini-cli 都能通过自然语言指令高效处理。 它特别适合广大软件工程师、DevOps 人员及技术研究人员使用。其核心亮点包括支持高达 100 万 token 的超长上下文窗口,具备出色的逻辑推理能力;内置 Google 搜索、文件操作及 Shell 命令执行等实用工具;更独特的是,它支持 MCP(模型上下文协议),允许用户灵活扩展自定义集成,连接如图像生成等外部能力。此外,个人谷歌账号即可享受免费的额度支持,且项目基于 Apache 2.0 协议完全开源,是提升终端工作效率的理想助手。
markitdown
MarkItDown 是一款由微软 AutoGen 团队打造的轻量级 Python 工具,专为将各类文件高效转换为 Markdown 格式而设计。它支持 PDF、Word、Excel、PPT、图片(含 OCR)、音频(含语音转录)、HTML 乃至 YouTube 链接等多种格式的解析,能够精准提取文档中的标题、列表、表格和链接等关键结构信息。 在人工智能应用日益普及的今天,大语言模型(LLM)虽擅长处理文本,却难以直接读取复杂的二进制办公文档。MarkItDown 恰好解决了这一痛点,它将非结构化或半结构化的文件转化为模型“原生理解”且 Token 效率极高的 Markdown 格式,成为连接本地文件与 AI 分析 pipeline 的理想桥梁。此外,它还提供了 MCP(模型上下文协议)服务器,可无缝集成到 Claude Desktop 等 LLM 应用中。 这款工具特别适合开发者、数据科学家及 AI 研究人员使用,尤其是那些需要构建文档检索增强生成(RAG)系统、进行批量文本分析或希望让 AI 助手直接“阅读”本地文件的用户。虽然生成的内容也具备一定可读性,但其核心优势在于为机器
LLMs-from-scratch
LLMs-from-scratch 是一个基于 PyTorch 的开源教育项目,旨在引导用户从零开始一步步构建一个类似 ChatGPT 的大型语言模型(LLM)。它不仅是同名技术著作的官方代码库,更提供了一套完整的实践方案,涵盖模型开发、预训练及微调的全过程。 该项目主要解决了大模型领域“黑盒化”的学习痛点。许多开发者虽能调用现成模型,却难以深入理解其内部架构与训练机制。通过亲手编写每一行核心代码,用户能够透彻掌握 Transformer 架构、注意力机制等关键原理,从而真正理解大模型是如何“思考”的。此外,项目还包含了加载大型预训练权重进行微调的代码,帮助用户将理论知识延伸至实际应用。 LLMs-from-scratch 特别适合希望深入底层原理的 AI 开发者、研究人员以及计算机专业的学生。对于不满足于仅使用 API,而是渴望探究模型构建细节的技术人员而言,这是极佳的学习资源。其独特的技术亮点在于“循序渐进”的教学设计:将复杂的系统工程拆解为清晰的步骤,配合详细的图表与示例,让构建一个虽小但功能完备的大模型变得触手可及。无论你是想夯实理论基础,还是为未来研发更大规模的模型做准备
NextChat
NextChat 是一款轻量且极速的 AI 助手,旨在为用户提供流畅、跨平台的大模型交互体验。它完美解决了用户在多设备间切换时难以保持对话连续性,以及面对众多 AI 模型不知如何统一管理的痛点。无论是日常办公、学习辅助还是创意激发,NextChat 都能让用户随时随地通过网页、iOS、Android、Windows、MacOS 或 Linux 端无缝接入智能服务。 这款工具非常适合普通用户、学生、职场人士以及需要私有化部署的企业团队使用。对于开发者而言,它也提供了便捷的自托管方案,支持一键部署到 Vercel 或 Zeabur 等平台。 NextChat 的核心亮点在于其广泛的模型兼容性,原生支持 Claude、DeepSeek、GPT-4 及 Gemini Pro 等主流大模型,让用户在一个界面即可自由切换不同 AI 能力。此外,它还率先支持 MCP(Model Context Protocol)协议,增强了上下文处理能力。针对企业用户,NextChat 提供专业版解决方案,具备品牌定制、细粒度权限控制、内部知识库整合及安全审计等功能,满足公司对数据隐私和个性化管理的高标准要求。
ML-For-Beginners
ML-For-Beginners 是由微软推出的一套系统化机器学习入门课程,旨在帮助零基础用户轻松掌握经典机器学习知识。这套课程将学习路径规划为 12 周,包含 26 节精炼课程和 52 道配套测验,内容涵盖从基础概念到实际应用的完整流程,有效解决了初学者面对庞大知识体系时无从下手、缺乏结构化指导的痛点。 无论是希望转型的开发者、需要补充算法背景的研究人员,还是对人工智能充满好奇的普通爱好者,都能从中受益。课程不仅提供了清晰的理论讲解,还强调动手实践,让用户在循序渐进中建立扎实的技能基础。其独特的亮点在于强大的多语言支持,通过自动化机制提供了包括简体中文在内的 50 多种语言版本,极大地降低了全球不同背景用户的学习门槛。此外,项目采用开源协作模式,社区活跃且内容持续更新,确保学习者能获取前沿且准确的技术资讯。如果你正寻找一条清晰、友好且专业的机器学习入门之路,ML-For-Beginners 将是理想的起点。