vibe-coding

4.2k 1.6k 简单 1 次阅读今天语言模型Agent插件

AI 解读由 AI 自动生成，仅供参考

vibe-coding 是一套基于大语言模型的高效开发方法论指南，旨在帮助开发者利用 OpenAI GPT-5.4 等先进模型，通过自然语言交互快速构建游戏或应用程序。它并非传统意义上的软件工具，而是一份详尽的操作手册，指导用户如何结合 Codex CLI 或 VSCode 插件，将创意转化为可运行的代码项目。

该方案核心解决了 AI 辅助编程中常见的“代码失控”难题。许多用户在让 AI 自主规划时，往往得到杂乱无章、难以维护的代码库。vibe-coding 强调“规划至上”，强制要求人类主导设计文档（GDD）和技术栈选型，并通过配置严格的规则文件（如 AGENTS.md），确保 AI 在模块化架构下工作，避免生成单体巨型文件，从而保持代码库的整洁与可扩展性。

这套方法特别适合希望提升开发效率的独立开发者、游戏制作人以及想要尝试"AI 结对编程”的技术爱好者。即使是不具备深厚编码背景的设计师，只要掌握基本的文档编写能力，也能借助此流程将创意落地。其独特亮点在于建立了一套标准化的“记忆银行”机制，强制 AI 在每次生成代码前读取架构文档和设计规范，并在功能完成后自动更新记录，实现了上下文的一致性与项目的长期可维护性，让 AI 真正成为可控的开发伙伴。

使用场景

独立开发者小明想在周末快速构建一款多人在线 3D 塔防游戏，但面临技术栈选型复杂和代码维护困难的挑战。

没有 vibe-coding 时

规划缺失导致返工：直接让 AI 写代码，缺乏统一的游戏设计文档（GDD），导致生成的逻辑与预期不符，反复修改耗时耗力。
代码结构混乱：AI 倾向于生成单个巨型文件（Monolith），随着功能增加，代码耦合严重，难以调试和扩展。
上下文丢失：在多轮对话中，AI 经常忘记之前的架构约定或数据库设计，导致新代码与旧逻辑冲突。
测试验证困难：缺乏分步实施计划，每次提交大量代码后无法精准定位错误，排查 bug 如同大海捞针。

使用 vibe-coding 后

文档驱动开发：先利用 GPT-5.4 生成标准的 game-design-document.md 和 tech-stack.md，确保 AI 完全理解游戏愿景与技术边界。
强制模块化架构：通过 Codex CLI 的 /init 命令加载自定义规则，强制 AI 将代码拆分为多个模块，从源头杜绝“单文件地狱”。
记忆银行机制：设置"Always"规则，要求 AI 在每次编码前必读 @architecture.md 和 @game-design-document.md，确保持续的上下文一致性。
步进式精准落地：依据生成的详细实施计划，每一步都包含具体的测试验证指令，实现小步快跑、即时反馈的开发节奏。

vibe-coding 通过将“规划先行”和“规则约束”植入工作流，让开发者从繁琐的代码纠错中解放，专注于核心创意的高效落地。

运行环境要求

操作系统

未说明

GPU

未说明

内存

未说明

依赖

notes该工具并非本地运行的 AI 模型，而是基于 OpenAI GPT-5.4 (high) 云端 API 的开发工作流指南。核心依赖是安装 Node.js 以通过 npm 全局安装 Codex CLI (`npm i -g @openai/codex`)，或直接使用 Codex App/VSCode 扩展。用户需要订阅 OpenAI Plus (~$20/月) 才能访问所需的高阶模型。开发环境推荐使用 Visual Studio Code。

python未说明

Node.js (用于 npm)

@openai/codex

快速开始

振动编码终极指南 V1.2.2

作者: 尼古拉斯·祖洛，https://x.com/NicolasZu
创建日期: 2025年3月12日
最后更新日期: 2026年3月5日

入门

要开始振动编码，你只需要：

OpenAI GPT-5.4（高），通过 Codex CLI 或 Codex 应用程序使用（选择 Plus 订阅，每月约 20 美元）

本指南适用于 CLI 版本（在终端中使用）、VSCode 扩展版本或 Codex 应用程序。目前，Codex 应用程序正受到越来越多的关注。

*（注：虽然本指南的早期版本曾使用 Grok 3，但我们随后过渡到了 Gemini 2.5 Pro。而现在我们使用的是 OpenAI GPT-5.4（高））*

（注 2：如果你想使用 Cursor，请查看本指南的版本 1.1，不过我们认为它不如 Codex CLI 功能强大）

正确设置一切是关键。如果你认真想要创建一个功能齐全且视觉上吸引人的游戏（或应用），请花时间打下坚实的基础。

核心原则： 规划就是一切。 别让 AI 自主规划，否则你的代码库会变得难以管理。

设置一切

0. 初步设置

下载 Visual Studio Code (https://code.visualstudio.com/)
在你的电脑上创建一个新的文件夹
右键点击，选择“用 Code 打开”
打开终端
- 安装 Codex CLI：npm i -g @openai/codex （或者下载 Codex 应用程序）

1. 游戏设计文档（或应用程序的需求文档）

将你的游戏创意交给 OpenAI GPT-5.4（高），让它以 Markdown 格式生成一份简单的 游戏设计文档：game-design-document.md。
审查并完善这份文档，确保它符合你的愿景。即使内容很简单也没关系——目的是给 AI 提供关于游戏结构和意图的背景信息。不要过度工程化，因为我们之后还会迭代。
如果你愿意，也可以让 AI 向你提问，并根据这些问题来编写 GDD 或 PRD。

2. 技术栈与 `AGENTS.md`

请 OpenAI GPT-5.4（高） 为你推荐最适合你游戏的技术栈（例如，对于多人 3D 游戏可以使用 Vite + ThreeJS 和 WebSocket）。将这些建议保存为 tech-stack.md。
- 挑战它提出 最简单但最健壮的技术栈。
在终端中打开 Codex，使用 /init 命令。它会使用你之前创建的两个 .md 文件。这将创建一组规则，以便正确引导你的 LLM。
至关重要的是，仔细审查生成的规则。 确保它们强调 模块化（多个文件），并避免 单体架构（一个巨大的文件）。你可能需要手动调整或添加规则。同时也要检查这些规则何时会被触发。
- 重要提示： 有些规则对于保持上下文非常重要，应将其设置为 “始终” 规则。这样可以确保 AI 在生成代码之前始终参考这些规则。可以考虑添加如下规则，并将其标记为“始终”：
```
# 重要：
# 在编写任何代码之前，务必阅读 memory-bank/@architecture.md。包含完整的数据库模式。
# 在编写任何代码之前，务必阅读 memory-bank/@game-design-document.md。
# 添加重大功能或完成里程碑后，更新 memory-bank/@architecture.md。
```
- 示例：确保其他非“始终”的规则能够引导 AI 遵循你所选技术栈的最佳实践（如网络通信、状态管理等）。
- 这种整体规则设置是必须的，如果你想打造一款尽可能优化、代码尽可能整洁的游戏的话。

3. 实施计划

将以下内容提供给 OpenAI GPT-5.4（高）：
- 游戏设计文档 (game-design-document.md)
- 技术栈建议 (tech-stack.md)
请它以 Markdown 格式（.md）创建一份详细的 实施计划，这是一份针对你的 AI 开发者的分步指导说明。
- 步骤应该小而具体。
- 每个步骤都必须包含测试，以验证实现是否正确。
- 不涉及代码：只需清晰、具体的指令。
- 重点放在 基础游戏 上，而不是完整功能集（细节稍后再添加）。

4. 内存库

为你的项目创建一个新的文件夹，然后在 VSCode 中打开它。
在项目文件夹内，创建一个名为 memory-bank 的子文件夹。
将以下文件添加到 memory-bank：
- game-design-document.md
- tech-stack.md
- implementation-plan.md
- progress.md（创建这个空文件用于跟踪已完成步骤）
- architecture.md（创建这个空文件用于记录文件用途）

振动编码基础游戏

现在乐趣开始了！

确保一切清晰

在 VSCode 扩展中打开 Codex，或者在项目的终端中启动它。
提示：请阅读 /memory-bank 中的所有文档，确认 implementation-plan.md 是否清晰？你有哪些问题可以让它对你来说完全清晰？
它通常会提出 9–10 个问题。回答这些问题，并提示它相应地编辑 implementation-plan.md，使其更加完善。

你的第一个实施提示

在 VSCode 扩展中打开 Codex，或者在项目的终端中启动它。
提示：请阅读 /memory-bank 中的所有文档，并按照实施计划的第 1 步进行操作。我会运行测试。在我验证测试通过之前，请不要开始第 2 步。一旦我验证通过，就打开 progress.md，记录你所做的工作，以便未来的开发者参考。然后将任何架构方面的见解添加到 architecture.md 中，解释每个文件的作用。
始终先进行一次规划性执行，当你满意后，再让 AI 按照步骤推进。
极致体验： 安装 Superwhisper，用它来与 OpenAI GPT-5.4（高） 轻松对话，而不是打字。

工作流程

完成第 1 步后：
将你的更改提交到 Git（如果不熟悉，可以请 AI 帮助你）。
开始一个新的聊天会话（/new 或 /clear）。为什么？LLM 在上下文窗口还有大量空间时，才能产生最佳效果。
提示：现在请浏览内存库中的所有文件，阅读 progress.md 了解之前的工作，并继续执行第 2 步。在我验证测试通过之前，请不要开始第 3 步。
重复此过程，直到整个 implementation-plan.md 完成。

添加细节

恭喜你，你已经构建了基础游戏！它可能还比较粗糙，缺少一些功能，但现在你可以开始实验和改进了。

想加入雾效、后期处理、特效或音效吗？想要更精美的飞机、汽车或城堡吗？或者一片绚丽的天空？
对于每个主要功能，创建一个新的 feature-implementation.md 文件，其中包含简短的步骤和测试。
逐步实施并测试。

修复错误与卡顿

如果提示失败或导致游戏崩溃：
不断优化你的提示，直到它正常工作。你也可以频繁提交到 Git，并在需要时进行重置。
针对错误：
- 如果是 JavaScript 错误： 打开浏览器控制台（F12），复制错误信息，粘贴到 VSCode 中；对于视觉异常，则提供截图。
- 懒人方案： 安装 BrowserTools，省去手动复制和截图的步骤。
如果程序卡住：
- 回退到最近一次 Git 提交（git reset），然后用新的提示重新尝试。
如果实在无法解决：
- 使用 RepoPrompt 或 uithub 将整个代码库整合到一个文件中，再向 OpenAI GPT-5.4 (high) 寻求帮助。

Codex 使用技巧

在终端中运行 Codex： 在 VSCode 的终端内执行，这样可以查看代码差异并传递更多上下文，而无需离开当前工作环境。
自定义 Codex 命令或技能： 创建类似 /explain $arguments 的辅助命令，触发如下提示：“深入分析这段代码，理解 $arguments 的作用。等你完全理解后告诉我，我会给出接下来的任务。” 这样模型就能在编辑前获取丰富的上下文信息。
清理上下文： 如果仍需保留之前的对话上下文，可使用 /clear 或 /compact 定期清理；建议将 /context 参数保持在 50% 至 60% 之间，以获得最佳效果。
节省时间（自担风险）： 使用 codex --yolo 启动 Codex，使其进入一种不会要求确认的模式。

其他提示

小规模修改： 使用 OpenAI GPT-5.4 (high)。
优秀的营销文案撰写： 使用 OpenAI GPT-5.4 (high)。
生成高质量 2D 精灵图： 使用 ChatGPT 和 Nano Banana Pro。
生成 3D 资源： 使用 Trellis、Tripo 或 Hunyuan。
生成音乐： 使用 Suno、ElevenLabs。
生成音效： 使用 ElevenLabs。
生成视频： 使用 Sora 2、Veo 3。
提升提示效果：
- 可加入以下内容：“请尽情思考，直到得出正确结果为止，我不着急。重要的是你必须严格按照我的要求执行，做到完美无缺。如果我的描述不够清晰，请随时提问。”
- 对于 Codex，明确要求其先进行规划性处理、设定更严格的约束条件，并在执行前进行更深入的推理。

常见问题解答

问：有哪些项目是完全按照这种方法由您一人“vibe 编码”完成的？
答：最近的一些例子包括：

https://fly.zullo.fun/：一款 3D 第二次世界大战空战竞技场游戏。所有资源和代码均采用本指南中的方法完成。
https://vibecraft.game/：一款你可以通过提示让任何东西“凭空出现”的 3D 游戏。代码、用户界面及游戏内资源全部采用 vibe 编码。
https://www.dow-de.com/：一个用于评选《战锤 40K：黎明之怒》最佳玩家的 Web 应用，具备数据统计、录像上传功能，甚至还有高级会员服务。该项目同样完全采用此方法开发。

问：我正在开发应用而非游戏，流程是否相同？
答：大体流程相似！不过，你可以用 PRD（产品需求文档）代替 GDD（游戏设计文档）。此外，还可以借助 v0、Lovable 或 Bolt.new 等优秀工具快速搭建原型，随后将代码迁移到 GitHub，再克隆到 VSCode 或终端中，继续按照本指南进行开发。

问：您那款空战游戏中的飞机太棒了，但我用一个提示却无法复现！
答：实际上并非单个提示，而是约 30 个精心设计的提示，由专门的 plane-implementation.md 文件引导完成。请使用清晰具体的指令，例如“在机翼上为副翼留出空间”，而不是笼统的“造一架飞机”。

问：为什么现在 Codex 比 Cursor 更好？
答：这主要取决于个人偏好。我们强调的是，Codex 更擅长调用 OpenAI GPT-5.4 (high)，而 Cursor 则相对较弱。此外，Codex 直接运行在终端中，能够支持更多开发场景，比如从任意 IDE 工作、通过 SSH 登录远程服务器等。它还提供了强大的自定义选项，如自定义命令、子代理和钩子，这些都能长期提升开发质量和效率。最后，如果你使用的是较低级别的 ChatGPT 方案，也足以开始实践。

问：我不知道如何为我的多人游戏搭建服务器。
答：让你的 AI 来帮你解决吧！

Vibe Coding 快速上手指南

本指南基于 Vibe Coding V1.2.2，旨在帮助开发者利用 OpenAI GPT-5.4 (high) 和 Codex 高效构建游戏或应用。核心理念是：规划至上，切勿让 AI 自主规划，以免代码库混乱。

环境准备

在开始之前，请确保满足以下系统和软件要求：

操作系统：Windows, macOS 或 Linux
核心依赖：
- Node.js：用于安装 Codex CLI（建议最新 LTS 版本）
- Visual Studio Code (VSCode)：推荐编辑器
- Git：用于版本控制（强烈建议安装）
AI 服务订阅：
- 需拥有 OpenAI Plus 订阅（约 $20/月），以访问 GPT-5.4 (high) 模型。
- 使用方式可选：Codex CLI（终端运行）、VSCode 插件 或 Codex App。目前 Codex App 体验最佳。

注意：虽然早期版本支持 Grok 3 或 Gemini 2.5 Pro，但本指南专为 OpenAI GPT-5.4 (high) 优化。若需使用 Cursor，请参考旧版指南，但 Codex CLI 在当前工作流中表现更优。

安装步骤

1. 基础环境搭建

下载并安装 Visual Studio Code。在本地创建一个新项目文件夹，右键选择“通过 Code 打开”，然后在 VSCode 中启动终端。

2. 安装 Codex CLI

在终端中执行以下命令安装 OpenAI Codex 全局工具：

npm i -g @openai/codex

或者，您也可以直接下载并安装 Codex App 图形界面版本。

3. 初始化项目规则

在终端运行 codex 启动助手，并使用 /init 命令。该命令将读取您后续创建的设计文档，自动生成指导 AI 行为的规则文件。

关键配置：生成规则后，务必手动检查并确保包含以下 "Always"（始终执行） 规则，以维持上下文一致性：

# IMPORTANT:
# Always read memory-bank/@architecture.md before writing any code. Include entire database schema.
# Always read memory-bank/@game-design-document.md before writing any code.
# After adding a major feature or completing a milestone, update memory-bank/@architecture.md.

基本使用

第一步：生成设计文档与技术栈

不要直接写代码，先让 AI 帮你规划。

创建设计文档：向 GPT-5.4 (high) 发送提示，要求生成 Markdown 格式的游戏设计文档（GDD）或产品需求文档（PRD）：

"Create a simple Game Design Document in Markdown format named game-design-document.md based on my idea: [在此输入你的想法]."

保存为 game-design-document.md 并简要审查。
确定技术栈：让 AI 推荐最简洁且稳健的技术栈（如 Vite + ThreeJS）：

"Recommend the simplest yet most robust tech stack for this game. Save as tech-stack.md."

保存为 tech-stack.md。

第二步：构建记忆库 (Memory Bank)

在项目根目录下创建 memory-bank 文件夹，并将以下文件放入其中：

game-design-document.md (上一步生成)
tech-stack.md (上一步生成)
implementation-plan.md (见下文生成)
progress.md (新建空文件，用于记录进度)
architecture.md (新建空文件，用于记录架构细节)

生成分步实施计划：将上述两个文档提供给 AI，要求其生成详细的实施计划：

"Based on the GDD and tech stack, create a detailed Implementation Plan in Markdown (implementation-plan.md). Steps must be small, specific, include tests for validation, and contain NO code. Focus on the base game first."

第三步：开始编码 (Vibe Coding)

澄清计划：在 VSCode 终端或插件中打开 Codex，输入：
```
Read all documents in /memory-bank. Is `implementation-plan.md` clear? What are your questions to make it 100% clear?
```
回答 AI 提出的疑问（通常 9-10 个），并让其更新 implementation-plan.md。

执行第一步：输入以下指令开始第一个步骤的开发：

Read all documents in /memory-bank, and proceed with Step 1 of the implementation plan. I will run the tests. Do not start Step 2 until I validate the tests. Once I validate them, open `progress.md` and document what you did. Then add any architectural insights to `architecture.md`.

提示：建议先让 AI 进行一次“规划预演”(planning pass)，确认无误后再让其生成代码。

迭代开发：
- 测试通过后，提交 Git 变更：git commit -m "Step 1 completed"。
- 清空上下文：输入 /new 或 /clear 开启新对话，以确保上下文窗口充足。
- 继续下一步：
```
Read all files in memory-bank, check progress.md, and proceed with Step 2. Do not start Step 3 until I validate the test.
```
- 重复此过程直到完成基础版本。

进阶技巧

语音交互：安装 Superwhisper 可直接语音与 GPT-5.4 交流，实现极致流畅的"Vibe"体验。
调试报错：遇到 JS 错误时，按 F12 打开控制台复制错误信息粘贴给 AI；或使用 BrowserTools 自动截图反馈。
陷入困境时：使用 git reset 回退到上一个可用版本，或使用 codex --yolo 模式（慎用，跳过确认直接执行）加速尝试。

版本历史

1.2.22026/01/15

1.2.12025/10/07

常见问题

当编码过程中产生新变更（如添加未计划的功能或更改架构）时，如何让 AI 更新所有 memory-bank 文件？

相似工具推荐

openclaw

OpenClaw 是一款专为个人打造的本地化 AI 助手，旨在让你在自己的设备上拥有完全可控的智能伙伴。它打破了传统 AI 助手局限于特定网页或应用的束缚，能够直接接入你日常使用的各类通讯渠道，包括微信、WhatsApp、Telegram、Discord、iMessage 等数十种平台。无论你在哪个聊天软件中发送消息，OpenClaw 都能即时响应，甚至支持在 macOS、iOS 和 Android 设备上进行语音交互，并提供实时的画布渲染功能供你操控。这款工具主要解决了用户对数据隐私、响应速度以及“始终在线”体验的需求。通过将 AI 部署在本地，用户无需依赖云端服务即可享受快速、私密的智能辅助，真正实现了“你的数据，你做主”。其独特的技术亮点在于强大的网关架构，将控制平面与核心助手分离，确保跨平台通信的流畅性与扩展性。 OpenClaw 非常适合希望构建个性化工作流的技术爱好者、开发者，以及注重隐私保护且不愿被单一生态绑定的普通用户。只要具备基础的终端操作能力（支持 macOS、Linux 及 Windows WSL2），即可通过简单的命令行引导完成部署。如果你渴望拥有一个懂你

★ 349.3k|★★★☆☆|1周前

Agent开发框架图像

stable-diffusion-webui

stable-diffusion-webui 是一个基于 Gradio 构建的网页版操作界面，旨在让用户能够轻松地在本地运行和使用强大的 Stable Diffusion 图像生成模型。它解决了原始模型依赖命令行、操作门槛高且功能分散的痛点，将复杂的 AI 绘图流程整合进一个直观易用的图形化平台。无论是希望快速上手的普通创作者、需要精细控制画面细节的设计师，还是想要深入探索模型潜力的开发者与研究人员，都能从中获益。其核心亮点在于极高的功能丰富度：不仅支持文生图、图生图、局部重绘（Inpainting）和外绘（Outpainting）等基础模式，还独创了注意力机制调整、提示词矩阵、负向提示词以及“高清修复”等高级功能。此外，它内置了 GFPGAN 和 CodeFormer 等人脸修复工具，支持多种神经网络放大算法，并允许用户通过插件系统无限扩展能力。即使是显存有限的设备，stable-diffusion-webui 也提供了相应的优化选项，让高质量的 AI 艺术创作变得触手可及。

★ 162.1k|★★★☆☆|1周前

开发框架图像Agent

everything-claude-code

everything-claude-code 是一套专为 AI 编程助手（如 Claude Code、Codex、Cursor 等）打造的高性能优化系统。它不仅仅是一组配置文件，而是一个经过长期实战打磨的完整框架，旨在解决 AI 代理在实际开发中面临的效率低下、记忆丢失、安全隐患及缺乏持续学习能力等核心痛点。通过引入技能模块化、直觉增强、记忆持久化机制以及内置的安全扫描功能，everything-claude-code 能显著提升 AI 在复杂任务中的表现，帮助开发者构建更稳定、更智能的生产级 AI 代理。其独特的“研究优先”开发理念和针对 Token 消耗的优化策略，使得模型响应更快、成本更低，同时有效防御潜在的攻击向量。这套工具特别适合软件开发者、AI 研究人员以及希望深度定制 AI 工作流的技术团队使用。无论您是在构建大型代码库，还是需要 AI 协助进行安全审计与自动化测试，everything-claude-code 都能提供强大的底层支持。作为一个曾荣获 Anthropic 黑客大奖的开源项目，它融合了多语言支持与丰富的实战钩子（hooks），让 AI 真正成长为懂上

★ 152.6k|★★☆☆☆|今天

开发框架Agent语言模型

ComfyUI

ComfyUI 是一款功能强大且高度模块化的视觉 AI 引擎，专为设计和执行复杂的 Stable Diffusion 图像生成流程而打造。它摒弃了传统的代码编写模式，采用直观的节点式流程图界面，让用户通过连接不同的功能模块即可构建个性化的生成管线。这一设计巧妙解决了高级 AI 绘图工作流配置复杂、灵活性不足的痛点。用户无需具备编程背景，也能自由组合模型、调整参数并实时预览效果，轻松实现从基础文生图到多步骤高清修复等各类复杂任务。ComfyUI 拥有极佳的兼容性，不仅支持 Windows、macOS 和 Linux 全平台，还广泛适配 NVIDIA、AMD、Intel 及苹果 Silicon 等多种硬件架构，并率先支持 SDXL、Flux、SD3 等前沿模型。无论是希望深入探索算法潜力的研究人员和开发者，还是追求极致创作自由度的设计师与资深 AI 绘画爱好者，ComfyUI 都能提供强大的支持。其独特的模块化架构允许社区不断扩展新功能，使其成为当前最灵活、生态最丰富的开源扩散模型工具之一，帮助用户将创意高效转化为现实。

★ 108.3k|★★☆☆☆|3天前

开发框架图像Agent

gemini-cli

gemini-cli 是一款由谷歌推出的开源 AI 命令行工具，它将强大的 Gemini 大模型能力直接集成到用户的终端环境中。对于习惯在命令行工作的开发者而言，它提供了一条从输入提示词到获取模型响应的最短路径，无需切换窗口即可享受智能辅助。这款工具主要解决了开发过程中频繁上下文切换的痛点，让用户能在熟悉的终端界面内直接完成代码理解、生成、调试以及自动化运维任务。无论是查询大型代码库、根据草图生成应用，还是执行复杂的 Git 操作，gemini-cli 都能通过自然语言指令高效处理。它特别适合广大软件工程师、DevOps 人员及技术研究人员使用。其核心亮点包括支持高达 100 万 token 的超长上下文窗口，具备出色的逻辑推理能力；内置 Google 搜索、文件操作及 Shell 命令执行等实用工具；更独特的是，它支持 MCP（模型上下文协议），允许用户灵活扩展自定义集成，连接如图像生成等外部能力。此外，个人谷歌账号即可享受免费的额度支持，且项目基于 Apache 2.0 协议完全开源，是提升终端工作效率的理想助手。

★ 100.8k|★★☆☆☆|3天前

插件Agent图像

markitdown

MarkItDown 是一款由微软 AutoGen 团队打造的轻量级 Python 工具，专为将各类文件高效转换为 Markdown 格式而设计。它支持 PDF、Word、Excel、PPT、图片（含 OCR）、音频（含语音转录）、HTML 乃至 YouTube 链接等多种格式的解析，能够精准提取文档中的标题、列表、表格和链接等关键结构信息。在人工智能应用日益普及的今天，大语言模型（LLM）虽擅长处理文本，却难以直接读取复杂的二进制办公文档。MarkItDown 恰好解决了这一痛点，它将非结构化或半结构化的文件转化为模型“原生理解”且 Token 效率极高的 Markdown 格式，成为连接本地文件与 AI 分析 pipeline 的理想桥梁。此外，它还提供了 MCP（模型上下文协议）服务器，可无缝集成到 Claude Desktop 等 LLM 应用中。这款工具特别适合开发者、数据科学家及 AI 研究人员使用，尤其是那些需要构建文档检索增强生成（RAG）系统、进行批量文本分析或希望让 AI 助手直接“阅读”本地文件的用户。虽然生成的内容也具备一定可读性，但其核心优势在于为机器

★ 93.4k|★★☆☆☆|6天前

插件开发框架

使用场景

没有 vibe-coding 时

使用 vibe-coding 后

运行环境要求

快速开始

振动编码终极指南 V1.2.2

入门

设置一切

0. 初步设置

1. 游戏设计文档（或应用程序的需求文档）

2. 技术栈与 AGENTS.md

3. 实施计划

4. 内存库

振动编码基础游戏

确保一切清晰

你的第一个实施提示

工作流程

添加细节

修复错误与卡顿

Codex 使用技巧

其他提示

常见问题解答

问：我不知道如何为我的多人游戏搭建服务器。答： 让你的 AI 来帮你解决吧！

Vibe Coding 快速上手指南

环境准备

安装步骤

1. 基础环境搭建

2. 安装 Codex CLI

3. 初始化项目规则

基本使用

第一步：生成设计文档与技术栈

第二步：构建记忆库 (Memory Bank)

第三步：开始编码 (Vibe Coding)

进阶技巧

版本历史

常见问题

相似工具推荐

openclaw

stable-diffusion-webui

everything-claude-code

ComfyUI

gemini-cli

markitdown

2. 技术栈与 `AGENTS.md`

问：我不知道如何为我的多人游戏搭建服务器。
答：让你的 AI 来帮你解决吧！