[{"data":1,"prerenderedAt":-1},["ShallowReactive",2],{"similar-google-gemini--cookbook":3,"tool-google-gemini--cookbook":64},[4,16,27,35,48,56],{"id":5,"name":6,"github_repo":7,"description_zh":8,"stars":9,"difficulty_score":10,"last_commit_at":11,"category_tags":12,"status":15},8272,"opencode","anomalyco\u002Fopencode","OpenCode 是一款开源的 AI 编程助手（Coding Agent），旨在像一位智能搭档一样融入您的开发流程。它不仅仅是一个代码补全插件，而是一个能够理解项目上下文、自主规划任务并执行复杂编码操作的智能体。无论是生成全新功能、重构现有代码，还是排查难以定位的 Bug，OpenCode 都能通过自然语言交互高效完成，显著减少开发者在重复性劳动和上下文切换上的时间消耗。\n\n这款工具专为软件开发者、工程师及技术研究人员设计，特别适合希望利用大模型能力来提升编码效率、加速原型开发或处理遗留代码维护的专业人群。其核心亮点在于完全开源的架构，这意味着用户可以审查代码逻辑、自定义行为策略，甚至私有化部署以保障数据安全，彻底打破了传统闭源 AI 助手的“黑盒”限制。\n\n在技术体验上，OpenCode 提供了灵活的终端界面（Terminal UI）和正在测试中的桌面应用程序，支持 macOS、Windows 及 Linux 全平台。它兼容多种包管理工具，安装便捷，并能无缝集成到现有的开发环境中。无论您是追求极致控制权的资深极客，还是渴望提升产出的独立开发者，OpenCode 都提供了一个透明、可信",144296,1,"2026-04-16T14:50:03",[13,14],"Agent","插件","ready",{"id":17,"name":18,"github_repo":19,"description_zh":20,"stars":21,"difficulty_score":22,"last_commit_at":23,"category_tags":24,"status":15},6121,"gemini-cli","google-gemini\u002Fgemini-cli","gemini-cli 是一款由谷歌推出的开源 AI 命令行工具，它将强大的 Gemini 大模型能力直接集成到用户的终端环境中。对于习惯在命令行工作的开发者而言，它提供了一条从输入提示词到获取模型响应的最短路径，无需切换窗口即可享受智能辅助。\n\n这款工具主要解决了开发过程中频繁上下文切换的痛点，让用户能在熟悉的终端界面内直接完成代码理解、生成、调试以及自动化运维任务。无论是查询大型代码库、根据草图生成应用，还是执行复杂的 Git 操作，gemini-cli 都能通过自然语言指令高效处理。\n\n它特别适合广大软件工程师、DevOps 人员及技术研究人员使用。其核心亮点包括支持高达 100 万 token 的超长上下文窗口，具备出色的逻辑推理能力；内置 Google 搜索、文件操作及 Shell 命令执行等实用工具；更独特的是，它支持 MCP（模型上下文协议），允许用户灵活扩展自定义集成，连接如图像生成等外部能力。此外，个人谷歌账号即可享受免费的额度支持，且项目基于 Apache 2.0 协议完全开源，是提升终端工作效率的理想助手。",100752,2,"2026-04-10T01:20:03",[14,13,25,26],"图像","开发框架",{"id":28,"name":29,"github_repo":30,"description_zh":31,"stars":32,"difficulty_score":22,"last_commit_at":33,"category_tags":34,"status":15},4721,"markitdown","microsoft\u002Fmarkitdown","MarkItDown 是一款由微软 AutoGen 团队打造的轻量级 Python 工具，专为将各类文件高效转换为 Markdown 格式而设计。它支持 PDF、Word、Excel、PPT、图片（含 OCR）、音频（含语音转录）、HTML 乃至 YouTube 链接等多种格式的解析，能够精准提取文档中的标题、列表、表格和链接等关键结构信息。\n\n在人工智能应用日益普及的今天，大语言模型（LLM）虽擅长处理文本，却难以直接读取复杂的二进制办公文档。MarkItDown 恰好解决了这一痛点，它将非结构化或半结构化的文件转化为模型“原生理解”且 Token 效率极高的 Markdown 格式，成为连接本地文件与 AI 分析 pipeline 的理想桥梁。此外，它还提供了 MCP（模型上下文协议）服务器，可无缝集成到 Claude Desktop 等 LLM 应用中。\n\n这款工具特别适合开发者、数据科学家及 AI 研究人员使用，尤其是那些需要构建文档检索增强生成（RAG）系统、进行批量文本分析或希望让 AI 助手直接“阅读”本地文件的用户。虽然生成的内容也具备一定可读性，但其核心优势在于为机器",93400,"2026-04-06T19:52:38",[14,26],{"id":36,"name":37,"github_repo":38,"description_zh":39,"stars":40,"difficulty_score":22,"last_commit_at":41,"category_tags":42,"status":15},2268,"ML-For-Beginners","microsoft\u002FML-For-Beginners","ML-For-Beginners 是由微软推出的一套系统化机器学习入门课程，旨在帮助零基础用户轻松掌握经典机器学习知识。这套课程将学习路径规划为 12 周，包含 26 节精炼课程和 52 道配套测验，内容涵盖从基础概念到实际应用的完整流程，有效解决了初学者面对庞大知识体系时无从下手、缺乏结构化指导的痛点。\n\n无论是希望转型的开发者、需要补充算法背景的研究人员，还是对人工智能充满好奇的普通爱好者，都能从中受益。课程不仅提供了清晰的理论讲解，还强调动手实践，让用户在循序渐进中建立扎实的技能基础。其独特的亮点在于强大的多语言支持，通过自动化机制提供了包括简体中文在内的 50 多种语言版本，极大地降低了全球不同背景用户的学习门槛。此外，项目采用开源协作模式，社区活跃且内容持续更新，确保学习者能获取前沿且准确的技术资讯。如果你正寻找一条清晰、友好且专业的机器学习入门之路，ML-For-Beginners 将是理想的起点。",85267,"2026-04-18T11:00:28",[25,43,44,14,13,45,46,26,47],"数据工具","视频","其他","语言模型","音频",{"id":49,"name":50,"github_repo":51,"description_zh":52,"stars":53,"difficulty_score":22,"last_commit_at":54,"category_tags":55,"status":15},51,"gstack","garrytan\u002Fgstack","gstack 是 Y Combinator CEO Garry Tan 亲自开源的一套 AI 工程化配置，旨在将 Claude Code 升级为你的虚拟工程团队。面对单人开发难以兼顾产品战略、架构设计、代码审查及质量测试的挑战，gstack 提供了一套标准化解决方案，帮助开发者实现堪比二十人团队的高效产出。\n\n这套配置特别适合希望提升交付效率的创始人、技术负责人，以及初次尝试 Claude Code 的开发者。gstack 的核心亮点在于内置了 15 个具有明确职责的 AI 角色工具，涵盖 CEO、设计师、工程经理、QA 等职能。用户只需通过简单的斜杠命令（如 `\u002Freview` 进行代码审查、`\u002Fqa` 执行测试、`\u002Fplan-ceo-review` 规划功能），即可自动化处理从需求分析到部署上线的全链路任务。\n\n所有操作基于 Markdown 和斜杠命令，无需复杂配置，完全免费且遵循 MIT 协议。gstack 不仅是一套工具集，更是一种现代化的软件工厂实践，让单人开发者也能拥有严谨的工程流程。",75502,"2026-04-18T11:08:56",[13,14],{"id":57,"name":58,"github_repo":59,"description_zh":60,"stars":61,"difficulty_score":10,"last_commit_at":62,"category_tags":63,"status":15},7525,"codex","openai\u002Fcodex","Codex 是 OpenAI 推出的一款轻量级编程智能体，专为在终端环境中高效运行而设计。它允许开发者直接在命令行界面与 AI 交互，完成代码生成、调试、重构及项目维护等任务，无需频繁切换至浏览器或集成开发环境，从而显著提升了编码流程的连贯性与专注度。\n\n这款工具主要解决了传统 AI 辅助编程中上下文割裂的问题。通过将智能体本地化运行，Codex 能够更紧密地结合当前工作目录的文件结构，提供更具针对性的代码建议，同时支持以自然语言指令驱动复杂的开发操作，让“对话即编码”成为现实。\n\nCodex 非常适合习惯使用命令行的软件工程师、全栈开发者以及技术研究人员。对于追求极致效率、偏好键盘操作胜过图形界面的极客用户而言，它更是理想的结对编程伙伴。\n\n其独特亮点在于灵活的部署方式：既可作为全局命令行工具通过 npm 或 Homebrew 一键安装，也能无缝对接现有的 ChatGPT 订阅计划（如 Plus 或 Pro），直接复用账户权益。此外，它还提供了从纯文本终端到桌面应用的多形态体验，并支持基于 API 密钥的深度定制，充分满足不同场景下的开发需求。",75220,"2026-04-14T14:40:34",[46,13,14],{"id":65,"github_repo":66,"name":67,"description_en":68,"description_zh":69,"ai_summary_zh":69,"readme_en":70,"readme_zh":71,"quickstart_zh":72,"use_case_zh":73,"hero_image_url":74,"owner_login":75,"owner_name":75,"owner_avatar_url":76,"owner_bio":77,"owner_company":78,"owner_location":78,"owner_email":78,"owner_twitter":79,"owner_website":80,"owner_url":81,"languages":82,"stars":98,"forks":99,"last_commit_at":100,"license":101,"difficulty_score":10,"env_os":102,"env_gpu":103,"env_ram":103,"env_deps":104,"category_tags":107,"github_topics":108,"view_count":22,"oss_zip_url":78,"oss_zip_packed_at":78,"status":15,"created_at":111,"updated_at":112,"faqs":113,"releases":142},9074,"google-gemini\u002Fcookbook","cookbook","Examples and guides for using the Gemini API","cookbook 是谷歌官方推出的 Gemini API 实战指南库，旨在通过结构化的学习路径，帮助开发者快速掌握 Gemini 系列模型的应用开发。它解决了用户在面对强大但复杂的 AI 接口时，缺乏具体代码示例和场景化指导的痛点，将抽象的文档转化为可运行的 Jupyter Notebook 教程。\n\n无论是刚接触 Gemini 的初学者，还是希望构建复杂应用的专业开发者与研究人员，都能从中找到适合的资源。内容涵盖从基础的“快速入门”到多功能组合的“综合案例”，支持直接在 Google Colab 中运行体验。\n\ncookbook 的独特亮点在于其紧跟技术前沿，及时收录了最新模型的用法，例如支持深度推理的 Gemini 3、具备图像生成能力的 Nano-Banana 2，以及能创作完整歌曲的 Lyria 3 音乐模型。此外，它还详细介绍了如何通过调整推理层级（Inference tiers）来平衡任务的速度、成本与可靠性。如果你希望动手实践，探索多模态 AI 在文本、图像及音频领域的无限可能，cookbook 将是不可或缺的学习伴侣。","# Welcome to the Gemini API Cookbook\r\n\r\nThis cookbook provides a structured learning path for using the Gemini API, focusing on hands-on tutorials and practical examples.\r\n\r\n**For comprehensive API documentation, visit [ai.google.dev](https:\u002F\u002Fai.google.dev\u002Fgemini-api\u002Fdocs).**\r\n\u003Cbr>\u003Cbr>\r\n**For Gemma quickstarts and examples, check out the [Gemma cookbook](https:\u002F\u002Fgithub.com\u002Fgoogle-gemma\u002Fcookbook).**\r\n\u003Cbr>\u003Cbr>\r\n\r\n---\r\n> **Gemini 3**: For the most recent updates on our latest generation, please check the [Get Started](.\u002Fquickstarts\u002FGet_started.ipynb) [![Colab](https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002Fgoogle-gemini_cookbook_readme_66b6d5256d10.png)](https:\u002F\u002Fcolab.research.google.com\u002Fgithub\u002Fgoogle-gemini\u002Fcookbook\u002Fblob\u002Fmain\u002Fquickstarts\u002FGet_started.ipynb#gemini3) and the [thinking](.\u002Fquickstarts\u002FGet_started_thinking.ipynb) [![Colab](https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002Fgoogle-gemini_cookbook_readme_66b6d5256d10.png)](https:\u002F\u002Fcolab.research.google.com\u002Fgithub\u002Fgoogle-gemini\u002Fcookbook\u002Fblob\u002Fmain\u002Fquickstarts\u002FGet_started_thinking.ipynb#gemini3) guides who include [migration guides](https:\u002F\u002Fcolab.research.google.com\u002Fgithub\u002Fgoogle-gemini\u002Fcookbook\u002Fblob\u002Fmain\u002Fquickstarts\u002FGet_started.ipynb#gemini3migration).\r\n> \r\n> **🍌 Nano-Banana 2**: Go bananas with our latest image generation model: **Nano-Banana 2**. Get started [here](.\u002Fquickstarts\u002FGet_Started_Nano_Banana.ipynb) [![Colab](https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002Fgoogle-gemini_cookbook_readme_66b6d5256d10.png)](https:\u002F\u002Fcolab.research.google.com\u002Fgithub\u002Fgoogle-gemini\u002Fcookbook\u002Fblob\u002Fmain\u002Fquickstarts\u002FGet_Started_Nano_Banana.ipynb#nano-banana-pro) with 512px, thinking, search and image grounding, and a ton of examples!\r\n> \r\n> **🎶 Lyria 3**: Channel your inner composer with **Lyria 3**. Get started [here](.\u002Fquickstarts\u002FGet_started_Lyria.ipynb) [![Colab](https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002Fgoogle-gemini_cookbook_readme_66b6d5256d10.png)](https:\u002F\u002Fcolab.research.google.com\u002Fgithub\u002Fgoogle-gemini\u002Fcookbook\u002Fblob\u002Fmain\u002Fquickstarts\u002FGet_started_Lyria.ipynb) with 30s clips and full song generation, image-to-music, and a ton of examples!\r\n---\r\n\r\n## Navigating the Cookbook\r\n\r\nThis cookbook is organized into two main categories:\r\n\r\n1.  **[Quick Starts](https:\u002F\u002Fgithub.com\u002Fgoogle-gemini\u002Fcookbook\u002Ftree\u002Fmain\u002Fquickstarts\u002F):**  Step-by-step guides covering both introductory topics (\"[Get Started](.\u002Fquickstarts\u002FGet_started.ipynb) [![Colab](https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002Fgoogle-gemini_cookbook_readme_66b6d5256d10.png)](https:\u002F\u002Fcolab.research.google.com\u002Fgithub\u002Fgoogle-gemini\u002Fcookbook\u002Fblob\u002Fmain\u002Fquickstarts\u002FGet_started.ipynb)\") and specific API features.\r\n2.  **[Examples](https:\u002F\u002Fgithub.com\u002Fgoogle-gemini\u002Fcookbook\u002Ftree\u002Fmain\u002Fexamples\u002F):** Practical use cases demonstrating how to combine multiple features.\r\n\r\nWe also showcase **Demos** in separate repositories, illustrating end-to-end applications of the Gemini API.\r\n\u003Cbr>\u003Cbr>\r\n\r\n## What's New?\r\n\r\nHere are the recent additions and updates to the Gemini API and the Cookbook: \r\n\r\n* **Inference tiers**: Learn how to use the Priority and Flex tiers in the [Inference tiers guide](.\u002Fquickstarts\u002FInference_tiers.ipynb) [![Colab](https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002Fgoogle-gemini_cookbook_readme_66b6d5256d10.png)](https:\u002F\u002Fcolab.research.google.com\u002Fgithub\u002Fgoogle-gemini\u002Fcookbook\u002Fblob\u002Fmain\u002Fquickstarts\u002FInference_tiers.ipynb) to help you balance speed, cost, and reliability.\r\n* **🎶 Lyria 3**: Convert your ideas into [songs](.\u002Fquickstarts\u002FGet_Started_Lyria.ipynb) [![Colab](https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002Fgoogle-gemini_cookbook_readme_66b6d5256d10.png)](https:\u002F\u002Fcolab.research.google.com\u002Fgithub\u002Fgoogle-gemini\u002Fcookbook\u002Fblob\u002Fmain\u002Fquickstarts\u002FGet_Started_Lyria.ipynb) with full control over the music structure and more!\r\n* **🍌 Nano-Banana 2 & Pro:** Use [Gemini's native image generation](.\u002Fquickstarts\u002FGet_Started_Nano_Banana.ipynb) [![Colab](https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002Fgoogle-gemini_cookbook_readme_66b6d5256d10.png)](https:\u002F\u002Fcolab.research.google.com\u002Fgithub\u002Fgoogle-gemini\u002Fcookbook\u002Fblob\u002Fmain\u002Fquickstarts\u002FGet_Started_Nano_Banana.ipynb) capabilities to edit images with high consistency or generate visual stories. Experience **Nano-Banana 2** for high speed or **Nano-Banana Pro** for 4K quality—both now with thinking and search grounding!\r\n* **File Search:** Discover how to ground generations in your own data in a hosted RAG system with the [File Search quickstart](.\u002Fquickstarts\u002FFile_Search.ipynb) [![Colab](https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002Fgoogle-gemini_cookbook_readme_66b6d5256d10.png)](https:\u002F\u002Fcolab.research.google.com\u002Fgithub\u002Fgoogle-gemini\u002Fcookbook\u002Fblob\u002Fmain\u002Fquickstarts\u002FFile_Search.ipynb). \r\n* **Grounding with Google Maps:** Get started using factual geographical data from 📍 Google Maps in your apps! See the Google Maps section of the [Grounding Guide](.\u002Fquickstarts\u002FGrounding.ipynb) [![Colab](https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002Fgoogle-gemini_cookbook_readme_66b6d5256d10.png)](https:\u002F\u002Fcolab.research.google.com\u002Fgithub\u002Fgoogle-gemini\u002Fcookbook\u002Fblob\u002Fmain\u002Fquickstarts\u002FGrounding.ipynb).\r\n* **Veo 3.1**: Get started with our video generation model with this [Veo guide](.\u002Fquickstarts\u002FGet_started_Veo.ipynb), including image-to-videos and video extension! [![Colab](https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002Fgoogle-gemini_cookbook_readme_66b6d5256d10.png)](https:\u002F\u002Fcolab.research.google.com\u002Fgithub\u002Fgoogle-gemini\u002Fcookbook\u002Fblob\u002Fmain\u002Fquickstarts\u002FGet_started_Veo.ipynb)\r\n* **Gemini Robotics-ER 1.5**: Learn about this new Gemini model specifically for spatial understanding and reasoning for [robotics applications](.\u002Fquickstarts\u002Fgemini-robotics-er.ipynb). [![Colab](https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002Fgoogle-gemini_cookbook_readme_66b6d5256d10.png)](https:\u002F\u002Fcolab.research.google.com\u002Fgithub\u002Fgoogle-gemini\u002Fcookbook\u002Fblob\u002Fmain\u002Fquickstarts\u002Fgemini-robotics-er.ipynb)\r\n* **Lyria and TTS**: Get started with podcast and music generation with the [TTS](.\u002Fquickstarts\u002FGet_started_TTS.ipynb) [![Colab](https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002Fgoogle-gemini_cookbook_readme_66b6d5256d10.png)](https:\u002F\u002Fcolab.research.google.com\u002Fgithub\u002Fgoogle-gemini\u002Fcookbook\u002Fblob\u002Fmain\u002Fquickstarts\u002FGet_started_TTS.ipynb) and [Lyria RealTime](.\u002Fquickstarts\u002FGet_started_LyriaRealTime.ipynb) [![Colab](https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002Fgoogle-gemini_cookbook_readme_66b6d5256d10.png)](https:\u002F\u002Fcolab.research.google.com\u002Fgithub\u002Fgoogle-gemini\u002Fcookbook\u002Fblob\u002Fmain\u002Fquickstarts\u002FGet_started_LyriaRealTime.ipynb) models.\r\n* **LiveAPI**: Get started with the [multimodal Live API](.\u002Fquickstarts\u002FGet_started_LiveAPI.ipynb) [![Colab](https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002Fgoogle-gemini_cookbook_readme_66b6d5256d10.png)](https:\u002F\u002Fcolab.research.google.com\u002Fgithub\u002Fgoogle-gemini\u002Fcookbook\u002Fblob\u002Fmain\u002Fquickstarts\u002FGet_started_LiveAPI.ipynb) and unlock new interactivity with Gemini. \r\n* **Recently Added Guides:**\r\n  * [Grounding](.\u002Fquickstarts\u002FGrounding.ipynb) [![Colab](https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002Fgoogle-gemini_cookbook_readme_66b6d5256d10.png)](https:\u002F\u002Fcolab.research.google.com\u002Fgithub\u002Fgoogle-gemini\u002Fcookbook\u002Fblob\u002Fmain\u002Fquickstarts\u002FGrounding.ipynb): Discover different ways to ground Gemini's answer using different tools, from Google Search to Youtube and URLs and the new [**Maps grounding**](https:\u002F\u002Fcolab.research.google.com\u002Fgithub\u002Fgoogle-gemini\u002Fcookbook\u002Fblob\u002Fmain\u002Fquickstarts\u002FGrounding.ipynb#maps_grounding) tool. \r\n  * [Batch API](.\u002Fquickstarts\u002FBatch_mode.ipynb) [![Colab](https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002Fgoogle-gemini_cookbook_readme_66b6d5256d10.png)](https:\u002F\u002Fcolab.research.google.com\u002Fgithub\u002Fgoogle-gemini\u002Fcookbook\u002Fblob\u002Fmain\u002Fquickstarts\u002FBatch_mode.ipynb): Use Batch API to send large volume of non-time-sensitive requests to the model and get up to 90% discount. \r\n  * [Logs and datasets](.\u002Fexamples\u002FDatasets.ipynb) [![Colab](https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002Fgoogle-gemini_cookbook_readme_66b6d5256d10.png)](https:\u002F\u002Fcolab.research.google.com\u002Fgithub\u002Fgoogle-gemini\u002Fcookbook\u002Fblob\u002Fmain\u002Fexamples\u002FDatasets.ipynb): Process and evaluate your collected logs using the Batch API.\r\n  \r\n\u003Cbr>\u003Cbr>\r\n\r\n## 1. Quick Starts\r\n\r\nThe [quickstarts section](https:\u002F\u002Fgithub.com\u002Fgoogle-gemini\u002Fcookbook\u002Ftree\u002Fmain\u002Fquickstarts\u002F) contains step-by-step tutorials to get you started with Gemini and learn about its specific features.\r\n\r\n**To begin, you'll need:**\r\n\r\n1.  A Google account.\r\n2.  An API key (create one in [Google AI Studio](https:\u002F\u002Faistudio.google.com\u002Fapp\u002Fapikey)).\r\n\u003Cbr>\u003Cbr>\r\n\r\nWe recommend starting with the following:\r\n\r\n*   [Authentication](.\u002Fquickstarts\u002FAuthentication.ipynb) [![Colab](https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002Fgoogle-gemini_cookbook_readme_66b6d5256d10.png)](https:\u002F\u002Fcolab.research.google.com\u002Fgithub\u002Fgoogle-gemini\u002Fcookbook\u002Fblob\u002Fmain\u002Fquickstarts\u002FAuthentication.ipynb): Set up your API key for access.\r\n*   [**Get started**](.\u002Fquickstarts\u002FGet_started.ipynb) [![Colab](https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002Fgoogle-gemini_cookbook_readme_66b6d5256d10.png)](https:\u002F\u002Fcolab.research.google.com\u002Fgithub\u002Fgoogle-gemini\u002Fcookbook\u002Fblob\u002Fmain\u002Fquickstarts\u002FGet_started.ipynb): Get started with Gemini models and the Gemini API, covering basic prompting and multimodal input.\r\n\u003Cbr>\u003Cbr>\r\n\r\nThen, explore the other quickstarts tutorials to learn about individual features:\r\n*  [Get started with Live API](.\u002Fquickstarts\u002FGet_started_LiveAPI.ipynb) [![Colab](https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002Fgoogle-gemini_cookbook_readme_66b6d5256d10.png)](https:\u002F\u002Fcolab.research.google.com\u002Fgithub\u002Fgoogle-gemini\u002Fcookbook\u002Fblob\u002Fmain\u002Fquickstarts\u002FGet_started_LiveAPI.ipynb): Get started with the live API with this comprehensive overview of its capabilities\r\n*  [Get started with Veo](.\u002Fquickstarts\u002FGet_started_Veo.ipynb) [![Colab](https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002Fgoogle-gemini_cookbook_readme_66b6d5256d10.png)](https:\u002F\u002Fcolab.research.google.com\u002Fgithub\u002Fgoogle-gemini\u002Fcookbook\u002Fblob\u002Fmain\u002Fquickstarts\u002FGet_started_Veo.ipynb): Get started with our video generation capabilities \r\n*  [Get started with Imagen](.\u002Fquickstarts\u002FGet_started_imagen.ipynb) [![Colab](https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002Fgoogle-gemini_cookbook_readme_66b6d5256d10.png)](https:\u002F\u002Fcolab.research.google.com\u002Fgithub\u002Fgoogle-gemini\u002Fcookbook\u002Fblob\u002Fmain\u002Fquickstarts\u002FGet_started_imagen.ipynb) and [Native image generation](.\u002Fquickstarts\u002FGet_Started_Nano_Banana.ipynb) [![Colab](https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002Fgoogle-gemini_cookbook_readme_66b6d5256d10.png)](https:\u002F\u002Fcolab.research.google.com\u002Fgithub\u002Fgoogle-gemini\u002Fcookbook\u002Fblob\u002Fmain\u002Fquickstarts\u002FGet_Started_Nano_Banana.ipynb): Get started with our image generation capabilities \r\n*  [Grounding](.\u002Fquickstarts\u002FGrounding.ipynb) [![Colab](https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002Fgoogle-gemini_cookbook_readme_66b6d5256d10.png)](https:\u002F\u002Fcolab.research.google.com\u002Fgithub\u002Fgoogle-gemini\u002Fcookbook\u002Fblob\u002Fmain\u002Fquickstarts\u002FGrounding.ipynb): use Google Search for grounded responses\r\n*  [Code execution](.\u002Fquickstarts\u002FCode_Execution.ipynb) [![Colab](https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002Fgoogle-gemini_cookbook_readme_66b6d5256d10.png)](https:\u002F\u002Fcolab.research.google.com\u002Fgithub\u002Fgoogle-gemini\u002Fcookbook\u002Fblob\u002Fmain\u002Fquickstarts\u002FCode_Execution.ipynb): Generate and run Python code to solve complex tasks and even output graphs\r\n*  And [many more](https:\u002F\u002Fgithub.com\u002Fgoogle-gemini\u002Fcookbook\u002Ftree\u002Fmain\u002Fquickstarts\u002F)\r\n\u003Cbr>\u003Cbr>\r\n\r\n## 2. Examples (Practical Use Cases)\r\n\r\nThese examples demonstrate how to combine multiple Gemini API features or 3rd-party tools to build more complex applications.\r\n*  [Browser as a tool](.\u002Fexamples\u002FBrowser_as_a_tool.ipynb) [![Colab](https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002Fgoogle-gemini_cookbook_readme_66b6d5256d10.png)](https:\u002F\u002Fcolab.research.google.com\u002Fgithub\u002Fgoogle-gemini\u002Fcookbook\u002Fblob\u002Fmain\u002Fexamples\u002FBrowser_as_a_tool.ipynb): Use a web browser for live and internal (intranet) web interactions\r\n*  [Illustrate a book](.\u002Fexamples\u002FBook_illustration.ipynb) [![Colab](https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002Fgoogle-gemini_cookbook_readme_66b6d5256d10.png)](https:\u002F\u002Fcolab.research.google.com\u002Fgithub\u002Fgoogle-gemini\u002Fcookbook\u002Fblob\u002Fmain\u002Fexamples\u002FBook_illustration.ipynb): Use Gemini to create illustration for an open-source book\r\n*  [Animated Story Generation](.\u002Fexamples\u002FAnimated_Story_Video_Generation_gemini.ipynb) [![Colab](https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002Fgoogle-gemini_cookbook_readme_66b6d5256d10.png)](https:\u002F\u002Fcolab.research.google.com\u002Fgithub\u002Fgoogle-gemini\u002Fcookbook\u002Fblob\u002Fmain\u002Fexamples\u002FAnimated_Story_Video_Generation_gemini.ipynb): Create animated videos by combining Gemini's story generation, Imagen, and audio synthesis\r\n*  [Plotting and mapping Live](.\u002Fexamples\u002FLiveAPI_plotting_and_mapping.ipynb) [![Colab](https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002Fgoogle-gemini_cookbook_readme_66b6d5256d10.png)](https:\u002F\u002Fcolab.research.google.com\u002Fgithub\u002Fgoogle-gemini\u002Fcookbook\u002Fblob\u002Fmain\u002Fexamples\u002FLiveAPI_plotting_and_mapping.ipynb): Mix *Live API* and *Code execution* to solve complex tasks live\r\n*  [3D Spatial understanding](.\u002Fexamples\u002FSpatial_understanding_3d.ipynb) [![Colab](https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002Fgoogle-gemini_cookbook_readme_66b6d5256d10.png)](https:\u002F\u002Fcolab.research.google.com\u002Fgithub\u002Fgoogle-gemini\u002Fcookbook\u002Fblob\u002Fmain\u002Fexamples\u002FSpatial_understanding_3d.ipynb): Use Gemini *3D spatial* abilities to understand 3D scenes\r\n*  [Gradio and live API](.\u002Fexamples\u002Fgradio_audio.py): Use gradio to deploy your own instance of the *Live API*\r\n*  And [many many more](https:\u002F\u002Fgithub.com\u002Fgoogle-gemini\u002Fcookbook\u002Ftree\u002Fmain\u002Fexamples\u002F)\r\n\u003Cbr>\u003Cbr>\r\n\r\n## 3. Demos (End-to-End Applications)\r\n\r\nThese fully functional, end-to-end applications showcase the power of Gemini in real-world scenarios. \r\n\r\n*   [Gemini CLI](https:\u002F\u002Fgithub.com\u002Fgoogle-gemini\u002Fgemini-cli): Open-source AI agent that brings the power of Gemini directly into your terminal\r\n*   [Gemini API quickstart](https:\u002F\u002Fgithub.com\u002Fgoogle-gemini\u002Fgemini-api-quickstart): Python Flask App running with the Google AI Gemini API, designed to get you started building with Gemini's multi-modal capabilities\r\n*   [Multimodal Live API Web Console](https:\u002F\u002Fgithub.com\u002Fgoogle-gemini\u002Fmultimodal-live-api-web-console): React-based starter app for using the Multimodal Live API over a websocket\r\n*   [Fullstack Langgraph Quickstart](https:\u002F\u002Fgithub.com\u002Fgoogle-gemini\u002Fgemini-fullstack-langgraph-quickstart): A fullstack application using a React frontend and a LangGraph-powered backend agent\r\n*   [Google AI Studio Starter Applets](https:\u002F\u002Fgithub.com\u002Fgoogle-gemini\u002Fstarter-applets): A collection of small apps that demonstrate how Gemini can be used to create interactive experiences\r\n\u003Cbr>\u003Cbr>\r\n\r\n\r\n## Official SDKs\r\n\r\nThe Gemini API is a REST API. You can call it directly using tools like `curl` (see [REST examples](https:\u002F\u002Fgithub.com\u002Fgoogle-gemini\u002Fcookbook\u002Ftree\u002Fmain\u002Fquickstarts\u002Frest\u002F) or the great [Postman workspace](https:\u002F\u002Fwww.postman.com\u002Fai-on-postman\u002Fgoogle-gemini-apis\u002Foverview)), or use one of our official SDKs:\r\n* [Python](https:\u002F\u002Fgithub.com\u002Fgoogleapis\u002Fpython-genai)\r\n* [Go](https:\u002F\u002Fgithub.com\u002Fgoogleapis\u002Fgo-genai)\r\n* [Node.js](https:\u002F\u002Fgithub.com\u002Fgoogleapis\u002Fjs-genai)\r\n* [Java](https:\u002F\u002Fgithub.com\u002Fgoogleapis\u002Fjava-genai)\r\n* [C#](https:\u002F\u002Fgithub.com\u002Fgoogleapis\u002Fdotnet-genai\u002F)\r\n\u003Cbr>\u003Cbr>\r\n\r\n## Get Help\r\n\r\nAsk a question on the [Google AI Developer Forum](https:\u002F\u002Fdiscuss.ai.google.dev\u002F).\r\n\r\n## The Gemini API on Google Cloud Vertex AI\r\n\r\nFor enterprise developers, the Gemini API is also available on Google Cloud Vertex AI. See [this repo](https:\u002F\u002Fgithub.com\u002FGoogleCloudPlatform\u002Fgenerative-ai) for examples.\r\n\r\n## Contributing\r\n\r\nContributions are welcome! See [CONTRIBUTING.md](CONTRIBUTING.md) for details.\r\n\r\nThank you for developing with the Gemini API! We're excited to see what you create.\r\n\r\n\r\n\r\n\r\n","# 欢迎使用 Gemini API 烹饪书\n\n本烹饪书提供了一个系统化的学习路径，帮助您使用 Gemini API，重点在于动手教程和实用示例。\n\n**如需全面的 API 文档，请访问 [ai.google.dev](https:\u002F\u002Fai.google.dev\u002Fgemini-api\u002Fdocs)。**\n\u003Cbr>\u003Cbr>\n**有关 Gemma 的快速入门和示例，请查看 [Gemma 烹饪书](https:\u002F\u002Fgithub.com\u002Fgoogle-gemma\u002Fcookbook)。**\n\u003Cbr>\u003Cbr>\n\n---\n> **Gemini 3**：如需了解我们最新一代模型的最新更新，请参阅 [入门](.\u002Fquickstarts\u002FGet_started.ipynb) [![Colab](https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002Fgoogle-gemini_cookbook_readme_66b6d5256d10.png)](https:\u002F\u002Fcolab.research.google.com\u002Fgithub\u002Fgoogle-gemini\u002Fcookbook\u002Fblob\u002Fmain\u002Fquickstarts\u002FGet_started.ipynb#gemini3) 和 [思考](.\u002Fquickstarts\u002FGet_started_thinking.ipynb) [![Colab](https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002Fgoogle-gemini_cookbook_readme_66b6d5256d10.png)](https:\u002F\u002Fcolab.research.google.com\u002Fgithub\u002Fgoogle-gemini\u002Fcookbook\u002Fblob\u002Fmain\u002Fquickstarts\u002FGet_started_thinking.ipynb#gemini3) 指南，其中包含[迁移指南](https:\u002F\u002Fcolab.research.google.com\u002Fgithub\u002Fgoogle-gemini\u002Fcookbook\u002Fblob\u002Fmain\u002Fquickstarts\u002FGet_started.ipynb#gemini3migration)。\n> \n> **🍌 Nano-Banana 2**：用我们最新的图像生成模型——**Nano-Banana 2**——尽情发挥您的创意吧！从[这里](.\u002Fquickstarts\u002FGet_Started_Nano_Banana.ipynb)开始 [![Colab](https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002Fgoogle-gemini_cookbook_readme_66b6d5256d10.png)](https:\u002F\u002Fcolab.research.google.com\u002Fgithub\u002Fgoogle-gemini\u002Fcookbook\u002Fblob\u002Fmain\u002Fquickstarts\u002FGet_Started_Nano_Banana.ipynb#nano-banana-pro)，体验 512px 分辨率、思考模式、搜索功能、图像对齐等特性，以及大量示例！\n> \n> **🎶 Lyria 3**：用 **Lyria 3** 唤醒您内心的作曲家！从[这里](.\u002Fquickstarts\u002FGet_started_Lyria.ipynb)开始 [![Colab](https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002Fgoogle-gemini_cookbook_readme_66b6d5256d10.png)](https:\u002F\u002Fcolab.research.google.com\u002Fgithub\u002Fgoogle-gemini\u002Fcookbook\u002Fblob\u002Fmain\u002Fquickstarts\u002FGet_started_Lyria.ipynb)，体验 30 秒片段与完整歌曲生成、图像转音乐等功能，并获取丰富的示例！\n---\n\n## 烹饪书导航\n\n本烹饪书分为两大类：\n\n1.  **[快速入门](https:\u002F\u002Fgithub.com\u002Fgoogle-gemini\u002Fcookbook\u002Ftree\u002Fmain\u002Fquickstarts\u002F)：** 分步指南，涵盖入门主题（“[入门](.\u002Fquickstarts\u002FGet_started.ipynb) [![Colab](https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002Fgoogle-gemini_cookbook_readme_66b6d5256d10.png)](https:\u002F\u002Fcolab.research.google.com\u002Fgithub\u002Fgoogle-gemini\u002Fcookbook\u002Fblob\u002Fmain\u002Fquickstarts\u002FGet_started.ipynb)”）以及特定的 API 功能。\n2.  **[示例](https:\u002F\u002Fgithub.com\u002Fgoogle-gemini\u002Fcookbook\u002Ftree\u002Fmain\u002Fexamples\u002F)：** 实际应用场景，展示如何组合使用多种功能。\n\n此外，我们还在独立的仓库中提供了**演示**，以展示 Gemini API 的端到端应用。\n\u003Cbr>\u003Cbr>\n\n## 最新动态？\n\n以下是 Gemini API 和 Cookbook 的最新添加与更新：\n\n* **推理层级**：在 [推理层级指南](.\u002Fquickstarts\u002FInference_tiers.ipynb) [![Colab](https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002Fgoogle-gemini_cookbook_readme_66b6d5256d10.png)](https:\u002F\u002Fcolab.research.google.com\u002Fgithub\u002Fgoogle-gemini\u002Fcookbook\u002Fblob\u002Fmain\u002Fquickstarts\u002FInference_tiers.ipynb) 中了解如何使用优先级和灵活层级，帮助您在速度、成本和可靠性之间取得平衡。\n* **🎶 Lyria 3**：通过完全掌控音乐结构等功能，将您的想法转化为[歌曲](.\u002Fquickstarts\u002FGet_Started_Lyria.ipynb) [![Colab](https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002Fgoogle-gemini_cookbook_readme_66b6d5256d10.png)](https:\u002F\u002Fcolab.research.google.com\u002Fgithub\u002Fgoogle-gemini\u002Fcookbook\u002Fblob\u002Fmain\u002Fquickstarts\u002FGet_Started_Lyria.ipynb)！\n* **🍌 Nano-Banana 2 & Pro**：利用 [Gemini 原生图像生成](.\u002Fquickstarts\u002FGet_Started_Nano_Banana.ipynb) [![Colab](https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002Fgoogle-gemini_cookbook_readme_66b6d5256d10.png)](https:\u002F\u002Fcolab.research.google.com\u002Fgithub\u002Fgoogle-gemini\u002Fcookbook\u002Fblob\u002Fmain\u002Fquickstarts\u002FGet_Started_Nano_Banana.ipynb) 功能，以高度一致性编辑图像或生成视觉故事。体验高速的 **Nano-Banana 2**，或拥有 4K 质量的 **Nano-Banana Pro**——两者现均已支持思维与搜索增强功能！\n* **文件搜索**：在托管的 RAG 系统中，通过 [文件搜索快速入门](.\u002Fquickstarts\u002FFile_Search.ipynb) [![Colab](https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002Fgoogle-gemini_cookbook_readme_66b6d5256d10.png)](https:\u002F\u002Fcolab.research.google.com\u002Fgithub\u002Fgoogle-gemini\u002Fcookbook\u002Fblob\u002Fmain\u002Fquickstarts\u002FFile_Search.ipynb)，了解如何将生成内容基于您自己的数据进行增强。\n* **Google 地图增强**：开始在您的应用中使用 📍 Google 地图中的真实地理数据吧！请参阅 [增强指南](.\u002Fquickstarts\u002FGrounding.ipynb) [![Colab](https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002Fgoogle-gemini_cookbook_readme_66b6d5256d10.png)](https:\u002F\u002Fcolab.research.google.com\u002Fgithub\u002Fgoogle-gemini\u002Fcookbook\u002Fblob\u002Fmain\u002Fquickstarts\u002FGrounding.ipynb) 中的 Google 地图部分。\n* **Veo 3.1**：通过此 [Veo 指南](.\u002Fquickstarts\u002FGet_started_Veo.ipynb)，包括图像转视频和视频扩展功能，开始使用我们的视频生成模型！[![Colab](https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002Fgoogle-gemini_cookbook_readme_66b6d5256d10.png)](https:\u002F\u002Fcolab.research.google.com\u002Fgithub\u002Fgoogle-gemini\u002Fcookbook\u002Fblob\u002Fmain\u002Fquickstarts\u002FGet_started_Veo.ipynb)\n* **Gemini Robotics-ER 1.5**：了解这款专为机器人应用设计的新 Gemini 模型，它具备空间理解和推理能力，详情请参阅 [机器人应用指南](.\u002Fquickstarts\u002Fgemini-robotics-er.ipynb)。[![Colab](https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002Fgoogle-gemini_cookbook_readme_66b6d5256d10.png)](https:\u002F\u002Fcolab.research.google.com\u002Fgithub\u002Fgoogle-gemini\u002Fcookbook\u002Fblob\u002Fmain\u002Fquickstarts\u002Fgemini-robotics-er.ipynb)\n* **Lyria 和 TTS**：借助 [TTS](.\u002Fquickstarts\u002FGet_started_TTS.ipynb) [![Colab](https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002Fgoogle-gemini_cookbook_readme_66b6d5256d10.png)](https:\u002F\u002Fcolab.research.google.com\u002Fgithub\u002Fgoogle-gemini\u002Fcookbook\u002Fblob\u002Fmain\u002Fquickstarts\u002FGet_started_TTS.ipynb) 和 [Lyria RealTime](.\u002Fquickstarts\u002FGet_started_LyriaRealTime.ipynb) [![Colab](https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002Fgoogle-gemini_cookbook_readme_66b6d5256d10.png)](https:\u002F\u002Fcolab.research.google.com\u002Fgithub\u002Fgoogle-gemini\u002Fcookbook\u002Fblob\u002Fmain\u002Fquickstarts\u002FGet_started_LyriaRealTime.ipynb) 模型，开始制作播客和音乐吧。\n* **LiveAPI**：通过 [多模态 Live API](.\u002Fquickstarts\u002FGet_started_LiveAPI.ipynb) [![Colab](https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002Fgoogle-gemini_cookbook_readme_66b6d5256d10.png)](https:\u002F\u002Fcolab.research.google.com\u002Fgithub\u002Fgoogle-gemini\u002Fcookbook\u002Fblob\u002Fmain\u002Fquickstarts\u002FGet_started_LiveAPI.ipynb)，解锁与 Gemini 的全新交互方式。\n* **近期新增指南**：\n  * [增强](.\u002Fquickstarts\u002FGrounding.ipynb) [![Colab](https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002Fgoogle-gemini_cookbook_readme_66b6d5256d10.png)](https:\u002F\u002Fcolab.research.google.com\u002Fgithub\u002Fgoogle-gemini\u002Fcookbook\u002Fblob\u002Fmain\u002Fquickstarts\u002FGrounding.ipynb)：探索使用不同工具（从 Google 搜索到 YouTube、URL，以及全新的 [地图增强](https:\u002F\u002Fcolab.research.google.com\u002Fgithub\u002Fgoogle-gemini\u002Fcookbook\u002Fblob\u002Fmain\u002Fquickstarts\u002FGrounding.ipynb#maps_grounding) 工具）来增强 Gemini 回答的不同方法。\n  * [批量 API](.\u002Fquickstarts\u002FBatch_mode.ipynb) [![Colab](https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002Fgoogle-gemini_cookbook_readme_66b6d5256d10.png)](https:\u002F\u002Fcolab.research.google.com\u002Fgithub\u002Fgoogle-gemini\u002Fcookbook\u002Fblob\u002Fmain\u002Fquickstarts\u002FBatch_mode.ipynb)：使用批量 API 向模型发送大量非实时敏感请求，并享受高达 90% 的折扣。\n  * [日志与数据集](.\u002Fexamples\u002FDatasets.ipynb) [![Colab](https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002Fgoogle-gemini_cookbook_readme_66b6d5256d10.png)](https:\u002F\u002Fcolab.research.google.com\u002Fgithub\u002Fgoogle-gemini\u002Fcookbook\u002Fblob\u002Fmain\u002Fexamples\u002FDatasets.ipynb)：利用批量 API 处理并评估您收集的日志。\n\n\u003Cbr>\u003Cbr>\n\n## 1. 快速入门\r\n\r\n[快速入门章节](https:\u002F\u002Fgithub.com\u002Fgoogle-gemini\u002Fcookbook\u002Ftree\u002Fmain\u002Fquickstarts\u002F) 包含逐步教程，帮助您快速上手 Gemini 并了解其各项功能特性。\n\n**开始之前，您需要：**\r\n\r\n1. 一个 Google 帐户。\r\n2. 一个 API 密钥（可在 [Google AI Studio](https:\u002F\u002Faistudio.google.com\u002Fapp\u002Fapikey) 中创建）。\r\n\u003Cbr>\u003Cbr>\r\n\r\n我们建议从以下内容开始：\r\n\r\n*   [身份验证](.\u002Fquickstarts\u002FAuthentication.ipynb) [![Colab](https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002Fgoogle-gemini_cookbook_readme_66b6d5256d10.png)](https:\u002F\u002Fcolab.research.google.com\u002Fgithub\u002Fgoogle-gemini\u002Fcookbook\u002Fblob\u002Fmain\u002Fquickstarts\u002FAuthentication.ipynb)：设置您的 API 密钥以进行访问。\r\n*   [**开始使用**](.\u002Fquickstarts\u002FGet_started.ipynb) [![Colab](https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002Fgoogle-gemini_cookbook_readme_66b6d5256d10.png)](https:\u002F\u002Fcolab.research.google.com\u002Fgithub\u002Fgoogle-gemini\u002Fcookbook\u002Fblob\u002Fmain\u002Fquickstarts\u002FGet_started.ipynb)：开始使用 Gemini 模型和 Gemini API，涵盖基础提示工程及多模态输入。\r\n\u003Cbr>\u003Cbr>\r\n\r\n随后，您可以探索其他快速入门教程，进一步了解各项功能：\r\n*  [Live API 入门](.\u002Fquickstarts\u002FGet_started_LiveAPI.ipynb) [![Colab](https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002Fgoogle-gemini_cookbook_readme_66b6d5256d10.png)](https:\u002F\u002Fcolab.research.google.com\u002Fgithub\u002Fgoogle-gemini\u002Fcookbook\u002Fblob\u002Fmain\u002Fquickstarts\u002FGet_started_LiveAPI.ipynb)：通过全面概述 Live API 的能力，快速上手该接口。\r\n*  [Veo 入门](.\u002Fquickstarts\u002FGet_started_Veo.ipynb) [![Colab](https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002Fgoogle-gemini_cookbook_readme_66b6d5256d10.png)](https:\u002F\u002Fcolab.research.google.com\u002Fgithub\u002Fgoogle-gemini\u002Fcookbook\u002Fblob\u002Fmain\u002Fquickstarts\u002FGet_started_Veo.ipynb)：开始体验我们的视频生成能力。\r\n*  [Imagen 入门](.\u002Fquickstarts\u002FGet_started_imagen.ipynb) [![Colab](https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002Fgoogle-gemini_cookbook_readme_66b6d5256d10.png)](https:\u002F\u002Fcolab.research.google.com\u002Fgithub\u002Fgoogle-gemini\u002Fcookbook\u002Fblob\u002Fmain\u002Fquickstarts\u002FGet_started_imagen.ipynb) 和 [原生图像生成](.\u002Fquickstarts\u002FGet_Started_Nano_Banana.ipynb) [![Colab](https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002Fgoogle-gemini_cookbook_readme_66b6d5256d10.png)](https:\u002F\u002Fcolab.research.google.com\u002Fgithub\u002Fgoogle-gemini\u002Fcookbook\u002Fblob\u002Fmain\u002Fquickstarts\u002FGet_Started_Nano_Banana.ipynb)：开始使用我们的图像生成能力。\r\n*  [知识增强](.\u002Fquickstarts\u002FGrounding.ipynb) [![Colab](https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002Fgoogle-gemini_cookbook_readme_66b6d5256d10.png)](https:\u002F\u002Fcolab.research.google.com\u002Fgithub\u002Fgoogle-gemini\u002Fcookbook\u002Fblob\u002Fmain\u002Fquickstarts\u002FGrounding.ipynb)：利用 Google 搜索实现有据可依的回答。\r\n*  [代码执行](.\u002Fquickstarts\u002FCode_Execution.ipynb) [![Colab](https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002Fgoogle-gemini_cookbook_readme_66b6d5256d10.png)](https:\u002F\u002Fcolab.research.google.com\u002Fgithub\u002Fgoogle-gemini\u002Fcookbook\u002Fblob\u002Fmain\u002Fquickstarts\u002FCode_Execution.ipynb)：生成并运行 Python 代码来解决复杂任务，甚至输出图表。\r\n*  以及 [更多内容](https:\u002F\u002Fgithub.com\u002Fgoogle-gemini\u002Fcookbook\u002Ftree\u002Fmain\u002Fquickstarts\u002F)。\r\n\u003Cbr>\u003Cbr>\r\n\r\n## 2. 示例（实际应用场景）\r\n\r\n这些示例展示了如何结合 Gemini API 的多项功能或第三方工具，构建更复杂的应用程序。\r\n*  [浏览器作为工具](.\u002Fexamples\u002FBrowser_as_a_tool.ipynb) [![Colab](https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002Fgoogle-gemini_cookbook_readme_66b6d5256d10.png)](https:\u002F\u002Fcolab.research.google.com\u002Fgithub\u002Fgoogle-gemini\u002Fcookbook\u002Fblob\u002Fmain\u002Fexamples\u002FBrowser_as_a_tool.ipynb)：使用网页浏览器进行实时及内网交互。\r\n*  [书籍插画绘制](.\u002Fexamples\u002FBook_illustration.ipynb) [![Colab](https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002Fgoogle-gemini_cookbook_readme_66b6d5256d10.png)](https:\u002F\u002Fcolab.research.google.com\u002Fgithub\u002Fgoogle-gemini\u002Fcookbook\u002Fblob\u002Fmain\u002Fexamples\u002FBook_illustration.ipynb)：利用 Gemini 为开源书籍创作插画。\r\n*  [动画故事生成](.\u002Fexamples\u002FAnimated_Story_Video_Generation_gemini.ipynb) [![Colab](https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002Fgoogle-gemini_cookbook_readme_66b6d5256d10.png)](https:\u002F\u002Fcolab.research.google.com\u002Fgithub\u002Fgoogle-gemini\u002Fcookbook\u002Fblob\u002Fmain\u002Fexamples\u002FAnimated_Story_Video_Generation_gemini.ipynb)：结合 Gemini 的故事生成、Imagen 和音频合成技术，制作动画视频。\r\n*  [实时绘图与地图绘制](.\u002Fexamples\u002FLiveAPI_plotting_and_mapping.ipynb) [![Colab](https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002Fgoogle-gemini_cookbook_readme_66b6d5256d10.png)](https:\u002F\u002Fcolab.research.google.com\u002Fgithub\u002Fgoogle-gemini\u002Fcookbook\u002Fblob\u002Fmain\u002Fexamples\u002FLiveAPI_plotting_and_mapping.ipynb)：将 *Live API* 与 *代码执行* 结合，实时解决复杂任务。\r\n*  [3D 空间理解](.\u002Fexamples\u002FSpatial_understanding_3d.ipynb) [![Colab](https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002Fgoogle-gemini_cookbook_readme_66b6d5256d10.png)](https:\u002F\u002Fcolab.research.google.com\u002Fgithub\u002Fgoogle-gemini\u002Fcookbook\u002Fblob\u002Fmain\u002Fexamples\u002FSpatial_understanding_3d.ipynb)：利用 Gemini 的 *3D 空间理解* 能力来解析 3D 场景。\r\n*  [Gradio 与 Live API](.\u002Fexamples\u002Fgradio_audio.py)：使用 Gradio 部署您自己的 *Live API* 实例。\r\n*  以及 [更多示例](https:\u002F\u002Fgithub.com\u002Fgoogle-gemini\u002Fcookbook\u002Ftree\u002Fmain\u002Fexamples\u002F)。\r\n\u003Cbr>\u003Cbr>\r\n\r\n## 3. 演示（端到端应用）\r\n\r\n这些功能完备的端到端应用展示了 Gemini 在真实场景中的强大能力。\r\n\r\n*   [Gemini CLI](https:\u002F\u002Fgithub.com\u002Fgoogle-gemini\u002Fgemini-cli)：一款开源 AI 助手，可将 Gemini 的强大功能直接引入您的终端。\r\n*   [Gemini API 快速入门](https:\u002F\u002Fgithub.com\u002Fgoogle-gemini\u002Fgemini-api-quickstart)：基于 Python Flask 的应用，集成 Google AI Gemini API，旨在帮助您快速开启基于 Gemini 多模态能力的开发。\r\n*   [多模态 Live API Web 控制台](https:\u002F\u002Fgithub.com\u002Fgoogle-gemini\u002Fmultimodal-live-api-web-console)：基于 React 的入门应用，用于通过 WebSocket 使用多模态 Live API。\r\n*   [全栈 LangGraph 快速入门](https:\u002F\u002Fgithub.com\u002Fgoogle-gemini\u002Fgemini-fullstack-langgraph-quickstart)：一款采用 React 前端和基于 LangGraph 的后端代理的全栈应用。\r\n*   [Google AI Studio 入门小应用](https:\u002F\u002Fgithub.com\u002Fgoogle-gemini\u002Fstarter-applets)：一系列小型应用，演示如何利用 Gemini 打造交互式体验。\r\n\u003Cbr>\u003Cbr>\r\n\r\n\r\n## 官方 SDK\r\n\r\nGemini API 是一种 REST API。您可以直接使用 `curl` 等工具调用它（参见 [REST 示例](https:\u002F\u002Fgithub.com\u002Fgoogle-gemini\u002Fcookbook\u002Ftree\u002Fmain\u002Fquickstarts\u002Frest\u002F) 或优秀的 [Postman 工作区](https:\u002F\u002Fwww.postman.com\u002Fai-on-postman\u002Fgoogle-gemini-apis\u002Foverview)），也可以使用我们的官方 SDK：\r\n* [Python](https:\u002F\u002Fgithub.com\u002Fgoogleapis\u002Fpython-genai)\r\n* [Go](https:\u002F\u002Fgithub.com\u002Fgoogleapis\u002Fgo-genai)\r\n* [Node.js](https:\u002F\u002Fgithub.com\u002Fgoogleapis\u002Fjs-genai)\r\n* [Java](https:\u002F\u002Fgithub.com\u002Fgoogleapis\u002Fjava-genai)\r\n* [C#](https:\u002F\u002Fgithub.com\u002Fgoogleapis\u002Fdotnet-genai\u002F)\r\n\u003Cbr>\u003Cbr>\n\n## 获取帮助\n\n在 [Google AI 开发者论坛](https:\u002F\u002Fdiscuss.ai.google.dev\u002F) 上提问。\n\n## Gemini API 在 Google Cloud Vertex AI 上\n\n对于企业级开发者，Gemini API 也已在 Google Cloud Vertex AI 上提供。有关示例，请参阅 [此仓库](https:\u002F\u002Fgithub.com\u002FGoogleCloudPlatform\u002Fgenerative-ai)。\n\n## 贡献\n\n欢迎贡献！详情请参阅 [CONTRIBUTING.md](CONTRIBUTING.md)。\n\n感谢您使用 Gemini API 进行开发！我们非常期待看到您的作品。","# Gemini API Cookbook 快速上手指南\n\n本指南旨在帮助开发者快速开始使用 Google Gemini API，通过结构化的学习路径掌握核心功能与实战案例。\n\n## 环境准备\n\n在开始之前，请确保满足以下前置条件：\n\n1.  **Google 账号**：拥有一个有效的 Google 账户。\n2.  **API Key**：\n    *   访问 [Google AI Studio](https:\u002F\u002Faistudio.google.com\u002Fapp\u002Fapikey) 创建并获取您的 API Key。\n3.  **运行环境**：\n    *   推荐使用 **Google Colab**（官方教程均提供 Colab 链接，无需本地配置即可运行）。\n    *   若需在本地运行，请安装 Python 3.9+ 及以下依赖库：\n        ```bash\n        pip install google-generativeai\n        ```\n\n## 安装步骤\n\n如果您选择在本地环境中开发，请执行以下命令安装官方 SDK：\n\n```bash\npip install -U google-generativeai\n```\n\n> **提示**：国内开发者若遇到网络连接问题，建议在代码中配置代理或使用支持中转的服务端环境运行。\n\n## 基本使用\n\n以下是使用 Gemini API 进行基础对话的最简示例。\n\n### 1. 初始化客户端\n\n首先导入库并设置您的 API Key：\n\n```python\nimport google.generativeai as genai\n\n# 替换为您的实际 API Key\ngenai.configure(api_key=\"YOUR_API_KEY\")\n```\n\n### 2. 调用模型进行对话\n\n加载模型并发送简单的文本提示：\n\n```python\n# 选择模型版本，例如 gemini-1.5-flash 或 gemini-1.5-pro\nmodel = genai.GenerativeModel('gemini-1.5-flash')\n\n# 生成回复\nresponse = model.generate_content(\"请用中文简要介绍 Gemini API 的主要特点。\")\n\n# 输出结果\nprint(response.text)\n```\n\n### 3. 进阶探索\n\n完成基础测试后，您可以参考官方 Cookbook 中的详细教程深入探索特定功能：\n\n*   **快速入门 (Quick Starts)**：涵盖身份验证、多模态输入（图片\u002F视频）、代码执行、搜索接地（Grounding）等单点功能教程。\n    *   推荐起点：[Get Started](.\u002Fquickstarts\u002FGet_started.ipynb)\n*   **实战案例 (Examples)**：展示如何组合多种功能构建复杂应用，如“浏览器作为工具”、“书籍插图生成”、“动画故事视频生成”等。\n\n所有教程均提供可直接运行的 **Colab** 笔记本链接，点击即可在云端环境中体验最新模型特性（如 Nano-Banana 2 图像生成、Lyria 3 音乐生成、Veo 视频生成等）。","一家初创公司的技术团队正急于利用 Gemini API 最新的 Nano-Banana 2 图像生成和 Lyria 3 音乐创作功能，为即将上线的多媒体营销活动策划原型。\n\n### 没有 cookbook 时\n- 开发者面对官方文档中零散的新功能介绍（如推理层级、多模态输入），不知从何下手，难以快速构建可运行的代码框架。\n- 在尝试组合图像生成与音乐合成时，因缺乏具体的参数配置示例，反复遭遇 API 调用错误，调试过程耗时耗力。\n- 团队无法直观了解如何平衡“速度、成本与可靠性”，导致初期测试阶段预算超支且响应延迟严重。\n- 缺少端到端的完整案例参考，开发人员只能凭猜测拼接功能，最终产出的 Demo 稳定性差，难以向投资人展示核心价值。\n\n### 使用 cookbook 后\n- 团队直接复用\"Quick Starts\"中针对 Nano-Banana 2 和 Lyria 3 的 Colab 笔记本，几分钟内即可跑通包含 512px 图像生成与 30 秒音乐合成的基础流程。\n- 参照\"Examples\"分类下的实战案例，轻松掌握将图像作为音乐生成提示词（Image-to-Music）的高级用法，大幅降低集成难度。\n- 通过\"Inference tiers\"指南，迅速学会配置 Priority 和 Flex 层级，在保证演示流畅度的同时有效控制了测试成本。\n- 基于成熟的端到端 Demo 架构进行二次开发，快速交付出高质量的原型系统，成功获得项目下一轮融资支持。\n\ncookbook 将抽象的 API 文档转化为即插即用的实战代码，让开发者从“摸索语法”转向“专注创新”，极大缩短了从概念验证到产品落地的周期。","https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002Fgoogle-gemini_cookbook_c743f1fb.png","google-gemini","https:\u002F\u002Foss.gittoolsai.com\u002Favatars\u002Fgoogle-gemini_49f2a16f.jpg","Get started building with the Gemini API",null,"googleaidevs","https:\u002F\u002Fai.google.dev\u002Fgemini-api\u002Fdocs","https:\u002F\u002Fgithub.com\u002Fgoogle-gemini",[83,87,91,95],{"name":84,"color":85,"percentage":86},"Jupyter Notebook","#DA5B0B",99.8,{"name":88,"color":89,"percentage":90},"JavaScript","#f1e05a",0.1,{"name":92,"color":93,"percentage":94},"Python","#3572A5",0,{"name":96,"color":97,"percentage":94},"Shell","#89e051",17029,2597,"2026-04-18T06:24:34","Apache-2.0","","未说明",{"notes":105,"python":103,"dependencies":106},"该工具并非本地运行的开源模型代码库，而是 Google Gemini API 的教程和示例集合（Cookbook）。所有示例均以 Jupyter Notebook (.ipynb) 形式提供，并设计为在 Google Colab 云端环境中直接运行。用户无需配置本地 GPU、内存或安装特定依赖库，仅需拥有 Google 账号并在 Google AI Studio 获取 API Key 即可使用。",[],[14],[109,110],"gemini","gemini-api","2026-03-27T02:49:30.150509","2026-04-18T22:35:23.071458",[114,119,124,129,134,138],{"id":115,"question_zh":116,"answer_zh":117,"source_url":118},40714,"如何在启用工具（Tools）的同时使用 JSON 模式（Structured Output）？","原生的 google.generativeai 库在同时设置 response_mime_type=\"application\u002Fjson\" 和 tools 时会报错，因为 API 限制受控生成（JSON 模式）和强制函数调用不能同时以这种方式配置。\n\n解决方案是改用支持该功能的第三方库，例如 PydanticAI。使用 PydanticAI 可以同时实现结构化输出和工具调用。示例代码如下：\n\n```python\nfrom pydantic import BaseModel\nfrom pydantic_ai import Agent\n\nclass MyModel(BaseModel):\n    city: str\n    country: str\n    population: int\n\nagent = Agent(model='google-gla:gemini-2.0-flash', result_type=MyModel)\n# 定义工具并在 agent 中使用\n```\n这样可以绕过原生 SDK 的限制，同时获得结构化数据和工具调用能力。","https:\u002F\u002Fgithub.com\u002Fgoogle-gemini\u002Fcookbook\u002Fissues\u002F393",{"id":120,"question_zh":121,"answer_zh":122,"source_url":123},40715,"模型生成长文本时出现无限重复序列（死循环）怎么办？","这是一个已知的模型质量问题，特别是在使用 gemini-1.5-flash 或 gemini-2.0-flash 生成长文本或进行音频转录时，模型可能会陷入重复同一句话的死循环，直到耗尽 Token 限额。\n\n目前官方没有完美的修复方案，但社区发现以下缓解措施：\n1. 重试机制：大多数情况下，使用相同的输入重新发起请求，问题会消失，输出恢复正常。\n2. 调整参数：尝试调整 temperature 参数（即使设为 0 也可能偶发，但改变参数可能有助于跳出局部最优）。\n3. 避免过长上下文：如果是单轮调用出现此问题，检查输入是否过于复杂；如果是多轮对话，尝试清理记忆（Context）。\n\n由于这是偶发的模型行为而非代码逻辑错误，建议在应用层增加重试逻辑（Retry Logic）来处理此类异常输出。","https:\u002F\u002Fgithub.com\u002Fgoogle-gemini\u002Fcookbook\u002Fissues\u002F220",{"id":125,"question_zh":126,"answer_zh":127,"source_url":128},40716,"使用 Gemini 2.0 Flash 进行结构化输出时，为什么会出现字段缺失或值重复？","在使用 Gemini 2.0 Flash 配合严格的 JSON Schema 进行结构化输出时，可能会遇到生成的 JSON 中某些字段缺失，或者某个字段的值无限重复直到达到 Token 上限的问题。\n\n这通常与 Prompt 的引导方式或 Schema 的复杂性有关。虽然 GPT-4o 在相同条件下表现正常，但 Gemini 对此类约束更敏感。\n\n建议的解决步骤：\n1. 简化 Prompt：确保 Prompt 清晰地指示模型填充所有必填字段，避免歧义。\n2. 检查 Schema：确保 JSON Schema 定义准确，避免过于复杂的嵌套结构。\n3. 增加重试：鉴于这是概率性事件，实施自动重试机制是当前的最佳实践。\n4. 切换模型版本：如果问题频繁发生，尝试切换到其他版本（如 gemini-1.5-pro）看是否有所改善。","https:\u002F\u002Fgithub.com\u002Fgoogle-gemini\u002Fcookbook\u002Fissues\u002F449",{"id":130,"question_zh":131,"answer_zh":132,"source_url":133},40717,"Allstar 报告'Branch Protection'安全策略违规是什么意思？","这意味着您的仓库主分支（main branch）未启用分支保护规则。Allstar 是一个自动化安全合规工具，它会检测并报告此类问题。\n\n具体违规内容是：\"No protection found for branch main\"（未发现主分支的保护措施）。\n\n解决方法：\n1. 前往 GitHub 仓库的 Settings（设置）页面。\n2. 点击左侧菜单的 Branches（分支）。\n3. 点击 \"Add branch protection rule\"（添加分支保护规则）。\n4. 在 Branch name pattern 中输入 \"main\"。\n5. 勾选必要的保护选项，例如 \"Require a pull request before merging\"（合并前需要拉取请求）或 \"Require status checks to pass before merging\"（合并前状态检查必须通过）。\n6. 保存规则后，Allstar 会在下一个检测周期自动关闭该 Issue。","https:\u002F\u002Fgithub.com\u002Fgoogle-gemini\u002Fcookbook\u002Fissues\u002F898",{"id":135,"question_zh":136,"answer_zh":137,"source_url":123},40718,"在 Vertex AI 上使用 Gemini 模型进行音频转录时遇到重复输出问题如何解决？","在 Vertex AI 上调用 Gemini 2.5 Flash 等模型进行音频转录时，约有 2%-5% 的概率会出现模型输出重复片段直到超时的问题。\n\n根据用户反馈，这不是代码实现错误，而是模型本身的偶发性缺陷。有效的应对策略包括：\n1. 实施客户端重试逻辑：捕获到重复输出或异常终止时，自动重新发送相同的转录请求。实测表明，重试通常能生成正确的结果。\n2. 监控输出长度：如果在短时间内输出了大量重复文本，主动中断请求并重试，以节省 Token 成本。\n3. 无需更改代码架构：该问题与是否使用 LangChain 或直接调用 API 无关，重点在于应用层的容错处理。",{"id":139,"question_zh":140,"answer_zh":141,"source_url":118},40719,"有没有办法在原生的 Google Generative AI SDK 中同时使用工具调用和 JSON 响应格式？","截至目前，原生的 google.generativeai SDK 尚不支持在同一个请求中同时开启 `response_mime_type=\"application\u002Fjson\"` 和 `tools` 功能。强行组合会抛出 `InvalidArgument` 错误，提示对于强制函数调用，不应设置 response_mime_type。\n\n目前的替代方案有：\n1. 使用 PydanticAI 库：这是一个封装良好的第三方库，专门解决了这个问题，允许你定义 Pydantic 模型作为输出结构，同时注册工具函数。\n2. 手动解析：如果不使用第三方库，只能选择其一。通常建议让模型自由输出（包含工具调用），然后在代码中解析模型返回的工具调用参数，如果需要结构化数据，可以在工具返回后让模型再进行一次总结生成 JSON，但这会增加延迟和成本。",[]]