[{"data":1,"prerenderedAt":-1},["ShallowReactive",2],{"similar-google-gemini--nano-banana-hackathon-kit":3,"tool-google-gemini--nano-banana-hackathon-kit":62},[4,18,26,35,44,53],{"id":5,"name":6,"github_repo":7,"description_zh":8,"stars":9,"difficulty_score":10,"last_commit_at":11,"category_tags":12,"status":17},4358,"openclaw","openclaw\u002Fopenclaw","OpenClaw 是一款专为个人打造的本地化 AI 助手，旨在让你在自己的设备上拥有完全可控的智能伙伴。它打破了传统 AI 助手局限于特定网页或应用的束缚，能够直接接入你日常使用的各类通讯渠道，包括微信、WhatsApp、Telegram、Discord、iMessage 等数十种平台。无论你在哪个聊天软件中发送消息，OpenClaw 都能即时响应，甚至支持在 macOS、iOS 和 Android 设备上进行语音交互，并提供实时的画布渲染功能供你操控。\n\n这款工具主要解决了用户对数据隐私、响应速度以及“始终在线”体验的需求。通过将 AI 部署在本地，用户无需依赖云端服务即可享受快速、私密的智能辅助，真正实现了“你的数据，你做主”。其独特的技术亮点在于强大的网关架构，将控制平面与核心助手分离，确保跨平台通信的流畅性与扩展性。\n\nOpenClaw 非常适合希望构建个性化工作流的技术爱好者、开发者，以及注重隐私保护且不愿被单一生态绑定的普通用户。只要具备基础的终端操作能力（支持 macOS、Linux 及 Windows WSL2），即可通过简单的命令行引导完成部署。如果你渴望拥有一个懂你",349277,3,"2026-04-06T06:32:30",[13,14,15,16],"Agent","开发框架","图像","数据工具","ready",{"id":19,"name":20,"github_repo":21,"description_zh":22,"stars":23,"difficulty_score":10,"last_commit_at":24,"category_tags":25,"status":17},3808,"stable-diffusion-webui","AUTOMATIC1111\u002Fstable-diffusion-webui","stable-diffusion-webui 是一个基于 Gradio 构建的网页版操作界面，旨在让用户能够轻松地在本地运行和使用强大的 Stable Diffusion 图像生成模型。它解决了原始模型依赖命令行、操作门槛高且功能分散的痛点，将复杂的 AI 绘图流程整合进一个直观易用的图形化平台。\n\n无论是希望快速上手的普通创作者、需要精细控制画面细节的设计师，还是想要深入探索模型潜力的开发者与研究人员，都能从中获益。其核心亮点在于极高的功能丰富度：不仅支持文生图、图生图、局部重绘（Inpainting）和外绘（Outpainting）等基础模式，还独创了注意力机制调整、提示词矩阵、负向提示词以及“高清修复”等高级功能。此外，它内置了 GFPGAN 和 CodeFormer 等人脸修复工具，支持多种神经网络放大算法，并允许用户通过插件系统无限扩展能力。即使是显存有限的设备，stable-diffusion-webui 也提供了相应的优化选项，让高质量的 AI 艺术创作变得触手可及。",162132,"2026-04-05T11:01:52",[14,15,13],{"id":27,"name":28,"github_repo":29,"description_zh":30,"stars":31,"difficulty_score":32,"last_commit_at":33,"category_tags":34,"status":17},2271,"ComfyUI","Comfy-Org\u002FComfyUI","ComfyUI 是一款功能强大且高度模块化的视觉 AI 引擎，专为设计和执行复杂的 Stable Diffusion 图像生成流程而打造。它摒弃了传统的代码编写模式，采用直观的节点式流程图界面，让用户通过连接不同的功能模块即可构建个性化的生成管线。\n\n这一设计巧妙解决了高级 AI 绘图工作流配置复杂、灵活性不足的痛点。用户无需具备编程背景，也能自由组合模型、调整参数并实时预览效果，轻松实现从基础文生图到多步骤高清修复等各类复杂任务。ComfyUI 拥有极佳的兼容性，不仅支持 Windows、macOS 和 Linux 全平台，还广泛适配 NVIDIA、AMD、Intel 及苹果 Silicon 等多种硬件架构，并率先支持 SDXL、Flux、SD3 等前沿模型。\n\n无论是希望深入探索算法潜力的研究人员和开发者，还是追求极致创作自由度的设计师与资深 AI 绘画爱好者，ComfyUI 都能提供强大的支持。其独特的模块化架构允许社区不断扩展新功能，使其成为当前最灵活、生态最丰富的开源扩散模型工具之一，帮助用户将创意高效转化为现实。",108322,2,"2026-04-10T11:39:34",[14,15,13],{"id":36,"name":37,"github_repo":38,"description_zh":39,"stars":40,"difficulty_score":32,"last_commit_at":41,"category_tags":42,"status":17},6121,"gemini-cli","google-gemini\u002Fgemini-cli","gemini-cli 是一款由谷歌推出的开源 AI 命令行工具，它将强大的 Gemini 大模型能力直接集成到用户的终端环境中。对于习惯在命令行工作的开发者而言，它提供了一条从输入提示词到获取模型响应的最短路径，无需切换窗口即可享受智能辅助。\n\n这款工具主要解决了开发过程中频繁上下文切换的痛点，让用户能在熟悉的终端界面内直接完成代码理解、生成、调试以及自动化运维任务。无论是查询大型代码库、根据草图生成应用，还是执行复杂的 Git 操作，gemini-cli 都能通过自然语言指令高效处理。\n\n它特别适合广大软件工程师、DevOps 人员及技术研究人员使用。其核心亮点包括支持高达 100 万 token 的超长上下文窗口，具备出色的逻辑推理能力；内置 Google 搜索、文件操作及 Shell 命令执行等实用工具；更独特的是，它支持 MCP（模型上下文协议），允许用户灵活扩展自定义集成，连接如图像生成等外部能力。此外，个人谷歌账号即可享受免费的额度支持，且项目基于 Apache 2.0 协议完全开源，是提升终端工作效率的理想助手。",100752,"2026-04-10T01:20:03",[43,13,15,14],"插件",{"id":45,"name":46,"github_repo":47,"description_zh":48,"stars":49,"difficulty_score":10,"last_commit_at":50,"category_tags":51,"status":17},4487,"LLMs-from-scratch","rasbt\u002FLLMs-from-scratch","LLMs-from-scratch 是一个基于 PyTorch 的开源教育项目，旨在引导用户从零开始一步步构建一个类似 ChatGPT 的大型语言模型（LLM）。它不仅是同名技术著作的官方代码库，更提供了一套完整的实践方案，涵盖模型开发、预训练及微调的全过程。\n\n该项目主要解决了大模型领域“黑盒化”的学习痛点。许多开发者虽能调用现成模型，却难以深入理解其内部架构与训练机制。通过亲手编写每一行核心代码，用户能够透彻掌握 Transformer 架构、注意力机制等关键原理，从而真正理解大模型是如何“思考”的。此外，项目还包含了加载大型预训练权重进行微调的代码，帮助用户将理论知识延伸至实际应用。\n\nLLMs-from-scratch 特别适合希望深入底层原理的 AI 开发者、研究人员以及计算机专业的学生。对于不满足于仅使用 API，而是渴望探究模型构建细节的技术人员而言，这是极佳的学习资源。其独特的技术亮点在于“循序渐进”的教学设计：将复杂的系统工程拆解为清晰的步骤，配合详细的图表与示例，让构建一个虽小但功能完备的大模型变得触手可及。无论你是想夯实理论基础，还是为未来研发更大规模的模型做准备",90106,"2026-04-06T11:19:32",[52,15,13,14],"语言模型",{"id":54,"name":55,"github_repo":56,"description_zh":57,"stars":58,"difficulty_score":10,"last_commit_at":59,"category_tags":60,"status":17},4292,"Deep-Live-Cam","hacksider\u002FDeep-Live-Cam","Deep-Live-Cam 是一款专注于实时换脸与视频生成的开源工具，用户仅需一张静态照片，即可通过“一键操作”实现摄像头画面的即时变脸或制作深度伪造视频。它有效解决了传统换脸技术流程繁琐、对硬件配置要求极高以及难以实时预览的痛点，让高质量的数字内容创作变得触手可及。\n\n这款工具不仅适合开发者和技术研究人员探索算法边界，更因其极简的操作逻辑（仅需三步：选脸、选摄像头、启动），广泛适用于普通用户、内容创作者、设计师及直播主播。无论是为了动画角色定制、服装展示模特替换，还是制作趣味短视频和直播互动，Deep-Live-Cam 都能提供流畅的支持。\n\n其核心技术亮点在于强大的实时处理能力，支持口型遮罩（Mouth Mask）以保留使用者原始的嘴部动作，确保表情自然精准；同时具备“人脸映射”功能，可同时对画面中的多个主体应用不同面孔。此外，项目内置了严格的内容安全过滤机制，自动拦截涉及裸露、暴力等不当素材，并倡导用户在获得授权及明确标注的前提下合规使用，体现了技术发展与伦理责任的平衡。",88924,"2026-04-06T03:28:53",[14,15,13,61],"视频",{"id":63,"github_repo":64,"name":65,"description_en":66,"description_zh":67,"ai_summary_zh":68,"readme_en":69,"readme_zh":70,"quickstart_zh":71,"use_case_zh":72,"hero_image_url":73,"owner_login":74,"owner_name":74,"owner_avatar_url":75,"owner_bio":76,"owner_company":77,"owner_location":77,"owner_email":77,"owner_twitter":78,"owner_website":79,"owner_url":80,"languages":81,"stars":86,"forks":87,"last_commit_at":88,"license":89,"difficulty_score":90,"env_os":91,"env_gpu":92,"env_ram":92,"env_deps":93,"category_tags":99,"github_topics":77,"view_count":32,"oss_zip_url":77,"oss_zip_packed_at":77,"status":17,"created_at":101,"updated_at":102,"faqs":103,"releases":104},7036,"google-gemini\u002Fnano-banana-hackathon-kit","nano-banana-hackathon-kit","🍌 The official starter kit for the Nano Banana Hackathon. Clone this repo to get building fast!","nano-banana-hackathon-kit 是谷歌 DeepMind 为\"Nano Banana 48 小时挑战赛”官方推出的开发者启动套件，旨在帮助创作者快速上手并构建基于最新图像模型的应用。它主要解决了开发者在接触前沿 AI 图像技术时面临的配置繁琐、缺乏示例代码和文档指引等痛点，提供了一站式的资源中心。\n\n这套工具特别适合开发者、创意工程师以及对生成式 AI 感兴趣的技术爱好者使用。通过克隆仓库，用户可立即获取 Python 和 JavaScript 的代码示例、详细的 API 密钥获取指南以及进阶的“食谱”教程，从而在极短时间内完成从环境搭建到项目提交的全流程。\n\n其核心亮点在于集成了 Gemini 2.5 Flash Image Preview（代号 Nano Banana）模型的独家访问权限。该模型不仅支持基础的文本生成图像，更擅长动态内容创作，如保持角色一致性的漫画生成、电商场景中的虚拟物品摆放、以及基于自然语言的精准图片编辑。借助 nano-banana-hackathon-kit，创作者能够充分利用模型对世界的独特认知能力，打破传统视觉交互的限制，探索以往难以","nano-banana-hackathon-kit 是谷歌 DeepMind 为\"Nano Banana 48 小时挑战赛”官方推出的开发者启动套件，旨在帮助创作者快速上手并构建基于最新图像模型的应用。它主要解决了开发者在接触前沿 AI 图像技术时面临的配置繁琐、缺乏示例代码和文档指引等痛点，提供了一站式的资源中心。\n\n这套工具特别适合开发者、创意工程师以及对生成式 AI 感兴趣的技术爱好者使用。通过克隆仓库，用户可立即获取 Python 和 JavaScript 的代码示例、详细的 API 密钥获取指南以及进阶的“食谱”教程，从而在极短时间内完成从环境搭建到项目提交的全流程。\n\n其核心亮点在于集成了 Gemini 2.5 Flash Image Preview（代号 Nano Banana）模型的独家访问权限。该模型不仅支持基础的文本生成图像，更擅长动态内容创作，如保持角色一致性的漫画生成、电商场景中的虚拟物品摆放、以及基于自然语言的精准图片编辑。借助 nano-banana-hackathon-kit，创作者能够充分利用模型对世界的独特认知能力，打破传统视觉交互的限制，探索以往难以实现的创意应用。","\n\u003Cp align=\"center\">\n  \u003Cimg src=\"https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002Fgoogle-gemini_nano-banana-hackathon-kit_readme_0a84230636dd.png\" alt=\"Nano Banana Hackathon Banner\" width=\"600\"\u002F>\n\u003C\u002Fp>\n\nWelcome, hackers! This repository is the official starter kit and resource hub for the [**Nano Banana 48 Hour Challenge**](https:\u002F\u002Fwww.kaggle.com\u002Fcompetitions\u002Fbanana), hosted by **Google DeepMind**. Everything you need to get started, build something incredible, and submit your project is right here.\n\n**Go Bananas!** For 48 hours, starting on September 6, 2025, we are unlocking a special 48-hour free tier of the Gemini API, putting Gemini 2.5 Flash Image Preview (aka Nano Banana), our state-of-the-art image model, into your hands. In collaboration with Fal and ElevenLabs, we're giving over $400,000 of prizes! We're looking forward to seeing what you build in the next two days!\n\nNano Banana is about dynamic creation. Edit with words, blend realities, and access Gemini's unique world knowledge. We challenge you to unleash this power. Show us an application that transforms how we interact with visuals and deliver something that wasn't possible before.\n\n### Quick Navigation\n\n- [🚀 Get Started in 3 Steps](#-get-started-in-3-steps)\n- [🎯 The Challenge](#-the-challenge)\n- [🛠️ Technical Resources](#️-technical-resources)\n- [🏆 Submission \\& Judging](#-submission--judging)\n- [🗓️ Timeline \\& Prizes](#️-timeline--prizes)\n- [💬 Getting Help \\& Discussion](#-getting-help--discussion)\n\n## 🚀 Get Started in 3 Steps\n\n1.  **Get Your Free API Key**\n    *   Follow the **[API Key Guide](.\u002Fguides\u002F01-getting-your-api-key.ipynb)** to create your API key to access Nano Banana on the Gemini API. \n\n2.  **Explore the Resources**\n    *   Clone this repository to access code examples and check out the external links for inspiration and documentation.\n\n3.  **Submit Your Project on Kaggle**\n    *   When you're ready, head over to the **[Official Kaggle Competition Page](https:\u002F\u002Fwww.kaggle.com\u002Fcompetitions\u002Fbanana)** to submit your project before the deadline.\n\n## 🎯 The Challenge\n\nYour mission is to build a product, application, or demo that showcases one or more of these core strengths. Think beyond simple text-to-image. How can these advanced features create a magical user experience?\n\nConsider applications that:\n\n*   Enhance dynamic storytelling (e.g., consistent character comics).\n*   Revolutionize e-commerce (e.g., virtual room placement or product visualization).\n*   Automate creative workflows (e.g., personalized marketing assets at scale).\n*   Build the next generation of natural language photo editors.\n\n## 🛠️ Technical Resources\n\n*   **[START HERE: Getting Your API Key](.\u002Fguides\u002F01-getting-your-api-key.ipynb)**: Step-by-step instructions to get your free Gemini API key and generate a first image with nano banana using Python.\n    *   **[Use Nano banana](.\u002Fguides\u002F02-use-nano-banana.ipynb)**: Learn of the different ways to use nano banana, to generate and edit images.   \n*   **[`examples\u002F`](.\u002Fexamples\u002F)**: Self-contained code snippets demonstrating specific features of the Gemini API.\n    *  [JavaScript Getting Started](.\u002Fexamples\u002Fjavascript-getting-started.md)\n*   🌐 **Official Nano Banana Gemini API Docs**: https:\u002F\u002Fai.google.dev\u002Fgemini-api\u002Fdocs\u002Fimage-generation\n*   ✍️ **Prompting Guide & Strategies**: https:\u002F\u002Fai.google.dev\u002Fgemini-api\u002Fdocs\u002Fimage-generation#prompt-guide\n*   🍳 **Cookbooks (Advanced Recipes)**:\n    *   **Python**: [Quickstart with Image understanding (Colab)](https:\u002F\u002Fcolab.research.google.com\u002Fgithub\u002Fgoogle-gemini\u002Fcookbook\u002Fblob\u002Fmain\u002Fquickstarts\u002FImage_out.ipynb)\n    *   **JavaScript**: [Get Started with Image understanding (AI Studio)](https:\u002F\u002Faistudio.google.com\u002Fapps\u002Fbundled\u002Fget_started_image_out)\n*   ✨ **Inspirational Applets**: See what's possible with these interactive demos.\n    *   [GemBooth](https:\u002F\u002Faistudio.google.com\u002Fapps\u002Fbundled\u002Fgembooth)\n    *   [Home Canvas](https:\u002F\u002Faistudio.google.com\u002Fapps\u002Fbundled\u002Fhome_canvas)\n    *   [Past Forward](https:\u002F\u002Faistudio.google.com\u002Fapps\u002Fbundled\u002Fpast_forward)\n    *   [PixShop](https:\u002F\u002Faistudio.google.com\u002Fapps\u002Fbundled\u002Fpixshop)\n\n### Partner Resources 🤝\n\nExplore the tools and platforms from our partners to enhance your project.\n\n#### ElevenLabs\n\n*   [Get started with the ElevenLabs API](https:\u002F\u002Felevenlabs.io\u002Fdocs\u002Fquickstart)\n*   [Get started with ElevenLabs Agents](https:\u002F\u002Felevenlabs.io\u002Fdocs\u002Fagents-platform\u002Foverview)\n*   [Show us your projects](https:\u002F\u002Fshowcase.elevenlabs.io\u002F)\n*   [Follow for updates on X](https:\u002F\u002Fx.com\u002FElevenLabsDevs)\n*   [Watch on YouTube](https:\u002F\u002Fwww.youtube.com\u002F@elevenlabsio)\n\n#### fal.ai\n\n*   Create an account at [fal.ai](https:\u002F\u002Ffal.ai\u002F?utm_source=chatgpt.com)\n*   Generate your API [Keys](https:\u002F\u002Ffal.ai\u002Fdashboard\u002Fkeys) after logging in\n*   Start building: JavaScript and Python snippets can be found [here](https:\u002F\u002Fdocs.fal.ai\u002Fmodel-apis\u002Fquickstart?utm_source=chatgpt.com)\n\n\n\n## 🏆 Submission & Judging\n\nYour project will be judged primarily on your video demo. Show, don't just tell! We want to see the \"wow\" factor, the utility of your application, and the technical skill behind it.\n\n### How to Submit\nAll submissions must be made through the official competition page:\n> **[https:\u002F\u002Fwww.kaggle.com\u002Fcompetitions\u002Fbanana](https:\u002F\u002Fwww.kaggle.com\u002Fcompetitions\u002Fbanana)**\n\n### Submission Requirements\nYour complete Kaggle submission must include:\n\n1.  **🎥 The Video Demo (2 minutes or less)**\n    *   An engaging video demonstrating your project. It must be posted publicly (e.g., YouTube, X\u002FTwitter) and viewable without a login.\n\n2.  **🔗 Public Project Link**\n    *   A URL to your working product or interactive demo. If a live demo isn't feasible, a link to your public code repository (e.g., GitHub) with clear setup instructions is required.\n\n3.  **✍️ Gemini Integration Write-up (max 200 words)**\n    *   A brief description detailing which Gemini 2.5 Flash Image features you used and how they are central to your application.\n\n### Judging Criteria\n*   💡 **Innovation and \"Wow\" Factor (40%)**: How creative and novel is the application? Does it leverage Gemini 2.5 Flash Image in a way that wasn't previously possible?\n*   ⚙️ **Technical Execution and Functionality (30%)**: Does the application work? How effectively does it utilize the API's advanced features (consistency, fusion, editing)?\n*   📈 **Potential Impact and Utility (20%)**: Does the application solve a real-world problem (creative, commercial, or educational)?\n*   🎬 **Presentation Quality (10%)**: Clarity, storytelling, and engagement of the video demo.\n\nFor the Special Technology Prize, these same criteria will be applied with a focus on how that specific technology (ElevenLabs) was pivotal in achieving the project's impact and technical excellence.\n\n\n## 🗓️ Timeline & Prizes\n\n### 💰 Prizes\nCompete for your share of over **$400,000 in prizes**!\n\n**Overall Track**\n*   **Top 50 Submissions**: $5,000 in Gemini API Credits each + $1,000 in Fal credits, and 11 million (approx. US $2,000) ElevenLabs Credits.\n\n**Special Technology Prize - ElevenLabs**\n*   **Winner**: 22M ElevenLabs Credits (6 months of Scale, Approx value: $4,000)\n\n### ⏳ Key Dates\n*   **Competition Starts**: September 6, 2025 (12:01am UTC, September 5, 2025 5:00 PM PT)\n*   **Final Submission Deadline**: September 7, 2025 (4:59 PM UTC, 11:59 PM PT)\n*   **Judging Period**: September 8 - 17, 2025\n*   **Winners Announced**: September 19, 2025 (Estimated)\n\n*Time required to evaluate results is dependent on the number of submissions. All deadlines are at 11:59 PM UTC on the corresponding day unless otherwise noted. The organizers reserve the right to update the timeline.*\n\n## Notes About API Usage\n\nPlease note the special tier for the Gemini API (for all API users) - will allow **500 requests per project per day.** \n\nDevelopers using a paid API key will pay for all of their usage. To get the free 500 generations, please use a free tier API key.\n\n## 💬 Getting Help & Discussion\n\nAll questions, team formation, and discussions will take place on the Kaggle platform. This is the best place to get help from organizers, mentors, and the community.\n\n*   **Ask a question:** Post your technical or general questions for the community and organizers.\n*   **Find teammates:** Create a post to look for collaborators.\n*   **Share your ideas:** Discuss your project concepts and get feedback.\n\n> **[Go to the Official Kaggle Discussion Forum](https:\u002F\u002Fwww.kaggle.com\u002Fcompetitions\u002Fbanana\u002Fdiscussion)**\n\nHappy Hacking!\n","\u003Cp align=\"center\">\n  \u003Cimg src=\"https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002Fgoogle-gemini_nano-banana-hackathon-kit_readme_0a84230636dd.png\" alt=\"纳米香蕉黑客马拉松横幅\" width=\"600\"\u002F>\n\u003C\u002Fp>\n\n欢迎各位黑客！本仓库是 **Google DeepMind** 主办的 [**纳米香蕉48小时挑战赛**](https:\u002F\u002Fwww.kaggle.com\u002Fcompetitions\u002Fbanana) 的官方入门工具包与资源中心。你开始、打造精彩项目并提交所需的一切，都在这里。\n\n**一起玩转香蕉吧！** 从2025年9月6日起的48小时内，我们将开放 Gemini API 的特别48小时免费层级，把我们最先进的图像模型——Gemini 2.5 Flash Image Preview（又名“纳米香蕉”）——交到你手中。同时，我们还联合 Fal 和 ElevenLabs 提供超过40万美元的奖金！我们非常期待在接下来的两天里看到你的作品！\n\n“纳米香蕉”的核心在于动态创作：用文字编辑、融合现实，并利用 Gemini 独特的世界知识。我们诚邀你释放这一强大能力，向我们展示一款能够改变我们与视觉内容交互方式、实现前所未有效果的应用。\n\n### 快速导航\n\n- [🚀 三步快速入门](#-get-started-in-3-steps)\n- [🎯 挑战赛简介](#-the-challenge)\n- [🛠️ 技术资源](#️-technical-resources)\n- [🏆 提交与评审](#-submission--judging)\n- [🗓️ 时间线与奖项](#️-timeline--prizes)\n- [💬 帮助与讨论](#-getting-help--discussion)\n\n## 🚀 三步快速入门\n\n1.  **获取免费 API 密钥**\n    *   按照 **[API 密钥指南](.\u002Fguides\u002F01-getting-your-api-key.ipynb)** 创建你的 API 密钥，以访问 Gemini API 上的“纳米香蕉”。\n\n2.  **探索资源**\n    *   克隆此仓库以获取代码示例，并查看外部链接以获得灵感和文档支持。\n\n3.  **在 Kaggle 上提交项目**\n    *   准备就绪后，请前往 **[官方 Kaggle 比赛页面](https:\u002F\u002Fwww.kaggle.com\u002Fcompetitions\u002Fbanana)** 在截止日期前提交你的项目。\n\n## 🎯 挑战赛简介\n\n你的任务是构建一个产品、应用或演示，充分展现以下一项或多项核心优势。请跳出简单的文本生成图像的思维模式，思考这些高级功能如何创造出令人惊叹的用户体验？\n\n可以考虑以下应用场景：\n\n*   增强动态叙事（例如连贯角色的漫画创作）。\n*   革新电子商务（例如虚拟房间摆放或产品可视化）。\n*   自动化创意工作流（例如大规模个性化营销素材）。\n*   打造下一代自然语言照片编辑器。\n\n## 🛠️ 技术资源\n\n*   **[从这里开始：获取 API 密钥](.\u002Fguides\u002F01-getting-your-api-key.ipynb)**：分步指导你获取免费的 Gemini API 密钥，并使用 Python 生成第一张“纳米香蕉”图像。\n    *   **[使用纳米香蕉](.\u002Fguides\u002F02-use-nano-banana.ipynb)**：学习如何运用“纳米香蕉”生成和编辑图像的不同方法。\n*   **[`examples\u002F`](.\u002Fexamples\u002F)**：包含独立的代码片段，演示 Gemini API 的特定功能。\n    *  [JavaScript 入门](.\u002Fexamples\u002Fjavascript-getting-started.md)\n*   🌐 **官方“纳米香蕉”Gemini API 文档**：https:\u002F\u002Fai.google.dev\u002Fgemini-api\u002Fdocs\u002Fimage-generation\n*   ✍️ **提示指南与策略**：https:\u002F\u002Fai.google.dev\u002Fgemini-api\u002Fdocs\u002Fimage-generation#prompt-guide\n*   🍳 **进阶教程（高级用法）**：\n    *   **Python**：[图像理解快速入门（Colab）](https:\u002F\u002Fcolab.research.google.com\u002Fgithub\u002Fgoogle-gemini\u002Fcookbook\u002Fblob\u002Fmain\u002Fquickstarts\u002FImage_out.ipynb)\n    *   **JavaScript**：[图像理解入门（AI Studio）](https:\u002F\u002Faistudio.google.com\u002Fapps\u002Fbundled\u002Fget_started_image_out)\n*   ✨ **灵感应用小工具**：通过这些互动式演示，了解“纳米香蕉”的无限可能。\n    *   [GemBooth](https:\u002F\u002Faistudio.google.com\u002Fapps\u002Fbundled\u002Fgembooth)\n    *   [Home Canvas](https:\u002F\u002Faistudio.google.com\u002Fapps\u002Fbundled\u002Fhome_canvas)\n    *   [Past Forward](https:\u002F\u002Faistudio.google.com\u002Fapps\u002Fbundled\u002Fpast_forward)\n    *   [PixShop](https:\u002F\u002Faistudio.google.com\u002Fapps\u002Fbundled\u002Fpixshop)\n\n### 合作伙伴资源 🤝\n\n探索我们的合作伙伴提供的工具和平台，以进一步提升你的项目。\n\n#### ElevenLabs\n\n*   [开始使用 ElevenLabs API](https:\u002F\u002Felevenlabs.io\u002Fdocs\u002Fquickstart)\n*   [开始使用 ElevenLabs Agents](https:\u002F\u002Felevenlabs.io\u002Fdocs\u002Fagents-platform\u002Foverview)\n*   [展示你的作品](https:\u002F\u002Fshowcase.elevenlabs.io\u002F)\n*   [在 X 上关注最新动态](https:\u002F\u002Fx.com\u002FElevenLabsDevs)\n*   [观看 YouTube 视频](https:\u002F\u002Fwww.youtube.com\u002F@elevenlabsio)\n\n#### fal.ai\n\n*   在 [fal.ai](https:\u002F\u002Ffal.ai\u002F?utm_source=chatgpt.com) 创建账户\n*   登录后生成你的 API [密钥](https:\u002F\u002Ffal.ai\u002Fdashboard\u002Fkeys)\n*   开始构建：可在 [此处](https:\u002F\u002Fdocs.fal.ai\u002Fmodel-apis\u002Fquickstart?utm_source=chatgpt.com) 找到 JavaScript 和 Python 示例代码\n\n\n\n## 🏆 提交与评审\n\n你的项目将主要根据视频演示进行评判。用行动证明一切！我们希望看到你的作品带来的震撼效果、实际用途以及背后的技术实力。\n\n### 提交方式\n所有提交必须通过官方比赛页面完成：\n> **[https:\u002F\u002Fwww.kaggle.com\u002Fcompetitions\u002Fbanana](https:\u002F\u002Fwww.kaggle.com\u002Fcompetitions\u002Fbanana)**\n\n### 提交要求\n完整的 Kaggle 提交需包括以下内容：\n\n1.  **🎥 视频演示（不超过2分钟）**\n    *   一段生动有趣的视频，展示你的项目成果。视频必须公开发布（如 YouTube 或 X\u002FTwitter），且无需登录即可观看。\n\n2.  **🔗 公开项目链接**\n    *   一个指向你正在运行的产品或交互式演示的 URL。如果无法提供实时演示，则需要提供一个带有清晰部署说明的公共代码仓库链接（如 GitHub）。\n\n3.  **✍️ Gemini 集成说明（最多200字）**\n    *   简要描述你使用了 Gemini 2.5 Flash Image 的哪些功能，以及这些功能如何成为你应用的核心。\n\n### 评审标准\n*   💡 **创新性与震撼力（40%）**：应用是否具有创造性和新颖性？它是否以一种前所未有的方式利用了 Gemini 2.5 Flash Image？\n*   ⚙️ **技术实现与功能性（30%）**：应用是否正常运行？它是否有效地利用了 API 的高级特性（一致性、融合、编辑等）？\n*   📈 **潜在影响与实用性（20%）**：应用是否解决了现实世界中的问题（创意、商业或教育方面）？\n*   🎬 **呈现质量（10%）**：视频演示的清晰度、叙事能力和吸引力。\n\n对于特别技术奖，将采用相同的评审标准，但会重点关注特定技术（ElevenLabs）如何在实现项目影响力和技术卓越性方面起到关键作用。\n\n\n## 🗓️ 时间线与奖项\n\n### 💰 奖项\n争夺总额超过 **40万美元的奖金**！\n\n**综合赛道**\n*   **前50名参赛作品**：每份可获得5,000美元的Gemini API积分及1,000美元的Fal积分，此外还有1,100万（约合2,000美元）的ElevenLabs积分。\n\n**特别技术奖——ElevenLabs**\n*   **冠军**：2,200万ElevenLabs积分（6个月Scale套餐，估值约4,000美元）\n\n### ⏳ 重要日期\n*   **比赛开始**：2025年9月6日（UTC时间9月5日午夜00:01，太平洋时间下午5:00）\n*   **最终提交截止**：2025年9月7日（UTC时间下午4:59，太平洋时间晚上11:59）\n*   **评审阶段**：2025年9月8日至17日\n*   **公布获奖名单**：2025年9月19日（预计）\n\n*评审所需时间取决于参赛作品的数量。除非另有说明，所有截止时间均为对应日期的UTC晚上11:59。主办方保留调整时间安排的权利。*\n\n## 关于API使用须知\n\n请注意，Gemini API设有特别层级（适用于所有API用户），每日每个项目允许 **500次请求**。\n\n使用付费API密钥的开发者需自行支付全部使用费用。如需享受免费的500次生成额度，请使用免费层级的API密钥。\n\n## 💬 寻求帮助与讨论\n所有问题、组队及讨论均将在Kaggle平台上进行。这里是向主办方、导师及社区寻求帮助的最佳场所。\n\n*   **提问**：发布您的技术或一般性问题，供社区和主办方解答。\n*   **寻找队友**：发布帖子寻找合作伙伴。\n*   **分享创意**：讨论您的项目构想并获取反馈。\n\n> **[前往官方Kaggle讨论区](https:\u002F\u002Fwww.kaggle.com\u002Fcompetitions\u002Fbanana\u002Fdiscussion)**\n\n祝您编码愉快！","# Nano Banana Hackathon Kit 快速上手指南\n\n本指南旨在帮助开发者快速接入 Google DeepMind 推出的 **Nano Banana** (Gemini 2.5 Flash Image Preview) 模型，参与 48 小时挑战赛。\n\n## 环境准备\n\n在开始之前，请确保您的开发环境满足以下要求：\n\n*   **操作系统**：Windows, macOS 或 Linux。\n*   **Python 版本**：推荐 Python 3.10 或更高版本。\n*   **前置依赖**：\n    *   `pip` (Python 包管理工具)\n    *   Git (用于克隆代码库)\n    *   Google Cloud 账号 (用于获取 API Key)\n*   **网络环境**：由于涉及 Google API 调用，请确保您的网络环境可以正常访问 `ai.google.dev` 及相关服务。\n\n## 安装步骤\n\n### 1. 克隆项目仓库\n首先，将官方提供的 starter kit 克隆到本地，以获取示例代码和详细文档。\n\n```bash\ngit clone https:\u002F\u002Fgithub.com\u002Fgoogle-gemini\u002Fnano-banana-hackathon-kit.git\ncd nano-banana-hackathon-kit\n```\n\n### 2. 创建虚拟环境并安装依赖\n建议创建独立的虚拟环境以避免依赖冲突。\n\n```bash\npython -m venv venv\nsource venv\u002Fbin\u002Factivate  # Windows 用户请使用: venv\\Scripts\\activate\npip install -r requirements.txt\n```\n*(注：如果根目录没有 `requirements.txt`，请至少安装核心库)*\n```bash\npip install google-generativeai\n```\n\n### 3. 获取 API Key\n本项目核心依赖于 Gemini API。请按照仓库内提供的指南获取免费的 API Key：\n\n1.  运行或查看指南笔记：`.\u002Fguides\u002F01-getting-your-api-key.ipynb`\n2.  访问 Google AI Studio 或 Kaggle 竞赛页面申请 **Nano Banana** 专用免费额度。\n3.  将获取的 Key 设置为环境变量：\n\n```bash\nexport GEMINI_API_KEY=\"你的_API_KEY\"\n# Windows PowerShell: $env:GEMINI_API_KEY=\"你的_API_KEY\"\n```\n\n## 基本使用\n\n获取 API Key 后，您可以使用 Python 快速调用 Nano Banana 进行图像生成或编辑。以下是最简单的调用示例：\n\n### 图像生成示例 (Python)\n\n创建一个名为 `quick_start.py` 的文件，输入以下代码：\n\n```python\nimport google.generativeai as genai\nfrom google.generativeai.types import HarmCategory, HarmBlockThreshold\n\n# 配置 API Key\ngenai.configure(api_key=\"你的_API_KEY\")\n\n# 选择 Nano Banana 模型 (Gemini 2.5 Flash Image Preview)\n# 注意：具体模型名称请以官方最新文档为准，此处为示例占位符\nmodel = genai.GenerativeModel('gemini-2.5-flash-image-preview')\n\n# 定义提示词\nprompt = \"A futuristic city made of bananas, cyberpunk style, highly detailed.\"\n\n# 生成图像\nresponse = model.generate_content(\n    prompt,\n    generation_config={\"response_mime_type\": \"image\u002Fpng\"}\n)\n\n# 保存图像\nif response.candidates[0].content.parts[0].inline_data:\n    image_data = response.candidates[0].content.parts[0].inline_data.data\n    with open(\"output_banana_city.png\", \"wb\") as f:\n        f.write(image_data)\n    print(\"图像生成成功！已保存为 output_banana_city.png\")\nelse:\n    print(\"未返回图像数据，请检查模型响应。\")\n```\n\n### 运行测试\n\n在终端执行脚本：\n\n```bash\npython quick_start.py\n```\n\n如果配置正确，您将看到生成的图像文件。更多高级功能（如图像编辑、角色一致性控制）请参考 `.\u002Fguides\u002F02-use-nano-banana.ipynb` 和 `.\u002Fexamples\u002F` 目录下的完整案例。\n\n---\n**提示**：免费层级每个项目每天限制 **500 次请求**。请在开发过程中合理分配配额，并在截止日期前通过 [Kaggle 竞赛页面](https:\u002F\u002Fwww.kaggle.com\u002Fcompetitions\u002Fbanana) 提交您的作品。","一位独立开发者计划在 48 小时的 Nano Banana 黑客松中，快速构建一个能保持角色一致性的动态漫画生成应用。\n\n### 没有 nano-banana-hackathon-kit 时\n- **环境配置耗时**：需手动查阅分散的文档来申请 Gemini API 密钥并调试图像生成接口，浪费宝贵的比赛时间。\n- **功能实现困难**：缺乏针对“角色一致性”和“图像编辑”的代码参考，难以掌握如何用自然语言精准控制画面细节。\n- **工作流断裂**：需要自行整合 Fal 或 ElevenLabs 等多方资源，导致原型开发进度缓慢，甚至无法在截止前完成演示。\n- **创意受限**：因技术门槛过高，被迫放弃复杂的动态叙事构思，只能退而求其次制作简单的图文转换 demo。\n\n### 使用 nano-banana-hackathon-kit 后\n- **极速启动**：直接克隆仓库并运行指南脚本，几分钟内即可获取免费 API 密钥并跑通首个 Nano Banana 图像生成案例。\n- **核心能力现成**：利用 `examples` 目录中成熟的代码片段，轻松实现角色在不同场景下的风格统一与动态编辑。\n- **生态无缝集成**：内置的资源链接清晰指引如何结合 Fal 和 ElevenLabs 服务，快速搭建出音画同步的完整应用闭环。\n- **创意充分释放**：借助详细的提示词策略和高级食谱（Cookbooks），将精力集中于打磨“动态讲故事”的独特用户体验。\n\nnano-banana-hackathon-kit 通过将复杂的技术准备转化为标准化的三步流程，让开发者能在极短时间内从“配置环境”转向“创造奇迹”。","https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002Fgoogle-gemini_nano-banana-hackathon-kit_0a842306.png","google-gemini","https:\u002F\u002Foss.gittoolsai.com\u002Favatars\u002Fgoogle-gemini_49f2a16f.jpg","Get started building with the Gemini API",null,"googleaidevs","https:\u002F\u002Fai.google.dev\u002Fgemini-api\u002Fdocs","https:\u002F\u002Fgithub.com\u002Fgoogle-gemini",[82],{"name":83,"color":84,"percentage":85},"Jupyter Notebook","#DA5B0B",100,1025,174,"2026-04-11T05:50:05","Apache-2.0",1,"","未说明",{"notes":94,"python":92,"dependencies":95},"该工具包主要是一个基于云 API 的入门指南和资源集合，而非本地运行的重型模型。核心功能依赖 Google Gemini API（Nano Banana 模型）、ElevenLabs 和 fal.ai 的云端服务，因此对本地硬件（GPU\u002F内存）无特殊要求，只需能运行 Python 或 JavaScript 代码并具备网络连接即可。比赛期间提供免费的 API 调用额度（每个项目每天 500 次请求）。开发环境参考了 Jupyter Notebook (Colab) 和 AI Studio。",[96,97,98],"Google Gemini API","ElevenLabs API","fal.ai",[15,100],"其他","2026-03-27T02:49:30.150509","2026-04-13T16:34:08.752973",[],[]]