[{"data":1,"prerenderedAt":-1},["ShallowReactive",2],{"similar-google-ai-edge--gallery":3,"tool-google-ai-edge--gallery":61},[4,18,26,36,44,53],{"id":5,"name":6,"github_repo":7,"description_zh":8,"stars":9,"difficulty_score":10,"last_commit_at":11,"category_tags":12,"status":17},4358,"openclaw","openclaw\u002Fopenclaw","OpenClaw 是一款专为个人打造的本地化 AI 助手，旨在让你在自己的设备上拥有完全可控的智能伙伴。它打破了传统 AI 助手局限于特定网页或应用的束缚，能够直接接入你日常使用的各类通讯渠道，包括微信、WhatsApp、Telegram、Discord、iMessage 等数十种平台。无论你在哪个聊天软件中发送消息，OpenClaw 都能即时响应，甚至支持在 macOS、iOS 和 Android 设备上进行语音交互，并提供实时的画布渲染功能供你操控。\n\n这款工具主要解决了用户对数据隐私、响应速度以及“始终在线”体验的需求。通过将 AI 部署在本地，用户无需依赖云端服务即可享受快速、私密的智能辅助，真正实现了“你的数据，你做主”。其独特的技术亮点在于强大的网关架构，将控制平面与核心助手分离，确保跨平台通信的流畅性与扩展性。\n\nOpenClaw 非常适合希望构建个性化工作流的技术爱好者、开发者，以及注重隐私保护且不愿被单一生态绑定的普通用户。只要具备基础的终端操作能力（支持 macOS、Linux 及 Windows WSL2），即可通过简单的命令行引导完成部署。如果你渴望拥有一个懂你",349277,3,"2026-04-06T06:32:30",[13,14,15,16],"Agent","开发框架","图像","数据工具","ready",{"id":19,"name":20,"github_repo":21,"description_zh":22,"stars":23,"difficulty_score":10,"last_commit_at":24,"category_tags":25,"status":17},3808,"stable-diffusion-webui","AUTOMATIC1111\u002Fstable-diffusion-webui","stable-diffusion-webui 是一个基于 Gradio 构建的网页版操作界面，旨在让用户能够轻松地在本地运行和使用强大的 Stable Diffusion 图像生成模型。它解决了原始模型依赖命令行、操作门槛高且功能分散的痛点，将复杂的 AI 绘图流程整合进一个直观易用的图形化平台。\n\n无论是希望快速上手的普通创作者、需要精细控制画面细节的设计师，还是想要深入探索模型潜力的开发者与研究人员，都能从中获益。其核心亮点在于极高的功能丰富度：不仅支持文生图、图生图、局部重绘（Inpainting）和外绘（Outpainting）等基础模式，还独创了注意力机制调整、提示词矩阵、负向提示词以及“高清修复”等高级功能。此外，它内置了 GFPGAN 和 CodeFormer 等人脸修复工具，支持多种神经网络放大算法，并允许用户通过插件系统无限扩展能力。即使是显存有限的设备，stable-diffusion-webui 也提供了相应的优化选项，让高质量的 AI 艺术创作变得触手可及。",162132,"2026-04-05T11:01:52",[14,15,13],{"id":27,"name":28,"github_repo":29,"description_zh":30,"stars":31,"difficulty_score":32,"last_commit_at":33,"category_tags":34,"status":17},1381,"everything-claude-code","affaan-m\u002Feverything-claude-code","everything-claude-code 是一套专为 AI 编程助手（如 Claude Code、Codex、Cursor 等）打造的高性能优化系统。它不仅仅是一组配置文件，而是一个经过长期实战打磨的完整框架，旨在解决 AI 代理在实际开发中面临的效率低下、记忆丢失、安全隐患及缺乏持续学习能力等核心痛点。\n\n通过引入技能模块化、直觉增强、记忆持久化机制以及内置的安全扫描功能，everything-claude-code 能显著提升 AI 在复杂任务中的表现，帮助开发者构建更稳定、更智能的生产级 AI 代理。其独特的“研究优先”开发理念和针对 Token 消耗的优化策略，使得模型响应更快、成本更低，同时有效防御潜在的攻击向量。\n\n这套工具特别适合软件开发者、AI 研究人员以及希望深度定制 AI 工作流的技术团队使用。无论您是在构建大型代码库，还是需要 AI 协助进行安全审计与自动化测试，everything-claude-code 都能提供强大的底层支持。作为一个曾荣获 Anthropic 黑客大奖的开源项目，它融合了多语言支持与丰富的实战钩子（hooks），让 AI 真正成长为懂上",156804,2,"2026-04-15T11:34:33",[14,13,35],"语言模型",{"id":37,"name":38,"github_repo":39,"description_zh":40,"stars":41,"difficulty_score":32,"last_commit_at":42,"category_tags":43,"status":17},2271,"ComfyUI","Comfy-Org\u002FComfyUI","ComfyUI 是一款功能强大且高度模块化的视觉 AI 引擎，专为设计和执行复杂的 Stable Diffusion 图像生成流程而打造。它摒弃了传统的代码编写模式，采用直观的节点式流程图界面，让用户通过连接不同的功能模块即可构建个性化的生成管线。\n\n这一设计巧妙解决了高级 AI 绘图工作流配置复杂、灵活性不足的痛点。用户无需具备编程背景，也能自由组合模型、调整参数并实时预览效果，轻松实现从基础文生图到多步骤高清修复等各类复杂任务。ComfyUI 拥有极佳的兼容性，不仅支持 Windows、macOS 和 Linux 全平台，还广泛适配 NVIDIA、AMD、Intel 及苹果 Silicon 等多种硬件架构，并率先支持 SDXL、Flux、SD3 等前沿模型。\n\n无论是希望深入探索算法潜力的研究人员和开发者，还是追求极致创作自由度的设计师与资深 AI 绘画爱好者，ComfyUI 都能提供强大的支持。其独特的模块化架构允许社区不断扩展新功能，使其成为当前最灵活、生态最丰富的开源扩散模型工具之一，帮助用户将创意高效转化为现实。",108322,"2026-04-10T11:39:34",[14,15,13],{"id":45,"name":46,"github_repo":47,"description_zh":48,"stars":49,"difficulty_score":32,"last_commit_at":50,"category_tags":51,"status":17},6121,"gemini-cli","google-gemini\u002Fgemini-cli","gemini-cli 是一款由谷歌推出的开源 AI 命令行工具，它将强大的 Gemini 大模型能力直接集成到用户的终端环境中。对于习惯在命令行工作的开发者而言，它提供了一条从输入提示词到获取模型响应的最短路径，无需切换窗口即可享受智能辅助。\n\n这款工具主要解决了开发过程中频繁上下文切换的痛点，让用户能在熟悉的终端界面内直接完成代码理解、生成、调试以及自动化运维任务。无论是查询大型代码库、根据草图生成应用，还是执行复杂的 Git 操作，gemini-cli 都能通过自然语言指令高效处理。\n\n它特别适合广大软件工程师、DevOps 人员及技术研究人员使用。其核心亮点包括支持高达 100 万 token 的超长上下文窗口，具备出色的逻辑推理能力；内置 Google 搜索、文件操作及 Shell 命令执行等实用工具；更独特的是，它支持 MCP（模型上下文协议），允许用户灵活扩展自定义集成，连接如图像生成等外部能力。此外，个人谷歌账号即可享受免费的额度支持，且项目基于 Apache 2.0 协议完全开源，是提升终端工作效率的理想助手。",100752,"2026-04-10T01:20:03",[52,13,15,14],"插件",{"id":54,"name":55,"github_repo":56,"description_zh":57,"stars":58,"difficulty_score":10,"last_commit_at":59,"category_tags":60,"status":17},4487,"LLMs-from-scratch","rasbt\u002FLLMs-from-scratch","LLMs-from-scratch 是一个基于 PyTorch 的开源教育项目，旨在引导用户从零开始一步步构建一个类似 ChatGPT 的大型语言模型（LLM）。它不仅是同名技术著作的官方代码库，更提供了一套完整的实践方案，涵盖模型开发、预训练及微调的全过程。\n\n该项目主要解决了大模型领域“黑盒化”的学习痛点。许多开发者虽能调用现成模型，却难以深入理解其内部架构与训练机制。通过亲手编写每一行核心代码，用户能够透彻掌握 Transformer 架构、注意力机制等关键原理，从而真正理解大模型是如何“思考”的。此外，项目还包含了加载大型预训练权重进行微调的代码，帮助用户将理论知识延伸至实际应用。\n\nLLMs-from-scratch 特别适合希望深入底层原理的 AI 开发者、研究人员以及计算机专业的学生。对于不满足于仅使用 API，而是渴望探究模型构建细节的技术人员而言，这是极佳的学习资源。其独特的技术亮点在于“循序渐进”的教学设计：将复杂的系统工程拆解为清晰的步骤，配合详细的图表与示例，让构建一个虽小但功能完备的大模型变得触手可及。无论你是想夯实理论基础，还是为未来研发更大规模的模型做准备",90106,"2026-04-06T11:19:32",[35,15,13,14],{"id":62,"github_repo":63,"name":64,"description_en":65,"description_zh":66,"ai_summary_zh":66,"readme_en":67,"readme_zh":68,"quickstart_zh":69,"use_case_zh":70,"hero_image_url":71,"owner_login":72,"owner_name":72,"owner_avatar_url":73,"owner_bio":74,"owner_company":74,"owner_location":74,"owner_email":74,"owner_twitter":74,"owner_website":74,"owner_url":75,"languages":76,"stars":93,"forks":94,"last_commit_at":95,"license":96,"difficulty_score":97,"env_os":98,"env_gpu":99,"env_ram":100,"env_deps":101,"category_tags":108,"github_topics":74,"view_count":32,"oss_zip_url":74,"oss_zip_packed_at":74,"status":17,"created_at":111,"updated_at":112,"faqs":113,"releases":114},7816,"google-ai-edge\u002Fgallery","gallery","A gallery that showcases on-device ML\u002FGenAI use cases and allows people to try and use models locally.","Google AI Edge Gallery 是一款专为移动设备打造的生成式 AI 体验应用，旨在让用户无需联网即可在手机上直接运行强大的开源大语言模型。它解决了传统云端 AI 服务存在的数据隐私顾虑、网络依赖及延迟问题，让高性能人工智能真正变得离线、私密且响应迅速。\n\n这款工具非常适合希望尝鲜前沿科技的普通用户，同时也为开发者和研究人员提供了一个便捷的本地模型测试与评估平台。其核心亮点在于全面支持最新的 Gemma 4 模型家族，并引入了独特的“思考模式”，能直观展示模型解决问题的逐步推理过程，帮助用户理解复杂的逻辑判断。此外，Gallery 还具备丰富的多模态功能：通过\"Agent Skills\"可调用维基百科等外部工具增强回答准确性；\"Ask Image\"支持识图解题与描述；\"Audio Scribe\"能实时转录翻译语音；而\"Prompt Lab\"则允许用户精细调整参数以测试不同提示词效果。无论是想体验离线智能助手，还是探索端侧 AI 的无限可能，Google AI Edge Gallery 都提供了一个安全、高效且功能完备的入口。","# Google AI Edge Gallery ✨\n\n[![License](https:\u002F\u002Fimg.shields.io\u002Fbadge\u002FLicense-Apache%202.0-blue.svg)](LICENSE)\n[![GitHub release (latest by date)](https:\u002F\u002Fimg.shields.io\u002Fgithub\u002Fv\u002Frelease\u002Fgoogle-ai-edge\u002Fgallery)](https:\u002F\u002Fgithub.com\u002Fgoogle-ai-edge\u002Fgallery\u002Freleases)\n\n**Explore, Experience, and Evaluate the Future of On-Device Generative AI with Google AI Edge.**\n\nAI Edge Gallery is the premier destination for running the world's most powerful open-source Large Language Models (LLMs) on your mobile device. Experience high-performance Generative AI directly on your hardware—fully offline, private, and lightning-fast.\n\n**Now Featuring: Gemma 4**\n\nThe latest version brings official support for the newly released Gemma 4 family. As the centerpiece of this release, Gemma 4 allows you to test the cutting edge of on-device AI. Experience advanced reasoning, logic, and creative capabilities without ever sending your data to a server.\n\n\n| **Install the app today from Google Play** | **Install the app today from App Store** |\n| :--- | :--- |\n| \u003Ca href='https:\u002F\u002Fplay.google.com\u002Fstore\u002Fapps\u002Fdetails?id=com.google.ai.edge.gallery'>\u003Cimg alt='Get it on Google Play' height=\"120\" src='https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002Fgoogle-ai-edge_gallery_readme_1e91d02cf5a9.png'\u002F>\u003C\u002Fa> | \u003Ca href=\"https:\u002F\u002Fapps.apple.com\u002Fus\u002Fapp\u002Fgoogle-ai-edge-gallery\u002Fid6749645337?itscg=30200&itsct=apps_box_badge&mttnsubad=6749645337\" style=\"display: inline-block;\"> \u003Cimg src=\"https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002Fgoogle-ai-edge_gallery_readme_2928664fe1fc.png\" alt=\"Download on the App Store\" style=\"width: 246px; height: 90px; vertical-align: middle; object-fit: contain;\" \u002F>\u003C\u002Fa> |\n\nFor users without Google Play access, install the apk from the [**latest release**](https:\u002F\u002Fgithub.com\u002Fgoogle-ai-edge\u002Fgallery\u002Freleases\u002Flatest\u002F)\n\n\n## App Preview\n\n\u003Cimg width=\"480\" alt=\"01\" src=\"https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002Fgoogle-ai-edge_gallery_readme_be0f8527a676.png\" \u002F>\n\u003Cimg width=\"480\" alt=\"02\" src=\"https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002Fgoogle-ai-edge_gallery_readme_dcb4ede04dd6.png\" \u002F>\n\u003Cimg width=\"480\" alt=\"03\" src=\"https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002Fgoogle-ai-edge_gallery_readme_b960ecac0aee.png\" \u002F>\n\u003Cimg width=\"480\" alt=\"04\" src=\"https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002Fgoogle-ai-edge_gallery_readme_ccfde4f6be05.png\" \u002F>\n\u003Cimg width=\"480\" alt=\"05\" src=\"https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002Fgoogle-ai-edge_gallery_readme_51cac4f97c61.png\" \u002F>\n\u003Cimg width=\"480\" alt=\"06\" src=\"https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002Fgoogle-ai-edge_gallery_readme_bbb0dedf709e.png\" \u002F>\n\u003Cimg width=\"480\" alt=\"07\" src=\"https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002Fgoogle-ai-edge_gallery_readme_792ae59d607b.png\" \u002F>\n\u003Cimg width=\"480\" alt=\"08\" src=\"https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002Fgoogle-ai-edge_gallery_readme_0d852d5248db.png\" \u002F>\n\n## ✨ Core Features\n\n* **Agent Skills**: Transform your LLM from a conversationalist into a proactive assistant. Use the Agent Skills tile to augment model capabilities with tools like Wikipedia for fact-grounding, interactive maps, and rich visual summary cards. You can even load modular skills from a URL or browse community contributions on GitHub Discussions.\n\n* **AI Chat with Thinking Mode**: Engage in fluid, multi-turn conversations and toggle the new Thinking Mode to peek \"under the hood.\" This feature allows you to see the model’s step-by-step reasoning process, which is perfect for understanding complex problem-solving. Note: Thinking Mode currently works with supported models, starting with the Gemma 4 family.\n\n* **Ask Image**: Use multimodal power to identify objects, solve visual puzzles, or get detailed descriptions using your device’s camera or photo gallery.\n\n* **Audio Scribe**: Transcribe and translate voice recordings into text in real-time using high-efficiency on-device language models.\n\n* **Prompt Lab**: A dedicated workspace to test different prompts and single-turn use cases with granular control over model parameters like temperature and top-k.\n\n* **Mobile Actions**: Unlock offline device controls and automated tasks powered entirely by a finetune of FuntionGemma 270m.\n\n* **Tiny Garden**: A fun, experimental mini-game that uses natural language to plant and harvest a virtual garden using a finetune of FunctionGemma 270m.\n\n* **Model Management & Benchmark**: Gallery is a flexible sandbox for a wide variety of open-source models. Easily download models from the list or load your own custom models. Manage your model library effortlessly and run benchmark tests to understand exactly how each model performs on your specific hardware.\n\n* **100% On-Device Privacy**: All model inferences happen directly on your device hardware. No internet is required, ensuring total privacy for your prompts, images, and sensitive data.\n\n## 🏁 Get Started in Minutes!\n\n1. **Check OS Requirement**: Android 12 and up, and iOS 17 and up.\n2.  **Download the App:**\n    - Install the app from [Google Play](https:\u002F\u002Fplay.google.com\u002Fstore\u002Fapps\u002Fdetails?id=com.google.ai.edge.gallery) or [App Store](https:\u002F\u002Fapps.apple.com\u002Fus\u002Fapp\u002Fgoogle-ai-edge-gallery\u002Fid6749645337).\n    - For users without Google Play access: install the apk from the [**latest release**](https:\u002F\u002Fgithub.com\u002Fgoogle-ai-edge\u002Fgallery\u002Freleases\u002Flatest\u002F)\n3.  **Install & Explore:** For detailed installation instructions (including for corporate devices) and a full user guide, head over to our [**Project Wiki**](https:\u002F\u002Fgithub.com\u002Fgoogle-ai-edge\u002Fgallery\u002Fwiki)!\n\n## 🛠️ Technology Highlights\n\n*   **Google AI Edge:** Core APIs and tools for on-device ML.\n*   **LiteRT:** Lightweight runtime for optimized model execution.\n*   **Hugging Face Integration:** For model discovery and download.\n\n## ⌨️ Development\n\nCheck out the [development notes](DEVELOPMENT.md) for instructions about how to build the app locally.\n\n## 🤝 Feedback\n\nThis is an **experimental Beta release**, and your input is crucial!\n\n*   🐞 **Found a bug?** [Report it here!](https:\u002F\u002Fgithub.com\u002Fgoogle-ai-edge\u002Fgallery\u002Fissues\u002Fnew?assignees=&labels=bug&template=bug_report.md&title=%5BBUG%5D)\n*   💡 **Have an idea?** [Suggest a feature!](https:\u002F\u002Fgithub.com\u002Fgoogle-ai-edge\u002Fgallery\u002Fissues\u002Fnew?assignees=&labels=enhancement&template=feature_request.md&title=%5BFEATURE%5D)\n\n## 📄 License\n\nLicensed under the Apache License, Version 2.0. See the [LICENSE](LICENSE) file for details.\n\n## 🔗 Useful Links\n\n*   [**Project Wiki (Detailed Guides)**](https:\u002F\u002Fgithub.com\u002Fgoogle-ai-edge\u002Fgallery\u002Fwiki)\n*   [Hugging Face LiteRT Community](https:\u002F\u002Fhuggingface.co\u002Flitert-community)\n*   [LiteRT-LM](https:\u002F\u002Fgithub.com\u002Fgoogle-ai-edge\u002FLiteRT-LM)\n*   [Google AI Edge Documentation](https:\u002F\u002Fai.google.dev\u002Fedge)\n","# Google AI 边缘画廊 ✨\n\n[![许可证](https:\u002F\u002Fimg.shields.io\u002Fbadge\u002FLicense-Apache%202.0-blue.svg)](LICENSE)\n[![GitHub 发布（按日期最新）](https:\u002F\u002Fimg.shields.io\u002Fgithub\u002Fv\u002Frelease\u002Fgoogle-ai-edge\u002Fgallery)](https:\u002F\u002Fgithub.com\u002Fgoogle-ai-edge\u002Fgallery\u002Freleases)\n\n**与 Google AI 边缘一起探索、体验并评估设备端生成式 AI 的未来。**\n\nAI 边缘画廊是您在移动设备上运行全球最强大开源大型语言模型（LLM）的首选平台。在这里，您可以直接在本地硬件上体验高性能的生成式 AI——完全离线、私密且速度极快。\n\n**现已推出：Gemma 4**\n\n最新版本正式支持新发布的 Gemma 4 系列。作为本次发布的核心，Gemma 4 让您无需将数据发送到服务器，即可测试最先进的设备端 AI 技术。感受其先进的推理、逻辑和创作能力。\n\n\n| **立即从 Google Play 安装应用** | **立即从 App Store 安装应用** |\n| :--- | :--- |\n| \u003Ca href='https:\u002F\u002Fplay.google.com\u002Fstore\u002Fapps\u002Fdetails?id=com.google.ai.edge.gallery'>\u003Cimg alt='在 Google Play 获取' height=\"120\" src='https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002Fgoogle-ai-edge_gallery_readme_1e91d02cf5a9.png'\u002F>\u003C\u002Fa> | \u003Ca href=\"https:\u002F\u002Fapps.apple.com\u002Fus\u002Fapp\u002Fgoogle-ai-edge-gallery\u002Fid6749645337?itscg=30200&itsct=apps_box_badge&mttnsubad=6749645337\" style=\"display: inline-block;\"> \u003Cimg src=\"https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002Fgoogle-ai-edge_gallery_readme_2928664fe1fc.png\" alt=\"下载至 App Store\" style=\"width: 246px; height: 90px; vertical-align: middle; object-fit: contain;\" \u002F>\u003C\u002Fa> |\n\n对于无法使用 Google Play 的用户，请从 [**最新版本**](https:\u002F\u002Fgithub.com\u002Fgoogle-ai-edge\u002Fgallery\u002Freleases\u002Flatest\u002F) 安装 APK 文件。\n\n\n## 应用预览\n\n\u003Cimg width=\"480\" alt=\"01\" src=\"https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002Fgoogle-ai-edge_gallery_readme_be0f8527a676.png\" \u002F>\n\u003Cimg width=\"480\" alt=\"02\" src=\"https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002Fgoogle-ai-edge_gallery_readme_dcb4ede04dd6.png\" \u002F>\n\u003Cimg width=\"480\" alt=\"03\" src=\"https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002Fgoogle-ai-edge_gallery_readme_b960ecac0aee.png\" \u002F>\n\u003Cimg width=\"480\" alt=\"04\" src=\"https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002Fgoogle-ai-edge_gallery_readme_ccfde4f6be05.png\" \u002F>\n\u003Cimg width=\"480\" alt=\"05\" src=\"https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002Fgoogle-ai-edge_gallery_readme_51cac4f97c61.png\" \u002F>\n\u003Cimg width=\"480\" alt=\"06\" src=\"https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002Fgoogle-ai-edge_gallery_readme_bbb0dedf709e.png\" \u002F>\n\u003Cimg width=\"480\" alt=\"07\" src=\"https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002Fgoogle-ai-edge_gallery_readme_792ae59d607b.png\" \u002F>\n\u003Cimg width=\"480\" alt=\"08\" src=\"https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002Fgoogle-ai-edge_gallery_readme_0d852d5248db.png\" \u002F>\n\n## ✨ 核心功能\n\n* **智能体技能**：将您的 LLM 从对话伙伴转变为主动助手。通过“智能体技能”模块，您可以借助维基百科等工具进行事实核查、使用交互式地图以及查看丰富的视觉摘要卡片来增强模型能力。您甚至可以从 URL 加载模块化技能，或在 GitHub Discussions 上浏览社区贡献。\n\n* **带思考模式的 AI 聊天**：参与流畅的多轮对话，并切换新的“思考模式”以一窥“幕后”。此功能可让您查看模型的逐步推理过程，非常适合理解复杂问题的解决思路。注意：思考模式目前仅适用于受支持的模型，首先覆盖 Gemma 4 系列。\n\n* **图片提问**：利用多模态能力，通过设备摄像头或相册识别物体、解答视觉谜题或获取详细描述。\n\n* **音频速记**：使用高效的设备端语言模型，实时将语音录音转录并翻译成文本。\n\n* **提示实验室**：一个专用的工作区，用于测试不同的提示词和单轮用例，并对温度、top-k 等模型参数进行精细控制。\n\n* **移动操作**：解锁完全由 FunctionGemma 270m 微调模型驱动的离线设备控制和自动化任务。\n\n* **小花园**：一款有趣的实验性小游戏，通过自然语言种植并收获虚拟花园，同样基于 FunctionGemma 270m 的微调模型。\n\n* **模型管理与基准测试**：画廊是一个灵活的沙盒环境，支持多种开源模型。您可以轻松从列表中下载模型，或加载自定义模型。无缝管理您的模型库，并运行基准测试，以准确了解每款模型在您特定硬件上的表现。\n\n* **100% 设备端隐私**：所有模型推理均在您的设备硬件上直接完成。无需联网，确保您的提示、图像及敏感数据完全私密。\n\n## 🏁 几分钟内开始使用！\n\n1. **检查操作系统要求**：Android 12 及以上版本，iOS 17 及以上版本。\n2. **下载应用：**\n    - 从 [Google Play](https:\u002F\u002Fplay.google.com\u002Fstore\u002Fapps\u002Fdetails?id=com.google.ai.edge.gallery) 或 [App Store](https:\u002F\u002Fapps.apple.com\u002Fus\u002Fapp\u002Fgoogle-ai-edge-gallery\u002Fid6749645337) 安装应用。\n    - 对于无法使用 Google Play 的用户：请从 [**最新版本**](https:\u002F\u002Fgithub.com\u002Fgoogle-ai-edge\u002Fgallery\u002Freleases\u002Flatest\u002F) 安装 APK 文件。\n3. **安装并探索**：有关详细安装说明（包括企业设备）和完整用户指南，请访问我们的 [**项目维基**](https:\u002F\u002Fgithub.com\u002Fgoogle-ai-edge\u002Fgallery\u002Fwiki)！\n\n## 🛠️ 技术亮点\n\n* **Google AI 边缘**：用于设备端机器学习的核心 API 和工具。\n* **LiteRT**：轻量级运行时，用于优化模型执行。\n* **Hugging Face 集成**：用于模型发现和下载。\n\n## ⌨️ 开发\n\n请参阅 [开发说明](DEVELOPMENT.md)，了解如何在本地构建该应用。\n\n## 🤝 意见反馈\n\n本版本为**实验性 Beta 版**，您的反馈至关重要！\n\n*   🐞 **发现 bug？** [在此报告！](https:\u002F\u002Fgithub.com\u002Fgoogle-ai-edge\u002Fgallery\u002Fissues\u002Fnew?assignees=&labels=bug&template=bug_report.md&title=%5BBUG%5D)\n*   💡 **有想法？** [建议功能！](https:\u002F\u002Fgithub.com\u002Fgoogle-ai-edge\u002Fgallery\u002Fissues\u002Fnew?assignees=&labels=enhancement&template=feature_request.md&title=%5BFEATURE%5D)\n\n## 📄 许可证\n\n根据 Apache License, Version 2.0 授权。详情请参阅 [LICENSE](LICENSE) 文件。\n\n## 🔗 有用链接\n\n*   [**项目维基（详细指南）**](https:\u002F\u002Fgithub.com\u002Fgoogle-ai-edge\u002Fgallery\u002Fwiki)\n*   [Hugging Face LiteRT 社区](https:\u002F\u002Fhuggingface.co\u002Flitert-community)\n*   [LiteRT-LM](https:\u002F\u002Fgithub.com\u002Fgoogle-ai-edge\u002FLiteRT-LM)\n*   [Google AI 边缘文档](https:\u002F\u002Fai.google.dev\u002Fedge)","# Google AI Edge Gallery 快速上手指南\n\nGoogle AI Edge Gallery 是一款专为移动设备打造的开源应用，旨在让用户在本地离线运行强大的大语言模型（LLM），体验高性能、隐私安全的生成式 AI。最新版本已正式支持 **Gemma 4** 系列模型。\n\n## 环境准备\n\n在开始之前，请确保您的移动设备满足以下系统要求：\n\n*   **Android 用户**：系统版本需为 **Android 12** 或更高。\n*   **iOS 用户**：系统版本需为 **iOS 17** 或更高。\n*   **硬件建议**：由于模型在本地运行，建议使用配备较新处理器（如 Snapdragon 8 Gen 系列或 Apple A15 Bionic 及以上）的设备以获得最佳推理速度。\n*   **存储空间**：请预留足够的存储空间以下载模型文件（单个模型通常在几百 MB 到几 GB 不等）。\n\n## 安装步骤\n\n根据您的设备平台和网络环境，选择以下任一方式进行安装：\n\n### 方式一：通过官方应用商店（推荐）\n\n*   **Android**:\n    访问 [Google Play Store](https:\u002F\u002Fplay.google.com\u002Fstore\u002Fapps\u002Fdetails?id=com.google.ai.edge.gallery) 搜索 \"Google AI Edge Gallery\" 并点击安装。\n    *(注：国内安卓用户若无法访问 Google Play，请使用方式二)*\n\n*   **iOS**:\n    访问 [Apple App Store](https:\u002F\u002Fapps.apple.com\u002Fus\u002Fapp\u002Fgoogle-ai-edge-gallery\u002Fid6749645337) 搜索 \"Google AI Edge Gallery\" 并下载。\n\n### 方式二：手动安装 APK (仅限 Android)\n\n对于无法使用 Google Play 服务的用户，可以直接从 GitHub 获取安装包：\n\n1.  访问项目的 [Latest Release 页面](https:\u002F\u002Fgithub.com\u002Fgoogle-ai-edge\u002Fgallery\u002Freleases\u002Flatest\u002F)。\n2.  在 \"Assets\" 列表中下载最新的 `.apk` 文件。\n3.  在手机上允许“安装未知来源应用”权限，然后打开下载的 APK 文件完成安装。\n\n## 基本使用\n\n安装完成后，无需配置复杂的服务器环境，所有计算均在设备本地进行。以下是核心功能的使用流程：\n\n### 1. 下载与管理模型\n启动应用后，进入 **Model Management** 模块：\n*   浏览内置的开源模型列表（包括最新的 **Gemma 4** 系列）。\n*   点击模型旁的下载按钮，将模型权重缓存至本地。\n*   您也可以加载自定义模型或通过 Hugging Face 集成发现更多模型。\n\n### 2. 体验智能对话 (AI Chat)\n*   进入 **AI Chat** 界面，选择已下载的模型。\n*   输入文本即可开始多轮对话。\n*   **Thinking Mode (思维模式)**：针对支持的模型（如 Gemma 4），开启此模式可查看模型的逐步推理过程，适合处理复杂逻辑问题。\n\n### 3. 多模态交互 (Ask Image & Audio Scribe)\n*   **识图 (Ask Image)**：点击相机或相册图标，上传图片或现场拍摄，模型将识别物体、解答视觉谜题或描述图片内容。\n*   **语音转写 (Audio Scribe)**：录制语音，利用本地高效语言模型实时将其转录为文本或进行翻译。\n\n### 4. 高级功能探索\n*   **Agent Skills**: 启用代理技能，为模型添加维基百科查询、地图交互等工具能力，使其从单纯对话转变为主动助手。\n*   **Prompt Lab**: 在专用工作区中调整 `temperature`、`top-k` 等参数，测试不同提示词的效果。\n*   **Mobile Actions & Tiny Garden**: 体验基于 FunctionGemma 微调的设备控制任务和趣味自然语言互动游戏。\n\n> **注意**：所有推理过程完全离线，您的对话、图片和数据不会上传至任何服务器，确保 100% 隐私安全。\n\n如需更详细的开发者指南或构建说明，请访问 [Project Wiki](https:\u002F\u002Fgithub.com\u002Fgoogle-ai-edge\u002Fgallery\u002Fwiki)。","一位经常需要在无网络环境的野外进行地质考察的研究员，急需在移动端实时分析岩石样本照片并记录专业笔记。\n\n### 没有 gallery 时\n- **网络依赖严重**：在信号盲区无法调用云端大模型，导致图像识别和文献查询功能完全瘫痪。\n- **数据隐私风险**：敏感的未公开地质数据必须上传至第三方服务器处理，存在泄露隐患。\n- **推理过程黑盒**：面对复杂的岩石分类结论，无法查看模型的推导逻辑，难以验证结果的科学性。\n- **功能割裂低效**：需要分别打开翻译、录音和搜索等多个独立应用，工作流繁琐且中断频繁。\n\n### 使用 gallery 后\n- **全离线即时响应**：依托本地运行的 Gemma 4 模型，即使在深山无网环境下也能秒级识别岩石纹理并生成描述。\n- **数据完全私有**：所有照片分析与语音转写均在手机芯片上完成，原始数据无需离开设备，确保科研机密安全。\n- **思维链可视**：开启“思考模式”后，可逐步查看模型如何结合颜色、硬度等特征推导出岩石类型，辅助专业判断。\n- **智能体一站式协作**：通过\"Agent Skills\"直接调用内置维基百科核实数据，并利用\"Audio Scribe\"实时将口述笔记转为结构化文本。\n\ngallery 将高性能生成式 AI 装进口袋，让研究员在无网、私密且透明的环境中实现了从感知到认知的闭环作业。","https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002Fgoogle-ai-edge_gallery_be0f8527.jpg","google-ai-edge","https:\u002F\u002Foss.gittoolsai.com\u002Favatars\u002Fgoogle-ai-edge_0b6e7f86.png",null,"https:\u002F\u002Fgithub.com\u002Fgoogle-ai-edge",[77,81,85,89],{"name":78,"color":79,"percentage":80},"Kotlin","#A97BFF",91.2,{"name":82,"color":83,"percentage":84},"HTML","#e34c26",8.2,{"name":86,"color":87,"percentage":88},"JavaScript","#f1e05a",0.5,{"name":90,"color":91,"percentage":92},"CSS","#663399",0.1,21131,2004,"2026-04-15T10:51:36","Apache-2.0",1,"Android 12+, iOS 17+","未说明 (作为移动端应用，依赖设备内置的 NPU\u002FGPU\u002FDSP，通过 LiteRT 运行时优化)","未说明 (取决于具体运行的模型大小及移动设备硬件配置)",{"notes":102,"python":103,"dependencies":104},"这是一个专为移动设备设计的原生应用程序（非桌面端工具），支持 Android 12 及以上和 iOS 17 及以上系统。所有推理过程均在设备本地离线运行，无需联网以保障隐私。核心运行依赖于 Google 的 LiteRT 轻量级运行时。用户可通过 Google Play、App Store 或直接安装 APK 获取。支持加载 Gemma 4 等开源大模型，并具备代理技能、思维链模式、多模态图像识别及语音转写等功能。","不适用 (原生移动应用程序，非 Python 脚本)",[105,106,107],"LiteRT","Google AI Edge APIs","FunctionGemma (部分功能)",[35,15,109,13,110],"音频","其他","2026-03-27T02:49:30.150509","2026-04-16T01:44:51.230579",[],[115,120,125,130,135,140,145,150,155,160,165,170,174,179,184,189,194,199,204],{"id":116,"version":117,"summary_zh":118,"released_at":119},272368,"1.0.11","- **重磅推出 Gemma 4**：体验最新、性能卓越的模型，支持完全离线运行。  \n- **智能体技能**：通过模块化工具扩展大语言模型的功能，例如展示交互式地图、搜索维基百科等。同时支持社区自定义技能的加载。了解更多关于[如何创建技能](https:\u002F\u002Fgithub.com\u002Fgoogle-ai-edge\u002Fgallery\u002Ftree\u002Fmain\u002Fskills)的信息，并[与社区分享](https:\u002F\u002Fgithub.com\u002Fgoogle-ai-edge\u002Fgallery\u002Fdiscussions\u002Fcategories\u002Fskills)。  \n- **AI 聊天中的思考模式**：以可视化方式呈现模型的推理过程，提升透明度。（注：目前仅适用于受支持的模型，包括 Gemma 4 系列）。","2026-04-02T16:05:16",{"id":121,"version":122,"summary_zh":123,"released_at":124},272369,"1.0.10","- 一款全新微调过的 **Mobile Actions** Function Gemma 270M 模型，等你试用。  \n- 一款速度更快、更稳定的微调版 **Tiny Garden** Function Gemma 270M 模型，等你试用。  \n- 一个专门的 **基准测试** 页面，可在应用内直接运行模型基准测试，位于“模型管理”页面的左上角菜单中。  \n- 简化了 Gemma 模型的下载流程——无需登录 Hugging Face 账号。\n\n**完整更新日志**：https:\u002F\u002Fgithub.com\u002Fgoogle-ai-edge\u002Fgallery\u002Fcompare\u002F1.0.9...1.0.10","2026-02-26T19:03:18",{"id":126,"version":127,"summary_zh":128,"released_at":129},272370,"1.0.9","全新演示：快来体验 [FunctionGemma](https:\u002F\u002Fhuggingface.co\u002Fgoogle\u002Ffunctiongemma-270m-it) 的强大功能吧！\n\n*   **🌻 小小花园**: 玩一款实验性的完全离线迷你游戏，通过自然语言种植、浇水和收获鲜花。\n*   **📳 移动设备操作**: 使用我们的[开源教程](https:\u002F\u002Fgithub.com\u002Fgoogle-gemini\u002Fgemma-cookbook\u002Fblob\u002Fmain\u002FFunctionGemma\u002F%5BFunctionGemma%5DFinetune_FunctionGemma_270M_for_Mobile_Actions_with_Hugging_Face.ipynb)，学习如何对模型进行微调，然后将其加载到应用中，即可实现离线设备控制。\n\n**完整更新日志**: https:\u002F\u002Fgithub.com\u002Fgoogle-ai-edge\u002Fgallery\u002Fcompare\u002F1.0.8...1.0.9","2025-12-18T17:15:47",{"id":131,"version":132,"summary_zh":133,"released_at":134},272371,"1.0.8","## 变更内容\n* 应用现已可访问。\n* 已迁移到 LiteRT-LM Kotlin API。文档请参见 [这里](https:\u002F\u002Fgithub.com\u002Fgoogle-ai-edge\u002FLiteRT-LM\u002Ftree\u002Fmain\u002Fkotlin)。\n* 新增了 [Qwen2.5-1.5B-Instruct](https:\u002F\u002Fhuggingface.co\u002Flitert-community\u002FQwen2.5-1.5B-Instruct)、[Phi-4-mini-instruct](https:\u002F\u002Fhuggingface.co\u002Flitert-community\u002FPhi-4-mini-instruct) 和 [DeepSeek-R1-Distill-Qwen-1.5B](https:\u002F\u002Fhuggingface.co\u002Flitert-community\u002FDeepSeek-R1-Distill-Qwen-1.5B) 这些 liteRT-LM 模型，供您在 AI 聊天和 PromptLab 中试用。\n* 修复了长消息滚动失效、部分消息无法复制等问题，以及其他一些小的修复和改进。\n\n**完整变更日志**: https:\u002F\u002Fgithub.com\u002Fgoogle-ai-edge\u002Fgallery\u002Fcompare\u002F1.0.7...1.0.8","2025-12-03T21:25:45",{"id":136,"version":137,"summary_zh":138,"released_at":139},272372,"1.0.7","## 变更内容\n* 修复因下载失败导致的 NPE 崩溃。由 @copybara-service[bot] 在 https:\u002F\u002Fgithub.com\u002Fgoogle-ai-edge\u002Fgallery\u002Fpull\u002F282 中完成。\n* 移除对象而非索引，以避免潜在崩溃。由 @copybara-service[bot] 在 https:\u002F\u002Fgithub.com\u002Fgoogle-ai-edge\u002Fgallery\u002Fpull\u002F283 中完成。\n* 更新启动屏，加入动画图标；同时使“加载白名单失败”对话框可关闭。由 @copybara-service[bot] 在 https:\u002F\u002Fgithub.com\u002Fgoogle-ai-edge\u002Fgallery\u002Fpull\u002F287 中完成。\n* [gallery] 修复用户为数字输入无效文本值时的崩溃问题。由 @copybara-service[bot] 在 https:\u002F\u002Fgithub.com\u002Fgoogle-ai-edge\u002Fgallery\u002Fpull\u002F294 中完成。\n* 为音频录制添加动画效果，并简化音频录制界面。由 @copybara-service[bot] 在 https:\u002F\u002Fgithub.com\u002Fgoogle-ai-edge\u002Fgallery\u002Fpull\u002F296 中完成。\n* 发送提示后隐藏键盘；新提示发送时自动滚动至底部；当用户尝试导入 Web 模型时显示警告。由 @copybara-service[bot] 在 https:\u002F\u002Fgithub.com\u002Fgoogle-ai-edge\u002Fgallery\u002Fpull\u002F301 中完成。\n* [gallery] 允许使用 Git 引用来下载模型。由 @copybara-service[bot] 在 https:\u002F\u002Fgithub.com\u002Fgoogle-ai-edge\u002Fgallery\u002Fpull\u002F310 中完成。\n* 修复拼写错误。由 @EsmaeelNabil 在 https:\u002F\u002Fgithub.com\u002Fgoogle-ai-edge\u002Fgallery\u002Fpull\u002F261 中完成。\n* 进一步修复自动滚动相关问题。由 @copybara-service[bot] 在 https:\u002F\u002Fgithub.com\u002Fgoogle-ai-edge\u002Fgallery\u002Fpull\u002F313 中完成。\n\n## 新贡献者\n* @EsmaeelNabil 在 https:\u002F\u002Fgithub.com\u002Fgoogle-ai-edge\u002Fgallery\u002Fpull\u002F261 中完成了首次贡献。\n\n关于无障碍功能的说明：我们已收到您关于应用缺乏无障碍支持的宝贵反馈，并正在积极努力，在下一次发布中实现应用的全面无障碍化。非常感谢您一直以来的支持与耐心！\n\n**完整变更日志**：https:\u002F\u002Fgithub.com\u002Fgoogle-ai-edge\u002Fgallery\u002Fcompare\u002F1.0.6...1.0.7","2025-09-18T17:57:09",{"id":141,"version":142,"summary_zh":143,"released_at":144},272373,"1.0.6","少量代码清理和重构","2025-08-25T23:50:23",{"id":146,"version":147,"summary_zh":148,"released_at":149},272374,"1.0.5","重构了模型下载逻辑。这应该能修复社区反馈的各种模型下载问题。","2025-08-20T23:40:44",{"id":151,"version":152,"summary_zh":153,"released_at":154},272375,"1.0.4","Google AI Edge Gallery 应用的测试版现已在 Google Play 上线！目前仅在美国地区开放下载。\n\n- 美国用户：您可从 [Google Play](https:\u002F\u002Fplay.google.com\u002Fstore\u002Fapps\u002Fdetails?id=com.google.ai.edge.gallery) 获取该应用。\n- 美国以外的用户：请下载随附的 APK 文件以完成安装。敬请关注即将在全球范围内的正式发布。\n\n> [!重要提示]\n> 在安装本版本之前，请务必卸载所有旧版本的应用程序。旧版本将不再可用且不再受支持。\n\n更新说明：\n- 新增多图片多轮对话支持：在“Ask Image”功能中，您现在可以上传多张图片（最多 10 张），并针对这些图片进行多轮提问。\n- 在“Audio Scribe”中新增音频支持：您可以上传或录制一段音频片段，然后让模型将其转录为文本，或翻译成其他语言。\n- 优化了用户界面。\n- 修复了社区反馈的各种崩溃和使用问题。","2025-08-18T18:44:53",{"id":156,"version":157,"summary_zh":158,"released_at":159},272376,"1.0.3","修复图像捕获表单中的潜在内存泄漏","2025-05-22T23:53:17",{"id":161,"version":162,"summary_zh":163,"released_at":164},272377,"1.0.2","- 使用 camerax 在应用内实现图像采集，而非调用原生相机应用，以降低因 GPU 内存不足而导致应用被系统终止的风险。  \n- 在聊天消息发送者标签中显示加速器名称。  \n- 将下载工作线程与静默前台通知绑定，以减少其被系统终止的可能性。  \n- 更新应用图标，使其符合 Google 的设计规范。","2025-05-22T00:36:04",{"id":166,"version":167,"summary_zh":168,"released_at":169},272378,"1.0.1","- Update Gemma 3n 4B model.\r\n- Update context length to 4K for Gemma 3n models.\r\n- Fix a bug related to LLM inference engine cleanup.\r\n- Various UX improvements.\r\n","2025-05-21T19:48:44",{"id":171,"version":172,"summary_zh":74,"released_at":173},272379,"1.0.0","2025-05-20T16:26:02",{"id":175,"version":176,"summary_zh":177,"released_at":178},272380,"0.9.6","- Fix a download resume bug","2025-05-20T03:25:28",{"id":180,"version":181,"summary_zh":182,"released_at":183},272381,"0.9.5","- Check version when app resumes.","2025-05-20T00:03:49",{"id":185,"version":186,"summary_zh":187,"released_at":188},272382,"0.9.4","- Fix a bug where deleting a local model when there are >1 local models shows the wrong download status.\r\n- Don't go back to model selection screen automatically when there is an error during model initialization, so that users have a chance to change model parameters (e.g. accelerator) to retry the initialization.\r\n- Show error dialog properly in prompt lab screen.","2025-05-19T21:47:53",{"id":190,"version":191,"summary_zh":192,"released_at":193},272383,"0.9.3","- Better text formatting on home screen for smaller screen.\r\n- Set default backend based on the order of \"accelerators\" field in model allowlist.","2025-05-19T18:45:29",{"id":195,"version":196,"summary_zh":197,"released_at":198},272384,"0.9.2","- Re-enable image picker menu items when model config is updated.\r\n- Make theme picker work when system is in dark mode.","2025-05-19T18:10:31",{"id":200,"version":201,"summary_zh":202,"released_at":203},272385,"0.9.1","- Save the loaded model allowlist to a local file so that it can be read when the allowlist cannot be loaded from internet.\r\n- Improve the image clipping transitioning from full image back to the image thumbnail in chat ui.","2025-05-19T00:37:22",{"id":205,"version":206,"summary_zh":207,"released_at":208},272386,"0.9.0","- Show an info message to get user started when entering the \"ask image\" chat UI.\r\n- Click image in chat to see it in full screen.\r\n- Check new release on start up, and show a message if new release is available.\r\n- Only try to re-initialize session once when handling an exception from LLM engine.\r\n- Allow users to paste HF access token and clear it in the settings dialog.\r\n- Disable the stop and reset session button when LLM engine is in the prefill phase.\r\n- Fix a UI layout crash.\r\n- Fix various UI bugs for smaller screens and in dark mode.","2025-05-17T22:21:22"]