[{"data":1,"prerenderedAt":-1},["ShallowReactive",2],{"similar-Ayush0Chaudhary--blurr":3,"tool-Ayush0Chaudhary--blurr":62},[4,18,26,36,46,54],{"id":5,"name":6,"github_repo":7,"description_zh":8,"stars":9,"difficulty_score":10,"last_commit_at":11,"category_tags":12,"status":17},4358,"openclaw","openclaw\u002Fopenclaw","OpenClaw 是一款专为个人打造的本地化 AI 助手，旨在让你在自己的设备上拥有完全可控的智能伙伴。它打破了传统 AI 助手局限于特定网页或应用的束缚，能够直接接入你日常使用的各类通讯渠道，包括微信、WhatsApp、Telegram、Discord、iMessage 等数十种平台。无论你在哪个聊天软件中发送消息，OpenClaw 都能即时响应，甚至支持在 macOS、iOS 和 Android 设备上进行语音交互，并提供实时的画布渲染功能供你操控。\n\n这款工具主要解决了用户对数据隐私、响应速度以及“始终在线”体验的需求。通过将 AI 部署在本地，用户无需依赖云端服务即可享受快速、私密的智能辅助，真正实现了“你的数据，你做主”。其独特的技术亮点在于强大的网关架构，将控制平面与核心助手分离，确保跨平台通信的流畅性与扩展性。\n\nOpenClaw 非常适合希望构建个性化工作流的技术爱好者、开发者，以及注重隐私保护且不愿被单一生态绑定的普通用户。只要具备基础的终端操作能力（支持 macOS、Linux 及 Windows WSL2），即可通过简单的命令行引导完成部署。如果你渴望拥有一个懂你",349277,3,"2026-04-06T06:32:30",[13,14,15,16],"Agent","开发框架","图像","数据工具","ready",{"id":19,"name":20,"github_repo":21,"description_zh":22,"stars":23,"difficulty_score":10,"last_commit_at":24,"category_tags":25,"status":17},3808,"stable-diffusion-webui","AUTOMATIC1111\u002Fstable-diffusion-webui","stable-diffusion-webui 是一个基于 Gradio 构建的网页版操作界面，旨在让用户能够轻松地在本地运行和使用强大的 Stable Diffusion 图像生成模型。它解决了原始模型依赖命令行、操作门槛高且功能分散的痛点，将复杂的 AI 绘图流程整合进一个直观易用的图形化平台。\n\n无论是希望快速上手的普通创作者、需要精细控制画面细节的设计师，还是想要深入探索模型潜力的开发者与研究人员，都能从中获益。其核心亮点在于极高的功能丰富度：不仅支持文生图、图生图、局部重绘（Inpainting）和外绘（Outpainting）等基础模式，还独创了注意力机制调整、提示词矩阵、负向提示词以及“高清修复”等高级功能。此外，它内置了 GFPGAN 和 CodeFormer 等人脸修复工具，支持多种神经网络放大算法，并允许用户通过插件系统无限扩展能力。即使是显存有限的设备，stable-diffusion-webui 也提供了相应的优化选项，让高质量的 AI 艺术创作变得触手可及。",162132,"2026-04-05T11:01:52",[14,15,13],{"id":27,"name":28,"github_repo":29,"description_zh":30,"stars":31,"difficulty_score":32,"last_commit_at":33,"category_tags":34,"status":17},1381,"everything-claude-code","affaan-m\u002Feverything-claude-code","everything-claude-code 是一套专为 AI 编程助手（如 Claude Code、Codex、Cursor 等）打造的高性能优化系统。它不仅仅是一组配置文件，而是一个经过长期实战打磨的完整框架，旨在解决 AI 代理在实际开发中面临的效率低下、记忆丢失、安全隐患及缺乏持续学习能力等核心痛点。\n\n通过引入技能模块化、直觉增强、记忆持久化机制以及内置的安全扫描功能，everything-claude-code 能显著提升 AI 在复杂任务中的表现，帮助开发者构建更稳定、更智能的生产级 AI 代理。其独特的“研究优先”开发理念和针对 Token 消耗的优化策略，使得模型响应更快、成本更低，同时有效防御潜在的攻击向量。\n\n这套工具特别适合软件开发者、AI 研究人员以及希望深度定制 AI 工作流的技术团队使用。无论您是在构建大型代码库，还是需要 AI 协助进行安全审计与自动化测试，everything-claude-code 都能提供强大的底层支持。作为一个曾荣获 Anthropic 黑客大奖的开源项目，它融合了多语言支持与丰富的实战钩子（hooks），让 AI 真正成长为懂上",160784,2,"2026-04-19T11:32:54",[14,13,35],"语言模型",{"id":37,"name":38,"github_repo":39,"description_zh":40,"stars":41,"difficulty_score":42,"last_commit_at":43,"category_tags":44,"status":17},8272,"opencode","anomalyco\u002Fopencode","OpenCode 是一款开源的 AI 编程助手（Coding Agent），旨在像一位智能搭档一样融入您的开发流程。它不仅仅是一个代码补全插件，而是一个能够理解项目上下文、自主规划任务并执行复杂编码操作的智能体。无论是生成全新功能、重构现有代码，还是排查难以定位的 Bug，OpenCode 都能通过自然语言交互高效完成，显著减少开发者在重复性劳动和上下文切换上的时间消耗。\n\n这款工具专为软件开发者、工程师及技术研究人员设计，特别适合希望利用大模型能力来提升编码效率、加速原型开发或处理遗留代码维护的专业人群。其核心亮点在于完全开源的架构，这意味着用户可以审查代码逻辑、自定义行为策略，甚至私有化部署以保障数据安全，彻底打破了传统闭源 AI 助手的“黑盒”限制。\n\n在技术体验上，OpenCode 提供了灵活的终端界面（Terminal UI）和正在测试中的桌面应用程序，支持 macOS、Windows 及 Linux 全平台。它兼容多种包管理工具，安装便捷，并能无缝集成到现有的开发环境中。无论您是追求极致控制权的资深极客，还是渴望提升产出的独立开发者，OpenCode 都提供了一个透明、可信",144296,1,"2026-04-16T14:50:03",[13,45],"插件",{"id":47,"name":48,"github_repo":49,"description_zh":50,"stars":51,"difficulty_score":32,"last_commit_at":52,"category_tags":53,"status":17},2271,"ComfyUI","Comfy-Org\u002FComfyUI","ComfyUI 是一款功能强大且高度模块化的视觉 AI 引擎，专为设计和执行复杂的 Stable Diffusion 图像生成流程而打造。它摒弃了传统的代码编写模式，采用直观的节点式流程图界面，让用户通过连接不同的功能模块即可构建个性化的生成管线。\n\n这一设计巧妙解决了高级 AI 绘图工作流配置复杂、灵活性不足的痛点。用户无需具备编程背景，也能自由组合模型、调整参数并实时预览效果，轻松实现从基础文生图到多步骤高清修复等各类复杂任务。ComfyUI 拥有极佳的兼容性，不仅支持 Windows、macOS 和 Linux 全平台，还广泛适配 NVIDIA、AMD、Intel 及苹果 Silicon 等多种硬件架构，并率先支持 SDXL、Flux、SD3 等前沿模型。\n\n无论是希望深入探索算法潜力的研究人员和开发者，还是追求极致创作自由度的设计师与资深 AI 绘画爱好者，ComfyUI 都能提供强大的支持。其独特的模块化架构允许社区不断扩展新功能，使其成为当前最灵活、生态最丰富的开源扩散模型工具之一，帮助用户将创意高效转化为现实。",109154,"2026-04-18T11:18:24",[14,15,13],{"id":55,"name":56,"github_repo":57,"description_zh":58,"stars":59,"difficulty_score":32,"last_commit_at":60,"category_tags":61,"status":17},6121,"gemini-cli","google-gemini\u002Fgemini-cli","gemini-cli 是一款由谷歌推出的开源 AI 命令行工具，它将强大的 Gemini 大模型能力直接集成到用户的终端环境中。对于习惯在命令行工作的开发者而言，它提供了一条从输入提示词到获取模型响应的最短路径，无需切换窗口即可享受智能辅助。\n\n这款工具主要解决了开发过程中频繁上下文切换的痛点，让用户能在熟悉的终端界面内直接完成代码理解、生成、调试以及自动化运维任务。无论是查询大型代码库、根据草图生成应用，还是执行复杂的 Git 操作，gemini-cli 都能通过自然语言指令高效处理。\n\n它特别适合广大软件工程师、DevOps 人员及技术研究人员使用。其核心亮点包括支持高达 100 万 token 的超长上下文窗口，具备出色的逻辑推理能力；内置 Google 搜索、文件操作及 Shell 命令执行等实用工具；更独特的是，它支持 MCP（模型上下文协议），允许用户灵活扩展自定义集成，连接如图像生成等外部能力。此外，个人谷歌账号即可享受免费的额度支持，且项目基于 Apache 2.0 协议完全开源，是提升终端工作效率的理想助手。",100752,"2026-04-10T01:20:03",[45,13,15,14],{"id":63,"github_repo":64,"name":65,"description_en":66,"description_zh":67,"ai_summary_zh":67,"readme_en":68,"readme_zh":69,"quickstart_zh":70,"use_case_zh":71,"hero_image_url":72,"owner_login":73,"owner_name":74,"owner_avatar_url":75,"owner_bio":76,"owner_company":77,"owner_location":78,"owner_email":77,"owner_twitter":77,"owner_website":79,"owner_url":80,"languages":81,"stars":90,"forks":91,"last_commit_at":92,"license":93,"difficulty_score":94,"env_os":95,"env_gpu":96,"env_ram":96,"env_deps":97,"category_tags":103,"github_topics":105,"view_count":32,"oss_zip_url":77,"oss_zip_packed_at":77,"status":17,"created_at":118,"updated_at":119,"faqs":120,"releases":161},9671,"Ayush0Chaudhary\u002Fblurr","blurr","This app can now use Android, just like a human.","Blurr（项目代号 Panda）是一款运行在 Android 设备上的本地 AI 智能助手，旨在像真人一样理解并操作你的手机界面。它能通过自然语言指令，自主完成跨应用的多步骤复杂任务，例如自动浏览联系人、发送消息或执行特定工作流，从而将用户从重复性的屏幕操作中解放出来。\n\n这款工具主要解决了移动端自动化门槛高、传统脚本缺乏灵活性的痛点。不同于需要编写代码的自动化工具，Blurr 利用大语言模型的推理能力“看懂”屏幕内容并规划行动路径，真正实现了“动口不动手”的智能交互体验。\n\nBlurr 非常适合希望提升手机使用效率的普通用户，同时也为开发者提供了研究多智能体架构与移动端 UI 自动化的开源范本。其核心技术亮点在于完全基于 Kotlin 构建的多智能体系统：利用 Android 无障碍服务作为“眼睛和手”来感知屏幕层级并执行触控操作，同时接入强大的 LLM 作为“大脑”进行决策规划。此外，它还集成了高质量的语音交互功能。目前项目处于积极开发阶段，致力于让现代科技变得更加触手可及。","# 🐼 Panda: Your Personal AI Phone Operator  \n**You touch grass. I'll touch your glass.**  \n[![Join Discord](https:\u002F\u002Fimg.shields.io\u002Fbadge\u002FJoin%20Discord-5865F2?style=for-the-badge&logo=discord&logoColor=white)](https:\u002F\u002Fdiscord.gg\u002Fb2hxFNXvWk)\n\u003Ca href='https:\u002F\u002Fplay.google.com\u002Fstore\u002Fapps\u002Fdetails?id=com.blurr.voice&hl=en_US&pcampaignid=pcampaignidMKT-Other-global-all-co-prtnr-py-PartBadge-Mar2515-1'>\u003Cimg alt='Get it on Google Play' src='https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002FAyush0Chaudhary_blurr_readme_1e91d02cf5a9.png' width=250\u002F>\u003C\u002Fa>\n[![Ask DeepWiki](https:\u002F\u002Fdeepwiki.com\u002Fbadge.svg)](https:\u002F\u002Fdeepwiki.com\u002FAyush0Chaudhary\u002Fblurr)\n---\n\n# Demos:\n\n#### Explaining all the triggers of Panda\n [![Watch the video](https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002FAyush0Chaudhary_blurr_readme_f1611a842893.jpg)](https:\u002F\u002Fwww.youtube.com\u002Fembed\u002FIDvuqmPyKZs)\n\n#### Sending Welcome message to all the new Connections on Linkedin\n [![Watch the video](https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002FAyush0Chaudhary_blurr_readme_d388a6592a47.jpg)](https:\u002F\u002Fwww.youtube.com\u002Fembed\u002FJO_EWFYJJjA)\n\n#### 5 task demo: \nhttps:\u002F\u002Fgithub.com\u002Fuser-attachments\u002Fassets\u002Fcf76bb00-2bf4-4274-acad-d9f4c0d47188\n\n\n**Panda** is a proactive, on-device AI agent for Android that autonomously understands natural language commands and operates your phone's UI to achieve them. Inspired by the need to make modern technology more accessible, Panda acts as your personal operator, capable of handling complex, multi-step tasks across different applications.\n\n[![Project Status: WIP](https:\u002F\u002Fimg.shields.io\u002Fbadge\u002Fproject%20status-wip-yellow.svg)](https:\u002F\u002Fwip.vost.pt\u002F)\n[![License: Personal Use](https:\u002F\u002Fimg.shields.io\u002Fbadge\u002FLicense-Personal%20Use%20Only-red.svg)](.\u002FLICENSE)\n[![Kotlin Version](https:\u002F\u002Fimg.shields.io\u002Fbadge\u002FKotlin-1.9.22-7F52FF.svg?logo=kotlin)](https:\u002F\u002Fkotlinlang.org)\n\n## Core Capabilities\n\n* 🧠 **Intelligent UI Automation:** Panda sees the screen, understands the context of UI elements, and performs actions like tapping, swiping, and typing to navigate apps and complete tasks.\n* 📢 **High Qaulity voice:** Panda have high quality voice by GCS's Chirp  \n* 💾 **Persistent & Personalized local Memory:** ⚠️ **Temporarily Disabled** - Panda memory is turned off as of yet. Memory functionality will be restored in a future update.\n\n## Architecture Overview\n\nPanda is built on a sophisticated multi-agent system written entirely in Kotlin. This architecture separates responsibilities, allowing for more complex and reliable reasoning.\n\n* **Eyes & Hands (The Actuator):** The **Android Accessibility Service** serves as the agent's physical connection to the device, providing the low-level ability to read the screen element hierarchy and programmatically perform touch gestures.\n* **The Brain (The LLM):** All high-level reasoning, planning, and analysis are powered by **LLM** models. This is where decisions are made.\n* **The Agent:**\n    * **Operator:** This is executor with Notepad.\n\n\u003Cimg width=\"421\" height=\"251\" alt=\"Untitled Diagram drawio (2)\" src=\"https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002FAyush0Chaudhary_blurr_readme_50dce18bf4c9.png\" \u002F>\n\n\n## 🚀 Getting Started\n\n### Prerequisites\n* Android Studio (latest version recommended)\n* An Android device or emulator with API level 26+\n* Some Gemini keys, sample ENV\n```python\n# the name of these keys donot mean you need google cloud, you can use any servers that can accept requests, i will improve the developer experience in the future by making openapi compatible\nGCLOUD_PROXY_URL=\u003Curl-of-any-backend-that-accept-responses-like-below-payload>\nGCLOUD_PROXY_URL_KEY=\u003Cany-password-you-wanna-set-or-leave-empty>\n```\n`payload`\n```\n{\n  \"modelName\": \"model-name\",\n  \"messages\": [\n    {\n      \"role\": \"user\",\n      \"parts\": [\n        {\n          \"text\": \"Hello, what can you do?\"\n        }\n      ]\n    },\n    {\n      \"role\": \"model\",\n      \"parts\": [\n        {\n          \"text\": \"I can help you with a variety of tasks. What do you need assistance with today?\"\n        }\n      ]\n    }\n  ]\n}\n```\nor\n```\n\u002F\u002Fyou can also add gemini keys to play around\n\nGEMINI_API_KEYS=\n```\n\n\n\n\n### Installation\n\n1.  **Clone the repository:**\n    ```bash\n    git clone [https:\u002F\u002Fgithub.com\u002Fayush0chaudhary\u002Fblurr.git](https:\u002F\u002Fgithub.com\u002Fayush0chaudhary\u002Fblurr.git)\n    cd blurr\n    ```\n\n2.  **Build & Run:**\n    * Open the project in Android Studio.\n    * Let Gradle sync all the dependencies.\n    * Run the app on your selected device or emulator.\n\n3.  **Enable Accessibility Service:**\n    * On the first run, the app will prompt you to grant Accessibility permission.\n    * Click \"Grant Access\" and enable the \"Panda\" service in your phone's settings. This is required for the agent to see and control the screen.\n\n## 🗺️ What's Next for Panda (Roadmap)\n\nPanda is currently a powerful proof-of-concept, and the roadmap is focused on making it a truly indispensable assistant.\n\n* [ ] **NOT UPDATED:** List not updated\n\n## 🤝 Contributing\n\nContributions are welcome! If you have ideas for new features or improvements, feel free to open an issue or submit a pull request.\n\n## 📜 License\n\nThis project is licensed under a Personal Use License - see the [LICENSE](LICENSE) file for details.\n\n**Personal & Educational Use:** Free to use, modify, and distribute for personal, educational, and non-commercial purposes.\n\n**Commercial Use:** Requires a separate commercial license. Please contact Panda AI for commercial licensing terms.\n\n### A small video to help you understand what the project is about. \nhttps:\u002F\u002Fgithub.com\u002Fuser-attachments\u002Fassets\u002Fb577072e-2f7f-42d2-9054-3a11160cf87d\n\nWrite you api key in in local.properties, more keys you use, better is the speed 😉\n\n# View logs in real-time\nadb logcat | grep GeminiApi\n\n## Star History\n\n[![Star History Chart](https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002FAyush0Chaudhary_blurr_readme_15a6439cd67b.png)](https:\u002F\u002Fwww.star-history.com\u002F#Ayush0Chaudhary\u002Fblurr&Timeline)\n","# 🐼 熊猫：您的私人AI电话接线员  \n**您在玩手机，我在帮您操作。**  \n[![加入Discord](https:\u002F\u002Fimg.shields.io\u002Fbadge\u002FJoin%20Discord-5865F2?style=for-the-badge&logo=discord&logoColor=white)](https:\u002F\u002Fdiscord.gg\u002Fb2hxFNXvWk)\n\u003Ca href='https:\u002F\u002Fplay.google.com\u002Fstore\u002Fapps\u002Fdetails?id=com.blurr.voice&hl=en_US&pcampaignid=pcampaignidMKT-Other-global-all-co-prtnr-py-PartBadge-Mar2515-1'>\u003Cimg alt='在Google Play获取' src='https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002FAyush0Chaudhary_blurr_readme_1e91d02cf5a9.png' width=250\u002F>\u003C\u002Fa>\n[![向DeepWiki提问](https:\u002F\u002Fdeepwiki.com\u002Fbadge.svg)](https:\u002F\u002Fdeepwiki.com\u002FAyush0Chaudhary\u002Fblurr)\n---\n\n# 演示：\n\n#### 解释熊猫的所有触发条件\n [![观看视频](https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002FAyush0Chaudhary_blurr_readme_f1611a842893.jpg)](https:\u002F\u002Fwww.youtube.com\u002Fembed\u002FIDvuqmPyKZs)\n\n#### 向LinkedIn上的所有新联系人发送欢迎消息\n [![观看视频](https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002FAyush0Chaudhary_blurr_readme_d388a6592a47.jpg)](https:\u002F\u002Fwww.youtube.com\u002Fembed\u002FJO_EWFYJJjA)\n\n#### 5个任务演示： \nhttps:\u002F\u002Fgithub.com\u002Fuser-attachments\u002Fassets\u002Fcf76bb00-2bf4-4274-acad-d9f4c0d47188\n\n\n**熊猫**是一款适用于Android的主动式设备端AI智能体，能够自主理解自然语言指令，并操作手机UI来完成这些指令。受让现代技术更易用的需求启发，熊猫充当您的私人接线员，能够在不同应用中处理复杂、多步骤的任务。\n\n[![项目状态：开发中](https:\u002F\u002Fimg.shields.io\u002Fbadge\u002Fproject%20status-wip-yellow.svg)](https:\u002F\u002Fwip.vost.pt\u002F)\n[![许可证：个人使用](https:\u002F\u002Fimg.shields.io\u002Fbadge\u002FLicense-Personal%20Use%20Only-red.svg)](.\u002FLICENSE)\n[![Kotlin版本](https:\u002F\u002Fimg.shields.io\u002Fbadge\u002FKotlin-1.9.22-7F52FF.svg?logo=kotlin)](https:\u002F\u002Fkotlinlang.org)\n\n## 核心功能\n\n* 🧠 **智能UI自动化:** 熊猫能够“看到”屏幕，理解UI元素的上下文，并执行点击、滑动、输入等操作，以导航应用并完成任务。\n* 📢 **高质量语音:** 熊猫采用GCS的Chirp引擎，提供高质量语音。\n* 💾 **持久且个性化的本地记忆:** ⚠️ **暂时禁用** - 目前熊猫的记忆功能已被关闭。该功能将在未来的更新中恢复。\n\n## 架构概述\n\n熊猫基于一套复杂的多智能体系统构建，完全使用Kotlin编写。这种架构将不同职责分离，从而实现更复杂、更可靠的推理能力。\n\n* **眼睛与双手（执行器）:** **Android无障碍服务**作为智能体与设备之间的物理连接，提供读取屏幕元素层级结构以及以编程方式执行触摸手势的底层能力。\n* **大脑（LLM）:** 所有高层级的推理、规划和分析均由LLM模型驱动。决策在此处做出。\n* **智能体:**\n    * **操作员:** 这是一个带有记事本的执行者。\n\n\u003Cimg width=\"421\" height=\"251\" alt=\"Untitled Diagram drawio (2)\" src=\"https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002FAyush0Chaudhary_blurr_readme_50dce18bf4c9.png\" \u002F>\n\n\n## 🚀 开始使用\n\n### 前提条件\n* Android Studio（建议使用最新版本）\n* 具备API级别26及以上版本的Android设备或模拟器\n* 一些Gemini API密钥，示例ENV\n```python\n# 这些密钥的名字并不意味着您需要谷歌云，您可以使用任何能接受请求的服务器。未来我将通过兼容OpenAPI来提升开发者体验。\nGCLOUD_PROXY_URL=\u003C任何可接受如下响应格式的后端URL>\nGCLOUD_PROXY_URL_KEY=\u003C您想设置的任意密码，或留空>\n```\n`payload`\n```\n{\n  \"modelName\": \"model-name\",\n  \"messages\": [\n    {\n      \"role\": \"user\",\n      \"parts\": [\n        {\n          \"text\": \"你好，你能做什么？\"\n        }\n      ]\n    },\n    {\n      \"role\": \"model\",\n      \"parts\": [\n        {\n          \"text\": \"我可以帮助您完成各种任务。今天您需要什么帮助呢？\"\n        }\n      ]\n    }\n  ]\n}\n```\n或者\n```\n\u002F\u002F您也可以添加Gemini密钥进行尝试\n\nGEMINI_API_KEYS=\n```\n\n\n\n\n### 安装步骤\n\n1.  **克隆仓库:**\n    ```bash\n    git clone [https:\u002F\u002Fgithub.com\u002Fayush0chaudhary\u002Fblurr.git](https:\u002F\u002Fgithub.com\u002Fayush0chaudhary\u002Fblurr.git)\n    cd blurr\n    ```\n\n2.  **构建并运行:**\n    * 在Android Studio中打开项目。\n    * 让Gradle同步所有依赖项。\n    * 在您选择的设备或模拟器上运行应用。\n\n3.  **启用无障碍服务:**\n    * 首次运行时，应用会提示您授予无障碍权限。\n    * 点击“授予访问权限”，并在手机设置中启用“熊猫”服务。这是智能体查看和控制屏幕所必需的。\n\n## 🗺️ 熊猫的下一步计划（路线图）\n\n目前，熊猫还只是一个功能强大的概念验证，其路线图旨在将其打造为真正不可或缺的助手。\n\n* [ ] **未更新:** 列表尚未更新\n\n## 🤝 贡献\n\n我们欢迎任何形式的贡献！如果您对新功能或改进有任何想法，请随时提交问题或拉取请求。\n\n## 📜 许可证\n\n本项目采用个人使用许可——详情请参阅[LICENSE](LICENSE)文件。\n\n**个人及教育用途:** 可免费用于个人、教育及非商业目的的使用、修改和分发。\n\n**商业用途:** 需单独申请商业许可。如需商业授权条款，请联系Panda AI。\n\n### 一段小视频，帮助您了解该项目的内容。\nhttps:\u002F\u002Fgithub.com\u002Fuser-attachments\u002Fassets\u002Fb577072e-2f7f-42d2-9054-3a11160cf87d\n\n请将您的API密钥写入local.properties文件中，使用的密钥越多，速度越快😉\n\n# 实时查看日志\nadb logcat | grep GeminiApi\n\n## 星标历史\n\n[![星标历史图表](https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002FAyush0Chaudhary_blurr_readme_15a6439cd67b.png)](https:\u002F\u002Fwww.star-history.com\u002F#Ayush0Chaudhary\u002Fblurr&Timeline)","# Blurr (Panda) 快速上手指南\n\nBlurr (代号 Panda) 是一个基于 Android 的本机 AI 智能体，能够理解自然语言指令并自主操作手机 UI（点击、滑动、输入），从而完成跨应用的复杂任务。本项目完全使用 Kotlin 编写。\n\n## 环境准备\n\n在开始之前，请确保满足以下系统和依赖要求：\n\n*   **开发工具**: Android Studio (推荐最新版本)\n*   **运行设备**: Android 真机或模拟器，系统 API 级别需为 **26+** (Android 8.0+)\n*   **API 密钥**: 需要配置大模型 API 密钥。\n    *   **方案 A (推荐)**: 使用兼容 Google Gemini 格式的任意后端服务。\n    *   **方案 B**: 直接使用 Google Gemini API Keys。\n*   **网络环境**: 由于项目依赖外部 LLM 服务，国内开发者可能需要配置网络代理以确保连接稳定。\n\n## 安装步骤\n\n### 1. 克隆项目\n打开终端，执行以下命令获取源代码：\n\n```bash\ngit clone https:\u002F\u002Fgithub.com\u002Fayush0chaudhary\u002Fblurr.git\ncd blurr\n```\n\n### 2. 配置 API 密钥\n在项目根目录下找到或创建 `local.properties` 文件，填入你的 API 配置。你可以选择以下任一方式：\n\n**方式一：配置自定义后端 (兼容 Gemini 格式)**\n```properties\nGCLOUD_PROXY_URL=\u003C你的后端服务地址>\nGCLOUD_PROXY_URL_KEY=\u003C可选的密码，留空即可>\n```\n*注意：后端需接收如下 JSON Payload 格式的请求：*\n```json\n{\n  \"modelName\": \"model-name\",\n  \"messages\": [\n    { \"role\": \"user\", \"parts\": [{ \"text\": \"Hello\" }] },\n    { \"role\": \"model\", \"parts\": [{ \"text\": \"Hi\" }] }\n  ]\n}\n```\n\n**方式二：直接配置 Gemini Keys (可填多个以提升速度)**\n```properties\nGEMINI_API_KEYS=你的_gemini_api_key_1,你的_gemini_api_key_2\n```\n\n### 3. 构建与运行\n1.  使用 **Android Studio** 打开项目文件夹。\n2.  等待 Gradle 自动同步所有依赖。\n3.  连接你的 Android 设备或启动模拟器。\n4.  点击 Run 按钮编译并安装应用。\n\n## 基本使用\n\n应用安装完成后，请按以下步骤激活智能体：\n\n1.  **授权无障碍服务**:\n    *   首次启动 App 时，会弹出请求“无障碍权限” (Accessibility Permission) 的提示。\n    *   点击 **\"Grant Access\"** (授予访问权限)。\n    *   在系统设置页面中，找到 **\"Panda\"** 服务并开启开关。\n    *   *原理：这是 AI 能够“看见”屏幕内容并模拟手指操作（点击、滑动）的必要权限。*\n\n2.  **开始交互**:\n    *   返回 App 界面，通过语音或文本输入自然语言指令。\n    *   **示例指令**: “打开微信，给最近联系人发送一条消息说你好”。\n    *   Panda 将自动分析屏幕上下文，规划步骤并执行操作。\n\n3.  **实时调试 (可选)**:\n    如果你需要查看底层日志以排查问题，可在终端运行：\n    ```bash\n    adb logcat | grep GeminiApi\n    ```\n\n> **提示**: 目前记忆功能 (Persistent Memory) 暂时禁用，将在未来版本恢复。项目仅供个人学习和非商业用途使用。","一位自由职业者需要在每天早晨快速处理来自微信、邮件和领英的多平台客户沟通，同时记录关键待办事项到本地笔记应用中。\n\n### 没有 blurr 时\n- **操作繁琐重复**：用户必须手动解锁手机，依次打开微信、邮箱和领英 App，逐个查找新消息并回复，耗时且容易遗漏。\n- **跨应用断点严重**：在复制客户需求从聊天软件跳转到笔记应用时，需要频繁切换上下文，打断工作流，降低专注度。\n- **无法语音驱动复杂流程**：虽然手机有语音助手，但只能执行简单指令（如“打电话”），无法理解“把刚才微信里张总的需求记下来并回复确认”这类多步骤自然语言命令。\n- **夜间或忙碌时响应滞后**：当用户正在开会或驾驶时，无法及时通过语音让手机自动完成筛选和初步回复，导致客户等待时间过长。\n\n### 使用 blurr 后\n- **一键语音托管全流程**：用户只需对手机说“帮我检查所有新消息，回复紧急客户并把需求记到笔记里”，blurr 即可自主唤醒并遍历各个应用完成操作。\n- **智能识别与无缝衔接**：blurr 利用视觉能力“看懂”屏幕上的聊天内容，自动提取关键信息，无需人工复制粘贴，直接写入笔记应用，实现跨应用无感流转。\n- **深度理解自然语言意图**：基于大模型的大脑，blurr 能精准拆解复杂指令，自主规划点击、滑动和输入路径，像真人一样操作 UI 界面。\n- **全天候主动待命**：无论用户是否在操作手机，blurr 都能作为后台代理随时响应语音指令，确保在驾驶或会议中也能即时处理业务线索。\n\nblurr 将安卓手机从被动工具升级为能听懂人话、主动干活的私人数字员工，彻底释放用户在多任务处理中的双手与脑力。","https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002FAyush0Chaudhary_blurr_f1611a84.jpg","Ayush0Chaudhary","Ayush Chaudhary","https:\u002F\u002Foss.gittoolsai.com\u002Favatars\u002FAyush0Chaudhary_533ac224.jpg","No longer a Student @IITR | Developer @mdgspace @acmiitr \r\n\r\n ",null,"Bengaluru","https:\u002F\u002Fayushchaudhary.alpexlab.com\u002F","https:\u002F\u002Fgithub.com\u002FAyush0Chaudhary",[82,86],{"name":83,"color":84,"percentage":85},"Kotlin","#A97BFF",99.1,{"name":87,"color":88,"percentage":89},"HTML","#e34c26",0.9,902,129,"2026-04-19T05:13:28","NOASSERTION",4,"未说明 (基于 Android 应用，需在 Android 设备或模拟器上运行)","未说明",{"notes":98,"python":96,"dependencies":99},"该项目是一个原生的 Android 应用，而非传统的 Python AI 模型库。开发环境需要最新版的 Android Studio 和 API 级别 26+ 的 Android 设备或模拟器。运行时必须授予‘无障碍服务 (Accessibility Service)'权限以控制屏幕。后端依赖大语言模型 (LLM)，需配置 Google Gemini API 密钥或兼容的代理服务器地址。项目主要使用 Kotlin 编写。",[100,101,102],"Kotlin 1.9.22","Android Accessibility Service","Gradle",[45,13,104],"音频",[106,107,108,109,110,111,112,113,114,115,116,117],"agent","ai-automation","app","automation","browser-use","mobile-use","operator","accessibility","ai-assistant","voice-assistant","doubao","open-doubao","2026-03-27T02:49:30.150509","2026-04-20T04:08:06.354973",[121,126,131,136,141,146,151,156],{"id":122,"question_zh":123,"answer_zh":124,"source_url":125},43427,"应用内内容过滤代理误伤了应用自身的界面，如何解决？","需要配置内容过滤代理，使其在检测到用户正处于本应用内部时停止工作。具体做法是指示代理“当位于应用内部时放松限制（chill out）”，避免屏蔽应用屏幕上的正常内容。","https:\u002F\u002Fgithub.com\u002FAyush0Chaudhary\u002Fblurr\u002Fissues\u002F14",{"id":127,"question_zh":128,"answer_zh":129,"source_url":130},43428,"购买专业版后提示“开发者尚未确认您的购买”，该怎么办？","这通常是因为新版本正在等待 Google Play 审核。维护者建议：1. 等待应用商店更新到最新修复版本；2. 如果急需使用，可以将用于登录的邮箱地址发送给维护者，由他们手动处理以恢复专业版权限。","https:\u002F\u002Fgithub.com\u002FAyush0Chaudhary\u002Fblurr\u002Fissues\u002F349",{"id":132,"question_zh":133,"answer_zh":134,"source_url":135},43429,"如何实现基于邮箱和 OTP（一次性密码）的用户登录功能？","实现该功能需要 SMTP 服务来发送邮件。推荐方案有两种：1. 使用 nodemailer 配合 SMTP 凭据直接发送；2. （推荐）使用 Firebase 扩展程序 'Trigger Email from Firestore'。具体做法是将包含邮件内容的文档写入 Firestore 的特定集合（如 'mails'），Firebase 扩展会自动监听并触发邮件发送。","https:\u002F\u002Fgithub.com\u002FAyush0Chaudhary\u002Fblurr\u002Fissues\u002F357",{"id":137,"question_zh":138,"answer_zh":139,"source_url":140},43430,"应用报错且扣除了积分，或者响应缓慢，是什么原因？","如果遇到报错但仍扣除积分，或处理速度慢，通常是因为后端基础设施负载过高（overwhelmed）。维护者表示正在努力扩容，服务很快会恢复正常。此外，目前助手（Panda）主要支持英语，使用葡萄牙语等其他语言可能导致理解失败或流程变慢。","https:\u002F\u002Fgithub.com\u002FAyush0Chaudhary\u002Fblurr\u002Fissues\u002F344",{"id":142,"question_zh":143,"answer_zh":144,"source_url":145},43431,"如何让 AI 代理在执行任务时知晓用户名和当前时间？","需要在 Agent Service 的上下文（context）中添加用户名和时间信息，并将这些信息追加到发送给大模型的提示词（prompt）中。这样代理就能在进行个性化对话或判断任务时使用这些数据。","https:\u002F\u002Fgithub.com\u002FAyush0Chaudhary\u002Fblurr\u002Fissues\u002F323",{"id":147,"question_zh":148,"answer_zh":149,"source_url":150},43432,"如何在任务完成时向用户展示文件列表或结果报告？","在使用 `done` 动作完成任务时，利用其参数 `files_to_display`。该参数接受一个文件名列表（例如 `[\"results.md\"]`）。同时，应在 `text` 字段中告知用户结果已生成，并提示他们可以在应用内的特定页面查看该列表。系统会根据此参数自动将文件附件展示给用户。","https:\u002F\u002Fgithub.com\u002FAyush0Chaudhary\u002Fblurr\u002Fissues\u002F118",{"id":152,"question_zh":153,"answer_zh":154,"source_url":155},43433,"什么是“向上语义聚合（Upward Semantic Aggregation）”算法，它解决了什么问题？","该算法旨在解决 UI 描述信息与可交互元素分离的问题（例如文本标签“登录”与可点击的容器不在同一节点）。它通过构建完整的 UI 树，将子节点的语义信息（如文本、描述）向上聚合到父级可交互组件中。这使得原始 UI 数据更逻辑化，便于大语言模型（LLM）理解和操作。","https:\u002F\u002Fgithub.com\u002FAyush0Chaudhary\u002Fblurr\u002Fissues\u002F90",{"id":157,"question_zh":158,"answer_zh":159,"source_url":160},43434,"AI 代理无法完成多步骤的应用管理任务（如卸载后重新安装应用），怎么办？","这是一个已知问题，代理可能在执行连续操作（如先卸载 Spotify 再从 Play 商店重装）时卡住。这通常涉及对“长按”动作或多步流程的支持不足。建议关注相关 Issue（如 #214）的修复进度，或在操作时尝试将步骤分解得更细致。","https:\u002F\u002Fgithub.com\u002FAyush0Chaudhary\u002Fblurr\u002Fissues\u002F206",[]]