[{"data":1,"prerenderedAt":-1},["ShallowReactive",2],{"tool-neural-maze--ava-whatsapp-agent-course":3,"similar-neural-maze--ava-whatsapp-agent-course":107},{"id":4,"github_repo":5,"name":6,"description_en":7,"description_zh":8,"ai_summary_zh":8,"readme_en":9,"readme_zh":10,"quickstart_zh":11,"use_case_zh":12,"hero_image_url":13,"owner_login":14,"owner_name":15,"owner_avatar_url":16,"owner_bio":17,"owner_company":18,"owner_location":18,"owner_email":19,"owner_twitter":18,"owner_website":20,"owner_url":21,"languages":22,"stars":46,"forks":47,"last_commit_at":48,"license":49,"difficulty_score":50,"env_os":51,"env_gpu":52,"env_ram":51,"env_deps":53,"category_tags":64,"github_topics":68,"view_count":76,"oss_zip_url":18,"oss_zip_packed_at":18,"status":77,"created_at":78,"updated_at":79,"faqs":80,"releases":106},6072,"neural-maze\u002Fava-whatsapp-agent-course","ava-whatsapp-agent-course","Meet Ava, the WhatsApp Agent","ava-whatsapp-agent-course 是一个开源教学项目，旨在指导开发者构建名为\"Ava\"的智能 WhatsApp 代理。受科幻电影《机械姬》启发，该项目将经典的“图灵测试”理念融入日常通讯场景，让用户能通过 WhatsApp 与 AI 进行逼真的多模态互动。\n\n它主要解决了传统 AI 教程往往止步于简单对话或单一文本处理的痛点，提供了一套完整的端到端解决方案。通过本课程，用户不仅能实现消息的收发，还能让 AI 具备理解语音指令、识别发送的图片、回复语音笔记，甚至主动分享带有图片的“日常生活”动态等高级能力。\n\n该项目非常适合希望提升实战能力的软件工程师、机器学习专家及 AI 开发者。如果你不满足于基础的\"Hello World\"示例，而是想深入掌握如何打造复杂的、具备多模态交互能力的生产级 AI 应用，这是一个极佳的学习资源。其技术亮点在于整合了语音处理、图像识别与大语言模型，并在 WhatsApp 这一真实社交平台上实现了流畅的自然交互，为构建拟人化智能助手提供了宝贵的工程实践参考。","\u003Cp align=\"center\">\n        \u003Cimg alt=\"logo\" src=\"https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002Fneural-maze_ava-whatsapp-agent-course_readme_81366ffc7844.gif\" width=1000 \u002F>\n    \u003Ch1 align=\"center\">📱 Ava 📱\u003C\u002Fh1>\n    \u003Ch3 align=\"center\">Turning the Turing Test into a WhatsApp Agent\u003C\u002Fh3>\n\u003C\u002Fp>\n\n\u003Cp align=\"center\">\n    \u003Cimg alt=\"logo\" src=\"https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002Fneural-maze_ava-whatsapp-agent-course_readme_5deb90e23dea.png\" width=100 \u002F>\n\u003C\u002Fp>\n\n## Table of Contents\n\n- [Table of Contents](#table-of-contents)\n- [Course Overview](#course-overview)\n- [Who is this course for?](#who-is-this-course-for)\n- [What you'll get out of this course](#what-youll-get-out-of-this-course)\n- [Getting started](#getting-started)\n- [Course syllabus](#course-syllabus)\n- [How much is this going to cost me?](#how-much-is-this-going-to-cost-me)\n- [The tech stack](#the-tech-stack)\n- [Contributors](#contributors)\n- [License](#license)\n\n## Course Overview\n\nWhat happens when [two ML Engineers](#contributors) with a love for sci-fi movies team up? 🤔\n\nYou get **Ava**, a Whatsapp agent that can engage with users in a \"realistic\" way, inspired by the great film [Ex Machina](https:\u002F\u002Fwww.imdb.com\u002Fes-es\u002Ftitle\u002Ftt0470752\u002F). Ok, you won't find a fully sentient robot here, but you **will** have some pretty interesting Whatsapp conversations.\n\nBy the end of this course, you'll have built your own Ava too, capable of:\n\n\n* Receiving and sending Whatsapp messages 📲\n* Understanding your voice 🗣️\n* Recognizing your images 🖼️\n* Sending voice notes back 🎤\n* Sharing updates about its \"daily activities\" 🚣\n* Sending you images of its current activities 🖼️\n\n>You can think of it as a modern reinterpretation of the Turing Test 🤣\n\nExcited? Let's get started! \n\n\u003Cdiv style=\"text-align: center;\">\n    \u003Cvideo src=\"https:\u002F\u002Fgithub.com\u002Fuser-attachments\u002Fassets\u002F6d1abefc-b4d8-4f66-9db6-a0e54b8df944\" controls width=\"100%\">\u003C\u002Fvideo>\n\u003C\u002Fdiv>\n\n---\n\n\u003Ctable style=\"border-collapse: collapse; border: none;\">\n  \u003Ctr style=\"border: none;\">\n    \u003Ctd width=\"20%\" style=\"border: none;\">\n      \u003Ca href=\"https:\u002F\u002Ftheneuralmaze.substack.com\u002F\" aria-label=\"The Neural Maze\">\n        \u003Cimg src=\"https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002Fneural-maze_ava-whatsapp-agent-course_readme_3a15abcc0487.png\" alt=\"The Neural Maze Logo\" width=\"150\"\u002F>\n      \u003C\u002Fa>\n    \u003C\u002Ftd>\n    \u003Ctd width=\"80%\" style=\"border: none;\">\n      \u003Cdiv>\n        \u003Ch2>📬 Stay Updated\u003C\u002Fh2>\n        \u003Cp>\u003Cb>\u003Ca href=\"https:\u002F\u002Ftheneuralmaze.substack.com\u002F\">Join The Neural Maze\u003C\u002Fa>\u003C\u002Fb> and learn to build AI Systems that actually work, from principles to production. Every Wednesday, directly to your inbox. Don't miss out!\u003C\u002Fp>\n      \u003C\u002Fdiv>\n    \u003C\u002Ftd>\n  \u003C\u002Ftr>\n\u003C\u002Ftable>\n\n\u003Cp align=\"center\">\n  \u003Ca href=\"https:\u002F\u002Ftheneuralmaze.substack.com\u002F\">\n    \u003Cimg src=\"https:\u002F\u002Fimg.shields.io\u002Fstatic\u002Fv1?label&logo=substack&message=Subscribe%20Now&style=for-the-badge&color=black&scale=2\" alt=\"Subscribe Now\" height=\"40\">\n  \u003C\u002Fa>\n\u003C\u002Fp>\n\n\u003Ctable style=\"border-collapse: collapse; border: none;\">\n  \u003Ctr style=\"border: none;\">\n    \u003Ctd width=\"20%\" style=\"border: none;\">\n      \u003Ca href=\"https:\u002F\u002Fwww.youtube.com\u002F@jesuscopado-en\" aria-label=\"Jesus Copado YouTube Channel\">\n        \u003Cimg src=\"https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002Fneural-maze_ava-whatsapp-agent-course_readme_0f3295dce723.png\" alt=\"Jesus Copado YouTube Channel\" width=\"150\"\u002F>\n      \u003C\u002Fa>\n    \u003C\u002Ftd>\n    \u003Ctd width=\"80%\" style=\"border: none;\">\n      \u003Cdiv>\n        \u003Ch2>🎥 Watch More Content\u003C\u002Fh2>\n        \u003Cp>\u003Cb>\u003Ca href=\"https:\u002F\u002Fwww.youtube.com\u002F@jesuscopado-en\">Join Jesús Copado on YouTube\u003C\u002Fa>\u003C\u002Fb> to explore how to build real AI projects—from voice agents to creative tools. Weekly videos with code, demos, and ideas that push what's possible with AI. Don't miss the next drop!\u003C\u002Fp>\n      \u003C\u002Fdiv>\n    \u003C\u002Ftd>\n  \u003C\u002Ftr>\n\u003C\u002Ftable>\n\n\u003Cp align=\"center\">\n  \u003Ca href=\"https:\u002F\u002Fwww.youtube.com\u002F@jesuscopado-en\">\n    \u003Cimg src=\"https:\u002F\u002Fimg.shields.io\u002Fstatic\u002Fv1?label&logo=youtube&message=Subscribe%20Now&style=for-the-badge&color=FF0000&scale=2\" alt=\"Subscribe Now\" height=\"40\">\n  \u003C\u002Fa>\n\u003C\u002Fp>\n\n---\n\n## Who is this course for?\n\nThis course is for Software Engineers, ML Engineers, and AI Engineers who want to level up by building complex end-to-end apps. It's not just a basic \"Hello World\" tutorial—it's a deep dive into making a production-ready WhatsApp agent.\n\n## What you'll get out of this course\n\n* Build a fully working WhatsApp agent you can chat with on your phone\n* Get a solid understanding of how to build LangGraph workflows\n* Set up a long-term memory system using Qdrant as a Vector Database\n* Use Groq models to power AI Agent responses\n* Implement STT systems using Whisper\n* Implement TTS systems using ElevenLabs\n* Generate high-quality images using diffusion models, like FLUX models\n* Process images using VLM models, like llama-3.2-vision\n* Create chat interfaces using Chainlit\n* Deploy agentic applications to Cloud Run\n* Connect agentic applications to the WhatsApp API\n\n## Getting started\n\nBefore you begin the course, there are a few things you need to do. \n\nI'm referring to the virtual environment creation, dependencies installation, `.env` file creation, etc. I know, it's very boring, but it's a necessary evil! 😅\n\nAll of this is detailed in the following doc: [GETTING STARTED.md](docs\u002FGETTING_STARTED.md).\n\n> Make sure you follow the instructions in the doc, as it's crucial for the course to work.\n\n## Course syllabus\n\n| Lesson Number | Written Lesson | Video Lesson | Description |\n|---------------|----------------|--------------|-------------|\n| \u003Cdiv align=\"center\">1\u003C\u002Fdiv> | [Project overview](https:\u002F\u002Ftheneuralmaze.substack.com\u002Fp\u002Fmeet-ava-the-whatsapp-agent) | \u003Ca href=\"https:\u002F\u002Fyoutu.be\u002Fu5y06cFK2WA?si=RCx__sJNtr2DYf0U\">\u003Cimg src=\"https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002Fneural-maze_ava-whatsapp-agent-course_readme_002d5e8c7552.png\" alt=\"Thumbnail 1\" width=\"400\">\u003C\u002Fa> | Understand the project architecture and the tech stack. |\n| \u003Cdiv align=\"center\">2\u003C\u002Fdiv> | [Dissecting Ava's brain](https:\u002F\u002Ftheneuralmaze.substack.com\u002Fp\u002Fdissecting-avas-brain) | \u003Ca href=\"https:\u002F\u002Fyoutu.be\u002FnTsLL3htkCU?si=aSmSkpL-U3rzw9Za\">\u003Cimg src=\"https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002Fneural-maze_ava-whatsapp-agent-course_readme_a6f96d966226.png\" alt=\"Thumbnail 2\" width=\"400\">\u003C\u002Fa> | Learn the basics of LangGraph and implement complex workflows using this framework. |\n| \u003Cdiv align=\"center\">3\u003C\u002Fdiv> | [Unlocking Ava's memories](https:\u002F\u002Ftheneuralmaze.substack.com\u002Fp\u002Fcan-agents-get-nostalgic-about-the) | \u003Ca href=\"https:\u002F\u002Fyoutu.be\u002FoTHqYEpdFXg?si=MXEvjUJ8Xbc6h9l2\">\u003Cimg src=\"https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002Fneural-maze_ava-whatsapp-agent-course_readme_3ffdf6883d93.png\" alt=\"Thumbnail 3\" width=\"400\">\u003C\u002Fa> | Build a short-term memory system for graph state persistence and chat history. Also, implement a long-term memory system using Qdrant. |\n| \u003Cdiv align=\"center\">4\u003C\u002Fdiv> | [Giving Ava a Voice](https:\u002F\u002Ftheneuralmaze.substack.com\u002Fp\u002Fthe-ultimate-ai-voice-pipeline) | \u003Ca href=\"https:\u002F\u002Fyoutu.be\u002FRNmwvMjtIt0\">\u003Cimg src=\"https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002Fneural-maze_ava-whatsapp-agent-course_readme_c7b674666fd4.png\" alt=\"Thumbnail 4\" width=\"400\">\u003C\u002Fa> | Build a STT and a TTS pipeline to make Ava process input and output audio. |\n| \u003Cdiv align=\"center\">5\u003C\u002Fdiv> | [Ava learns to see](https:\u002F\u002Ftheneuralmaze.substack.com\u002Fp\u002Freading-images-drawing-dreams-vlms) | \u003Ca href=\"https:\u002F\u002Fyoutu.be\u002FLS7k-XFBbeo\">\u003Cimg src=\"https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002Fneural-maze_ava-whatsapp-agent-course_readme_86b08af47bca.png\" alt=\"Thumbnail 5\" width=\"400\">\u003C\u002Fa> | Understand how to process images using VLM models. Implement an image generation pipeline using FLUX models. |\n| \u003Cdiv align=\"center\">6\u003C\u002Fdiv> | [Ava installs Whatsapp](https:\u002F\u002Ftheneuralmaze.substack.com\u002Fp\u002Fconnecting-an-ai-agent-to-whatsapp) | \u003Ca href=\"https:\u002F\u002Fyoutu.be\u002FdFsI4lnUkKo\">\u003Cimg src=\"https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002Fneural-maze_ava-whatsapp-agent-course_readme_1057bb0a6a37.png\" alt=\"Thumbnail 6\" width=\"400\">\u003C\u002Fa> | Connect Ava to WhatsApp. Learn how to deploy a LangGraph application to Google Cloud Run. |\n\nAnd if you're feeling extra brave, there's also a 2+ hour video course where we walk through all the project details and the code, step by step.\n\n\u003Cp align=\"center\">\n    \u003Ca href=\"https:\u002F\u002Fyoutu.be\u002FNQlYB_OMtjQ?si=OacTft8tyQzO6pwh\">\u003Cimg src=\"https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002Fneural-maze_ava-whatsapp-agent-course_readme_64287e30d380.png\" alt=\"Ava Full Course\" width=\"500\">\u003C\u002Fa>\n\u003C\u002Fp>\n\n---\n\n## How much is this going to cost me?\n\nThe awesome thing about this project is **you can run it on your own computer for free!**\n\nThe **free tiers** from Groq, ElevenLabs, Qdrant Cloud, and Together AI are more than enough to get you going.\n\nIf you want to try it out on Google Cloud Run, you can get a free account and get $300 in free credits. Even if you've already used up your free credits, Cloud Run is super cheap - so it will take just a buck or two for your experiments.\n\n---\n\n## The tech stack\n\n\u003Ctable>\n  \u003Ctr>\n    \u003Cth>Technology\u003C\u002Fth>\n    \u003Cth>Description\u003C\u002Fth>\n  \u003C\u002Ftr>\n  \u003Ctr>\n    \u003Ctd>\u003Cimg src=\"https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002Fneural-maze_ava-whatsapp-agent-course_readme_bd3e7ab537de.png\" width=\"100\" alt=\"Groq Logo\"\u002F>\u003C\u002Ftd>\n    \u003Ctd>Powering the project with Llama 3.3, Llama 3.2 Vision, and Whisper. Groq models are awesome (and fast!!)\u003C\u002Ftd>\n  \u003C\u002Ftr>\n  \u003Ctr>\n    \u003Ctd>\u003Cimg src=\"https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002Fneural-maze_ava-whatsapp-agent-course_readme_7800371ca867.png\" width=\"100\" alt=\"Qdrant Logo\"\u002F>\u003C\u002Ftd>\n    \u003Ctd>Serving as the long-term database, enabling our agent to recall details you shared months ago.\u003C\u002Ftd>\n  \u003C\u002Ftr>\n  \u003Ctr>\n    \u003Ctd>\u003Cimg src=\"https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002Fneural-maze_ava-whatsapp-agent-course_readme_6f557904ac57.png\" width=\"100\" alt=\"Cloud Run Logo\"\u002F>\u003C\u002Ftd>\n    \u003Ctd>Deploying your containers easily to Google Cloud Platform\u003C\u002Ftd>\n  \u003C\u002Ftr>\n  \u003Ctr>\n    \u003Ctd>\u003Cimg src=\"https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002Fneural-maze_ava-whatsapp-agent-course_readme_80828c3ea317.png\" width=\"100\" alt=\"LangGraph Logo\"\u002F>\u003C\u002Ftd>\n    \u003Ctd>Learn how to build production-ready LangGraph workflows\u003C\u002Ftd>\n  \u003C\u002Ftr>\n  \u003Ctr>\n    \u003Ctd>\u003Cimg src=\"https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002Fneural-maze_ava-whatsapp-agent-course_readme_3d97135dcda3.png\" width=\"100\" alt=\"ElevenLabs Logo\"\u002F>\u003C\u002Ftd>\n    \u003Ctd>Amazing TTS models\u003C\u002Ftd>\n  \u003C\u002Ftr>\n  \u003Ctr>\n    \u003Ctd>\u003Cimg src=\"https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002Fneural-maze_ava-whatsapp-agent-course_readme_1acd433305a9.png\" width=\"100\" alt=\"Together AI Logo\"\u002F>\u003C\u002Ftd>\n    \u003Ctd>Behind Ava's image generation process\u003C\u002Ftd>\n  \u003C\u002Ftr>\n\u003C\u002Ftable>\n\n\n## Contributors\n\n\u003Ctable>\n  \u003Ctr>\n    \u003Ctd align=\"center\">\u003Cimg src=\"https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002Fneural-maze_ava-whatsapp-agent-course_readme_beeb94265d28.png\" width=\"100\" style=\"border-radius:50%;\"\u002F>\u003C\u002Ftd>\n    \u003Ctd>\n      \u003Cstrong>Miguel Otero Pedrido | Senior ML \u002F AI Engineer \u003C\u002Fstrong>\u003Cbr \u002F>\n      \u003Ci>Founder of The Neural Maze. Rick and Morty fan.\u003C\u002Fi>\u003Cbr \u002F>\u003Cbr \u002F>\n      \u003Ca href=\"https:\u002F\u002Fwww.linkedin.com\u002Fin\u002Fmigueloteropedrido\u002F\">LinkedIn\u003C\u002Fa>\u003Cbr \u002F>\n      \u003Ca href=\"https:\u002F\u002Fwww.youtube.com\u002F@TheNeuralMaze\">YouTube\u003C\u002Fa>\u003Cbr \u002F>\n      \u003Ca href=\"https:\u002F\u002Ftheneuralmaze.substack.com\u002F\">The Neural Maze Newsletter\u003C\u002Fa>\n    \u003C\u002Ftd>\n  \u003C\u002Ftr>\n  \u003Ctr>\n    \u003Ctd align=\"center\">\u003Cimg src=\"https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002Fneural-maze_ava-whatsapp-agent-course_readme_47a791d81fa2.png\" width=\"100\" style=\"border-radius:50%;\"\u002F>\u003C\u002Ftd>\n    \u003Ctd>\n      \u003Cstrong>Jesús Copado | Senior ML \u002F AI Engineer \u003C\u002Fstrong>\u003Cbr \u002F>\n      \u003Ci>Equal parts cinema fan and AI enthusiast.\u003C\u002Fi>\u003Cbr \u002F>\u003Cbr \u002F>\n      \u003Ca href=\"https:\u002F\u002Fwww.youtube.com\u002F@jesuscopado-en\">YouTube\u003C\u002Fa>\u003Cbr \u002F>\n      \u003Ca href=\"https:\u002F\u002Fwww.linkedin.com\u002Fin\u002Fcopadojesus\u002F\">LinkedIn\u003C\u002Fa>\u003Cbr \u002F>\n    \u003C\u002Ftd>\n  \u003C\u002Ftr>\n\u003C\u002Ftable>\n\n## License\n\nThis project is licensed under the MIT License - see the [LICENSE](LICENSE) file for details.\n\n---\n\n\u003Ctable style=\"border-collapse: collapse; border: none;\">\n  \u003Ctr style=\"border: none;\">\n    \u003Ctd width=\"20%\" style=\"border: none;\">\n      \u003Ca href=\"https:\u002F\u002Ftheneuralmaze.substack.com\u002F\" aria-label=\"The Neural Maze\">\n        \u003Cimg src=\"https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002Fneural-maze_ava-whatsapp-agent-course_readme_3a15abcc0487.png\" alt=\"The Neural Maze Logo\" width=\"150\"\u002F>\n      \u003C\u002Fa>\n    \u003C\u002Ftd>\n    \u003Ctd width=\"80%\" style=\"border: none;\">\n      \u003Cdiv>\n        \u003Ch2>📬 Stay Updated\u003C\u002Fh2>\n        \u003Cp>\u003Cb>\u003Ca href=\"https:\u002F\u002Ftheneuralmaze.substack.com\u002F\">Join The Neural Maze\u003C\u002Fa>\u003C\u002Fb> and learn to build AI Systems that actually work, from principles to production. Every Wednesday, directly to your inbox. Don't miss out!\u003C\u002Fp>\n      \u003C\u002Fdiv>\n    \u003C\u002Ftd>\n  \u003C\u002Ftr>\n\u003C\u002Ftable>\n\n\u003Cp align=\"center\">\n  \u003Ca href=\"https:\u002F\u002Ftheneuralmaze.substack.com\u002F\">\n    \u003Cimg src=\"https:\u002F\u002Fimg.shields.io\u002Fstatic\u002Fv1?label&logo=substack&message=Subscribe%20Now&style=for-the-badge&color=black&scale=2\" alt=\"Subscribe Now\" height=\"40\">\n  \u003C\u002Fa>\n\u003C\u002Fp>\n\n\u003Ctable style=\"border-collapse: collapse; border: none;\">\n  \u003Ctr style=\"border: none;\">\n    \u003Ctd width=\"20%\" style=\"border: none;\">\n      \u003Ca href=\"https:\u002F\u002Fwww.youtube.com\u002F@jesuscopado-en\" aria-label=\"Jesus Copado YouTube Channel\">\n        \u003Cimg src=\"https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002Fneural-maze_ava-whatsapp-agent-course_readme_0f3295dce723.png\" alt=\"Jesus Copado YouTube Channel\" width=\"150\"\u002F>\n      \u003C\u002Fa>\n    \u003C\u002Ftd>\n    \u003Ctd width=\"80%\" style=\"border: none;\">\n      \u003Cdiv>\n        \u003Ch2>🎥 Watch More Content\u003C\u002Fh2>\n        \u003Cp>\u003Cb>\u003Ca href=\"https:\u002F\u002Fwww.youtube.com\u002F@jesuscopado-en\">Join Jesús Copado on YouTube\u003C\u002Fa>\u003C\u002Fb> to explore how to build real AI projects—from voice agents to creative tools. Weekly videos with code, demos, and ideas that push what's possible with AI. Don't miss the next drop!\u003C\u002Fp>\n      \u003C\u002Fdiv>\n    \u003C\u002Ftd>\n  \u003C\u002Ftr>\n\u003C\u002Ftable>\n\n\u003Cp align=\"center\">\n  \u003Ca href=\"https:\u002F\u002Fwww.youtube.com\u002F@jesuscopado-en\">\n    \u003Cimg src=\"https:\u002F\u002Fimg.shields.io\u002Fstatic\u002Fv1?label&logo=youtube&message=Subscribe%20Now&style=for-the-badge&color=FF0000&scale=2\" alt=\"Subscribe Now\" height=\"40\">\n  \u003C\u002Fa>\n\u003C\u002Fp>","\u003Cp align=\"center\">\n        \u003Cimg alt=\"logo\" src=\"https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002Fneural-maze_ava-whatsapp-agent-course_readme_81366ffc7844.gif\" width=1000 \u002F>\n    \u003Ch1 align=\"center\">📱 Ava 📱\u003C\u002Fh1>\n    \u003Ch3 align=\"center\">将图灵测试转化为 WhatsApp 代理\u003C\u002Fh3>\n\u003C\u002Fp>\n\n\u003Cp align=\"center\">\n    \u003Cimg alt=\"logo\" src=\"https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002Fneural-maze_ava-whatsapp-agent-course_readme_5deb90e23dea.png\" width=100 \u002F>\n\u003C\u002Fp>\n\n## 目录\n\n- [目录](#目录)\n- [课程概述](#课程概述)\n- [本课程适合哪些人？](#本课程适合哪些人)\n- [你将从本课程中学到什么](#你将从本课程中学到什么)\n- [开始学习](#开始学习)\n- [课程大纲](#课程大纲)\n- [这门课程需要花费多少？](#这门课程需要花费多少)\n- [技术栈](#技术栈)\n- [贡献者](#贡献者)\n- [许可证](#许可证)\n\n## 课程概述\n\n当两位热爱科幻电影的机器学习工程师联手时，会发生什么呢？🤔\n\n你就会得到 **Ava**——一个受经典影片《机械姬》（Ex Machina）启发、能够以“真实”方式与用户互动的 WhatsApp 代理。当然，这里不会有完全具备意识的机器人，但你确实会体验到一些非常有趣的 WhatsApp 对话。\n\n完成本课程后，你也将构建属于自己的 Ava，它能够：\n\n* 接收并发送 WhatsApp 消息 📲\n* 理解你的语音 🗣️\n* 识别你的图片 🖼️\n* 回传语音消息 🎤\n* 分享其“日常活动”的更新 🚣\n* 向你发送当前活动的图片 🖼️\n\n> 你可以把它看作是图灵测试的现代诠释 🤣\n\n是不是很期待呢？让我们开始吧！\n\n\u003Cdiv style=\"text-align: center;\">\n    \u003Cvideo src=\"https:\u002F\u002Fgithub.com\u002Fuser-attachments\u002Fassets\u002F6d1abefc-b4d8-4f66-9db6-a0e54b8df944\" controls width=\"100%\">\u003C\u002Fvideo>\n\u003C\u002Fdiv>\n\n---\n\n\u003Ctable style=\"border-collapse: collapse; border: none;\">\n  \u003Ctr style=\"border: none;\">\n    \u003Ctd width=\"20%\" style=\"border: none;\">\n      \u003Ca href=\"https:\u002F\u002Ftheneuralmaze.substack.com\u002F\" aria-label=\"The Neural Maze\">\n        \u003Cimg src=\"https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002Fneural-maze_ava-whatsapp-agent-course_readme_3a15abcc0487.png\" alt=\"The Neural Maze Logo\" width=\"150\"\u002F>\n      \u003C\u002Fa>\n    \u003C\u002Ftd>\n    \u003Ctd width=\"80%\" style=\"border: none;\">\n      \u003Cdiv>\n        \u003Ch2>📬 保持更新\u003C\u002Fh2>\n        \u003Cp>\u003Cb>\u003Ca href=\"https:\u002F\u002Ftheneuralmaze.substack.com\u002F\">加入 The Neural Maze\u003C\u002Fa>\u003C\u002Fb>，从原理到生产，学习如何构建真正可用的 AI 系统。每周三直接发送到你的邮箱，千万不要错过！\u003C\u002Fp>\n      \u003C\u002Fdiv>\n    \u003C\u002Ftd>\n  \u003C\u002Ftr>\n\u003C\u002Ftable>\n\n\u003Cp align=\"center\">\n  \u003Ca href=\"https:\u002F\u002Ftheneuralmaze.substack.com\u002F\">\n    \u003Cimg src=\"https:\u002F\u002Fimg.shields.io\u002Fstatic\u002Fv1?label&logo=substack&message=Subscribe%20Now&style=for-the-badge&color=black&scale=2\" alt=\"立即订阅\" height=\"40\">\n  \u003C\u002Fa>\n\u003C\u002Fp>\n\n\u003Ctable style=\"border-collapse: collapse; border: none;\">\n  \u003Ctr style=\"border: none;\">\n    \u003Ctd width=\"20%\" style=\"border: none;\">\n      \u003Ca href=\"https:\u002F\u002Fwww.youtube.com\u002F@jesuscopado-en\" aria-label=\"Jesus Copado YouTube 频道\">\n        \u003Cimg src=\"https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002Fneural-maze_ava-whatsapp-agent-course_readme_0f3295dce723.png\" alt=\"Jesus Copado YouTube 频道\" width=\"150\"\u002F>\n      \u003C\u002Fa>\n    \u003C\u002Ftd>\n    \u003Ctd width=\"80%\" style=\"border: none;\">\n      \u003Cdiv>\n        \u003Ch2>🎥 观看更多内容\u003C\u002Fh2>\n        \u003Cp>\u003Cb>\u003Ca href=\"https:\u002F\u002Fwww.youtube.com\u002F@jesuscopado-en\">加入 Jesús Copado 的 YouTube 频道\u003C\u002Fa>\u003C\u002Fb>，探索如何构建真正的 AI 项目——从语音助手到创意工具。每周都有代码、演示和突破 AI 极限的想法，千万别错过下一期！\u003C\u002Fp>\n      \u003C\u002Fdiv>\n    \u003C\u002Ftd>\n  \u003C\u002Ftr>\n\u003C\u002Ftable>\n\n\u003Cp align=\"center\">\n  \u003Ca href=\"https:\u002F\u002Fwww.youtube.com\u002F@jesuscopado-en\">\n    \u003Cimg src=\"https:\u002F\u002Fimg.shields.io\u002Fstatic\u002Fv1?label&logo=youtube&message=Subscribe%20Now&style=for-the-badge&color=FF0000&scale=2\" alt=\"立即订阅\" height=\"40\">\n  \u003C\u002Fa>\n\u003C\u002Fp>\n\n---\n\n## 本课程适合哪些人？\n\n本课程面向希望通过构建复杂的端到端应用来提升技能的软件工程师、机器学习工程师和 AI 工程师。这不仅仅是一个简单的“Hello World”教程，而是一次深入探究如何打造可投入生产的 WhatsApp 代理的旅程。\n\n## 你将从本课程中学到什么\n\n* 构建一个功能完善的 WhatsApp 代理，你可以在手机上与其聊天\n* 扎实掌握如何构建 LangGraph 工作流\n* 使用 Qdrant 作为向量数据库搭建长期记忆系统\n* 利用 Groq 模型驱动 AI 代理的响应\n* 使用 Whisper 实现语音转文本系统\n* 使用 ElevenLabs 实现文本转语音系统\n* 利用扩散模型（如 FLUX 模型）生成高质量图像\n* 使用 VLM 模型（如 llama-3.2-vision）处理图像\n* 使用 Chainlit 创建聊天界面\n* 将智能体应用部署到 Cloud Run\n* 将智能体应用连接到 WhatsApp API\n\n## 开始学习\n\n在开始课程之前，你需要做一些准备工作。\n\n比如创建虚拟环境、安装依赖项、配置 `.env` 文件等。我知道这些步骤很枯燥，但却是必不可少的！ 😅\n\n所有细节都已在以下文档中详细说明：[GETTING_STARTED.md](docs\u002FGETTING_STARTED.md)。\n\n> 请务必按照文档中的说明操作，这对课程的顺利进行至关重要。\n\n## 课程大纲\n\n| 课次 | 文章 | 视频 | 描述 |\n|---------------|----------------|--------------|-------------|\n| \u003Cdiv align=\"center\">1\u003C\u002Fdiv> | [项目概述](https:\u002F\u002Ftheneuralmaze.substack.com\u002Fp\u002Fmeet-ava-the-whatsapp-agent) | \u003Ca href=\"https:\u002F\u002Fyoutu.be\u002Fu5y06cFK2WA?si=RCx__sJNtr2DYf0U\">\u003Cimg src=\"https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002Fneural-maze_ava-whatsapp-agent-course_readme_002d5e8c7552.png\" alt=\"缩略图1\" width=\"400\">\u003C\u002Fa> | 理解项目架构与技术栈。 |\n| \u003Cdiv align=\"center\">2\u003C\u002Fdiv> | [解剖Ava的大脑](https:\u002F\u002Ftheneuralmaze.substack.com\u002Fp\u002Fdissecting-avas-brain) | \u003Ca href=\"https:\u002F\u002Fyoutu.be\u002FnTsLL3htkCU?si=aSmSkpL-U3rzw9Za\">\u003Cimg src=\"https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002Fneural-maze_ava-whatsapp-agent-course_readme_a6f96d966226.png\" alt=\"缩略图2\" width=\"400\">\u003C\u002Fa> | 学习LangGraph的基础知识，并使用该框架实现复杂的工作流。 |\n| \u003Cdiv align=\"center\">3\u003C\u002Fdiv> | [解锁Ava的记忆](https:\u002F\u002Ftheneuralmaze.substack.com\u002Fp\u002Fcan-agents-get-nostalgic-about-the) | \u003Ca href=\"https:\u002F\u002Fyoutu.be\u002FoTHqYEpdFXg?si=MXEvjUJ8Xbc6h9l2\">\u003Cimg src=\"https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002Fneural-maze_ava-whatsapp-agent-course_readme_3ffdf6883d93.png\" alt=\"缩略图3\" width=\"400\">\u003C\u002Fa> | 构建用于图状态持久化和聊天记录的短期记忆系统。同时，使用Qdrant实现长期记忆系统。 |\n| \u003Cdiv align=\"center\">4\u003C\u002Fdiv> | [让Ava拥有声音](https:\u002F\u002Ftheneuralmaze.substack.com\u002Fp\u002Fthe-ultimate-ai-voice-pipeline) | \u003Ca href=\"https:\u002F\u002Fyoutu.be\u002FRNmwvMjtIt0\">\u003Cimg src=\"https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002Fneural-maze_ava-whatsapp-agent-course_readme_c7b674666fd4.png\" alt=\"缩略图4\" width=\"400\">\u003C\u002Fa> | 搭建STT和TTS流水线，使Ava能够处理音频输入与输出。 |\n| \u003Cdiv align=\"center\">5\u003C\u002Fdiv> | [Ava学会“看”](https:\u002F\u002Ftheneuralmaze.substack.com\u002Fp\u002Freading-images-drawing-dreams-vlms) | \u003Ca href=\"https:\u002F\u002Fyoutu.be\u002FLS7k-XFBbeo\">\u003Cimg src=\"https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002Fneural-maze_ava-whatsapp-agent-course_readme_86b08af47bca.png\" alt=\"缩略图5\" width=\"400\">\u003C\u002Fa> | 了解如何使用VLM模型处理图像。利用FLUX模型实现图像生成流水线。 |\n| \u003Cdiv align=\"center\">6\u003C\u002Fdiv> | [Ava安装WhatsApp](https:\u002F\u002Ftheneuralmaze.substack.com\u002Fp\u002Fconnecting-an-ai-agent-to-whatsapp) | \u003Ca href=\"https:\u002F\u002Fyoutu.be\u002FdFsI4lnUkKo\">\u003Cimg src=\"https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002Fneural-maze_ava-whatsapp-agent-course_readme_1057bb0a6a37.png\" alt=\"缩略图6\" width=\"400\">\u003C\u002Fa> | 将Ava接入WhatsApp。学习如何将LangGraph应用部署到Google Cloud Run上。\n\n如果你觉得更有勇气，还有一个长达2个多小时的视频课程，我们会一步步带你过完项目的全部细节和代码。\n\n\u003Cp align=\"center\">\n    \u003Ca href=\"https:\u002F\u002Fyoutu.be\u002FNQlYB_OMtjQ?si=OacTft8tyQzO6pwh\">\u003Cimg src=\"https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002Fneural-maze_ava-whatsapp-agent-course_readme_64287e30d380.png\" alt=\"Ava完整课程\" width=\"500\">\u003C\u002Fa>\n\u003C\u002Fp>\n\n---\n\n## 这会花我多少钱？\n\n这个项目的超棒之处在于：**你完全可以在自己的电脑上免费运行它！**\n\nGroq、ElevenLabs、Qdrant Cloud和Together AI提供的**免费层级**已经足够让你起步了。\n\n如果你想在Google Cloud Run上试一试，可以注册一个免费账号，获得300美元的免费额度。即使你已经用完了免费额度，Cloud Run的费用也非常低廉——你的实验可能只需要一两美元而已。\n\n---\n\n## 技术栈\n\n\u003Ctable>\n  \u003Ctr>\n    \u003Cth>技术\u003C\u002Fth>\n    \u003Cth>描述\u003C\u002Fth>\n  \u003C\u002Ftr>\n  \u003Ctr>\n    \u003Ctd>\u003Cimg src=\"https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002Fneural-maze_ava-whatsapp-agent-course_readme_bd3e7ab537de.png\" width=\"100\" alt=\"Groq Logo\"\u002F>\u003C\u002Ftd>\n    \u003Ctd>使用Llama 3.3、Llama 3.2 Vision和Whisper为项目提供算力。Groq模型非常强大（而且速度极快！！）\u003C\u002Ftd>\n  \u003C\u002Ftr>\n  \u003Ctr>\n    \u003Ctd>\u003Cimg src=\"https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002Fneural-maze_ava-whatsapp-agent-course_readme_7800371ca867.png\" width=\"100\" alt=\"Qdrant Logo\"\u002F>\u003C\u002Ftd>\n    \u003Ctd>作为长期数据库，让我们的智能体能够回忆起几个月前你分享过的细节。\u003C\u002Ftd>\n  \u003C\u002Ftr>\n  \u003Ctr>\n    \u003Ctd>\u003Cimg src=\"https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002Fneural-maze_ava-whatsapp-agent-course_readme_6f557904ac57.png\" width=\"100\" alt=\"Cloud Run Logo\"\u002F>\u003C\u002Ftd>\n    \u003Ctd>轻松将你的容器部署到Google云平台\u003C\u002Ftd>\n  \u003C\u002Ftr>\n  \u003Ctr>\n    \u003Ctd>\u003Cimg src=\"https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002Fneural-maze_ava-whatsapp-agent-course_readme_80828c3ea317.png\" width=\"100\" alt=\"LangGraph Logo\"\u002F>\u003C\u002Ftd>\n    \u003Ctd>学习如何构建生产级的LangGraph工作流\u003C\u002Ftd>\n  \u003C\u002Ftr>\n  \u003Ctr>\n    \u003Ctd>\u003Cimg src=\"https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002Fneural-maze_ava-whatsapp-agent-course_readme_3d97135dcda3.png\" width=\"100\" alt=\"ElevenLabs Logo\"\u002F>\u003C\u002Ftd>\n    \u003Ctd>出色的TTS模型\u003C\u002Ftd>\n  \u003C\u002Ftr>\n  \u003Ctr>\n    \u003Ctd>\u003Cimg src=\"https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002Fneural-maze_ava-whatsapp-agent-course_readme_1acd433305a9.png\" width=\"100\" alt=\"Together AI Logo\"\u002F>\u003C\u002Ftd>\n    \u003Ctd>Ava图像生成过程的背后支持\u003C\u002Ftd>\n  \u003C\u002Ftr>\n\u003C\u002Ftable>\n\n\n## 贡献者\n\n\u003Ctable>\n  \u003Ctr>\n    \u003Ctd align=\"center\">\u003Cimg src=\"https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002Fneural-maze_ava-whatsapp-agent-course_readme_beeb94265d28.png\" width=\"100\" style=\"border-radius:50%;\"\u002F>\u003C\u002Ftd>\n    \u003Ctd>\n      \u003Cstrong>米格尔·奥特罗·佩德里多 | 高级机器学习\u002F人工智能工程师 \u003C\u002Fstrong>\u003Cbr \u002F>\n      \u003Ci>The Neural Maze创始人。瑞克和莫蒂迷。\u003C\u002Fi>\u003Cbr \u002F>\u003Cbr \u002F>\n      \u003Ca href=\"https:\u002F\u002Fwww.linkedin.com\u002Fin\u002Fmigueloteropedrido\u002F\">LinkedIn\u003C\u002Fa>\u003Cbr \u002F>\n      \u003Ca href=\"https:\u002F\u002Fwww.youtube.com\u002F@TheNeuralMaze\">YouTube\u003C\u002Fa>\u003Cbr \u002F>\n      \u003Ca href=\"https:\u002F\u002Ftheneuralmaze.substack.com\u002F\">The Neural Maze新闻通讯\u003C\u002Fa>\n    \u003C\u002Ftd>\n  \u003C\u002Ftr>\n  \u003Ctr>\n    \u003Ctd align=\"center\">\u003Cimg src=\"https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002Fneural-maze_ava-whatsapp-agent-course_readme_47a791d81fa2.png\" width=\"100\" style=\"border-radius:50%;\"\u002F>\u003C\u002Ftd>\n    \u003Ctd>\n      \u003Cstrong>赫苏斯·科帕多 | 高级机器学习\u002F人工智能工程师 \u003C\u002Fstrong>\u003Cbr \u002F>\n      \u003Ci>既是电影迷，也是AI爱好者。\u003C\u002Fi>\u003Cbr \u002F>\u003Cbr \u002F>\n      \u003Ca href=\"https:\u002F\u002Fwww.youtube.com\u002F@jesuscopado-en\">YouTube\u003C\u002Fa>\u003Cbr \u002F>\n      \u003Ca href=\"https:\u002F\u002Fwww.linkedin.com\u002Fin\u002Fcopadojesus\u002F\">LinkedIn\u003C\u002Fa>\u003Cbr \u002F>\n    \u003C\u002Ftd>\n  \u003C\u002Ftr>\n\u003C\u002Ftable>\n\n## 许可证\n\n本项目采用 MIT 许可证授权——详情请参阅 [LICENSE](LICENSE) 文件。\n\n---\n\n\u003Ctable style=\"border-collapse: collapse; border: none;\">\n  \u003Ctr style=\"border: none;\">\n    \u003Ctd width=\"20%\" style=\"border: none;\">\n      \u003Ca href=\"https:\u002F\u002Ftheneuralmaze.substack.com\u002F\" aria-label=\"The Neural Maze\">\n        \u003Cimg src=\"https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002Fneural-maze_ava-whatsapp-agent-course_readme_3a15abcc0487.png\" alt=\"The Neural Maze Logo\" width=\"150\"\u002F>\n      \u003C\u002Fa>\n    \u003C\u002Ftd>\n    \u003Ctd width=\"80%\" style=\"border: none;\">\n      \u003Cdiv>\n        \u003Ch2>📬 保持更新\u003C\u002Fh2>\n        \u003Cp>\u003Cb>\u003Ca href=\"https:\u002F\u002Ftheneuralmaze.substack.com\u002F\">加入 The Neural Maze\u003C\u002Fa>\u003C\u002Fb>,学习如何从原理到落地构建真正可用的 AI 系统。每周三直接发送到您的邮箱，千万不要错过！\u003C\u002Fp>\n      \u003C\u002Fdiv>\n    \u003C\u002Ftd>\n  \u003C\u002Ftr>\n\u003C\u002Ftable>\n\n\u003Cp align=\"center\">\n  \u003Ca href=\"https:\u002F\u002Ftheneuralmaze.substack.com\u002F\">\n    \u003Cimg src=\"https:\u002F\u002Fimg.shields.io\u002Fstatic\u002Fv1?label&logo=substack&message=立即订阅&style=for-the-badge&color=black&scale=2\" alt=\"立即订阅\" height=\"40\">\n  \u003C\u002Fa>\n\u003C\u002Fp>\n\n\u003Ctable style=\"border-collapse: collapse; border: none;\">\n  \u003Ctr style=\"border: none;\">\n    \u003Ctd width=\"20%\" style=\"border: none;\">\n      \u003Ca href=\"https:\u002F\u002Fwww.youtube.com\u002F@jesuscopado-en\" aria-label=\"Jesus Copado YouTube 频道\">\n        \u003Cimg src=\"https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002Fneural-maze_ava-whatsapp-agent-course_readme_0f3295dce723.png\" alt=\"Jesus Copado YouTube 频道\" width=\"150\"\u002F>\n      \u003C\u002Fa>\n    \u003C\u002Ftd>\n    \u003Ctd width=\"80%\" style=\"border: none;\">\n      \u003Cdiv>\n        \u003Ch2>🎥 观看更多内容\u003C\u002Fh2>\n        \u003Cp>\u003Cb>\u003Ca href=\"https:\u002F\u002Fwww.youtube.com\u002F@jesuscopado-en\">加入 Jesús Copado 的 YouTube 频道\u003C\u002Fa>\u003C\u002Fb>，探索如何构建真正的 AI 项目——从语音助手到创意工具。每周发布包含代码、演示和创意的视频，带您突破 AI 的边界。别错过下一期内容！\u003C\u002Fp>\n      \u003C\u002Fdiv>\n    \u003C\u002Ftd>\n  \u003C\u002Ftr>\n\u003C\u002Ftable>\n\n\u003Cp align=\"center\">\n  \u003Ca href=\"https:\u002F\u002Fwww.youtube.com\u002F@jesuscopado-en\">\n    \u003Cimg src=\"https:\u002F\u002Fimg.shields.io\u002Fstatic\u002Fv1?label&logo=youtube&message=立即订阅&style=for-the-badge&color=FF0000&scale=2\" alt=\"立即订阅\" height=\"40\">\n  \u003C\u002Fa>\n\u003C\u002Fp>","# Ava WhatsApp Agent 快速上手指南\n\nAva 是一个受电影《机械姬》（Ex Machina）启发的 WhatsApp AI 智能体。它不仅能进行文字对话，还能理解语音、识别图片、发送语音回复，甚至生成并分享其“日常活动”的图片。本项目基于 LangGraph 构建，旨在帮助开发者打造生产级的多模态 AI 应用。\n\n## 环境准备\n\n在开始之前，请确保你的开发环境满足以下要求：\n\n*   **操作系统**: Linux, macOS 或 Windows (推荐 WSL2)\n*   **Python**: 3.9 或更高版本\n*   **包管理器**: pip 或 poetry\n*   **账号准备**:\n    *   **Groq**: 用于运行 Llama 3.3, Llama 3.2 Vision 和 Whisper 模型 (提供免费额度)。\n    *   **ElevenLabs**: 用于文本转语音 (TTS) (提供免费额度)。\n    *   **Qdrant Cloud**: 用于长期记忆向量数据库 (提供免费额度)。\n    *   **Together AI**: 用于图像生成 (FLUX 模型) (提供免费额度)。\n    *   **Google Cloud Platform (可选)**: 如果计划部署到 Cloud Run，需注册账号 (新用户通常有 $300 免费积分)。\n    *   **WhatsApp Business API**: 用于连接 WhatsApp (可通过 Meta Developer 平台获取测试号码)。\n\n> **注意**: 上述服务的免费层级足以支持本项目的学习和实验运行。\n\n## 安装步骤\n\n### 1. 克隆项目\n首先，将代码仓库克隆到本地：\n\n```bash\ngit clone https:\u002F\u002Fgithub.com\u002FTheNeuralMaze\u002Fava-whatsapp-agent-course.git\ncd ava-whatsapp-agent-course\n```\n\n### 2. 创建虚拟环境\n建议创建一个独立的 Python 虚拟环境以避免依赖冲突：\n\n```bash\npython -m venv venv\nsource venv\u002Fbin\u002Factivate  # Windows 用户请使用: venv\\Scripts\\activate\n```\n\n### 3. 安装依赖\n安装项目所需的所有 Python 包：\n\n```bash\npip install -r requirements.txt\n```\n*(注：如果项目中包含 `pyproject.toml` 或 `poetry.lock`，也可使用 `poetry install`)*\n\n### 4. 配置环境变量\n项目根目录下需要创建一个 `.env` 文件来存储 API 密钥。请参考官方文档 [`docs\u002FGETTING_STARTED.md`](docs\u002FGETTING_STARTED.md) 中的详细指引，填写以下关键配置：\n\n```bash\n# .env 文件示例\nGROQ_API_KEY=your_groq_key\nELEVENLABS_API_KEY=your_elevenlabs_key\nQDRANT_URL=your_qdrant_url\nQDRANT_API_KEY=your_qdrant_api_key\nTOGETHER_API_KEY=your_together_ai_key\nWHATSAPP_TOKEN=your_whatsapp_token\nWHATSAPP_PHONE_NUMBER_ID=your_phone_number_id\n# ... 其他必要配置\n```\n\n## 基本使用\n\n完成环境配置后，你可以按照课程大纲逐步构建和运行 Ava。以下是核心的运行逻辑：\n\n### 1. 本地运行智能体\n在项目配置完成后，你可以通过运行主脚本来启动 Ava 的核心逻辑（具体入口文件请参考最新代码结构，通常为 `main.py` 或通过 LangGraph 服务器启动）：\n\n```bash\n# 示例：启动 LangGraph 服务器或运行主脚本\npython src\u002Fmain.py\n```\n\n### 2. 功能模块体验\n根据课程进度，Ava 具备以下交互能力：\n*   **文字对话**: 通过 WhatsApp 发送消息，Ava 将利用 Groq (Llama 3) 进行回复。\n*   **语音交互**: 发送语音消息，Ava 使用 Whisper 识别内容并用 ElevenLabs 生成语音回复。\n*   **视觉能力**: 发送图片，Ava 使用 Llama 3.2 Vision 进行识别；或请求 Ava 画图，它将调用 FLUX 模型生成图像。\n*   **长期记忆**: Ava 会将对话历史存入 Qdrant，从而在后续对话中“记得”你之前说过的话。\n\n### 3. 部署到云端 (可选)\n若需让 WhatsApp 实时回调，建议将应用部署到 Google Cloud Run：\n\n```bash\n# 构建 Docker 镜像\ndocker build -t gcr.io\u002FYOUR_PROJECT_ID\u002Fava-agent .\n\n# 推送到 Google Container Registry\ndocker push gcr.io\u002FYOUR_PROJECT_ID\u002Fava-agent\n\n# 部署到 Cloud Run\ngcloud run deploy ava-agent --image gcr.io\u002FYOUR_PROJECT_ID\u002Fava-agent --platform managed\n```\n\n部署成功后，将生成的 Cloud Run URL 配置到 WhatsApp Webhook 设置中即可实现手机端实时互动。\n\n---\n*更多详细架构解析和代码 walkthrough，请参考项目中的视频课程及 [The Neural Maze](https:\u002F\u002Ftheneuralmaze.substack.com\u002F) 订阅通讯。*","某独立开发者希望构建一个能通过 WhatsApp 与用户进行多模态交互（文字、语音、图片）的智能助手，以模拟电影《机械姬》中 Ava 的真实对话体验。\n\n### 没有 ava-whatsapp-agent-course 时\n- 开发者需独自摸索 WhatsApp Business API 的复杂鉴权与回调机制，耗时数周仍难以打通消息收发闭环。\n- 实现语音识别与合成、图像理解等多模态功能时，面临模型选型困难及音频\u002F图像数据流处理的技术断层。\n- 缺乏统一的架构指导，导致代码结构松散，难以维护“日常活动”模拟等拟人化逻辑，最终成品交互生硬。\n- 在调试实时语音消息和图片发送功能时，因缺少现成的端到端示例，反复遭遇格式兼容性与延迟问题。\n\n### 使用 ava-whatsapp-agent-course 后\n- 跟随课程提供的完整技术栈，快速搭建起稳定的 WhatsApp 消息收发通道，当天即可实现基础对话功能。\n- 直接复用课程中集成的语音转文字、图像识别及语音合成模块，轻松赋予助手“听、看、说”的多模态能力。\n- 基于课程设计的拟人化架构，高效植入“每日活动更新”与“现场照片分享”逻辑，使助手交互自然且富有个性。\n- 依托详细的视频演示与代码库，迅速解决多媒体消息处理的痛点，将开发周期从数月缩短至几天。\n\nava-whatsapp-agent-course 将复杂的图灵测试概念转化为可落地的工程实践，让开发者能专注于创造有灵魂的 AI 交互而非重复造轮子。","https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002Fneural-maze_ava-whatsapp-agent-course_3a15abcc.png","neural-maze","The Neural Maze","https:\u002F\u002Foss.gittoolsai.com\u002Favatars\u002Fneural-maze_2f1be7be.png","Become a real Machine Learning Engineer In a World Full of Hype",null,"theneuralmaze@gmail.com","https:\u002F\u002Ftheneuralmaze.substack.com\u002F","https:\u002F\u002Fgithub.com\u002Fneural-maze",[23,27,31,35,38,42],{"name":24,"color":25,"percentage":26},"Python","#3572A5",65.6,{"name":28,"color":29,"percentage":30},"Jupyter Notebook","#DA5B0B",26.8,{"name":32,"color":33,"percentage":34},"Batchfile","#C1F12E",2.9,{"name":36,"color":37,"percentage":34},"PowerShell","#012456",{"name":39,"color":40,"percentage":41},"Dockerfile","#384d54",1.1,{"name":43,"color":44,"percentage":45},"Makefile","#427819",0.8,1654,420,"2026-04-07T17:29:52","MIT",4,"未说明","未说明 (项目主要调用 Groq, Together AI, ElevenLabs 等云端 API，本地无需高性能 GPU)",{"notes":54,"python":51,"dependencies":55},"该项目是一个基于云服务的 WhatsApp Agent 教程。核心计算任务（如 LLM 推理、图像生成、语音合成）均通过外部 API (Groq, Together AI, ElevenLabs) 完成，因此对本地硬件要求极低，普通电脑即可运行。部署目标平台为 Google Cloud Run。用户需要配置 .env 文件以填入各服务的 API Key，并拥有 WhatsApp API 访问权限。免费层级的云服务额度足以支持实验。",[56,57,58,59,60,61,62,63],"LangGraph","Qdrant","Groq (SDK)","ElevenLabs (SDK)","Whisper","FLUX models","llama-3.2-vision","Chainlit",[65,66,67],"数据工具","音频","Agent",[69,70,71,72,73,74,75],"agent","agent-based","agentic-workflow","agents","stt","tts","vector-database",2,"ready","2026-03-27T02:49:30.150509","2026-04-10T10:30:24.262956",[81,86,91,96,101],{"id":82,"question_zh":83,"answer_zh":84,"source_url":85},27511,"Docker 中运行 Chainlit 服务时报错 'ModuleNotFoundError: No module named ai_companion' 怎么办？","该问题通常是因为使用了旧版本的代码库。请确保拉取了仓库的最新版本（latest update），该错误在最近的更新中已被修复。如果更新后问题仍然存在，请检查本地代码是否与远程同步。","https:\u002F\u002Fgithub.com\u002Fneural-maze\u002Fava-whatsapp-agent-course\u002Fissues\u002F30",{"id":87,"question_zh":88,"answer_zh":89,"source_url":90},27512,"Chainlit 的 Dockerfile 中暴露的端口是 8080，但服务绑定在 8000 端口，这样配置正确吗？","这是一个已知配置不一致问题，维护者已进行修复并对 README 进行了重大重构。建议查看最新的 `Getting Started` 章节，按照说明创建环境变量、安装依赖并运行。推荐使用命令 `make ava-run` 在本地启动 \"Ava\" 服务，新文档会引导你正确配置端口和依赖。","https:\u002F\u002Fgithub.com\u002Fneural-maze\u002Fava-whatsapp-agent-course\u002Fissues\u002F20",{"id":92,"question_zh":93,"answer_zh":94,"source_url":95},27513,"项目中使用的哪些文本模型已过时，应该替换为什么？","以下模型已弃用且不再使用：\"gemma-7b-it\", \"llama3-70b-8192\", \"llama3-8b-8192\", \"mixtral-8x7b-32768\"。应根据官方公告切换到替代模型，例如可以使用 \"llama-3.1-8b-instant\" 来替代已弃用的 \"gemma-7b-it\"。","https:\u002F\u002Fgithub.com\u002Fneural-maze\u002Fava-whatsapp-agent-course\u002Fissues\u002F48",{"id":97,"question_zh":98,"answer_zh":99,"source_url":100},27514,"运行 WhatsApp 聊天机器人时遇到 500 错误，是否必须拥有 Facebook 商务账户？","是的，要使 WhatsApp 聊天功能正常工作，通常需要关联一个 Facebook 商务账户（Business Account）。如果遇到 500 错误，请检查你的 WhatsApp Business API 配置是否正确，并确保已正确设置商务账户权限和相关回调 URL。","https:\u002F\u002Fgithub.com\u002Fneural-maze\u002Fava-whatsapp-agent-course\u002Fissues\u002F32",{"id":102,"question_zh":103,"answer_zh":104,"source_url":105},27515,"执行 'make ava-run' 命令时在 Docker 构建阶段失败，报错与 'uv sync' 有关，如何解决？","此问题通常与环境依赖或缓存有关。虽然具体堆栈跟踪显示在 'RUN uv sync --frozen --no-cache' 步骤失败，但建议首先尝试清理 Docker 缓存并重新构建：\n1. 运行 `docker compose down`\n2. 运行 `docker builder prune` 清理构建缓存\n3. 再次运行 `make ava-run`\n如果问题依旧，请确保你的 `uv` 工具版本兼容（如 v0.6.10+），并检查网络连接是否能正常访问 ghcr.io 镜像源。","https:\u002F\u002Fgithub.com\u002Fneural-maze\u002Fava-whatsapp-agent-course\u002Fissues\u002F26",[],[108,119,127,136,144,153],{"id":109,"name":110,"github_repo":111,"description_zh":112,"stars":113,"difficulty_score":114,"last_commit_at":115,"category_tags":116,"status":77},4358,"openclaw","openclaw\u002Fopenclaw","OpenClaw 是一款专为个人打造的本地化 AI 助手，旨在让你在自己的设备上拥有完全可控的智能伙伴。它打破了传统 AI 助手局限于特定网页或应用的束缚，能够直接接入你日常使用的各类通讯渠道，包括微信、WhatsApp、Telegram、Discord、iMessage 等数十种平台。无论你在哪个聊天软件中发送消息，OpenClaw 都能即时响应，甚至支持在 macOS、iOS 和 Android 设备上进行语音交互，并提供实时的画布渲染功能供你操控。\n\n这款工具主要解决了用户对数据隐私、响应速度以及“始终在线”体验的需求。通过将 AI 部署在本地，用户无需依赖云端服务即可享受快速、私密的智能辅助，真正实现了“你的数据，你做主”。其独特的技术亮点在于强大的网关架构，将控制平面与核心助手分离，确保跨平台通信的流畅性与扩展性。\n\nOpenClaw 非常适合希望构建个性化工作流的技术爱好者、开发者，以及注重隐私保护且不愿被单一生态绑定的普通用户。只要具备基础的终端操作能力（支持 macOS、Linux 及 Windows WSL2），即可通过简单的命令行引导完成部署。如果你渴望拥有一个懂你",349277,3,"2026-04-06T06:32:30",[67,117,118,65],"开发框架","图像",{"id":120,"name":121,"github_repo":122,"description_zh":123,"stars":124,"difficulty_score":114,"last_commit_at":125,"category_tags":126,"status":77},3808,"stable-diffusion-webui","AUTOMATIC1111\u002Fstable-diffusion-webui","stable-diffusion-webui 是一个基于 Gradio 构建的网页版操作界面，旨在让用户能够轻松地在本地运行和使用强大的 Stable Diffusion 图像生成模型。它解决了原始模型依赖命令行、操作门槛高且功能分散的痛点，将复杂的 AI 绘图流程整合进一个直观易用的图形化平台。\n\n无论是希望快速上手的普通创作者、需要精细控制画面细节的设计师，还是想要深入探索模型潜力的开发者与研究人员，都能从中获益。其核心亮点在于极高的功能丰富度：不仅支持文生图、图生图、局部重绘（Inpainting）和外绘（Outpainting）等基础模式，还独创了注意力机制调整、提示词矩阵、负向提示词以及“高清修复”等高级功能。此外，它内置了 GFPGAN 和 CodeFormer 等人脸修复工具，支持多种神经网络放大算法，并允许用户通过插件系统无限扩展能力。即使是显存有限的设备，stable-diffusion-webui 也提供了相应的优化选项，让高质量的 AI 艺术创作变得触手可及。",162132,"2026-04-05T11:01:52",[117,118,67],{"id":128,"name":129,"github_repo":130,"description_zh":131,"stars":132,"difficulty_score":76,"last_commit_at":133,"category_tags":134,"status":77},1381,"everything-claude-code","affaan-m\u002Feverything-claude-code","everything-claude-code 是一套专为 AI 编程助手（如 Claude Code、Codex、Cursor 等）打造的高性能优化系统。它不仅仅是一组配置文件，而是一个经过长期实战打磨的完整框架，旨在解决 AI 代理在实际开发中面临的效率低下、记忆丢失、安全隐患及缺乏持续学习能力等核心痛点。\n\n通过引入技能模块化、直觉增强、记忆持久化机制以及内置的安全扫描功能，everything-claude-code 能显著提升 AI 在复杂任务中的表现，帮助开发者构建更稳定、更智能的生产级 AI 代理。其独特的“研究优先”开发理念和针对 Token 消耗的优化策略，使得模型响应更快、成本更低，同时有效防御潜在的攻击向量。\n\n这套工具特别适合软件开发者、AI 研究人员以及希望深度定制 AI 工作流的技术团队使用。无论您是在构建大型代码库，还是需要 AI 协助进行安全审计与自动化测试，everything-claude-code 都能提供强大的底层支持。作为一个曾荣获 Anthropic 黑客大奖的开源项目，它融合了多语言支持与丰富的实战钩子（hooks），让 AI 真正成长为懂上",148568,"2026-04-09T23:34:24",[117,67,135],"语言模型",{"id":137,"name":138,"github_repo":139,"description_zh":140,"stars":141,"difficulty_score":76,"last_commit_at":142,"category_tags":143,"status":77},2271,"ComfyUI","Comfy-Org\u002FComfyUI","ComfyUI 是一款功能强大且高度模块化的视觉 AI 引擎，专为设计和执行复杂的 Stable Diffusion 图像生成流程而打造。它摒弃了传统的代码编写模式，采用直观的节点式流程图界面，让用户通过连接不同的功能模块即可构建个性化的生成管线。\n\n这一设计巧妙解决了高级 AI 绘图工作流配置复杂、灵活性不足的痛点。用户无需具备编程背景，也能自由组合模型、调整参数并实时预览效果，轻松实现从基础文生图到多步骤高清修复等各类复杂任务。ComfyUI 拥有极佳的兼容性，不仅支持 Windows、macOS 和 Linux 全平台，还广泛适配 NVIDIA、AMD、Intel 及苹果 Silicon 等多种硬件架构，并率先支持 SDXL、Flux、SD3 等前沿模型。\n\n无论是希望深入探索算法潜力的研究人员和开发者，还是追求极致创作自由度的设计师与资深 AI 绘画爱好者，ComfyUI 都能提供强大的支持。其独特的模块化架构允许社区不断扩展新功能，使其成为当前最灵活、生态最丰富的开源扩散模型工具之一，帮助用户将创意高效转化为现实。",108111,"2026-04-08T11:23:26",[117,118,67],{"id":145,"name":146,"github_repo":147,"description_zh":148,"stars":149,"difficulty_score":76,"last_commit_at":150,"category_tags":151,"status":77},6121,"gemini-cli","google-gemini\u002Fgemini-cli","gemini-cli 是一款由谷歌推出的开源 AI 命令行工具，它将强大的 Gemini 大模型能力直接集成到用户的终端环境中。对于习惯在命令行工作的开发者而言，它提供了一条从输入提示词到获取模型响应的最短路径，无需切换窗口即可享受智能辅助。\n\n这款工具主要解决了开发过程中频繁上下文切换的痛点，让用户能在熟悉的终端界面内直接完成代码理解、生成、调试以及自动化运维任务。无论是查询大型代码库、根据草图生成应用，还是执行复杂的 Git 操作，gemini-cli 都能通过自然语言指令高效处理。\n\n它特别适合广大软件工程师、DevOps 人员及技术研究人员使用。其核心亮点包括支持高达 100 万 token 的超长上下文窗口，具备出色的逻辑推理能力；内置 Google 搜索、文件操作及 Shell 命令执行等实用工具；更独特的是，它支持 MCP（模型上下文协议），允许用户灵活扩展自定义集成，连接如图像生成等外部能力。此外，个人谷歌账号即可享受免费的额度支持，且项目基于 Apache 2.0 协议完全开源，是提升终端工作效率的理想助手。",100752,"2026-04-10T01:20:03",[152,67,118,117],"插件",{"id":154,"name":155,"github_repo":156,"description_zh":157,"stars":158,"difficulty_score":114,"last_commit_at":159,"category_tags":160,"status":77},4487,"LLMs-from-scratch","rasbt\u002FLLMs-from-scratch","LLMs-from-scratch 是一个基于 PyTorch 的开源教育项目，旨在引导用户从零开始一步步构建一个类似 ChatGPT 的大型语言模型（LLM）。它不仅是同名技术著作的官方代码库，更提供了一套完整的实践方案，涵盖模型开发、预训练及微调的全过程。\n\n该项目主要解决了大模型领域“黑盒化”的学习痛点。许多开发者虽能调用现成模型，却难以深入理解其内部架构与训练机制。通过亲手编写每一行核心代码，用户能够透彻掌握 Transformer 架构、注意力机制等关键原理，从而真正理解大模型是如何“思考”的。此外，项目还包含了加载大型预训练权重进行微调的代码，帮助用户将理论知识延伸至实际应用。\n\nLLMs-from-scratch 特别适合希望深入底层原理的 AI 开发者、研究人员以及计算机专业的学生。对于不满足于仅使用 API，而是渴望探究模型构建细节的技术人员而言，这是极佳的学习资源。其独特的技术亮点在于“循序渐进”的教学设计：将复杂的系统工程拆解为清晰的步骤，配合详细的图表与示例，让构建一个虽小但功能完备的大模型变得触手可及。无论你是想夯实理论基础，还是为未来研发更大规模的模型做准备",90106,"2026-04-06T11:19:32",[135,118,67,117]]