[{"data":1,"prerenderedAt":-1},["ShallowReactive",2],{"similar-DataTalksClub--machine-learning-zoomcamp":3,"tool-DataTalksClub--machine-learning-zoomcamp":61},[4,18,26,36,44,53],{"id":5,"name":6,"github_repo":7,"description_zh":8,"stars":9,"difficulty_score":10,"last_commit_at":11,"category_tags":12,"status":17},4358,"openclaw","openclaw\u002Fopenclaw","OpenClaw 是一款专为个人打造的本地化 AI 助手，旨在让你在自己的设备上拥有完全可控的智能伙伴。它打破了传统 AI 助手局限于特定网页或应用的束缚，能够直接接入你日常使用的各类通讯渠道，包括微信、WhatsApp、Telegram、Discord、iMessage 等数十种平台。无论你在哪个聊天软件中发送消息，OpenClaw 都能即时响应，甚至支持在 macOS、iOS 和 Android 设备上进行语音交互，并提供实时的画布渲染功能供你操控。\n\n这款工具主要解决了用户对数据隐私、响应速度以及“始终在线”体验的需求。通过将 AI 部署在本地，用户无需依赖云端服务即可享受快速、私密的智能辅助，真正实现了“你的数据，你做主”。其独特的技术亮点在于强大的网关架构，将控制平面与核心助手分离，确保跨平台通信的流畅性与扩展性。\n\nOpenClaw 非常适合希望构建个性化工作流的技术爱好者、开发者，以及注重隐私保护且不愿被单一生态绑定的普通用户。只要具备基础的终端操作能力（支持 macOS、Linux 及 Windows WSL2），即可通过简单的命令行引导完成部署。如果你渴望拥有一个懂你",349277,3,"2026-04-06T06:32:30",[13,14,15,16],"Agent","开发框架","图像","数据工具","ready",{"id":19,"name":20,"github_repo":21,"description_zh":22,"stars":23,"difficulty_score":10,"last_commit_at":24,"category_tags":25,"status":17},3808,"stable-diffusion-webui","AUTOMATIC1111\u002Fstable-diffusion-webui","stable-diffusion-webui 是一个基于 Gradio 构建的网页版操作界面，旨在让用户能够轻松地在本地运行和使用强大的 Stable Diffusion 图像生成模型。它解决了原始模型依赖命令行、操作门槛高且功能分散的痛点，将复杂的 AI 绘图流程整合进一个直观易用的图形化平台。\n\n无论是希望快速上手的普通创作者、需要精细控制画面细节的设计师，还是想要深入探索模型潜力的开发者与研究人员，都能从中获益。其核心亮点在于极高的功能丰富度：不仅支持文生图、图生图、局部重绘（Inpainting）和外绘（Outpainting）等基础模式，还独创了注意力机制调整、提示词矩阵、负向提示词以及“高清修复”等高级功能。此外，它内置了 GFPGAN 和 CodeFormer 等人脸修复工具，支持多种神经网络放大算法，并允许用户通过插件系统无限扩展能力。即使是显存有限的设备，stable-diffusion-webui 也提供了相应的优化选项，让高质量的 AI 艺术创作变得触手可及。",162132,"2026-04-05T11:01:52",[14,15,13],{"id":27,"name":28,"github_repo":29,"description_zh":30,"stars":31,"difficulty_score":32,"last_commit_at":33,"category_tags":34,"status":17},1381,"everything-claude-code","affaan-m\u002Feverything-claude-code","everything-claude-code 是一套专为 AI 编程助手（如 Claude Code、Codex、Cursor 等）打造的高性能优化系统。它不仅仅是一组配置文件，而是一个经过长期实战打磨的完整框架，旨在解决 AI 代理在实际开发中面临的效率低下、记忆丢失、安全隐患及缺乏持续学习能力等核心痛点。\n\n通过引入技能模块化、直觉增强、记忆持久化机制以及内置的安全扫描功能，everything-claude-code 能显著提升 AI 在复杂任务中的表现，帮助开发者构建更稳定、更智能的生产级 AI 代理。其独特的“研究优先”开发理念和针对 Token 消耗的优化策略，使得模型响应更快、成本更低，同时有效防御潜在的攻击向量。\n\n这套工具特别适合软件开发者、AI 研究人员以及希望深度定制 AI 工作流的技术团队使用。无论您是在构建大型代码库，还是需要 AI 协助进行安全审计与自动化测试，everything-claude-code 都能提供强大的底层支持。作为一个曾荣获 Anthropic 黑客大奖的开源项目，它融合了多语言支持与丰富的实战钩子（hooks），让 AI 真正成长为懂上",154349,2,"2026-04-13T23:32:16",[14,13,35],"语言模型",{"id":37,"name":38,"github_repo":39,"description_zh":40,"stars":41,"difficulty_score":32,"last_commit_at":42,"category_tags":43,"status":17},2271,"ComfyUI","Comfy-Org\u002FComfyUI","ComfyUI 是一款功能强大且高度模块化的视觉 AI 引擎，专为设计和执行复杂的 Stable Diffusion 图像生成流程而打造。它摒弃了传统的代码编写模式，采用直观的节点式流程图界面，让用户通过连接不同的功能模块即可构建个性化的生成管线。\n\n这一设计巧妙解决了高级 AI 绘图工作流配置复杂、灵活性不足的痛点。用户无需具备编程背景，也能自由组合模型、调整参数并实时预览效果，轻松实现从基础文生图到多步骤高清修复等各类复杂任务。ComfyUI 拥有极佳的兼容性，不仅支持 Windows、macOS 和 Linux 全平台，还广泛适配 NVIDIA、AMD、Intel 及苹果 Silicon 等多种硬件架构，并率先支持 SDXL、Flux、SD3 等前沿模型。\n\n无论是希望深入探索算法潜力的研究人员和开发者，还是追求极致创作自由度的设计师与资深 AI 绘画爱好者，ComfyUI 都能提供强大的支持。其独特的模块化架构允许社区不断扩展新功能，使其成为当前最灵活、生态最丰富的开源扩散模型工具之一，帮助用户将创意高效转化为现实。",108322,"2026-04-10T11:39:34",[14,15,13],{"id":45,"name":46,"github_repo":47,"description_zh":48,"stars":49,"difficulty_score":32,"last_commit_at":50,"category_tags":51,"status":17},6121,"gemini-cli","google-gemini\u002Fgemini-cli","gemini-cli 是一款由谷歌推出的开源 AI 命令行工具，它将强大的 Gemini 大模型能力直接集成到用户的终端环境中。对于习惯在命令行工作的开发者而言，它提供了一条从输入提示词到获取模型响应的最短路径，无需切换窗口即可享受智能辅助。\n\n这款工具主要解决了开发过程中频繁上下文切换的痛点，让用户能在熟悉的终端界面内直接完成代码理解、生成、调试以及自动化运维任务。无论是查询大型代码库、根据草图生成应用，还是执行复杂的 Git 操作，gemini-cli 都能通过自然语言指令高效处理。\n\n它特别适合广大软件工程师、DevOps 人员及技术研究人员使用。其核心亮点包括支持高达 100 万 token 的超长上下文窗口，具备出色的逻辑推理能力；内置 Google 搜索、文件操作及 Shell 命令执行等实用工具；更独特的是，它支持 MCP（模型上下文协议），允许用户灵活扩展自定义集成，连接如图像生成等外部能力。此外，个人谷歌账号即可享受免费的额度支持，且项目基于 Apache 2.0 协议完全开源，是提升终端工作效率的理想助手。",100752,"2026-04-10T01:20:03",[52,13,15,14],"插件",{"id":54,"name":55,"github_repo":56,"description_zh":57,"stars":58,"difficulty_score":32,"last_commit_at":59,"category_tags":60,"status":17},4721,"markitdown","microsoft\u002Fmarkitdown","MarkItDown 是一款由微软 AutoGen 团队打造的轻量级 Python 工具，专为将各类文件高效转换为 Markdown 格式而设计。它支持 PDF、Word、Excel、PPT、图片（含 OCR）、音频（含语音转录）、HTML 乃至 YouTube 链接等多种格式的解析，能够精准提取文档中的标题、列表、表格和链接等关键结构信息。\n\n在人工智能应用日益普及的今天，大语言模型（LLM）虽擅长处理文本，却难以直接读取复杂的二进制办公文档。MarkItDown 恰好解决了这一痛点，它将非结构化或半结构化的文件转化为模型“原生理解”且 Token 效率极高的 Markdown 格式，成为连接本地文件与 AI 分析 pipeline 的理想桥梁。此外，它还提供了 MCP（模型上下文协议）服务器，可无缝集成到 Claude Desktop 等 LLM 应用中。\n\n这款工具特别适合开发者、数据科学家及 AI 研究人员使用，尤其是那些需要构建文档检索增强生成（RAG）系统、进行批量文本分析或希望让 AI 助手直接“阅读”本地文件的用户。虽然生成的内容也具备一定可读性，但其核心优势在于为机器",93400,"2026-04-06T19:52:38",[52,14],{"id":62,"github_repo":63,"name":64,"description_en":65,"description_zh":66,"ai_summary_zh":67,"readme_en":68,"readme_zh":69,"quickstart_zh":70,"use_case_zh":71,"hero_image_url":72,"owner_login":73,"owner_name":73,"owner_avatar_url":74,"owner_bio":75,"owner_company":76,"owner_location":76,"owner_email":77,"owner_twitter":73,"owner_website":78,"owner_url":79,"languages":80,"stars":97,"forks":98,"last_commit_at":99,"license":76,"difficulty_score":32,"env_os":100,"env_gpu":101,"env_ram":100,"env_deps":102,"category_tags":115,"github_topics":116,"view_count":32,"oss_zip_url":76,"oss_zip_packed_at":76,"status":17,"created_at":125,"updated_at":126,"faqs":127,"releases":168},7292,"DataTalksClub\u002Fmachine-learning-zoomcamp","machine-learning-zoomcamp","Learn ML engineering for free in 4 months! Register here 👇🏼","Machine Learning Zoomcamp 是一个为期四个月的免费开源课程，旨在帮助学习者系统掌握机器学习工程的全流程。它解决了从理论模型到生产部署之间的技能断层问题，不仅教授如何使用 Python 构建回归、分类及深度学习模型，更重点讲解如何利用 Docker、FastAPI、Kubernetes 和 AWS Lambda 将这些模型真正落地到生产环境中。\n\n该项目非常适合拥有一年以上编程经验、熟悉命令行基础，但希望转型或进阶为机器学习工程师的开发者。即使你此前没有机器学习背景，课程也会从基础算法（如线性回归、决策树）讲起，循序渐进地引导你掌握 TensorFlow 和 PyTorch 等主流框架。\n\n其独特亮点在于“端到端”的工程化视角：不同于仅关注算法理论的教程，Machine Learning Zoomcamp 强调实战，通过两个完整的项目演练和同伴评审机制，让学员亲手经历数据预处理、模型训练、API 封装到容器化部署的完整闭环。你可以选择加入有截止日期和证书认证的直播期次，感受社群共进的氛围；也可以利用仓库中开放的资料随时自学。无论哪种方式，都能让你在真实的工程场景中","Machine Learning Zoomcamp 是一个为期四个月的免费开源课程，旨在帮助学习者系统掌握机器学习工程的全流程。它解决了从理论模型到生产部署之间的技能断层问题，不仅教授如何使用 Python 构建回归、分类及深度学习模型，更重点讲解如何利用 Docker、FastAPI、Kubernetes 和 AWS Lambda 将这些模型真正落地到生产环境中。\n\n该项目非常适合拥有一年以上编程经验、熟悉命令行基础，但希望转型或进阶为机器学习工程师的开发者。即使你此前没有机器学习背景，课程也会从基础算法（如线性回归、决策树）讲起，循序渐进地引导你掌握 TensorFlow 和 PyTorch 等主流框架。\n\n其独特亮点在于“端到端”的工程化视角：不同于仅关注算法理论的教程，Machine Learning Zoomcamp 强调实战，通过两个完整的项目演练和同伴评审机制，让学员亲手经历数据预处理、模型训练、API 封装到容器化部署的完整闭环。你可以选择加入有截止日期和证书认证的直播期次，感受社群共进的氛围；也可以利用仓库中开放的资料随时自学。无论哪种方式，都能让你在真实的工程场景中积累宝贵经验，为职业发展打下坚实基础。","\u003Ch1 align=\"center\">\n    \u003Cstrong>Machine Learning Zoomcamp: A Free 4-Month Course on ML Engineering\u003C\u002Fstrong>\n\u003C\u002Fh1>\n\n\u003Cp align=\"center\">\n\u003Cimg src=\"https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002FDataTalksClub_machine-learning-zoomcamp_readme_b649488a5e62.png\" alt=\"Machine Learning Zoomcamp\" width=\"500\" \u002F>\n\u003C\u002Fp>\n\n\u003Cp align=\"center\">\n\u003Ca href=\"https:\u002F\u002Fcourses.datatalks.club\u002F\">Course platform with deadlines and submission forms for homework assignments and projects\u003C\u002Fa> •\n\u003Ca href=\"https:\u002F\u002Fdatatalks.club\u002Fslack.html\"> Course Channel on Slack (#course-ml-zoomcamp) \u003C\u002Fa> •\n\u003Ca href=\"https:\u002F\u002Ft.me\u002Fmlzoomcamp\">Telegram Announcements\u003C\u002Fa> •\n\u003Ca href=\"https:\u002F\u002Fwww.youtube.com\u002Fplaylist?list=PL3MmuxUbc_hIhxl5Ji8t4O6lPAOpHaCLR\">Course Playlist\u003C\u002Fa> •\n\u003Ca href=\"https:\u002F\u002Fdatatalks.club\u002Ffaq\u002Fmachine-learning-zoomcamp.html\">FAQ\u003C\u002Fa> •\n\u003Ca href=\"https:\u002F\u002Fctt.ac\u002FXZ6b9\">Tweet about the Course\u003C\u002Fa>\n\u003C\u002Fp>\n\n\n\n\u003Cp align=\"center\">\nLearn machine learning engineering end-to-end, from core models to deploying real applications.\n\u003C\u002Fp>\n\n\u003Cp align=\"center\">\nBuild regression and classification models in Python, work with key algorithms like linear\u002Flogistic regression, decision trees, and deep learning, and then take them to production using Docker, FastAPI, Kubernetes, and AWS Lambda.\n\u003C\u002Fp>\n\n\u003Cp align=\"center\">\n\u003Ca href=\"https:\u002F\u002Fairtable.com\u002FshryxwLd0COOEaqXo\">\u003Cimg src=\"https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002FDataTalksClub_machine-learning-zoomcamp_readme_1c849b1e69fb.png\" height=\"50\" \u002F>\u003C\u002Fa>\n\u003C\u002Fp>\n\n## Table of Contents\n- [What This Course Is About](#about-ml-zoomcamp)\n- [Prerequisites](#prerequisites)\n- [How to Join](#how-to-join)\n- [Syllabus](#syllabus)\n- [Community & Getting Help](#community--getting-help)\n- [Certificates](#certificates)\n- [Sponsors](#sponsors)\n- [About DataTalks.Club](#about-datatalksclub)\n\n## About ML Zoomcamp\nMachine Learning Zoomcamp teaches you the complete machine learning engineering, covering the entire pipeline: from building models with Python to deploying them in production environments.\n\n\u003Cp align=\"center\">\n\u003Cimg src=\"https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002FDataTalksClub_machine-learning-zoomcamp_readme_2f3e99a8b3c7.png\" alt=\"ML Zoomcamp course overview showing progression from ML algorithms (Python, NumPy, Pandas, Scikit-learn) to deployment (Docker, FastAPI, Kubernetes)\" title=\"ML Zoomcamp course overview: ML algorithms to deployment\" width=\"500\" \u002F>\n\u003C\u002Fp>\n\nYou’ll master the key ML algorithms like linear regression, logistic regression, decision trees, and deep learning with TensorFlow and PyTorch, then learn to containerize with Docker, build APIs with FastAPI, and scale with Kubernetes and AWS Lambda.\n\n## Prerequisites\n\n**You'll need:**\n- Prior programming experience (at least 1+ year)\n- Comfort with command line basics\n\nYou don't need any prior experience with machine learning. We'll start from the basics.\n\n**Technical setup**: For machine learning modules, you only need a laptop with an internet connection. For deep learning sections, we'll use cloud resources for more intensive computations.\n\n## How to Join\n\nYou can join ML Zoomcamp either by **following a live cohort** or **learning at your own pace**.\n\nAll materials are freely available in this repository. Each module has its own folder (e.g., `01-intro`, `03-classification`), and cohort-specific homework and deadlines are in the `cohorts` directory. Lectures are pre-recorded and available in this [YouTube playlist](https:\u002F\u002Fwww.youtube.com\u002Fplaylist?list=PL3MmuxUbc_hIhxl5Ji8t4O6lPAOpHaCLR).\n\n```mermaid\nflowchart TD\n    A[\"Want to learn Machine Learning Zoomcamp\"] --> B{\"Do you want\u003Cbr\u002F>deadlines & a certificate?\"}\n\n    B -->|Yes| C[\"Join Live Cohort\"]\n    B -->|No \u002F Not sure| D[\"Self-Paced Learning\"]\n\n    C --> C1[\"Fixed schedule (Sept–Dec)\"]\n    C --> C2[\"Scored homework + leaderboard\"]\n    C --> C3[\"2 projects + peer review\"]\n    C --> C4[\"Eligible for certificate\"]\n\n    D --> D1[\"Start anytime, go at your own pace\"]\n    D --> D2[\"Unscored homework & optional projects\"]\n    D --> D3[\"No certificate\"]\n```\n\n### Option 1: Self-Paced Learning\n\nStart anytime. You get full access to materials and community support on Slack.\n\nComplete homework assignments: homework and solutions are available on the [course platform](https:\u002F\u002Fcourses.datatalks.club). Build a project for your portfolio.\n\n> Under self-paced learning, homework isn't scored, your project isn't peer-reviewed, and you can't earn a certificate.\n\n### Option 2: Live Cohort\n\n> **2025 Cohort:** Starts September 15. Register here: [Fill in this form](https:\u002F\u002Fairtable.com\u002FshryxwLd0COOEaqXo)\n\nRuns once per year (September–December).\n\nIncludes:\n- Updated homework\n- Automatic homework scoring and a leaderboard\n- Project peer review\n- Eligibility for a certificate after meeting all requirements\n\nEven if you join after the official start date, you can still follow along — but note that some homework forms may already be closed. All active deadlines are listed on the [course platform](https:\u002F\u002Fcourses.datatalks.club).\n\n> To earn a [certificate](#certificate), you'll need enough time to complete two [projects](#projects) and the required peer reviews. Details are in the Projects and Certificate sections.\n\n### Comparison\n\nWe summarized the key differences between the two joining options in this table:\n| Feature | Self-Paced | Live Cohort |\n|---------|------------|-------------|\n| **Timing** | Learn at your own pace, start anytime | Fixed 4-month schedule (September–December each year) |\n| **Course Materials** | Full access to GitHub repository and YouTube lectures | Full access to GitHub repository and YouTube lectures |\n| **Community** | Access to Slack community (`#course-ml-zoomcamp`) | Access to Slack community (`#course-ml-zoomcamp`) |\n| **Homework** | Available but not scored | Scored automatically, appears on leaderboard |\n| **Projects** | Build on your own, no evaluation | Submit 2 projects (midterm + capstone OR two capstones) with peer review |\n| **Certificate** | Not available | Available after completing projects and peer reviews |\n| **Structure** | Flexible, no deadlines | Weekly rhythm with deadlines and peer accountability |\n\n\u003Cp align=\"center\">\n  \u003Cstrong>Ready to start? \u003Ca href=\"https:\u002F\u002Fairtable.com\u002FshryxwLd0COOEaqXo\">Join the 2025 cohort\u003C\u002Fa> or \u003Ca href=\"01-intro\u002F\">start with Module 1\u003C\u002Fa>\u003C\u002Fstrong>\n\u003C\u002Fp>\n\n## Syllabus\n\n| Module | Description | Topics |\n|--------|-------------|--------|\n| **[Module 1: Introduction to Machine Learning](01-intro\u002F)** | Learn the fundamentals: what ML is, when to use it, and how to approach ML problems using the CRISP-DM framework. | • ML vs rule-based systems\u003Cbr>• Supervised learning basics\u003Cbr>• CRISP-DM methodology\u003Cbr>• Model selection concepts\u003Cbr>• Environment setup |\n| **[Module 2: Machine Learning for Regression](02-regression\u002F)** | Build a car price prediction model while learning linear regression, feature engineering, and regularization. | • Linear regression (from scratch and with scikit-learn)\u003Cbr>• Exploratory data analysis\u003Cbr>• Feature engineering\u003Cbr>• Regularization techniques\u003Cbr>• Model validation |\n| **[Module 3: Machine Learning for Classification](03-classification\u002F)** | Create a customer churn prediction system using logistic regression and learn about feature selection. | • Logistic regression\u003Cbr>• Feature importance and selection\u003Cbr>• Categorical variable encoding\u003Cbr>• Model interpretation |\n| **[Module 4: Evaluation Metrics for Classification](04-evaluation\u002F)** | Learn how to properly evaluate classification models and handle imbalanced datasets. | • Accuracy, precision, recall, F1-score\u003Cbr>• ROC curves and AUC\u003Cbr>• Cross-validation\u003Cbr>• Confusion matrices\u003Cbr>• Class imbalance handling |\n| **[Module 5: Deploying Machine Learning Models](05-deployment\u002F)** | Turn your models into web services and deploy them with Docker and cloud platforms. | • Model serialization with Pickle\u003Cbr>• FastAPI web services\u003Cbr>• Docker containerization\u003Cbr>• Cloud deployment |\n| **[Module 6: Decision Trees & Ensemble Learning](06-trees\u002F)** | Learn tree-based models and ensemble methods for better predictions. | • Decision trees\u003Cbr>• Random Forest\u003Cbr>• Gradient boosting (XGBoost)\u003Cbr>• Hyperparameter tuning\u003Cbr>• Feature importance |\n| **[Midterm Project](projects\u002F)** |  |  |\n| **[Module 8: Neural Networks & Deep Learning](08-deep-learning\u002F)** | Introduction to neural networks using TensorFlow and Keras, including CNNs and transfer learning. | • Neural network fundamentals\u003Cbr>• PyTorch\u003Cbr>• TensorFlow & Keras\u003Cbr>• Convolutional Neural Networks\u003Cbr>• Transfer learning\u003Cbr>• Model optimization |\n| **[Module 9: Serverless Deep Learning](09-serverless\u002F)** | Deploy deep learning models using serverless technologies like AWS Lambda. | • Serverless concepts\u003Cbr>• Deploying Scikit-Learn models with AWS Lambda\u003Cbr>• Deploying TensorFlow and PyTorch models with AWS Lambda\u003Cbr>• API Gateway |\n| **[Module 10: Kubernetes & TensorFlow Serving](10-kubernetes\u002F)** | Learn to serve ML models at scale using Kubernetes and TensorFlow Serving. | • Kubernetes basics\u003Cbr>• TensorFlow Serving\u003Cbr>• Model deployment and scaling\u003Cbr>• Load balancing |\n| **[Capstone project 1](projects\u002F)** |  |  |\n| **[Capstone project 2](projects\u002F)** |  |  |\n\n### Projects\n\nChoose a problem that interests you, find a suitable dataset, develop your model, and deploy it as a web service.\n\nThere will be 3 projects:\n1. [Midterm Project](projects\u002F) after [Module 6: Decision Trees & Ensemble Learning](06-trees\u002F)\n2. [Capstone project 1](projects\u002F) at the end of the course, after [Module 10: Kubernetes & TensorFlow Serving](10-kubernetes\u002F)\n3. [Capstone project 2](projects\u002F) at the end of the course, after [Module 10: Kubernetes & TensorFlow Serving](10-kubernetes\u002F)\n\nThese projects allow you to apply everything you've learned and make a great addition to your GitHub profile and portfolio.\n\n#### Project Examples from Past Cohorts\n\n\u003Cp align=\"center\">\n\u003Cimg src=\"https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002FDataTalksClub_machine-learning-zoomcamp_readme_3b82fb1c012d.png\" alt=\"Machine Learning Zoomcamp certificate of completion awarded after successfully completing projects and peer reviews\" title=\"ML Zoomcamp Certificate of Completion\" width=\"500\", align=center \u002F>\n\u003Cp align=\"center\"> \u003Ci> A local deployment architecture using Kubernetes with Kind from one of the students' projects \u003C\u002Fi> \u003C\u002Fp>\n\u003C\u002Fp>\n\nSome of the course projects from past cohorts:\n- [Blood cell classifier for cancer prediction](https:\u002F\u002Fdatatalks.club\u002Fblog\u002Fhow-to-build-blood-cell-classifier-for-cancer-prediction-case-study-from-ml-zoomcamp.html): an end-to-end tool that segments and classifies blood cells from microscope images to assist in detecting signs of acute lymphoblastic leukemia (ALL)\n- [Waste classifier](https:\u002F\u002Fdatatalks.club\u002Fblog\u002Fhow-to-build-waste-classifier-case-study-from-ml-zoomcamp.html): an Xception-based image classifier on ~15,000 waste images, reaching 93.3% test accuracy, and serving predictions via a Flask API packaged in Docker\n\n## Certificate\n\u003Cp align=\"center\">\n\u003Cimg src=\"https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002FDataTalksClub_machine-learning-zoomcamp_readme_13441b1d8821.jpg\" alt=\"Machine Learning Zoomcamp certificate of completion awarded after successfully completing projects and peer reviews\" title=\"ML Zoomcamp Certificate of Completion\" width=\"500\", align=center \u002F>\n\u003Cp align=\"center\"> \u003Ci> Machine Learning Zoomcamp certificate awarded upon successful completion \u003C\u002Fi> \u003C\u002Fp>\n\u003C\u002Fp>\n\nTo receive a certificate, you'll need to complete and submit two projects:\n\n1. **Complete two projects**: Submit either a midterm project and a capstone project, OR two capstone projects\n2. **Submit on time**: Meet the project submission deadlines to qualify for certification\n3. **Peer review**: Evaluate and provide feedback on 3 fellow students' projects during the peer review process\n\n## Testimonials\n\n> Machine Learning Zoomcamp was exhaustive, with very comprehensive content that covered concepts in depth. You can learn everything from the simplest concepts to preparing and deploying an ML model for production. Additionally, the entire community behind this course is highly participative and collaborative. I would like to thank Alexey Grigorev for all the knowledge he shared with us and his team for providing the support we needed to solve each problem we faced.\n>\n> - [Alexander Daniel Rios](https:\u002F\u002Fwww.linkedin.com\u002Fin\u002Falexander-daniel-rios) ([Source](https:\u002F\u002Fwww.linkedin.com\u002Fposts\u002Falexander-daniel-rios_mlzoomcamp-activity-7295527609239584768-TWHh))\n\n> Machine Learning Zoomcamp has been an incredible journey, thanks to the expert guidance of Alexey Grigorev. Hugely grateful to Alexey, Timur, and the entire DataTalksClub team for this course, and to my cohort batchmates for the invaluable support that enriched my learning experience. I’m thankful for this programme, which provided challenging coursework that is taught in a very structured and lucid way. The timely assignments & hands-on projects instill the sense of timely delivery, besides equipping us with practical acumen to solve real-life problems.\n>\n> - [Siddhartha Gogoi](https:\u002F\u002Fwww.linkedin.com\u002Fin\u002Fsiddhartha-gogoi) ([Source](https:\u002F\u002Fwww.linkedin.com\u002Fposts\u002Factivity-7299906113997524994-R-oD?utm_source=share&utm_medium=member_desktop&rcm=ACoAADJu9vMBW6iyIYswCQnN6t8UJLkXH2tQPi4))\n\n> Balancing the intensive Machine Learning Zoomcamp with my other engagements was no easy task, but the experience deepened my expertise in machine learning engineering, reinforced my passion for ML deployment and cloud technologies, and strengthened my resilience in handling real-world ML challenges. Thank you, Alexey Grigorev, for this course!\n>\n> - [Patrick Edosoma](https:\u002F\u002Fwww.linkedin.com\u002Fin\u002Fpatrickedosoma) ([Source](https:\u002F\u002Fwww.linkedin.com\u002Fposts\u002Fpatrickedosoma_machinelearning-mlzoomcamp-datascience-activity-7299090071201193985-JyuC))\n\n> Highly recommend the ML Zoomcamp for anyone wanting a structured path to production-ready machine learning. A big thank you - Alexey Grigorev and to the team at DataTalksClub for providing such a well-structured and engaging course.\n>\n> - [Abdiaziz Mohamed](https:\u002F\u002Fwww.linkedin.com\u002Fin\u002Fabdiaziz-mohamed) ([Source 1](https:\u002F\u002Fwww.linkedin.com\u002Fposts\u002Fabdiaziz-mohamed_machinelearning-deployment-docker-activity-7257086439333523456-CyK4), [Source 2](https:\u002F\u002Fwww.linkedin.com\u002Fposts\u002Fabdiaziz-mohamed_machinelearningzoomcamp-machinelearning-kubernetes-activity-7277039208072904704-OAiY?utm_source=share&utm_medium=member_desktop&rcm=ACoAADJu9vMBW6iyIYswCQnN6t8UJLkXH2tQPi4))\n\n> A huge thank you to Alexey Grigoriev for creating such an amazing course—and making it free! It’s truly inspiring.\n>\n> - [Guilherme Pereira](https:\u002F\u002Fwww.linkedin.com\u002Fin\u002Fguilherme-torres-pereira) ([Source](https:\u002F\u002Fwww.linkedin.com\u002Fposts\u002Fguilherme-torres-pereira_alexeygrigoriev-mlzoomcamp-machinelearning-activity-7396336012018356224-sK27))\n\n> Huge thanks to Alexey Grigorev and the DataTalksClub community for the incredible support and clarity throughout. The open-source spirit and collaborative notes made the learning experience even richer.\n>\n> - [Rajendra Rawale](https:\u002F\u002Fwww.linkedin.com\u002Fin\u002Frajendra1x) ([Source](https:\u002F\u002Fwww.linkedin.com\u002Fposts\u002Frajendra1x_machinelearning-mlzoomcamp-datatalksclub-activity-7378450260999852032-V5Z1))\n\n\u003Cp align=\"center\">\n  \u003Cstrong>Ready to start? \u003Ca href=\"https:\u002F\u002Fairtable.com\u002FshryxwLd0COOEaqXo\">Join the 2025 cohort\u003C\u002Fa> or \u003Ca href=\"01-intro\u002F\">start with Module 1\u003C\u002Fa>\u003C\u002Fstrong>\n\u003C\u002Fp>\n\n## Community & Getting Help\n\n### Where to Get Help\n- **Slack**: [`#course-ml-zoomcamp`](https:\u002F\u002Fapp.slack.com\u002Fclient\u002FT01ATQK62F8\u002FC0288NJ5XSA) channel\n- **FAQ**: [Common questions and answers](https:\u002F\u002Fdatatalks.club\u002Ffaq\u002Fmachine-learning-zoomcamp.html)\n- **Study Groups**: Connect with other learners\n\n### Community Guidelines\n- Check the [FAQ](https:\u002F\u002Fdatatalks.club\u002Ffaq\u002Fmachine-learning-zoomcamp.html) first\n- Follow our [question guidelines](asking-questions.md)\n- Be helpful and respectful\n- Share your learning journey\n\n### Learning in Public\nWe encourage sharing your progress! Write blog posts, create videos, post on social media with #mlzoomcamp. It helps you learn better and builds your professional network.\n\n**Bonus**: You can earn extra points for sharing your learning experience publicly.\n\nLearn more: [Learning in Public](learning-in-public.md)\n\n## Sponsors\n\nInterested in sponsoring? Contact [alexey@datatalks.club](mailto:alexey@datatalks.club).\n\n## About DataTalks.Club\n\n\u003Cp align=\"center\">\n  \u003Cimg width=\"40%\" src=\"https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002FDataTalksClub_machine-learning-zoomcamp_readme_3c4548bda00b.png\" alt=\"DataTalks.Club\">\n\u003C\u002Fp>\n\n\u003Cp align=\"center\">\n\u003Ca href=\"https:\u002F\u002Fdatatalks.club\u002F\">DataTalks.Club\u003C\u002Fa> is a global online community of data enthusiasts. It's a place to discuss data, learn, share knowledge, ask and answer questions, and support each other.\n\u003C\u002Fp>\n\n\u003Cp align=\"center\">\n\u003Ca href=\"https:\u002F\u002Fdatatalks.club\u002F\">Website\u003C\u002Fa> •\n\u003Ca href=\"https:\u002F\u002Fdatatalks.club\u002Fslack.html\">Join Slack Community\u003C\u002Fa> •\n\u003Ca href=\"https:\u002F\u002Fus19.campaign-archive.com\u002Fhome\u002F?u=0d7822ab98152f5afc118c176&id=97178021aa\">Newsletter\u003C\u002Fa> •\n\u003Ca href=\"http:\u002F\u002Flu.ma\u002Fdtc-events\">Upcoming Events\u003C\u002Fa> •\n\u003Ca href=\"https:\u002F\u002Fwww.youtube.com\u002F@DataTalksClub\u002Ffeatured\">YouTube\u003C\u002Fa> •\n\u003Ca href=\"https:\u002F\u002Fgithub.com\u002FDataTalksClub\">GitHub\u003C\u002Fa> •\n\u003Ca href=\"https:\u002F\u002Fwww.linkedin.com\u002Fcompany\u002Fdatatalks-club\u002F\">LinkedIn\u003C\u002Fa> •\n\u003Ca href=\"https:\u002F\u002Ftwitter.com\u002FDataTalksClub\">Twitter\u003C\u002Fa>\n\u003C\u002Fp>\n\nAll the activity at DataTalks.Club mainly happens on [Slack](https:\u002F\u002Fdatatalks.club\u002Fslack.html). We post updates there and discuss different aspects of data, career questions, and more.\n","\u003Ch1 align=\"center\">\n    \u003Cstrong>机器学习Zoomcamp：免费的4个月机器学习工程课程\u003C\u002Fstrong>\n\u003C\u002Fh1>\n\n\u003Cp align=\"center\">\n\u003Cimg src=\"https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002FDataTalksClub_machine-learning-zoomcamp_readme_b649488a5e62.png\" alt=\"Machine Learning Zoomcamp\" width=\"500\" \u002F>\n\u003C\u002Fp>\n\n\u003Cp align=\"center\">\n\u003Ca href=\"https:\u002F\u002Fcourses.datatalks.club\u002F\">包含作业和项目截止日期及提交表单的课程平台\u003C\u002Fa> •\n\u003Ca href=\"https:\u002F\u002Fdatatalks.club\u002Fslack.html\">Slack上的课程频道（#course-ml-zoomcamp）\u003C\u002Fa> •\n\u003Ca href=\"https:\u002F\u002Ft.me\u002Fmlzoomcamp\">Telegram公告\u003C\u002Fa> •\n\u003Ca href=\"https:\u002F\u002Fwww.youtube.com\u002Fplaylist?list=PL3MmuxUbc_hIhxl5Ji8t4O6lPAOpHaCLR\">课程播放列表\u003C\u002Fa> •\n\u003Ca href=\"https:\u002F\u002Fdatatalks.club\u002Ffaq\u002Fmachine-learning-zoomcamp.html\">常见问题解答\u003C\u002Fa> •\n\u003Ca href=\"https:\u002F\u002Fctt.ac\u002FXZ6b9\">分享关于该课程的推文\u003C\u002Fa>\n\u003C\u002Fp>\n\n\n\n\u003Cp align=\"center\">\n从核心模型到实际应用的部署，全面学习机器学习工程。\n\u003C\u002Fp>\n\n\u003Cp align=\"center\">\n使用Python构建回归和分类模型，掌握线性\u002F逻辑回归、决策树和深度学习等关键算法，并通过Docker、FastAPI、Kubernetes和AWS Lambda将其部署到生产环境。\n\u003C\u002Fp>\n\n\u003Cp align=\"center\">\n\u003Ca href=\"https:\u002F\u002Fairtable.com\u002FshryxwLd0COOEaqXo\">\u003Cimg src=\"https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002FDataTalksClub_machine-learning-zoomcamp_readme_1c849b1e69fb.png\" height=\"50\" \u002F>\u003C\u002Fa>\n\u003C\u002Fp>\n\n## 目录\n- [本课程简介](#about-ml-zoomcamp)\n- [先决条件](#prerequisites)\n- [如何加入](#how-to-join)\n- [课程大纲](#syllabus)\n- [社区与帮助](#community--getting-help)\n- [证书](#certificates)\n- [赞助商](#sponsors)\n- [关于DataTalks.Club](#about-datatalksclub)\n\n## 关于ML Zoomcamp\nMachine Learning Zoomcamp教授完整的机器学习工程知识，涵盖整个流程：从用Python构建模型到将其部署到生产环境中。\n\n\u003Cp align=\"center\">\n\u003Cimg src=\"https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002FDataTalksClub_machine-learning-zoomcamp_readme_2f3e99a8b3c7.png\" alt=\"ML Zoomcamp课程概览，展示从机器学习算法（Python、NumPy、Pandas、Scikit-learn）到部署（Docker、FastAPI、Kubernetes）的全过程\" title=\"ML Zoomcamp课程概览：从机器学习算法到部署\" width=\"500\" \u002F>\n\u003C\u002Fp>\n\n你将掌握线性回归、逻辑回归、决策树以及使用TensorFlow和PyTorch进行深度学习等关键机器学习算法，随后学习如何使用Docker容器化、用FastAPI构建API，并借助Kubernetes和AWS Lambda实现规模化部署。\n\n## 先决条件\n\n**你需要：**\n- 至少1年以上的编程经验\n- 熟悉命令行基础操作\n\n你无需具备机器学习方面的任何先验知识。我们将从基础知识开始。\n\n**技术准备**：对于机器学习模块，你只需要一台连接互联网的笔记本电脑即可。而在深度学习部分，我们将使用云资源来进行更密集的计算。\n\n## 如何加入\n\n你可以选择**跟随直播班级**或**按照自己的节奏学习**来加入ML Zoomcamp。\n\n本仓库中提供了所有免费的学习资料。每个模块都有独立的文件夹（例如`01-intro`、`03-classification`），而针对不同班级的作业和截止日期则位于`cohorts`目录下。讲座均为预先录制好的视频，可在本[YouTube播放列表](https:\u002F\u002Fwww.youtube.com\u002Fplaylist?list=PL3MmuxUbc_hIhxl5Ji8t4O6lPAOpHaCLR)中观看。\n\n```mermaid\nflowchart TD\n    A[\"想学习Machine Learning Zoomcamp\"] --> B{\"你是否需要\u003Cbr\u002F>截止日期和证书？\"}\n\n    B -->|是| C[\"加入直播班级\"]\n    B -->|否 \u002F 不确定| D[\"自主学习\"]\n\n    C --> C1[\"固定时间表（9月–12月）\"]\n    C --> C2[\"有评分的作业 + 排行榜\"]\n    C --> C3[\"2个项目 + 同行评审\"]\n    C --> C4[\"可获得证书\"]\n\n    D --> D1[\"随时开始，按自己的节奏进行\"]\n    D --> D2[\"无评分的作业及可选项目\"]\n    D --> D3[\"无法获得证书\"]\n```\n\n### 选项1：自主学习\n\n你可以随时开始学习。你将获得对所有资料的完全访问权限，并在Slack上得到社区支持。\n\n完成作业：作业及其解答可在[课程平台](https:\u002F\u002Fcourses.datatalks.club)上找到。为你的作品集构建一个项目。\n\n> 在自主学习模式下，作业不计分，项目也不会接受同行评审，因此你无法获得证书。\n\n### 选项2：直播班级\n\n> **2025届班级**：9月15日开课。请在此处报名：[填写此表格](https:\u002F\u002Fairtable.com\u002FshryxwLd0COOEaqXo)\n\n每年举办一次（9月至12月）。\n\n包括：\n- 更新后的作业\n- 自动作业评分及排行榜\n- 项目同行评审\n- 达到所有要求后可获得证书\n\n即使你在正式开课日期之后加入，仍然可以跟上进度——但请注意，某些作业表单可能已经关闭。所有当前有效的截止日期都列在[课程平台](https:\u002F\u002Fcourses.datatalks.club)上。\n\n> 要获得[证书](#certificate)，你需要足够的时间来完成两个[项目](#projects)以及所需的同行评审。详细信息请参阅“项目”和“证书”章节。\n\n### 对比\n\n我们在这张表格中总结了两种加入方式之间的主要区别：\n| 特性 | 自主学习 | 播放班级 |\n|---------|------------|-------------|\n| **时间安排** | 按自己的节奏学习，随时开始 | 固定的4个月时间表（每年9月–12月） |\n| **课程材料** | 完全访问GitHub仓库和YouTube讲座 | 完全访问GitHub仓库和YouTube讲座 |\n| **社区支持** | 可访问Slack社区（`#course-ml-zoomcamp`） | 可访问Slack社区（`#course-ml-zoomcamp`） |\n| **作业** | 提供但不计分 | 自动作业评分，并显示在排行榜上 |\n| **项目** | 自行完成，不进行评估 | 提交2个项目（期中+结业项目 或 两份结业项目）并接受同行评审 |\n| **证书** | 无法获得 | 完成项目和同行评审后可获得 |\n| **结构** | 灵活，无截止日期 | 每周有固定的节奏，设有截止日期和同伴监督 |\n\n\u003Cp align=\"center\">\n  \u003Cstrong>准备好开始了吗？\u003Ca href=\"https:\u002F\u002Fairtable.com\u002FshryxwLd0COOEaqXo\">加入2025届班级\u003C\u002Fa>或\u003Ca href=\"01-intro\u002F\">从模块1开始\u003C\u002Fa>\u003C\u002Fstrong>\n\u003C\u002Fp>\n\n## 课程大纲\n\n| 模块 | 描述 | 主题 |\n|--------|-------------|--------|\n| **[模块1：机器学习导论](01-intro\u002F)** | 学习机器学习的基础知识：什么是机器学习、何时使用以及如何利用CRISP-DM框架来解决机器学习问题。 | • 机器学习与基于规则的系统\u003Cbr>• 监督学习基础\u003Cbr>• CRISP-DM方法论\u003Cbr>• 模型选择概念\u003Cbr>• 环境搭建 |\n| **[模块2：回归任务的机器学习](02-regression\u002F)** | 在学习线性回归、特征工程和正则化的同时，构建一个汽车价格预测模型。 | • 线性回归（从零开始实现及使用scikit-learn）\u003Cbr>• 探索性数据分析\u003Cbr>• 特征工程\u003Cbr>• 正则化技术\u003Cbr>• 模型验证 |\n| **[模块3：分类任务的机器学习](03-classification\u002F)** | 使用逻辑回归创建客户流失预测系统，并学习特征选择方法。 | • 逻辑回归\u003Cbr>• 特征重要性和选择\u003Cbr>• 分类变量编码\u003Cbr>• 模型解释 |\n| **[模块4：分类模型的评估指标](04-evaluation\u002F)** | 学习如何正确评估分类模型，并处理不平衡数据集。 | • 准确率、精确率、召回率、F1分数\u003Cbr>• ROC曲线与AUC\u003Cbr>• 交叉验证\u003Cbr>• 混淆矩阵\u003Cbr>• 不平衡类别处理 |\n| **[模块5：机器学习模型部署](05-deployment\u002F)** | 将你的模型转化为Web服务，并通过Docker和云平台进行部署。 | • 使用Pickle序列化模型\u003Cbr>• FastAPI Web服务\u003Cbr>• Docker容器化\u003Cbr>• 云上部署 |\n| **[模块6：决策树与集成学习](06-trees\u002F)** | 学习基于树的模型和集成方法，以获得更好的预测效果。 | • 决策树\u003Cbr>• 随机森林\u003Cbr>• 梯度提升（XGBoost）\u003Cbr>• 超参数调优\u003Cbr>• 特征重要性 |\n| **[期中项目](projects\u002F)** |  |  |\n| **[模块8：神经网络与深度学习](08-deep-learning\u002F)** | 使用TensorFlow和Keras介绍神经网络，包括卷积神经网络和迁移学习。 | • 神经网络基础\u003Cbr>• PyTorch\u003Cbr>• TensorFlow与Keras\u003Cbr>• 卷积神经网络\u003Cbr>• 迁移学习\u003Cbr>• 模型优化 |\n| **[模块9：无服务器深度学习](09-serverless\u002F)** | 使用AWS Lambda等无服务器技术部署深度学习模型。 | • 无服务器概念\u003Cbr>• 使用AWS Lambda部署scikit-learn模型\u003Cbr>• 使用AWS Lambda部署TensorFlow和PyTorch模型\u003Cbr>• API网关 |\n| **[模块10：Kubernetes与TensorFlow Serving](10-kubernetes\u002F)** | 学习使用Kubernetes和TensorFlow Serving大规模部署机器学习模型。 | • Kubernetes基础\u003Cbr>• TensorFlow Serving\u003Cbr>• 模型部署与扩展\u003Cbr>• 负载均衡 |\n| **[毕业设计1](projects\u002F)** |  |  |\n| **[毕业设计2](projects\u002F)** |  |  |\n\n### 项目\n\n选择一个你感兴趣的问题，找到合适的数据集，开发你的模型，并将其部署为Web服务。\n\n本课程共有3个项目：\n1. [期中项目](projects\u002F)，在完成[模块6：决策树与集成学习](06-trees\u002F)之后；\n2. [毕业设计1](projects\u002F)，在课程结束时，完成[模块10：Kubernetes与TensorFlow Serving](10-kubernetes\u002F)之后；\n3. [毕业设计2](projects\u002F)，同样在课程结束时，完成[模块10：Kubernetes与TensorFlow Serving](10-kubernetes\u002F)之后。\n\n这些项目将帮助你应用所学知识，并为你的GitHub和个人作品集增添亮点。\n\n#### 往届学员项目示例\n\n\u003Cp align=\"center\">\n\u003Cimg src=\"https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002FDataTalksClub_machine-learning-zoomcamp_readme_3b82fb1c012d.png\" alt=\"成功完成项目和同行评审后颁发的Machine Learning Zoomcamp结业证书\" title=\"ML Zoomcamp结业证书\" width=\"500\", align=center \u002F>\n\u003Cp align=\"center\"> \u003Ci> 一位学员项目中的本地Kubernetes集群部署架构（使用Kind） \u003C\u002Fi> \u003C\u002Fp>\n\u003C\u002Fp>\n\n往届学员的一些课程项目：\n- [用于癌症预测的血细胞分类器](https:\u002F\u002Fdatatalks.club\u002Fblog\u002Fhow-to-build-blood-cell-classifier-for-cancer-prediction-case-study-from-ml-zoomcamp.html)：一个端到端工具，能够从显微镜图像中分割并分类血细胞，以辅助检测急性淋巴母细胞白血病（ALL）的迹象。\n- [垃圾分类器](https:\u002F\u002Fdatatalks.club\u002Fblog\u002Fhow-to-build-waste-classifier-case-study-from-ml-zoomcamp.html)：基于Xception的图像分类器，训练数据约15,000张垃圾图片，测试准确率达到93.3%，并通过封装在Docker中的Flask API提供预测服务。\n\n## 结业证书\n\u003Cp align=\"center\">\n\u003Cimg src=\"https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002FDataTalksClub_machine-learning-zoomcamp_readme_13441b1d8821.jpg\" alt=\"成功完成项目和同行评审后颁发的Machine Learning Zoomcamp结业证书\" title=\"ML Zoomcamp结业证书\" width=\"500\", align=center \u002F>\n\u003Cp align=\"center\"> \u003Ci> 成功完成课程后颁发的Machine Learning Zoomcamp结业证书 \u003C\u002Fi> \u003C\u002Fp>\n\u003C\u002Fp>\n\n要获得结业证书，你需要完成并提交两个项目：\n\n1. **完成两个项目**：提交一个期中项目和一个毕业设计，或者直接提交两个毕业设计；\n2. **按时提交**：在规定的截止日期前提交项目，方可获得认证资格；\n3. **同行评审**：在同行评审环节中，对三位同学的项目进行评估并提供反馈。\n\n## 用户评价\n\n> 机器学习Zoomcamp课程内容非常全面且深入，涵盖了从基础概念到模型准备与部署的全流程。无论是初学者还是有一定经验的从业者，都能从中受益。此外，课程背后的社区氛围也非常活跃，大家互相帮助、共同进步。我要感谢Alexey Grigorev分享的宝贵知识，以及他的团队为我们解决遇到的各种问题所提供的支持。\n>\n> - [Alexander Daniel Rios](https:\u002F\u002Fwww.linkedin.com\u002Fin\u002Falexander-daniel-rios) ([来源](https:\u002F\u002Fwww.linkedin.com\u002Fposts\u002Falexander-daniel-rios_mlzoomcamp-activity-7295527609239584768-TWHh))\n\n> 在Alexey Grigorev的专业指导下，参加机器学习Zoomcamp课程是一段非常难忘的经历。我由衷地感谢Alexey、Timur以及DataTalksClub团队提供的这门课程，也感谢同期的同学们给予的宝贵支持，让我的学习体验更加丰富。这门课程设计严谨、讲解清晰，作业和实践项目都安排得当，不仅培养了我们按时完成任务的能力，还让我们掌握了应对实际问题的实用技能。\n>\n> - [Siddhartha Gogoi](https:\u002F\u002Fwww.linkedin.com\u002Fin\u002Fsiddhartha-gogoi) ([来源](https:\u002F\u002Fwww.linkedin.com\u002Fposts\u002Factivity-7299906113997524994-R-oD?utm_source=share&utm_medium=member_desktop&rcm=ACoAADJu9vMBW6iyIYswCQnN6t8UJLkXH2tQPi4))\n\n> 在兼顾其他工作的同时完成密集的机器学习Zoomcamp课程并不容易，但这段经历极大地提升了我在机器学习工程领域的专业能力，坚定了我对ML部署和云技术的热情，并增强了我应对实际ML挑战的信心和韧性。感谢Alexey Grigorev带来的这门课程！\n>\n> - [Patrick Edosoma](https:\u002F\u002Fwww.linkedin.com\u002Fin\u002Fpatrickedosoma) ([来源](https:\u002F\u002Fwww.linkedin.com\u002Fposts\u002Fpatrickedosoma_machinelearning-mlzoomcamp-datascience-activity-7299090071201193985-JyuC))\n\n> 强烈推荐ML Zoomcamp给任何希望系统性掌握生产级机器学习技术的人。特别感谢Alexey Grigorev以及DataTalksClub团队，他们打造了一门结构清晰、内容生动有趣的课程。\n>\n> - [Abdiaziz Mohamed](https:\u002F\u002Fwww.linkedin.com\u002Fin\u002Fabdiaziz-mohamed) ([来源1](https:\u002F\u002Fwww.linkedin.com\u002Fposts\u002Fabdiaziz-mohamed_machinelearning-deployment-docker-activity-7257086439333523456-CyK4), [来源2](https:\u002F\u002Fwww.linkedin.com\u002Fposts\u002Fabdiaziz-mohamed_machinelearningzoomcamp-machinelearning-kubernetes-activity-7277039208072904704-OAiY?utm_source=share&utm_medium=member_desktop&rcm=ACoAADJu9vMBW6iyIYswCQnN6t8UJLkXH2tQPi4))\n\n> 非常感谢Alexey Grigoriev创建了这样一门精彩的课程——而且还是免费的！这真的令人深受启发。\n>\n> - [Guilherme Pereira](https:\u002F\u002Fwww.linkedin.com\u002Fin\u002Fguilherme-torres-pereira) ([来源](https:\u002F\u002Fwww.linkedin.com\u002Fposts\u002Fguilherme-torres-pereira_alexeygrigoriev-mlzoomcamp-machinelearning-activity-7396336012018356224-sK27))\n\n> 衷心感谢Alexey Grigorev和DataTalksClub社区在整个学习过程中给予的大力支持与清晰指导。开源精神和协作式笔记让学习体验更加充实。\n>\n> - [Rajendra Rawale](https:\u002F\u002Fwww.linkedin.com\u002Fin\u002Frajendra1x) ([来源](https:\u002F\u002Fwww.linkedin.com\u002Fposts\u002Frajendra1x_machinelearning-mlzoomcamp-datatalksclub-activity-7378450260999852032-V5Z1))\n\n\u003Cp align=\"center\">\n  \u003Cstrong>准备好开始了吗？\u003Ca href=\"https:\u002F\u002Fairtable.com\u002FshryxwLd0COOEaqXo\">加入2025届学员\u003C\u002Fa>或\u003Ca href=\"01-intro\u002F\">从模块1开始\u003C\u002Fa>\u003C\u002Fstrong>\n\u003C\u002Fp>\n\n## 社区与求助\n\n### 寻求帮助的途径\n- **Slack**: [`#course-ml-zoomcamp`](https:\u002F\u002Fapp.slack.com\u002Fclient\u002FT01ATQK62F8\u002FC0288NJ5XSA) 频道\n- **常见问题解答**: [常见问题与解答](https:\u002F\u002Fdatatalks.club\u002Ffaq\u002Fmachine-learning-zoomcamp.html)\n- **学习小组**: 与其他学员交流互动\n\n### 社区行为准则\n- 请先查看[常见问题解答](https:\u002F\u002Fdatatalks.club\u002Ffaq\u002Fmachine-learning-zoomcamp.html)\n- 遵循我们的[提问指南](asking-questions.md)\n- 保持乐于助人、尊重他人的态度\n- 分享你的学习历程\n\n### 公开学习\n我们鼓励大家分享自己的学习进展！可以撰写博客文章、制作视频，或在社交媒体上使用#mlzoomcamp标签发布内容。这不仅能帮助你更好地吸收知识，还能拓展你的职业人脉。\n\n**小贴士**: 公开分享学习经验还可以获得额外积分哦！\n\n了解更多：[公开学习](learning-in-public.md)\n\n## 赞助商\n\n有意赞助者请联系[alexey@datatalks.club](mailto:alexey@datatalks.club)。\n\n## 关于DataTalks.Club\n\n\u003Cp align=\"center\">\n  \u003Cimg width=\"40%\" src=\"https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002FDataTalksClub_machine-learning-zoomcamp_readme_3c4548bda00b.png\" alt=\"DataTalks.Club\">\n\u003C\u002Fp>\n\n\u003Cp align=\"center\">\n\u003Ca href=\"https:\u002F\u002Fdatatalks.club\u002F\">DataTalks.Club\u003C\u002Fa> 是一个全球性的数据爱好者在线社区。这里是一个讨论数据、学习知识、分享经验、答疑解惑并相互支持的平台。\u003C\u002Fp>\n\n\u003Cp align=\"center\">\n\u003Ca href=\"https:\u002F\u002Fdatatalks.club\u002F\">官网\u003C\u002Fa> •\n\u003Ca href=\"https:\u002F\u002Fdatatalks.club\u002Fslack.html\">加入Slack社区\u003C\u002Fa> •\n\u003Ca href=\"https:\u002F\u002Fus19.campaign-archive.com\u002Fhome\u002F?u=0d7822ab98152f5afc118c176&id=97178021aa\">邮件通讯\u003C\u002Fa> •\n\u003Ca href=\"http:\u002F\u002Flu.ma\u002Fdtc-events\">即将举行的活动\u003C\u002Fa> •\n\u003Ca href=\"https:\u002F\u002Fwww.youtube.com\u002F@DataTalksClub\u002Ffeatured\">YouTube频道\u003C\u002Fa> •\n\u003Ca href=\"https:\u002F\u002Fgithub.com\u002FDataTalksClub\">GitHub仓库\u003C\u002Fa> •\n\u003Ca href=\"https:\u002F\u002Fwww.linkedin.com\u002Fcompany\u002Fdatatalks-club\u002F\">LinkedIn主页\u003C\u002Fa> •\n\u003Ca href=\"https:\u002F\u002Ftwitter.com\u002FDataTalksClub\">Twitter账号\u003C\u002Fa>\u003C\u002Fp>\n\nDataTalks.Club的大部分活动都在[Slack](https:\u002F\u002Fdatatalks.club\u002Fslack.html)平台上进行。我们会在那里发布最新动态，讨论数据相关话题、职业发展等问题等。","# Machine Learning Zoomcamp 快速上手指南\n\nMachine Learning Zoomcamp 是一门免费的 4 个月机器学习工程课程，涵盖从核心模型构建到生产环境部署的全流程。本指南将帮助你快速开始学习。\n\n## 环境准备\n\n### 系统要求\n- **操作系统**：Windows、macOS 或 Linux 均可。\n- **硬件**：\n  - 普通机器学习模块：任意配备互联网连接的笔记本电脑即可。\n  - 深度学习模块：课程将提供云端资源（如 Google Colab 或 Kaggle Kernels）用于高强度计算，本地无需高端 GPU。\n- **前置技能**：\n  - 至少 1 年以上的编程经验。\n  - 熟悉命令行基本操作。\n  - **无需**预先具备机器学习知识。\n\n### 前置依赖\n确保已安装以下基础工具：\n- **Python 3.8+**\n- **Git**\n- **Docker** (用于模块 5 及之后的部署部分)\n- **代码编辑器** (推荐 VS Code 或 PyCharm)\n\n> **国内用户提示**：建议配置国内镜像源以加速 Python 包下载。\n> ```bash\n> # 临时使用清华源安装依赖示例\n> pip install -r requirements.txt -i https:\u002F\u002Fpypi.tuna.tsinghua.edu.cn\u002Fsimple\n> ```\n\n## 安装步骤\n\n本课程没有单一的“安装包”，而是通过克隆 GitHub 仓库获取所有学习资料、代码和数据集。\n\n### 1. 克隆课程仓库\n打开终端，执行以下命令获取最新课程内容：\n\n```bash\ngit clone https:\u002F\u002Fgithub.com\u002FDataTalksClub\u002Fmachine-learning-zoomcamp.git\ncd machine-learning-zoomcamp\n```\n\n### 2. 创建虚拟环境\n为每个模块或整体课程创建独立的 Python 虚拟环境（推荐使用 `venv` 或 `conda`）：\n\n```bash\npython -m venv ml-zoomcamp-env\nsource ml-zoomcamp-env\u002Fbin\u002Factivate  # Windows 用户使用: ml-zoomcamp-env\\Scripts\\activate\n```\n\n### 3. 安装基础依赖库\n进入第一个模块目录并安装所需库（后续模块可能有额外的 `requirements.txt`）：\n\n```bash\ncd 01-intro\npip install -r requirements.txt\n```\n\n*注：若遇到网络问题，请配合上述清华源命令使用。*\n\n### 4. 验证环境\n运行模块内的示例 Notebook 或脚本，确保环境配置无误：\n\n```bash\njupyter notebook\n# 或在浏览器中打开对应的 .ipynb 文件运行测试代码\n```\n\n## 基本使用\n\n课程采用模块化学习，每个文件夹（如 `01-intro`, `02-regression`）包含该主题的视频链接、笔记、作业和数据集。\n\n### 学习流程示例\n以 **模块 2：回归 (Regression)** 为例：\n\n1. **进入目录**：\n   ```bash\n   cd ..\u002F02-regression\n   ```\n\n2. **观看视频与阅读笔记**：\n   访问 [YouTube 播放列表](https:\u002F\u002Fwww.youtube.com\u002Fplaylist?list=PL3MmuxUbc_hIhxl5Ji8t4O6lPAOpHaCLR) 观看对应章节，或阅读目录下的 `README.md`。\n\n3. **运行代码示例**：\n   打开提供的 Jupyter Notebook（例如 `03-car-price.ipynb`），逐步运行单元格以学习线性回归和特征工程：\n   ```python\n   # 示例代码片段（来自课程笔记）\n   import pandas as pd\n   from sklearn.linear_model import LinearRegression\n\n   df = pd.read_csv('data.csv')\n   model = LinearRegression()\n   model.fit(df[['feature1', 'feature2']], df['target'])\n   ```\n\n4. **完成作业**：\n   - **自学模式**：直接在本地完成作业代码，无强制截止日期，无评分。\n   - **直播班模式**：需在 [课程平台](https:\u002F\u002Fcourses.datatalks.club) 提交答案以获得评分和排行榜名次。\n\n5. **项目实战**：\n   在完成模块 6（决策树）和模块 10（Kubernetes）后，分别进行期中项目和期末毕业设计。你需要选择一个感兴趣的问题，寻找数据集，训练模型并使用 Docker\u002FFastAPI 将其部署为 Web 服务。\n\n### 加入社区\n遇到问题时，可加入官方 Slack 频道 `#course-ml-zoomcamp` 或 Telegram 公告频道获取帮助（需科学上网）。国内开发者也可在相关技术论坛搜索\"ML Zoomcamp\"寻找讨论组。\n\n---\n**下一步**：前往 `01-intro` 文件夹开始你的第一个机器学习任务，或访问 [课程注册页面](https:\u002F\u002Fairtable.com\u002FshryxwLd0COOEaqXo) 加入 2025 直播班。","某初创公司的后端工程师李明，虽有一年 Python 开发经验，但被要求独立负责将团队的原型算法转化为可上线的机器学习服务，却对工程化部署一无所知。\n\n### 没有 machine-learning-zoomcamp 时\n- **知识断层严重**：熟悉 Scikit-learn 建模，但完全不懂如何将模型封装为 API，导致算法只能停留在本地 Jupyter Notebook 中无法交付。\n- **部署环境混乱**：尝试手动在服务器上配置依赖，因环境不一致导致“在我电脑上能跑”的问题频发，浪费大量时间排查兼容性错误。\n- **缺乏系统路径**：在网上零散搜索 Docker、Kubernetes 教程，内容碎片化且难度跳跃，难以形成从训练到上线的完整工程闭环。\n- **孤军奋战无反馈**：遇到报错只能独自摸索，没有同伴讨论或代码审查机制，项目进度严重滞后，面临延期风险。\n\n### 使用 machine-learning-zoomcamp 后\n- **掌握全链路技能**：通过课程系统学习了用 FastAPI 构建模型服务，并成功将线性回归与决策树模型包装成标准接口，实现了从代码到服务的跨越。\n- **容器化解决一致性**：学会使用 Docker 容器化应用，确保开发、测试与生产环境完全一致，彻底消除了环境差异导致的部署故障。\n- **实战导向的学习路径**：跟随 4 个月的结构化大纲，按部就班地完成了从数据预处理到 AWS Lambda 无服务器部署的完整项目，建立了清晰的工程视野。\n- **社区支持加速成长**：加入 Slack 频道参与作业互评，在真实案例交流中快速修正错误，最终顺利通过了包含同行评审的期末项目考核。\n\nmachine-learning-zoomcamp 帮助开发者填补了从“会写模型”到“能落地服务”的关键鸿沟，让机器学习工程化变得有章可循。","https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002FDataTalksClub_machine-learning-zoomcamp_b649488a.png","DataTalksClub","https:\u002F\u002Foss.gittoolsai.com\u002Favatars\u002FDataTalksClub_b71d8174.png","The place to talk about data",null,"alexey@datatalks.club","datatalks.club","https:\u002F\u002Fgithub.com\u002FDataTalksClub",[81,85,89,93],{"name":82,"color":83,"percentage":84},"Jupyter Notebook","#DA5B0B",99.2,{"name":86,"color":87,"percentage":88},"Python","#3572A5",0.7,{"name":90,"color":91,"percentage":92},"Dockerfile","#384d54",0.1,{"name":94,"color":95,"percentage":96},"Shell","#89e051",0,12896,2923,"2026-04-13T16:40:38","未说明","机器学习模块无需特殊 GPU（普通笔记本即可）；深度学习模块建议使用云端资源进行计算，本地具体配置未说明",{"notes":103,"python":100,"dependencies":104},"本课程涵盖从基础模型到生产部署的全流程。基础机器学习模块仅需一台能上网的笔记本电脑；深度学习部分因计算密集，课程建议使用云端资源而非依赖本地硬件。需掌握至少 1 年编程经验及命令行基础。涉及容器化 (Docker)、API 构建 (FastAPI) 及编排 (Kubernetes) 等工程化技术。",[105,106,107,108,109,110,111,112,113,114],"NumPy","Pandas","Scikit-learn","TensorFlow","PyTorch","Keras","XGBoost","FastAPI","Docker","AWS Lambda",[14,52],[117,118,119,120,121,122,123,124],"course","deployment","docker","fastapi","kubernetes","machine-learning","pytorch","tensorflow","2026-03-27T02:49:30.150509","2026-04-14T12:26:53.503371",[128,133,138,143,148,153,158,163],{"id":129,"question_zh":130,"answer_zh":131,"source_url":132},32748,"机器学习与基于规则的系统有什么区别？视频中有何详解？","相关视频时间戳解析了核心概念：0:37 介绍基于规则的系统，6:26 说明为何使用机器学习，7:56 讲解特征（Features），11:41 展示模型输出，14:22 总结两者差异。","https:\u002F\u002Fgithub.com\u002FDataTalksClub\u002Fmachine-learning-zoomcamp\u002Fissues\u002F234",{"id":134,"question_zh":135,"answer_zh":136,"source_url":137},32749,"如何使用 Scikit-Learn 绘制 ROC 曲线？","虽然部分旧视频链接可能失效或时长不符，但通常可以使用 `sklearn.metrics.roc_curve` 计算假阳性率和真阳性率，并结合 `matplotlib` 进行绘制。建议参考课程最新提供的代码库或更新后的视频资源。","https:\u002F\u002Fgithub.com\u002FDataTalksClub\u002Fmachine-learning-zoomcamp\u002Fissues\u002F189",{"id":139,"question_zh":140,"answer_zh":141,"source_url":142},32742,"将 Keras 模型转换为 TFLite 时出现 'Unrecognized keyword arguments: ragged' 错误怎么办？","该错误通常是由于 TensorFlow 版本过旧导致的。请尝试升级到较新的版本（至少 2.0 或更高），升级后通常可以成功转换。","https:\u002F\u002Fgithub.com\u002FDataTalksClub\u002Fmachine-learning-zoomcamp\u002Fissues\u002F3",{"id":144,"question_zh":145,"answer_zh":146,"source_url":147},32743,"课程视频中提到的训练集、验证集和测试集的划分比例是多少？","正确的数据划分比例应为：60% 训练集、20% 验证集和 20% 测试集，并设置随机种子为 11。部分文档中误写为 80% 训练集，请以 60\u002F20\u002F20 为准。","https:\u002F\u002Fgithub.com\u002FDataTalksClub\u002Fmachine-learning-zoomcamp\u002Fissues\u002F315",{"id":149,"question_zh":150,"answer_zh":151,"source_url":152},32744,"在哪里可以找到机器学习训练营课程的详细目录和时间戳？","可以在相关 GitHub Issue 的评论中找到详细的时间戳列表。例如 2022 年课程介绍视频包含：0:00 介绍、3:55 先决条件、7:40 课程概述、21:25 课程后勤、35:10 排行榜与评分等关键节点。","https:\u002F\u002Fgithub.com\u002FDataTalksClub\u002Fmachine-learning-zoomcamp\u002Fissues\u002F238",{"id":154,"question_zh":155,"answer_zh":156,"source_url":157},32745,"如何快速定位 NumPy 入门视频中关于创建数组和多维数组的内容？","在 \"Introduction to NumPy\" 视频中，关键时间点如下：0:40 导入 NumPy，1:14 创建数组，5:38 多维数组，10:28 随机生成数组，14:02 元素级操作，17:15 比较操作，19:50 汇总操作。","https:\u002F\u002Fgithub.com\u002FDataTalksClub\u002Fmachine-learning-zoomcamp\u002Fissues\u002F230",{"id":159,"question_zh":160,"answer_zh":161,"source_url":162},32746,"迁移学习（Transfer Learning）视频中讲解了哪些关键步骤？","视频涵盖了以下核心内容：0:01:50 重用卷积层进行训练，0:03:41 输入预处理与批次大小设置，0:09:31 创建基础模型，0:11:45 提取非训练模型的向量表示，0:19:51 使用函数式风格构建神经网络，0:23:27 推荐使用 Adam 优化器，以及 0:28:45 使用 fit 方法进行模型训练。","https:\u002F\u002Fgithub.com\u002FDataTalksClub\u002Fmachine-learning-zoomcamp\u002Fissues\u002F156",{"id":164,"question_zh":165,"answer_zh":166,"source_url":167},32747,"第一次作业（Homework 1）的解题思路和视频讲解重点是什么？","作业解答视频重点包括：0:02:46 使用 Pandas 函数分析数据集，0:05:52 检测缺失值并计算中位数\u002F众数，0:08:46 填充缺失值及应用正规方程（矩阵乘法），0:11:52 利用矩阵乘法解释线性回归原理。","https:\u002F\u002Fgithub.com\u002FDataTalksClub\u002Fmachine-learning-zoomcamp\u002Fissues\u002F271",[169,174],{"id":170,"version":171,"summary_zh":172,"released_at":173},247505,"dl-models","该TF模型可使用TensorFlow 2.20及以上版本加载。","2025-08-15T17:47:37",{"id":175,"version":176,"summary_zh":177,"released_at":178},247506,"chapter7-model","第七章的预训练模型——服装类型检测","2020-09-26T20:40:17"]