[{"data":1,"prerenderedAt":-1},["ShallowReactive",2],{"similar-mrdbourke--zero-to-mastery-ml":3,"tool-mrdbourke--zero-to-mastery-ml":64},[4,17,27,35,43,56],{"id":5,"name":6,"github_repo":7,"description_zh":8,"stars":9,"difficulty_score":10,"last_commit_at":11,"category_tags":12,"status":16},3808,"stable-diffusion-webui","AUTOMATIC1111\u002Fstable-diffusion-webui","stable-diffusion-webui 是一个基于 Gradio 构建的网页版操作界面，旨在让用户能够轻松地在本地运行和使用强大的 Stable Diffusion 图像生成模型。它解决了原始模型依赖命令行、操作门槛高且功能分散的痛点，将复杂的 AI 绘图流程整合进一个直观易用的图形化平台。\n\n无论是希望快速上手的普通创作者、需要精细控制画面细节的设计师，还是想要深入探索模型潜力的开发者与研究人员，都能从中获益。其核心亮点在于极高的功能丰富度：不仅支持文生图、图生图、局部重绘（Inpainting）和外绘（Outpainting）等基础模式，还独创了注意力机制调整、提示词矩阵、负向提示词以及“高清修复”等高级功能。此外，它内置了 GFPGAN 和 CodeFormer 等人脸修复工具，支持多种神经网络放大算法，并允许用户通过插件系统无限扩展能力。即使是显存有限的设备，stable-diffusion-webui 也提供了相应的优化选项，让高质量的 AI 艺术创作变得触手可及。",162132,3,"2026-04-05T11:01:52",[13,14,15],"开发框架","图像","Agent","ready",{"id":18,"name":19,"github_repo":20,"description_zh":21,"stars":22,"difficulty_score":23,"last_commit_at":24,"category_tags":25,"status":16},1381,"everything-claude-code","affaan-m\u002Feverything-claude-code","everything-claude-code 是一套专为 AI 编程助手（如 Claude Code、Codex、Cursor 等）打造的高性能优化系统。它不仅仅是一组配置文件，而是一个经过长期实战打磨的完整框架，旨在解决 AI 代理在实际开发中面临的效率低下、记忆丢失、安全隐患及缺乏持续学习能力等核心痛点。\n\n通过引入技能模块化、直觉增强、记忆持久化机制以及内置的安全扫描功能，everything-claude-code 能显著提升 AI 在复杂任务中的表现，帮助开发者构建更稳定、更智能的生产级 AI 代理。其独特的“研究优先”开发理念和针对 Token 消耗的优化策略，使得模型响应更快、成本更低，同时有效防御潜在的攻击向量。\n\n这套工具特别适合软件开发者、AI 研究人员以及希望深度定制 AI 工作流的技术团队使用。无论您是在构建大型代码库，还是需要 AI 协助进行安全审计与自动化测试，everything-claude-code 都能提供强大的底层支持。作为一个曾荣获 Anthropic 黑客大奖的开源项目，它融合了多语言支持与丰富的实战钩子（hooks），让 AI 真正成长为懂上",138956,2,"2026-04-05T11:33:21",[13,15,26],"语言模型",{"id":28,"name":29,"github_repo":30,"description_zh":31,"stars":32,"difficulty_score":23,"last_commit_at":33,"category_tags":34,"status":16},2271,"ComfyUI","Comfy-Org\u002FComfyUI","ComfyUI 是一款功能强大且高度模块化的视觉 AI 引擎，专为设计和执行复杂的 Stable Diffusion 图像生成流程而打造。它摒弃了传统的代码编写模式，采用直观的节点式流程图界面，让用户通过连接不同的功能模块即可构建个性化的生成管线。\n\n这一设计巧妙解决了高级 AI 绘图工作流配置复杂、灵活性不足的痛点。用户无需具备编程背景，也能自由组合模型、调整参数并实时预览效果，轻松实现从基础文生图到多步骤高清修复等各类复杂任务。ComfyUI 拥有极佳的兼容性，不仅支持 Windows、macOS 和 Linux 全平台，还广泛适配 NVIDIA、AMD、Intel 及苹果 Silicon 等多种硬件架构，并率先支持 SDXL、Flux、SD3 等前沿模型。\n\n无论是希望深入探索算法潜力的研究人员和开发者，还是追求极致创作自由度的设计师与资深 AI 绘画爱好者，ComfyUI 都能提供强大的支持。其独特的模块化架构允许社区不断扩展新功能，使其成为当前最灵活、生态最丰富的开源扩散模型工具之一，帮助用户将创意高效转化为现实。",107662,"2026-04-03T11:11:01",[13,14,15],{"id":36,"name":37,"github_repo":38,"description_zh":39,"stars":40,"difficulty_score":23,"last_commit_at":41,"category_tags":42,"status":16},3704,"NextChat","ChatGPTNextWeb\u002FNextChat","NextChat 是一款轻量且极速的 AI 助手，旨在为用户提供流畅、跨平台的大模型交互体验。它完美解决了用户在多设备间切换时难以保持对话连续性，以及面对众多 AI 模型不知如何统一管理的痛点。无论是日常办公、学习辅助还是创意激发，NextChat 都能让用户随时随地通过网页、iOS、Android、Windows、MacOS 或 Linux 端无缝接入智能服务。\n\n这款工具非常适合普通用户、学生、职场人士以及需要私有化部署的企业团队使用。对于开发者而言，它也提供了便捷的自托管方案，支持一键部署到 Vercel 或 Zeabur 等平台。\n\nNextChat 的核心亮点在于其广泛的模型兼容性，原生支持 Claude、DeepSeek、GPT-4 及 Gemini Pro 等主流大模型，让用户在一个界面即可自由切换不同 AI 能力。此外，它还率先支持 MCP（Model Context Protocol）协议，增强了上下文处理能力。针对企业用户，NextChat 提供专业版解决方案，具备品牌定制、细粒度权限控制、内部知识库整合及安全审计等功能，满足公司对数据隐私和个性化管理的高标准要求。",87618,"2026-04-05T07:20:52",[13,26],{"id":44,"name":45,"github_repo":46,"description_zh":47,"stars":48,"difficulty_score":23,"last_commit_at":49,"category_tags":50,"status":16},2268,"ML-For-Beginners","microsoft\u002FML-For-Beginners","ML-For-Beginners 是由微软推出的一套系统化机器学习入门课程，旨在帮助零基础用户轻松掌握经典机器学习知识。这套课程将学习路径规划为 12 周，包含 26 节精炼课程和 52 道配套测验，内容涵盖从基础概念到实际应用的完整流程，有效解决了初学者面对庞大知识体系时无从下手、缺乏结构化指导的痛点。\n\n无论是希望转型的开发者、需要补充算法背景的研究人员，还是对人工智能充满好奇的普通爱好者，都能从中受益。课程不仅提供了清晰的理论讲解，还强调动手实践，让用户在循序渐进中建立扎实的技能基础。其独特的亮点在于强大的多语言支持，通过自动化机制提供了包括简体中文在内的 50 多种语言版本，极大地降低了全球不同背景用户的学习门槛。此外，项目采用开源协作模式，社区活跃且内容持续更新，确保学习者能获取前沿且准确的技术资讯。如果你正寻找一条清晰、友好且专业的机器学习入门之路，ML-For-Beginners 将是理想的起点。",84991,"2026-04-05T10:45:23",[14,51,52,53,15,54,26,13,55],"数据工具","视频","插件","其他","音频",{"id":57,"name":58,"github_repo":59,"description_zh":60,"stars":61,"difficulty_score":10,"last_commit_at":62,"category_tags":63,"status":16},3128,"ragflow","infiniflow\u002Fragflow","RAGFlow 是一款领先的开源检索增强生成（RAG）引擎，旨在为大语言模型构建更精准、可靠的上下文层。它巧妙地将前沿的 RAG 技术与智能体（Agent）能力相结合，不仅支持从各类文档中高效提取知识，还能让模型基于这些知识进行逻辑推理和任务执行。\n\n在大模型应用中，幻觉问题和知识滞后是常见痛点。RAGFlow 通过深度解析复杂文档结构（如表格、图表及混合排版），显著提升了信息检索的准确度，从而有效减少模型“胡编乱造”的现象，确保回答既有据可依又具备时效性。其内置的智能体机制更进一步，使系统不仅能回答问题，还能自主规划步骤解决复杂问题。\n\n这款工具特别适合开发者、企业技术团队以及 AI 研究人员使用。无论是希望快速搭建私有知识库问答系统，还是致力于探索大模型在垂直领域落地的创新者，都能从中受益。RAGFlow 提供了可视化的工作流编排界面和灵活的 API 接口，既降低了非算法背景用户的上手门槛，也满足了专业开发者对系统深度定制的需求。作为基于 Apache 2.0 协议开源的项目，它正成为连接通用大模型与行业专有知识之间的重要桥梁。",77062,"2026-04-04T04:44:48",[15,14,13,26,54],{"id":65,"github_repo":66,"name":67,"description_en":68,"description_zh":69,"ai_summary_zh":69,"readme_en":70,"readme_zh":71,"quickstart_zh":72,"use_case_zh":73,"hero_image_url":74,"owner_login":75,"owner_name":76,"owner_avatar_url":77,"owner_bio":78,"owner_company":79,"owner_location":79,"owner_email":79,"owner_twitter":75,"owner_website":80,"owner_url":81,"languages":82,"stars":91,"forks":92,"last_commit_at":93,"license":79,"difficulty_score":94,"env_os":95,"env_gpu":95,"env_ram":95,"env_deps":96,"category_tags":105,"github_topics":106,"view_count":23,"oss_zip_url":79,"oss_zip_packed_at":79,"status":16,"created_at":110,"updated_at":111,"faqs":112,"releases":143},2572,"mrdbourke\u002Fzero-to-mastery-ml","zero-to-mastery-ml","All course materials for the Zero to Mastery Machine Learning and Data Science course.","zero-to-mastery-ml 是一套专为机器学习和数据科学初学者打造的开源学习资源库，完整收录了 Zero to Mastery 知名课程的所有代码、笔记、数据集及教学素材。它旨在解决新手在进入 AI 领域时面临的“无从下手”痛点，通过结构化的路径帮助用户从零掌握核心技能。\n\n这套资源非常适合希望系统入门的开发者、转行人员以及计算机专业学生使用。内容编排逻辑清晰，从 NumPy、pandas、Matplotlib 等基础数据处理库讲起，逐步过渡到 Scikit-Learn 算法应用。其独特亮点在于强调“实战驱动”，不仅提供了清晰的六步机器学习项目框架，还包含两个端到端的里程碑项目：心脏病分类预测与推土机价格回归。用户可以直接在浏览器中通过 Binder 或 Google Colab 运行代码，无需繁琐的环境配置。此外，项目还维护了一本精美的在线电子书，并持续更新以适应最新的技术趋势，让学习者能跟随行业节奏稳步成长。","# Zero to Mastery Machine Learning\n[![Binder](https:\u002F\u002Fmybinder.org\u002Fbadge_logo.svg)](https:\u002F\u002Fmybinder.org\u002Fv2\u002Fgh\u002Fmrdbourke\u002Fzero-to-mastery-ml\u002Fmaster)\n[![Colab](https:\u002F\u002Fcolab.research.google.com\u002Fassets\u002Fcolab-badge.svg)](https:\u002F\u002Fcolab.research.google.com\u002Fgithub\u002Fmrdbourke\u002Fzero-to-mastery-ml\u002Fblob\u002Fmaster)\n\nWelcome! This repository contains all of the code, notebooks, images and other materials related to the [Zero to Mastery Machine Learning Course on Udemy](https:\u002F\u002Fdbourke.link\u002Fmlcourse) and [zerotomastery.io](https:\u002F\u002Fdbourke.link\u002FZTMmlcourse).\n\n## Quick links\n\n* 🎥 Watch the [first 10 hours of the course on YouTube](https:\u002F\u002Fyoutu.be\u002Fr67SfaiYaDI).\n* 📚 Read the materials of the course in a [beautiful online book](https:\u002F\u002Fdev.mrdbourke.com\u002Fzero-to-mastery-ml\u002F).\n* 🤔 Found something wrong with the code? Leave an [issue](https:\u002F\u002Fgithub.com\u002Fmrdbourke\u002Fzero-to-mastery-ml\u002Fissues).\n* ❓ Got a question? [Post a discussion](https:\u002F\u002Fgithub.com\u002Fmrdbourke\u002Fzero-to-mastery-ml\u002Fdiscussions) (see the [question template](https:\u002F\u002Fgithub.com\u002Fmrdbourke\u002Fzero-to-mastery-ml\u002Fdiscussions\u002F48)). \n\n## Updates\n\n* **30 October 2024** - Add course book version of [Milestone Project 2: Bulldozer Price Regression](https:\u002F\u002Fdev.mrdbourke.com\u002Fzero-to-mastery-ml\u002Fend-to-end-bluebook-bulldozer-price-regression-v2\u002F) (updated for 2025 onwards)\n* **12 September 2024** - Working on updating the materials for 2025, see progress in [#105](https:\u002F\u002Fgithub.com\u002Fmrdbourke\u002Fzero-to-mastery-ml\u002Fdiscussions\u002F105)\n* **12 October 2023** - Created an online book version of the course materials, see: https:\u002F\u002Fdev.mrdbourke.com\u002Fzero-to-mastery-ml\u002F \n\n## Contents\n\nThe following contents are listed in suggested chronological order.\n\nBut feel free to mix in match in anyway you feel fit.\n\n> **Note:** All of the datasets we use in the course are available in the [`data\u002F`](https:\u002F\u002Fgithub.com\u002Fmrdbourke\u002Fzero-to-mastery-ml\u002Ftree\u002Fmaster\u002Fdata) folder.\n\n| **Section** | **Resource** | **Description** |\n|-----|-----|-----| \n| 00 | [A 6 step framework for approaching machine learning projects](https:\u002F\u002Fdev.mrdbourke.com\u002Fzero-to-mastery-ml\u002Fa-6-step-framework-for-approaching-machine-learning-projects\u002F) | A guideline for different kinds of machine learning projects and how to break them down into smaller steps. |\n| 01 | [Introduction to NumPy](https:\u002F\u002Fdev.mrdbourke.com\u002Fzero-to-mastery-ml\u002Fintroduction-to-numpy\u002F) | NumPy stands for Numerical Python. It's one of the most used Python libraries for numerical processing (which is what much of data science and machine learning is). | \n| 02 | [Introduction to pandas](https:\u002F\u002Fdev.mrdbourke.com\u002Fzero-to-mastery-ml\u002Fintroduction-to-pandas\u002F) | pandas is a Python library for manipulating and analysing data. You can imagine pandas as a programmatic form of an Excel spreadsheet. |\n| 03 | [Introduction to Matplotlib](https:\u002F\u002Fdev.mrdbourke.com\u002Fzero-to-mastery-ml\u002Fintroduction-to-matplotlib\u002F) | Matplotlib helps to visualize data. You can create plots and graphs programmatically based on various data sources. |\n| 04 | [Introduction to Scikit-Learn](https:\u002F\u002Fdev.mrdbourke.com\u002Fzero-to-mastery-ml\u002Fintroduction-to-scikit-learn\u002F) | Scikit-Learn or sklearn is full of data processing techniques as well as pre-built machine learning algorithms for many different tasks. |\n| 05 | [Milestone Project 1: End-to-end Heart Disease Classification](https:\u002F\u002Fdev.mrdbourke.com\u002Fzero-to-mastery-ml\u002Fend-to-end-heart-disease-classification\u002F) | Here we'll put together everything we've gone through in the previous sections to create a machine learning model that is capable of classifying if someone has heart disease or not based on their health characteristics. We'll start with a raw dataset and work through performing an exploratory data analysis (EDA) on it before trying out several different machine learning models to see which performs best. | \n| 06 | [Milestone Project 2: End-to-end Bulldozer Price Prediction](https:\u002F\u002Fdev.mrdbourke.com\u002Fzero-to-mastery-ml\u002Fend-to-end-bluebook-bulldozer-price-regression-v2\u002F) | In this project we'll work with an open-source dataset of bulldozer sales information. We'll use this data to build a machine learning model capable of predicting the sales price of a bulldozer based on several input parameters such as size and brand. Since this dataset isn't perfect, we'll work through several data preprocessing steps before building a model. And since we'll be working towards predicting a number (price of bulldozers), this project is known as regression project. | \n| 07 | [Milestone Project 3: Introduction to TensorFlow\u002FKeras and Deep Learning](https:\u002F\u002Fdev.mrdbourke.com\u002Fzero-to-mastery-ml\u002Fend-to-end-dog-vision-v2\u002F) | TensorFlow\u002FKeras are deep learning frameworks written in Python. Originally created by Google and are now open-source. These frameworks allow you to build and train neural networks, one of the most powerful kinds of machine learning models. In this section we'll learn about deep learning and TensorFlow\u002FKeras by building Dog Vision 🐶👁️, a neural network to identify dog breeds in images. |\n| 08 | [Communicating your work](https:\u002F\u002Fdev.mrdbourke.com\u002Fzero-to-mastery-ml\u002Fcommunicating-your-work\u002F) | One of the most important parts of machine learning and any software project is communicating what you've found\u002Fdone. This module takes the learnings from the previous sections and gives tips and tricks on how you can communicate your work to others. |\n\n## What this course focuses on\n\n1. Create a framework for working through problems ([6 step machine learning modelling framework](https:\u002F\u002Fgithub.com\u002Fmrdbourke\u002Fzero-to-mastery-ml\u002Fblob\u002Fmaster\u002Fsection-1-getting-ready-for-machine-learning\u002Fa-6-step-framework-for-approaching-machine-learning-projects.md))\n2. Find tools to fit the framework\n3. Targeted practice = use tools and framework steps to work on end-to-end machine learning modelling projects \n\n## How this course is structured \n\n* Section 1 - Getting your mind and computer ready for machine learning (concepts, computer setup)\n* Section 2 - Tools for machine learning and data science (pandas, NumPy, Matplotlib, Scikit-Learn)\n* Section 3 - End-to-end structured data projects (classification and regression)\n* Section 4 - Neural networks, deep learning and transfer learning with TensorFlow 2.0\n* Section 5 - Communicating and sharing your work\n\n## Student notes\n\nSome students have taken and shared extensive notes on this course, see them below.\n\nIf you'd like to submit yours, leave a pull request.\n\n1. Chester's notes - https:\u002F\u002Fgithub.com\u002Fchesterheng\u002Fmachinelearning-datascience\n2. Sophia's notes - https:\u002F\u002Fwww.rockyourcode.com\u002Ftags\u002Fudemy-complete-machine-learning-and-data-science-zero-to-mastery\u002F\n","# 从零开始掌握机器学习\n[![Binder](https:\u002F\u002Fmybinder.org\u002Fbadge_logo.svg)](https:\u002F\u002Fmybinder.org\u002Fv2\u002Fgh\u002Fmrdbourke\u002Fzero-to-mastery-ml\u002Fmaster)\n[![Colab](https:\u002F\u002Fcolab.research.google.com\u002Fassets\u002Fcolab-badge.svg)](https:\u002F\u002Fcolab.research.google.com\u002Fgithub\u002Fmrdbourke\u002Fzero-to-mastery-ml\u002Fblob\u002Fmaster)\n\n欢迎！本仓库包含了与[Udemy上的“从零开始掌握机器学习”课程](https:\u002F\u002Fdbourke.link\u002Fmlcourse)以及[zerotomastery.io](https:\u002F\u002Fdbourke.link\u002FZTMmlcourse)相关的所有代码、笔记本、图片及其他资料。\n\n## 快速链接\n\n* 🎥 在YouTube上观看课程的前10小时：[点击这里](https:\u002F\u002Fyoutu.be\u002Fr67SfaiYaDI)。\n* 📚 在精美的在线书中阅读课程内容：[点击这里](https:\u002F\u002Fdev.mrdbourke.com\u002Fzero-to-mastery-ml\u002F)。\n* 🤔 发现代码有问题？请提交[issue](https:\u002F\u002Fgithub.com\u002Fmrdbourke\u002Fzero-to-mastery-ml\u002Fissues)。\n* ❓ 有疑问？请在[讨论区](https:\u002F\u002Fgithub.com\u002Fmrdbourke\u002Fzero-to-mastery-ml\u002Fdiscussions)提问（请参考[问题模板](https:\u002F\u002Fgithub.com\u002Fmrdbourke\u002Fzero-to-mastery-ml\u002Fdiscussions\u002F48)）。\n\n## 更新\n\n* **2024年10月30日** - 添加了课程书籍版的里程碑项目2：推土机价格回归（适用于2025年及以后）。\n* **2024年9月12日** - 正在更新2025年的课程材料，进度请见[#105](https:\u002F\u002Fgithub.com\u002Fmrdbourke\u002Fzero-to-mastery-ml\u002Fdiscussions\u002F105)。\n* **2023年10月12日** - 创建了课程材料的在线书版本，详情请见：https:\u002F\u002Fdev.mrdbourke.com\u002Fzero-to-mastery-ml\u002F。\n\n## 目录\n\n以下内容按建议的时间顺序排列。\n\n不过，您可以根据自己的需求随意组合和调整。\n\n> **注意**：我们在课程中使用的所有数据集都位于[`data\u002F`](https:\u002F\u002Fgithub.com\u002Fmrdbourke\u002Fzero-to-mastery-ml\u002Ftree\u002Fmaster\u002Fdata)文件夹中。\n\n| **章节** | **资源** | **描述** |\n|-----|-----|-----|\n| 00 | [解决机器学习项目的6步框架](https:\u002F\u002Fdev.mrdbourke.com\u002Fzero-to-mastery-ml\u002Fa-6-step-framework-for-approaching-machine-learning-projects\u002F) | 针对不同类型的机器学习项目及其分解为更小步骤的指导原则。 |\n| 01 | [NumPy简介](https:\u002F\u002Fdev.mrdbourke.com\u002Fzero-to-mastery-ml\u002Fintroduction-to-numpy\u002F) | NumPy代表数值Python。它是用于数值处理最常用的Python库之一（而数据科学和机器学习很大程度上就是围绕数值处理展开的）。 |\n| 02 | [pandas简介](https:\u002F\u002Fdev.mrdbourke.com\u002Fzero-to-mastery-ml\u002Fintroduction-to-pandas\u002F) | pandas是一个用于操作和分析数据的Python库。您可以将其想象成程序化的Excel电子表格。 |\n| 03 | [Matplotlib简介](https:\u002F\u002Fdev.mrdbourke.com\u002Fzero-to-mastery-ml\u002Fintroduction-to-matplotlib\u002F) | Matplotlib用于数据可视化。您可以基于各种数据源以编程方式创建图表和图形。 |\n| 04 | [Scikit-Learn简介](https:\u002F\u002Fdev.mrdbourke.com\u002Fzero-to-mastery-ml\u002Fintroduction-to-scikit-learn\u002F) | Scikit-Learn或sklearn包含丰富的数据处理技术以及针对多种任务的预构建机器学习算法。 |\n| 05 | [里程碑项目1：端到端心脏病分类](https:\u002F\u002Fdev.mrdbourke.com\u002Fzero-to-mastery-ml\u002Fend-to-end-heart-disease-classification\u002F) | 在这一部分，我们将结合前面各节所学的内容，构建一个能够根据个人健康特征判断其是否患有心脏病的机器学习模型。我们将从原始数据集入手，先进行探索性数据分析（EDA），然后尝试多种不同的机器学习模型，以确定哪一种效果最佳。 |\n| 06 | [里程碑项目2：端到端推土机价格预测](https:\u002F\u002Fdev.mrdbourke.com\u002Fzero-to-mastery-ml\u002Fend-to-end-bluebook-bulldozer-price-regression-v2\u002F) | 在这个项目中，我们将使用一个公开的推土机销售信息数据集。利用这些数据，我们将构建一个机器学习模型，该模型可以根据尺寸、品牌等多个输入参数来预测推土机的售价。由于该数据集并不完美，我们将在建模之前进行多步数据预处理。此外，由于我们的目标是预测一个数值（推土机的价格），因此该项目被称为回归项目。 |\n| 07 | [里程碑项目3：TensorFlow\u002FKeras与深度学习入门](https:\u002F\u002Fdev.mrdbourke.com\u002Fzero-to-mastery-ml\u002Fend-to-end-dog-vision-v2\u002F) | TensorFlow\u002FKeras是用Python编写的深度学习框架。最初由Google开发，现已开源。这些框架允许您构建和训练神经网络——这是功能最强大的机器学习模型之一。在这一部分，我们将通过构建“狗狗视觉”🐶👁️——一个用于识别图像中犬种的神经网络——来学习深度学习和TensorFlow\u002FKeras。 |\n| 08 | [如何展示你的工作](https:\u002F\u002Fdev.mrdbourke.com\u002Fzero-to-mastery-ml\u002Fcommunicating-your-work\u002F) | 机器学习以及任何软件项目中最重要的环节之一，就是如何向他人传达你的发现或成果。本模块将结合前面各节的学习内容，提供一些技巧和方法，帮助您更好地与他人分享自己的工作成果。 |\n\n## 本课程的重点\n\n1. 构建解决问题的框架（[6步机器学习建模框架](https:\u002F\u002Fgithub.com\u002Fmrdbourke\u002Fzero-to-mastery-ml\u002Fblob\u002Fmaster\u002Fsection-1-getting-ready-for-machine-learning\u002Fa-6-step-framework-for-approaching-machine-learning-projects.md)）\n2. 寻找适合该框架的工具\n3. 有针对性的实践——运用工具和框架步骤，完成端到端的机器学习建模项目\n\n## 课程结构\n\n* 第1节：为机器学习做好心理和硬件准备（概念介绍、计算机设置）\n* 第2节：机器学习与数据科学的工具（pandas、NumPy、Matplotlib、Scikit-Learn）\n* 第3节：结构化数据的端到端项目（分类与回归）\n* 第4节：神经网络、深度学习及使用TensorFlow 2.0进行迁移学习\n* 第5节：如何展示和分享你的工作\n\n## 学生笔记\n\n一些学生已经整理并分享了关于本课程的详细笔记，如下所示。\n\n如果您也想提交自己的笔记，请发起一个拉取请求。\n\n1. Chester的笔记 - https:\u002F\u002Fgithub.com\u002Fchesterheng\u002Fmachinelearning-datascience\n2. Sophia的笔记 - https:\u002F\u002Fwww.rockyourcode.com\u002Ftags\u002Fudemy-complete-machine-learning-and-data-science-zero-to-mastery\u002F","# Zero to Mastery 机器学习快速上手指南\n\n本指南基于 `zero-to-mastery-ml` 开源项目，旨在帮助开发者快速搭建环境并开始端到端的机器学习实践。该项目涵盖了从数据准备、模型构建到深度学习的全流程。\n\n## 环境准备\n\n在开始之前，请确保你的开发环境满足以下要求：\n\n*   **操作系统**：Windows, macOS 或 Linux\n*   **Python 版本**：推荐 Python 3.8 或更高版本\n*   **前置知识**：基础的 Python 编程能力\n*   **可选平台**：如果你不想在本地配置环境，可以直接使用以下在线平台运行所有代码（无需安装）：\n    *   [Google Colab](https:\u002F\u002Fcolab.research.google.com\u002Fgithub\u002Fmrdbourke\u002Fzero-to-mastery-ml\u002Fblob\u002Fmaster)\n    *   [Binder](https:\u002F\u002Fmybinder.org\u002Fv2\u002Fgh\u002Fmrdbourke\u002Fzero-to-mastery-ml\u002Fmaster)\n\n### 核心依赖库\n本项目主要依赖以下 Python 数据科学库：\n*   `numpy` (数值计算)\n*   `pandas` (数据处理)\n*   `matplotlib` (数据可视化)\n*   `scikit-learn` (传统机器学习算法)\n*   `tensorflow` (深度学习)\n\n## 安装步骤\n\n### 1. 克隆项目仓库\n首先，将项目代码下载到本地：\n\n```bash\ngit clone https:\u002F\u002Fgithub.com\u002Fmrdbourke\u002Fzero-to-mastery-ml.git\ncd zero-to-mastery-ml\n```\n\n### 2. 创建虚拟环境（推荐）\n为了避免依赖冲突，建议创建独立的虚拟环境：\n\n```bash\npython -m venv ml-env\n# Windows\nml-env\\Scripts\\activate\n# macOS\u002FLinux\nsource ml-env\u002Fbin\u002Factivate\n```\n\n### 3. 安装依赖\n项目根目录通常包含 `requirements.txt` 文件。为了获得更快的下载速度，国内用户建议使用清华或阿里镜像源进行安装：\n\n```bash\n# 使用清华镜像源安装依赖\npip install -r requirements.txt -i https:\u002F\u002Fpypi.tuna.tsinghua.edu.cn\u002Fsimple\n```\n\n*注意：如果项目中没有明确的 `requirements.txt`，你可以手动安装核心库：*\n```bash\npip install numpy pandas matplotlib scikit-learn tensorflow -i https:\u002F\u002Fpypi.tuna.tsinghua.edu.cn\u002Fsimple\n```\n\n## 基本使用\n\n本项目采用“学习 - 实践”结合的方式，核心内容位于各个章节的 Jupyter Notebook (`.ipynb`) 文件中。\n\n### 1. 启动 Jupyter Notebook\n在项目根目录下运行以下命令启动服务：\n\n```bash\njupyter notebook\n```\n浏览器会自动打开，你将看到按顺序排列的章节文件夹（如 `section-00`, `section-01` 等）。\n\n### 2. 运行第一个示例：NumPy 入门\n1.  进入 `section-01-introduction-to-numpy` 文件夹。\n2.  打开对应的 `.ipynb` 文件。\n3.  逐个单元格（Cell）运行代码，体验数值计算操作。\n\n### 3. 实战演练：端到端心脏病分类项目\n这是课程的第一个里程碑项目（Milestone Project 1），展示了完整的机器学习工作流。\n\n1.  导航至 `section-05-milestone-project-1-heart-disease` (具体路径请参考目录结构)。\n2.  打开 `end-to-end-heart-disease-classification.ipynb`。\n3.  **执行流程**：\n    *   **加载数据**：代码会自动从 `data\u002F` 文件夹加载心脏病数据集。\n    *   **探索性数据分析 (EDA)**：运行可视化代码查看数据分布。\n    *   **模型训练**：使用 `scikit-learn` 尝试多种分类器。\n    *   **评估**：查看模型的准确率和其他指标。\n\n示例代码片段（在 Notebook 中运行）：\n```python\nimport pandas as pd\nfrom sklearn.model_selection import train_test_split\nfrom sklearn.ensemble import RandomForestClassifier\n\n# 加载数据 (假设在当前目录下的 data 文件夹中)\ndf = pd.read_csv(\"data\u002Fheart.csv\")\n\n# 准备特征 (X) 和标签 (y)\nX = df.drop(\"target\", axis=1)\ny = df[\"target\"]\n\n# 划分训练集和测试集\nX_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2)\n\n# 初始化并训练模型\nclf = RandomForestClassifier()\nclf.fit(X_train, y_train)\n\n# 评估模型\nprint(f\"Model accuracy: {clf.score(X_test, y_test):.2f}\")\n```\n\n### 4. 进阶学习路径\n按照以下顺序逐步深入：\n1.  **基础工具**：依次学习 NumPy, pandas, Matplotlib, Scikit-Learn 章节。\n2.  **结构化数据项目**：完成心脏病分类（分类问题）和推土机价格预测（回归问题）。\n3.  **深度学习**：进入 TensorFlow\u002FKeras 章节，构建“狗品种识别”神经网络模型。\n4.  **成果展示**：参考最后一章学习如何沟通和展示你的机器学习项目。\n\n所有数据集均已包含在项目的 `data\u002F` 目录中，无需额外下载。","一位刚转行数据科学的新人，试图独立构建一个预测二手工程机械价格的回归模型，却因缺乏系统指导而在数据清洗和特征工程阶段举步维艰。\n\n### 没有 zero-to-mastery-ml 时\n- **学习路径混乱**：面对 NumPy、pandas 和 Scikit-Learn 等零散文档，不知道按什么顺序学习才能串联成完整的项目流程。\n- **实战代码缺失**：网上教程多为理论片段，找不到像“推土机价格预测”这样包含从原始数据到模型部署的全流程开源代码参考。\n- **调试效率低下**：遇到数据报错或模型不收敛时，缺乏标准的六步框架来排查问题，只能盲目搜索，浪费数天时间。\n- **可视化能力薄弱**：不懂得如何利用 Matplotlib 进行有效的探索性数据分析（EDA），导致无法发现数据中的关键规律。\n\n### 使用 zero-to-mastery-ml 后\n- **路线清晰明确**：直接跟随仓库中建议的 chronological order（时间顺序），从基础库入门到里程碑项目，循序渐进掌握技能树。\n- **端到端案例复刻**：直接复用\"Milestone Project 2\"中的完整 Notebook 代码，快速理解如何处理类别特征、缺失值及构建回归流水线。\n- **方法论标准化**：运用仓库提供的\"6 步机器学习框架”，有条不紊地拆解问题，将原本几天的调试工作缩短至几小时。\n- **图表专业规范**：参考课程中的可视化范例，迅速生成高质量的分析图表，精准定位影响价格的核心因子。\n\nzero-to-mastery-ml 通过提供结构化的课程内容和真实的端到端项目代码，将初学者从碎片化学习的困境中解放出来，使其能专注于解决实际的商业数据问题。","https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002Fmrdbourke_zero-to-mastery-ml_f97351d3.png","mrdbourke","Daniel Bourke","https:\u002F\u002Foss.gittoolsai.com\u002Favatars\u002Fmrdbourke_c53fa7a6.jpg","Machine Learning Engineer live on YouTube.",null,"www.mrdbourke.com","https:\u002F\u002Fgithub.com\u002Fmrdbourke",[83,87],{"name":84,"color":85,"percentage":86},"Jupyter Notebook","#DA5B0B",100,{"name":88,"color":89,"percentage":90},"Shell","#89e051",0,4068,3790,"2026-04-03T04:33:50",1,"未说明",{"notes":97,"python":95,"dependencies":98},"该项目是机器学习课程配套代码，涵盖从数据处理到深度学习的全流程。支持通过 Binder 或 Google Colab 直接在浏览器中运行，无需本地配置环境。若本地运行，需自行安装上述主要依赖库。课程包含结构化数据项目（分类\u002F回归）及基于 TensorFlow 2.0 的深度学习项目（如狗品种识别）。",[99,100,101,102,103,104],"NumPy","pandas","Matplotlib","Scikit-Learn","TensorFlow","Keras",[54,13,51],[107,108,109],"machine-learning","data-science","deep-learning","2026-03-27T02:49:30.150509","2026-04-06T07:13:58.129106",[113,118,123,128,133,138],{"id":114,"question_zh":115,"answer_zh":116,"source_url":117},11889,"如何将 `hub.KerasLayer` 添加到 Keras Sequential 模型中而不报错？","如果直接添加 `hub.KerasLayer` 导致错误（提示只有 `keras.Layer` 实例才能添加），可以使用 `tf.keras.layers.Lambda` 将其包裹起来。具体代码如下：\n`tf.keras.layers.Lambda(hub.KerasLayer(model_url))`\n\n完整构建函数示例：\n```python\ndef create_model(input_shape=INPUT_SHAPE, output_shape=OUTPUT_SHAPE, model_url=MODEL_URL):\n  model = tf.keras.Sequential([\n    tf.keras.layers.Lambda(hub.KerasLayer(model_url)), # 输入层\n    tf.keras.layers.Dense(units=output_shape, activation=\"softmax\") # 输出层\n  ])\n  model.compile(\n      loss=tf.keras.losses.CategoricalCrossentropy(),\n      optimizer=tf.keras.optimizers.Adam(),\n      metrics=[\"accuracy\"]\n  )\n  model.build(input_shape)\n  return model\n```\n另外，降级 TensorFlow 或相关库的版本也可能解决此兼容性问题。","https:\u002F\u002Fgithub.com\u002Fmrdbourke\u002Fzero-to-mastery-ml\u002Fissues\u002F125",{"id":119,"question_zh":120,"answer_zh":121,"source_url":122},11890,"在进行数据预处理转换分类特征时遇到 scikit-learn 错误怎么办？","这通常是由于 scikit-learn 版本过旧或不兼容导致的。建议更新 scikit-learn 到指定版本（如 0.23）。如果你使用 Conda 环境，可以运行以下命令：\n1. `conda uninstall scikit-learn`\n2. `conda install scikit-learn=0.23`\n\n执行完成后，务必重启 Jupyter Notebook 以使更改生效。如果问题依旧，尝试更新 Anaconda 并重新安装 jupyter 和 scikit-learn。","https:\u002F\u002Fgithub.com\u002Fmrdbourke\u002Fzero-to-mastery-ml\u002Fissues\u002F20",{"id":124,"question_zh":125,"answer_zh":126,"source_url":127},11891,"访问在线手册链接时出现 TLS 证书错误（SSL certificate problem）如何解决？","如果遇到类似 `SSL certificate problem: self-signed certificate in certificate chain` 的错误，首先检查是否是本地网络或安全软件拦截。有用户反馈这是 Cloudflare Zero Trust 误报拦截了连接（False positive hit），关闭相关安全策略或检查本地防火墙设置后通常可恢复正常访问。如果确认是网站证书问题，可尝试联系课程维护者。","https:\u002F\u002Fgithub.com\u002Fmrdbourke\u002Fzero-to-mastery-ml\u002Fissues\u002F129",{"id":129,"question_zh":130,"answer_zh":131,"source_url":132},11892,"为什么无法加入课程的 Discord 服务器或收到消息发送失败的错误？","如果出现“消息无法送达”或无法加入服务器的提示，通常是因为尚未完成加入步骤或隐私设置限制。请确保：\n1. 已下载并注册 Discord 账号。\n2. 已通过课程提供的邀请链接正式加入服务器群组。\n3. 检查 Discord 隐私设置，允许接收来自服务器成员的消息。\n如果是验证环节卡住，请确认是否完成了服务器内的验证机器人步骤。若问题自行恢复，可能是临时的网络或服务器同步延迟。","https:\u002F\u002Fgithub.com\u002Fmrdbourke\u002Fzero-to-mastery-ml\u002Fissues\u002F89",{"id":134,"question_zh":135,"answer_zh":136,"source_url":137},11893,"在时间序列数据（如推土机价格预测）中进行超参数调优时，为什么不能使用默认的随机交叉验证？","对于时间序列数据，使用默认的 `RandomizedSearchCV` (cv=5) 是错误的，因为它会随机打乱数据顺序，破坏了时间依赖性，导致评估结果不准确。\n正确的做法是使用 `sklearn.model_selection.TimeSeriesSplit` 进行交叉验证。这种方法能保持数据的内在时间顺序，确保训练集在时间上早于测试集，从而得到更可靠的超参数评估结果。","https:\u002F\u002Fgithub.com\u002Fmrdbourke\u002Fzero-to-mastery-ml\u002Fissues\u002F93",{"id":139,"question_zh":140,"answer_zh":141,"source_url":142},11894,"混淆矩阵（Confusion Matrix）的坐标轴标签是否标反了？","是的，这是一个常见的绘图错误。在绘制混淆矩阵时，通常 X 轴应代表“预测值”（Predicted），Y 轴应代表“真实值”（True\u002FActual）。如果发现代码中将 X 轴标记为 True 而 Y 轴标记为 Predicted，应当交换这两个标签以符合标准惯例，确保图表解读正确。","https:\u002F\u002Fgithub.com\u002Fmrdbourke\u002Fzero-to-mastery-ml\u002Fissues\u002F73",[]]