course20

840 303 简单 1 次阅读 3天前Apache-2.0开发框架

AI 解读由 AI 自动生成，仅供参考

course20 是一套专为程序员设计的深度学习实战课程，旨在让开发者无需博士学位也能掌握人工智能应用开发。它通过结合《Deep Learning for Coders》一书与 2020 版视频教程，解决了传统深度学习学习曲线陡峭、理论过于抽象的痛点，帮助用户快速从代码实践入手构建模型。

这套资源非常适合具备一定编程基础但缺乏机器学习背景的开发者，同时也适合希望快速上手解决实际问题的数据科学家。课程独特的亮点在于“自顶向下”的教学法：先让用户运行并修改现成的强大模型以获得直观反馈，再逐步深入讲解背后的数学原理。内容基于 fastai 库和 PyTorch 框架，所有章节均提供可交互的 Jupyter Notebook 代码实例，支持直接在云端环境（如 Gradient 或 Colab）中运行实验，无需复杂的环境配置。此外，视频提供多语言字幕（含简体中文）及全文检索功能，配合活跃的全球社区论坛，为学习者提供了友好的互助环境。无论你是想转行 AI 的工程师，还是希望将智能功能融入产品的技术人员，course20 都能为你提供一条高效、务实的学习路径。

使用场景

一位只有基础 Python 经验的电商数据分析师，试图为公司构建一个自动识别商品图片中缺陷的深度学习模型。

没有 course20 时

被复杂的数学公式和理论推导劝退，认为必须拥有博士学位才能入门深度学习，迟迟不敢动手写代码。
在配置本地 GPU 环境、安装 CUDA 驱动和处理版本兼容性上耗费数周时间，导致项目尚未开始就已停滞。
面对从零搭建神经网络架构的庞大工程量感到无从下手，难以将业务问题转化为具体的代码实现。
缺乏系统的实践指导，遇到报错时只能在零散的技术博客中盲目搜索，效率极低且容易放弃。

使用 course20 后

遵循“先代码后理论”的理念，直接利用 fastai 库在几行代码内跑通第一个图像分类模型，迅速建立信心。
直接使用课程推荐的 Gradient 或 Colab 云端 Jupyter 环境，无需任何本地配置即可立即开始训练高性能模型。
通过书中配套的交互式 Notebook 逐步拆解任务，快速学会如何加载数据、微调预训练模型并部署应用。
依托课程视频的可搜索字幕和活跃的官方论坛社区，能精准定位并解决如 Bing API 密钥获取等具体实操难题。

course20 的核心价值在于它打破了学术高墙，让普通开发者无需深奥的数学背景也能高效落地真实的 AI 应用。

运行环境要求

操作系统

Linux

GPU

强烈建议使用带 GPU 的云端服务器（如 Gradient, Colab, Google Cloud）
本地运行需具备 NVIDIA GPU、CUDA 驱动及相应的系统管理能力，具体型号和显存未说明

内存

未说明

依赖

notes官方强烈不建议在个人电脑上运行本课程，除非用户非常精通 Linux 系统管理、GPU 驱动安装及 CUDA 配置。推荐直接使用 Gradient 或 Colab 等在线平台以避免环境配置问题。其中 Colab 存在部分功能限制（如不支持创建 Web GUI），Gradient 免费服务器可能过载。课程代码主要基于 Python，需具备至少一年编程经验。

python未说明 (建议熟悉 Python)

fastai (v2)

PyTorch

Jupyter Notebook

快速开始

针对编码者的实用深度学习

使用 fastai 和 PyTorch 的编码者深度学习：无需博士学位的 AI 应用——本书及课程

欢迎来到《针对编码者的实用深度学习》。本网站涵盖了本书以及 2020 年版课程的内容，两者设计为紧密配合使用。如果您尚未拥有本书，可以在此购买。此外，本书也以交互式 Jupyter Notebook 的形式免费提供；请继续阅读以了解如何获取它们。

我该如何开始？

如果您现在就准备开始学习，以下是入门步骤。如果您想了解更多关于本课程的信息，请先阅读接下来的几部分，然后再回到这里。

要观看视频，请点击导航侧边栏中的“课程”部分。所有课程都配有可搜索的字幕文本；点击右上角的“字幕搜索”即可查找特定词汇或短语，然后单击该词句即可直接跳转到视频中出现该内容的时间点。视频均带有字幕，并已翻译成简体中文和西班牙语。观看时，您可以点击“CC”按钮来开启或关闭字幕，再点击设置按钮选择语言。

每段视频对应书中的一章内容。而书中的每一章内容也都以交互式 Jupyter Notebook 的形式提供。Jupyter Notebook 是 Python 数据科学领域最受欢迎的工具，这绝非偶然——它功能强大、灵活且易于使用。我们相信您会爱上它！由于学习深度学习最重要的就是编写代码并进行实验，因此拥有一款优秀的代码实验平台至关重要。

为了开始学习，我们推荐您使用以下推荐在线平台提供的 Jupyter 服务器（点击链接可查看如何在这些平台上运行本课程的相关说明）：

Gradient：与 Colab 不同，这是一个“真正的”Jupyter Notebook 环境，因此课程中的所有内容都能正常运行。它还提供存储笔记本和模型的空间。不过，有时免费服务器可能会过载，导致无法连接。
Colab：谷歌推出的热门免费服务。由于谷歌近期对 Notebook 平台进行了较大改动，快捷键有所变化，且并非所有功能都可用（例如，第 2 章的许多内容无法运行，因为 Colab 不支持创建 Web 应用 GUI）。

如果您希望体验完整 Linux 服务器的运行环境，也可以考虑 Google Cloud（非常流行且可靠的服务，但性能最强的 GPU 成本较高）。我们强烈建议您使用上述推荐的在线平台来运行笔记本，而不要在自己的电脑上操作，除非您具备丰富的 Linux 系统管理经验，并熟悉 GPU 驱动程序、CUDA 等相关技术。

如果您需要帮助，forums.fast.ai 上有一个优秀的在线社区，随时准备为您提供支持。在论坛发帖提问之前，请务必仔细搜索，看看类似问题是否已经有人回答过。（论坛系统会要求您先在网站上花几分钟阅读现有主题，才能发布新帖子。）许多学员觉得比较棘手的一个环节是为第 2 课中的图片下载任务注册必应 API 密钥；这里有一篇很有帮助的论坛帖子，详细介绍了如何获取下载图片所需的必应 API 密钥。

这门课程适合我吗？

感谢您邀请我们陪伴您踏上深度学习之旅，无论您目前处于哪个阶段！以往的 fast.ai 课程吸引了来自世界各地、各行各业的数十万名学员。许多学员分享了他们的成长经历：有人在国际机器学习竞赛中多次斩获金牌（详情），有人获得了顶尖公司的录用通知（详情），还有人发表了研究论文（详情、详情、详情）。例如，Isaac Dimitrovsky 曾告诉我们：“我玩机器学习已有几年，却始终不得要领……去年底参加了 fast.ai 第一部分课程后，我才真正开窍。”随后，他一举夺得享有盛誉的国际 RA2-DREAM 挑战赛冠军！他基于 fastai 库，开发了一种多阶段深度学习方法，用于评估类风湿性关节炎患者的放射学手足关节损伤程度。

无论您是否具备技术或数学背景——当然，有也没关系！——我们都致力于让尽可能多的人轻松掌握深度学习。本课程唯一的先决条件是您会编程（一年左右的经验即可），最好使用 Python，并且至少修过高中数学课程。前三个章节特意以通俗易懂的方式编写，即使是高管、产品经理等非技术人员也能快速理解深度学习的核心要点；如果您属于这一群体，可以直接跳过这些章节中的代码部分。

深度学习是一种利用多层神经网络来提取和转换数据的计算机技术，其应用场景涵盖从语音识别到动物图像分类等多个领域。许多人误以为要取得出色的深度学习成果，必须具备各种稀缺资源，但通过本课程的学习，您会发现这种观点并不正确。以下是一些“完全不需要”的所谓“必备条件”：

误区（无需具备）	真相
大量数学知识	高中数学水平已足够
海量数据	我们曾见证仅用不到 50 个样本就创造纪录级效果
昂贵的计算设备	即使是免费工具，也能完成最先进的深度学习任务

深度学习兼具强大能力、高度灵活性和简洁性，因此我们认为它应当被广泛应用于各个学科领域，包括社会科学、自然科学、艺术、医学、金融、科学研究等等。以下是深度学习或深度学习主导的方法目前在全球范围内处于领先地位的数千项任务示例：

自然语言处理 (NLP)：问答系统、语音识别、文档摘要、文档分类、从文档中提取姓名、日期等信息、搜索提及特定概念的文章
计算机视觉：卫星与无人机影像解读（如灾害风险评估）、人脸识别、图像字幕生成、交通标志识别、自动驾驶车辆中的行人与车辆定位
医学：在 CT、MRI 和 X 光等影像中检测异常、病理切片特征计数、超声检查中测量指标、糖尿病视网膜病变诊断
生物学：蛋白质折叠、蛋白质分类、多项基因组学任务，例如肿瘤与正常组织测序、临床可干预基因突变分类、细胞分类、蛋白质间相互作用分析
图像生成：给黑白照片上色、提升图像分辨率、去除图像噪声、将照片转化为著名艺术家风格的艺术作品
推荐系统：网页搜索、商品推荐、首页内容布局
游戏：国际象棋、围棋、大多数 Atari 游戏以及许多即时战略游戏
机器人技术：处理难以定位（如透明、反光、缺乏纹理）或难以抓取的物体
其他应用：金融与物流预测、文本转语音等……

我们是谁

我们是 Sylvain Gugger 和 Jeremy Howard，您本次旅程的导师。我们是 fastai 的共同作者，而 fastai 正是您在本课程中将全程使用的软件。

Jeremy 从事机器学习的研究与教学已有约 30 年，早在 25 年前就开始使用神经网络。在此期间，他领导过多家以机器学习为核心的企业和项目，包括创立全球首家专注于深度学习与医疗的公司 Enlitic，并担任全球最大机器学习社区 Kaggle 的总裁兼首席科学家。此外，他还与 Rachel Thomas 博士共同创立了 fast.ai，也就是本课程的开发机构。

Sylvain 曾编写 10 册数学教材，覆盖法国高级数学课程的全部内容！如今，他任职于 Hugging Face，此前则在 fast.ai 担任研究员。

我们非常重视教学。在本课程中，我们首先通过简单直观的工具，展示如何使用一个完整、可用且功能强大的先进深度学习模型来解决实际问题。随后，我们会逐步深入探讨这些工具的工作原理，以及构建这些工具的基础工具又是如何运作的，以此类推……我们始终采用实例教学，确保每个知识点都有清晰的情境和明确的目的，而不是一开始就进行抽象的符号运算。

你将使用的软件

在本课程中，你将会使用 PyTorch 和 fastai。

我们曾使用数十种不同的库和多种编程语言完成了数百个机器学习项目。在 fast.ai，我们已经用当今主流的深度学习和机器学习框架开设过多门课程。在决定未来课程、软件开发和研究都采用 PyTorch 之前，我们花了超过一千个小时对其进行测试。如今，PyTorch 已经成为全球发展最快的深度学习库，并且被用于顶级会议上的大多数研究论文。

PyTorch 最适合作为底层基础库，提供更高层功能所需的基本操作。而 fastai 库则是最流行的在 PyTorch 基础之上添加这些高层功能的工具包。在本课程中，随着我们对深度学习基础的逐步深入，我们也会不断探索 fastai 的各个层次。本课程涵盖 fastai 库的 2.0 版本，这是一个从头开始重写的版本，提供了许多独特的功能。

你将学到什么

完成本课程后，你将掌握：

如何训练能够达到当前最先进水平的模型，应用于以下领域：
- 计算机视觉，包括图像分类（例如按品种对宠物照片进行分类）以及图像定位与检测（例如找出图像中动物的位置）；
- 自然语言处理（NLP），包括文档分类（例如电影评论的情感分析）和语言建模；
- 表格数据（例如销售预测），涵盖类别型数据、连续型数据及混合型数据，还包括时间序列；
- 协同过滤（例如电影推荐）。
如何将你的模型转化为 Web 应用并进行部署。
深度学习模型的工作原理及其背后的机制，并学会如何利用这些知识来提升模型的准确性、速度和可靠性。
实际应用中真正重要的最新深度学习技术。
如何从零开始实现随机梯度下降算法及完整的训练循环。
如何思考你的工作可能带来的伦理影响，以确保你的努力能够推动社会进步，同时避免技术被滥用造成伤害。

以下是部分将要讲解的技术（如果你目前对这些术语还不太熟悉也不用担心——很快你就会全部掌握）：

随机森林与梯度提升；
线性变换与非线性激活函数；
参数与激活值；
随机初始化与迁移学习；
SGD、动量法、Adam 等优化器；
卷积运算；
批归一化；
Dropout 正则化；
数据增强；
权重衰减；
图像分类与回归；
实体嵌入与词嵌入；
循环神经网络（RNN）；
图像分割；
以及更多内容。

course20 (Practical Deep Learning for Coders) 快速上手指南

本指南基于 fastai 和 PyTorch，旨在帮助开发者无需博士学位即可上手前沿的深度学习应用。

环境准备

本课程强烈建议不要在本地计算机配置环境（除非您精通 Linux 系统管理、GPU 驱动及 CUDA 配置），而是直接使用云端 Jupyter 服务器。这能确保所有课程代码（包括 Web GUI 功能）正常运行。

前置知识

编程：至少一年编程经验（推荐使用 Python）。
数学：高中数学水平即可。

安装步骤

如果您选择使用推荐的云端平台（Gradient 或 Colab），无需手动安装任何依赖。这些环境已预装了课程所需的特定版本：

PyTorch: 深度学习基础库。
fastai (v2): 基于 PyTorch 的高级封装库，本课程的核心工具。

云端笔记本启动后，直接导入即可使用：

from fastai.vision.all import *
import torch

注意：若坚持在本地 Linux 环境部署，需自行处理 CUDA、cuDNN 及驱动兼容性，并参考 docs.fast.ai 安装最新版的 fastai v2 和 PyTorch，但这不在本快速指南推荐范围内。

基本使用

本课程的核心是通过交互式 Jupyter Notebook 学习。每个视频章节对应一个完整的 Notebook。

1. 获取课程笔记

课程所有章节均以交互式 Jupyter Notebook 形式提供。

在线阅读/运行：直接在上述推荐的云端平台中打开对应的课程笔记链接。
源码仓库：所有笔记源码也可在 GitHub 上的 fastbook 仓库免费获取。

2. 最简单的使用示例

以下是一个使用 fastai 进行图像分类（识别宠物品种）的最小化代码示例，展示了如何加载数据、创建模型并进行训练：

from fastai.vision.all import *

# 1. 下载并解压示例数据集 (牛津宠物数据集)
path = untar_data(URLs.PETS)
files = get_image_files(path/"images")

# 2. 定义数据变换和数据加载器
# 根据文件名中的数字判断类别 (例如: american_bulldog_1.jpg -> 类别 0)
def label_func(f): return f[0].isupper()

dls = ImageDataLoaders.from_name_func(
    path, files, valid_pct=0.2, seed=42,
    label_func=label_func, item_tfms=Resize(224)
)

# 3. 创建并训练模型 (使用预训练的 ResNet34)
learn = vision_learner(dls, resnet34, metrics=error_rate)
learn.fine_tune(1)

# 4. 进行预测
img = PILImage.create('test_image.jpg') # 替换为您的图片路径
pred_class, pred_idx, outputs = learn.predict(img)
print(f"预测结果：{pred_class}, 置信度：{outputs[pred_idx].item():.4f}")

3. 开始学习

进入课程网站，点击侧边栏的 Lessons 观看视频（支持中文字幕：点击 "CC" 并在设置中选择 "简体中文"）。
打开对应的 Jupyter Notebook，逐单元格运行代码并尝试修改参数进行实验。
遇到问题时，可访问 fast.ai 论坛搜索解决方案或提问。

常见问题

如何为 fast.ai 课程贡献代码或文档？第一步该做什么？

在 Python 3 中运行 `search_images_ddg` 函数时报错 `'str' object has no attribute 'decode'` 怎么办？

AWS SageMaker 部署模板启动失败或找不到 fastai kernel 如何解决？

Paperspace Gradient 的免费层级是否还能使用？文档似乎过时了。

Google Colab 现在是否支持课程第 2 章中的交互式 widgets？

为什么直接访问仓库中的 `start_colab` 或 `start_gradient` 文件会返回 404 错误？

如何在贡献文档时避免内容被视为过度推广？

相似工具推荐

openclaw

OpenClaw 是一款专为个人打造的本地化 AI 助手，旨在让你在自己的设备上拥有完全可控的智能伙伴。它打破了传统 AI 助手局限于特定网页或应用的束缚，能够直接接入你日常使用的各类通讯渠道，包括微信、WhatsApp、Telegram、Discord、iMessage 等数十种平台。无论你在哪个聊天软件中发送消息，OpenClaw 都能即时响应，甚至支持在 macOS、iOS 和 Android 设备上进行语音交互，并提供实时的画布渲染功能供你操控。这款工具主要解决了用户对数据隐私、响应速度以及“始终在线”体验的需求。通过将 AI 部署在本地，用户无需依赖云端服务即可享受快速、私密的智能辅助，真正实现了“你的数据，你做主”。其独特的技术亮点在于强大的网关架构，将控制平面与核心助手分离，确保跨平台通信的流畅性与扩展性。 OpenClaw 非常适合希望构建个性化工作流的技术爱好者、开发者，以及注重隐私保护且不愿被单一生态绑定的普通用户。只要具备基础的终端操作能力（支持 macOS、Linux 及 Windows WSL2），即可通过简单的命令行引导完成部署。如果你渴望拥有一个懂你

★ 349.3k|★★★☆☆|1周前

Agent开发框架图像

stable-diffusion-webui

stable-diffusion-webui 是一个基于 Gradio 构建的网页版操作界面，旨在让用户能够轻松地在本地运行和使用强大的 Stable Diffusion 图像生成模型。它解决了原始模型依赖命令行、操作门槛高且功能分散的痛点，将复杂的 AI 绘图流程整合进一个直观易用的图形化平台。无论是希望快速上手的普通创作者、需要精细控制画面细节的设计师，还是想要深入探索模型潜力的开发者与研究人员，都能从中获益。其核心亮点在于极高的功能丰富度：不仅支持文生图、图生图、局部重绘（Inpainting）和外绘（Outpainting）等基础模式，还独创了注意力机制调整、提示词矩阵、负向提示词以及“高清修复”等高级功能。此外，它内置了 GFPGAN 和 CodeFormer 等人脸修复工具，支持多种神经网络放大算法，并允许用户通过插件系统无限扩展能力。即使是显存有限的设备，stable-diffusion-webui 也提供了相应的优化选项，让高质量的 AI 艺术创作变得触手可及。

★ 162.1k|★★★☆☆|1周前

开发框架图像Agent

everything-claude-code

everything-claude-code 是一套专为 AI 编程助手（如 Claude Code、Codex、Cursor 等）打造的高性能优化系统。它不仅仅是一组配置文件，而是一个经过长期实战打磨的完整框架，旨在解决 AI 代理在实际开发中面临的效率低下、记忆丢失、安全隐患及缺乏持续学习能力等核心痛点。通过引入技能模块化、直觉增强、记忆持久化机制以及内置的安全扫描功能，everything-claude-code 能显著提升 AI 在复杂任务中的表现，帮助开发者构建更稳定、更智能的生产级 AI 代理。其独特的“研究优先”开发理念和针对 Token 消耗的优化策略，使得模型响应更快、成本更低，同时有效防御潜在的攻击向量。这套工具特别适合软件开发者、AI 研究人员以及希望深度定制 AI 工作流的技术团队使用。无论您是在构建大型代码库，还是需要 AI 协助进行安全审计与自动化测试，everything-claude-code 都能提供强大的底层支持。作为一个曾荣获 Anthropic 黑客大奖的开源项目，它融合了多语言支持与丰富的实战钩子（hooks），让 AI 真正成长为懂上

★ 155.4k|★★☆☆☆|今天

开发框架Agent语言模型

ComfyUI

ComfyUI 是一款功能强大且高度模块化的视觉 AI 引擎，专为设计和执行复杂的 Stable Diffusion 图像生成流程而打造。它摒弃了传统的代码编写模式，采用直观的节点式流程图界面，让用户通过连接不同的功能模块即可构建个性化的生成管线。这一设计巧妙解决了高级 AI 绘图工作流配置复杂、灵活性不足的痛点。用户无需具备编程背景，也能自由组合模型、调整参数并实时预览效果，轻松实现从基础文生图到多步骤高清修复等各类复杂任务。ComfyUI 拥有极佳的兼容性，不仅支持 Windows、macOS 和 Linux 全平台，还广泛适配 NVIDIA、AMD、Intel 及苹果 Silicon 等多种硬件架构，并率先支持 SDXL、Flux、SD3 等前沿模型。无论是希望深入探索算法潜力的研究人员和开发者，还是追求极致创作自由度的设计师与资深 AI 绘画爱好者，ComfyUI 都能提供强大的支持。其独特的模块化架构允许社区不断扩展新功能，使其成为当前最灵活、生态最丰富的开源扩散模型工具之一，帮助用户将创意高效转化为现实。

★ 108.3k|★★☆☆☆|4天前

开发框架图像Agent

gemini-cli

gemini-cli 是一款由谷歌推出的开源 AI 命令行工具，它将强大的 Gemini 大模型能力直接集成到用户的终端环境中。对于习惯在命令行工作的开发者而言，它提供了一条从输入提示词到获取模型响应的最短路径，无需切换窗口即可享受智能辅助。这款工具主要解决了开发过程中频繁上下文切换的痛点，让用户能在熟悉的终端界面内直接完成代码理解、生成、调试以及自动化运维任务。无论是查询大型代码库、根据草图生成应用，还是执行复杂的 Git 操作，gemini-cli 都能通过自然语言指令高效处理。它特别适合广大软件工程师、DevOps 人员及技术研究人员使用。其核心亮点包括支持高达 100 万 token 的超长上下文窗口，具备出色的逻辑推理能力；内置 Google 搜索、文件操作及 Shell 命令执行等实用工具；更独特的是，它支持 MCP（模型上下文协议），允许用户灵活扩展自定义集成，连接如图像生成等外部能力。此外，个人谷歌账号即可享受免费的额度支持，且项目基于 Apache 2.0 协议完全开源，是提升终端工作效率的理想助手。

★ 100.8k|★★☆☆☆|5天前

插件Agent图像

markitdown

MarkItDown 是一款由微软 AutoGen 团队打造的轻量级 Python 工具，专为将各类文件高效转换为 Markdown 格式而设计。它支持 PDF、Word、Excel、PPT、图片（含 OCR）、音频（含语音转录）、HTML 乃至 YouTube 链接等多种格式的解析，能够精准提取文档中的标题、列表、表格和链接等关键结构信息。在人工智能应用日益普及的今天，大语言模型（LLM）虽擅长处理文本，却难以直接读取复杂的二进制办公文档。MarkItDown 恰好解决了这一痛点，它将非结构化或半结构化的文件转化为模型“原生理解”且 Token 效率极高的 Markdown 格式，成为连接本地文件与 AI 分析 pipeline 的理想桥梁。此外，它还提供了 MCP（模型上下文协议）服务器，可无缝集成到 Claude Desktop 等 LLM 应用中。这款工具特别适合开发者、数据科学家及 AI 研究人员使用，尤其是那些需要构建文档检索增强生成（RAG）系统、进行批量文本分析或希望让 AI 助手直接“阅读”本地文件的用户。虽然生成的内容也具备一定可读性，但其核心优势在于为机器

★ 93.4k|★★☆☆☆|1周前

插件开发框架

使用场景

没有 course20 时

使用 course20 后

运行环境要求

快速开始

针对编码者的实用深度学习

我该如何开始？

这门课程适合我吗？

我们是谁

你将使用的软件

你将学到什么

course20 (Practical Deep Learning for Coders) 快速上手指南

环境准备

推荐平台

前置知识

安装步骤

基本使用

1. 获取课程笔记

2. 最简单的使用示例

3. 开始学习

常见问题

相似工具推荐

openclaw

stable-diffusion-webui

everything-claude-code

ComfyUI

gemini-cli

markitdown