studio-lab-examples

762 227 简单 1 次阅读 5天前Apache-2.0开发框架图像

AI 解读由 AI 自动生成，仅供参考

studio-lab-examples 是亚马逊官方提供的一套开源 Jupyter Notebook 示例合集，旨在帮助用户快速上手 SageMaker Studio Lab 这一免费的云端机器学习开发环境。它主要解决了初学者在配置 AI/ML 学习环境时面临的门槛高、资源受限等痛点，通过提供开箱即用的代码模板，让用户无需本地部署即可直接开始实践。

这套示例非常适合希望进入人工智能领域的学生、数据科学新手以及独立开发者使用。内容覆盖广泛，不仅包含计算机视觉（如图像分类）、自然语言处理（如机器翻译微调）和地理空间数据分析等经典任务，还紧跟前沿趋势，提供了生成式 AI（如文生图模型）的实战案例。

其独特亮点在于“零成本”与“无缝衔接”：用户只需注册免费账号，点击示例中的"Open in Studio Lab"按钮，即可在云端直接运行或克隆项目进行学习；完成实验后，还能轻松将项目部署到专业的 Amazon SageMaker 平台，实现从学习探索到职业级开发的平滑过渡。无论是想系统学习深度学习基础，还是尝试最新的生成式模型，studio-lab-examples 都能为你提供清晰的路径指引和丰富的实践素材。

使用场景

一名刚接触深度学习的大学生想尝试用 PyTorch 训练图像分类模型，但受限于本地电脑配置低且缺乏云环境搭建经验。

没有 studio-lab-examples 时

环境配置劝退：需要在本地手动安装 CUDA、PyTorch 等复杂依赖，常因版本冲突导致配置失败，还没开始写代码就耗费数天。
高昂硬件门槛：本地显卡显存不足，无法运行稍大的模型（如 DenseNet），被迫放弃实验或自费购买昂贵的云服务器。
缺乏实战指引：网上教程碎片化严重，不知道如何从数据加载、模型训练到最终部署形成完整闭环，容易在中间步骤卡壳。
协作分享困难：代码和环境散落在本地，难以一键分享给导师或同学复现，沟通成本极高。

使用 studio-lab-examples 后

开箱即用环境：直接点击"Open in Studio Lab"即可导入预置好的 Jupyter Notebook，云端已配齐所有依赖，秒级启动开发。
免费算力支持：无偿获得包含 GPU 的云端计算资源，轻松跑通计算机视觉或大语言模型微调示例，零成本验证想法。
全流程最佳实践：参考官方提供的从数据处理到 SageMaker 部署的完整案例，快速掌握工业级 AI 开发标准流程。
便捷共享复现：通过 Git 仓库一键分享项目链接，协作者只需点击按钮即可克隆并运行相同环境，极大提升团队协作效率。

studio-lab-examples 让初学者无需纠结环境搭建与硬件限制，仅需专注于算法逻辑本身，真正实现了 AI 学习的“零门槛”起步。

运行环境要求

操作系统

未说明 (基于 Web 的 SageMaker Studio Lab 环境)

GPU

非必需
基础环境提供 CPU，部分示例（如 RAPIDS、Stable Diffusion）需要 GPU 加速，具体型号和显存由 SageMaker Studio Lab 平台分配

内存

未说明 (由 SageMaker Studio Lab 平台动态分配)

依赖

notes该工具主要运行在 Amazon SageMaker Studio Lab 云端环境中，无需本地安装操作系统依赖。用户需注册免费账号。项目提供了多个 .yml 文件用于在云端构建特定的 Conda 环境（如 R, Julia, AutoGluon, Medical Image AI 等）。若需连接 AWS 其他资源，需配置相应的凭证。

python未说明 (通过 Conda 环境文件 .yml 自定义，支持多种版本)

PyTorch

Hugging Face Transformers

AutoGluon

fast.ai

SciPy

Diffusers

RAPIDS

Geopandas

MONAI

Gradio

快速开始

SageMaker Studio Lab 示例

演示如何使用 Amazon SageMaker Studio Lab 构建 AI/ML 学习环境的 Jupyter 笔记本示例。

:books: 背景

SageMaker Studio Lab 是一项面向希望向 AI/ML 从业者发展的个人数据科学家的服务。您可以免费开启您的机器学习之旅。

此仓库将向您介绍如何根据您的兴趣领域（如计算机视觉、自然语言处理等）设置 Studio Lab。此外，我们还将展示如何将您的项目部署到 Amazon SageMaker，从而成为一名 AI/ML 从业者。

:hammer_and_wrench: 设置

请按照开始使用 Amazon SageMaker Studio Lab 的说明进行操作。

申请 Studio Lab 账户
创建 Studio Lab 账户
登录 Studio Lab

如果您希望本地化用户界面，请按照用户界面本地化的说明进行操作。

:computer: 使用

阅读：您无需 Studio Lab 账户即可在 Studio Lab 中阅读笔记本。请随时点击“示例”部分中的“在 Studio Lab 中打开”按钮。
运行：您可以通过复制笔记本或将仓库 git clone 到您的 Studio Lab 项目来运行笔记本。
分享：您可以借助 GitHub 等 Git 仓库分享这些笔记本。如果您添加“在 Studio Lab 中打开”按钮，读者只需点击按钮即可复制笔记本或克隆仓库。

:notebook: 示例

计算机视觉

序号	标题	在 Studio Lab 中打开
1	使用 PyTorch 训练图像分类模型
2	使用 DenseNet-161 进行天气分类以降低灾害风险

自然语言处理

序号	标题	在 Studio Lab 中打开
1	使用 Hugging Face 在本地微调 T5 模型，用于 COVID-19 健康服务公告的机器翻译

地理空间数据科学

序号	标题	在 Studio Lab 中打开
1	地理空间数据分析入门
2	NOAA 天气与气候数据集的探索性分析

生成式深度学习

序号	标题	在 Studio Lab 中打开
1	JumpStart 入门——文本到图像
2	提示 Mistral 7B Instruct

连接 AWS

序号	标题	在 Studio Lab 中打开
1	在 Studio Lab 中使用 AWS 资源
2	将 Hugging Face 预训练模型部署到 Amazon SageMaker 无服务器端点——使用 Boto3

自定义环境

我们提供了 .yml 文件来设置各种编程语言和框架的运行环境。要使用这些 .yml 文件，请按照以下步骤操作。

点击此处的按钮 -->
点击 复制到项目 按钮
- 在此之前需要先登录并启动运行时。
出现提示时，选择 克隆整个仓库。
确认勾选了 打开 README 文件 后，点击 克隆。
- 如果出现 未找到 Conda 环境文件 的提示，请点击 忽略。
打开 README.md 预览后，请前往 自定义环境 部分，根据需要点击相应的编程语言或特定框架环境链接以打开 .yml 文件。
右键单击已打开的 .yml 文件选项卡，选择 在文件浏览器中显示。
在文件浏览器中右键单击该 .yml 文件，然后选择 构建 Conda 环境。
命令执行完成后，请在同一文件夹中运行笔记本以检查环境。当提示选择内核时，请选择刚刚创建的环境。

编程语言环境

特定框架环境

AutoGluon (CPU) 环境
- AutoGluon 是一个自动机器学习库，无需专业知识即可通过最先进的方法快速构建原型。
fast.ai 环境
- fast.ai 是一个深度学习库，它为实践者提供高级 API，为专家提供低级 API，同时能够实现最先进的结果。
SciPy 环境
- SciPy 是一款用于数学、科学和工程领域的开源软件。
Diffusers 环境
- diffusers 提供跨多种模态（如视觉和音频）的预训练扩散模型，并作为一个模块化的工具箱，用于扩散模型的推理和训练。
RAPIDS 环境（外部链接）
- RAPIDS 提供 GPU 加速的数据科学库。
地理空间环境
- 地理空间环境基于用于地理空间分析的基础库构建，例如 geopandas、shapely 和 folium 等。
医学影像 AI 环境
- 医学影像 AI 环境基于用于医学影像分析的基础库构建，例如 itkwidgets 和 monai。
Gradio 环境
- Gradio 是一个适合通过交互式界面展示模型的应用程序。

社区内容

以下是来自社区的一些示例。

GitHub 上的 Studio Lab 示例。

请在您使用 Studio Lab 的仓库上添加 amazon-sagemaker-lab 标签！我们将在此处或我们的博客中精选热门仓库。

:balance_scale: 许可证

本项目采用 Apache-2.0 许可证。

:handshake: 贡献

尽管我们非常期待收到社区的贡献，但我们仍在努力寻找最佳机制来接收来自外部的示例。如果您的拉取请求耗时比预期长或被关闭，请您暂时谅解。

如果您想提交问题或拉取请求，请阅读我们的贡献指南。

🔎 参考资料

SageMaker Studio Lab 示例快速上手指南

本指南旨在帮助开发者利用 Amazon SageMaker Studio Lab 免费构建 AI/ML 学习环境，并通过官方示例快速上手计算机视觉、自然语言处理及生成式 AI 等任务。

环境准备

SageMaker Studio Lab 是一个基于云端的免费服务，无需本地安装重型依赖，仅需满足以下条件：

硬件要求：任意可运行现代浏览器的设备（PC、Mac 或 Linux）。
网络要求：稳定的互联网连接（建议配置科学上网环境以访问 AWS 服务及 GitHub 资源）。
账号要求：需要注册一个 Amazon SageMaker Studio Lab 账号（完全免费，无需绑定信用卡）。
前置知识：了解基础的 Jupyter Notebook 操作和 Python 编程。

注意：目前该服务主要面向全球用户，暂无专门的中国区镜像加速方案。若加载缓慢，请检查网络连接状态。

安装与设置步骤

由于是云端环境，无需在本地安装软件，只需按以下步骤开通账户并克隆仓库：

1. 注册与登录

访问 SageMaker Studio Lab 官网，依次完成：

Request an account：提交注册申请（通常需等待审核邮件）。
Create account：收到邮件后设置密码创建账户。
Sign in：登录控制台。

2. 获取示例代码

登录成功后，有两种方式获取 studio-lab-examples 项目：

方式 A：直接打开单个示例（推荐新手） 在浏览器中点击下方表格中的 "Open in Studio Lab" 按钮，系统将自动把对应的 Notebook 复制到你的项目中。

方式 B：克隆整个仓库（适合进阶探索） 在 Studio Lab 终端（Terminal）中执行以下命令：

git clone https://github.com/aws/studio-lab-examples.git

3. 配置自定义环境（可选）

部分示例（如 AutoGluon, Diffusers, R 语言等）需要特定的 Conda 环境。若遇到缺少依赖包的情况，请按以下步骤构建：

在文件浏览器中找到对应的 .yml 文件（例如 custom-environments/AutoGluon/autogluon_cpu.yml）。
右键点击该文件，选择 Build Conda Environment。
等待构建完成后，在运行 Notebook 时，点击右上角内核选择器，切换到新创建的环境。

基本使用示例

以下以“使用 PyTorch 训练图像分类模型”为例，展示最基础的使用流程。

步骤 1：打开示例

点击链接直接在 Studio Lab 中打开示例：

或者，如果你已克隆仓库，在文件浏览器中导航至： computer-vision/kmnist/cv-kminst.ipynb

步骤 2：启动运行时

打开 Notebook 文件。
点击右上角的 Start runtime 按钮。
首次运行可能需要几分钟来初始化环境。

步骤 3：运行代码

按顺序执行单元格（Cell），典型代码如下（无需修改即可运行）：

# 导入必要的库
import torch
import torch.nn as nn
import torchvision.transforms as transforms
from torchvision import datasets

# 定义数据转换
transform = transforms.Compose([
    transforms.ToTensor(),
    transforms.Normalize((0.5,), (0.5,))
])

# 下载并加载 KMNIST 数据集
train_dataset = datasets.KMNIST(root='./data', train=True, download=True, transform=transform)
test_dataset = datasets.KMNIST(root='./data', train=False, download=True, transform=transform)

print(f"训练集大小：{len(train_dataset)}")
print(f"测试集大小：{len(test_dataset)}")

步骤 4：查看结果与部署

查看结果：代码执行完毕后，下方将显示训练损失曲线及模型准确率。
部署模型：学习完成后，可参考 connect-to-aws/ 目录下的示例，使用 boto3 将训练好的模型部署到 Amazon SageMaker Serverless Endpoint。

更多领域示例索引：

自然语言处理：微调 T5 模型进行机器翻译 (natural-language-processing/)
地理空间数据：NOAA 气候数据探索分析 (geospatial-data-science/)
生成式 AI：Stable Diffusion 文生图、Mistral 7B 提示词工程 (generative-ai/)

相似工具推荐

openclaw

OpenClaw 是一款专为个人打造的本地化 AI 助手，旨在让你在自己的设备上拥有完全可控的智能伙伴。它打破了传统 AI 助手局限于特定网页或应用的束缚，能够直接接入你日常使用的各类通讯渠道，包括微信、WhatsApp、Telegram、Discord、iMessage 等数十种平台。无论你在哪个聊天软件中发送消息，OpenClaw 都能即时响应，甚至支持在 macOS、iOS 和 Android 设备上进行语音交互，并提供实时的画布渲染功能供你操控。这款工具主要解决了用户对数据隐私、响应速度以及“始终在线”体验的需求。通过将 AI 部署在本地，用户无需依赖云端服务即可享受快速、私密的智能辅助，真正实现了“你的数据，你做主”。其独特的技术亮点在于强大的网关架构，将控制平面与核心助手分离，确保跨平台通信的流畅性与扩展性。 OpenClaw 非常适合希望构建个性化工作流的技术爱好者、开发者，以及注重隐私保护且不愿被单一生态绑定的普通用户。只要具备基础的终端操作能力（支持 macOS、Linux 及 Windows WSL2），即可通过简单的命令行引导完成部署。如果你渴望拥有一个懂你

★ 349.3k|★★★☆☆|昨天

Agent开发框架图像

stable-diffusion-webui

stable-diffusion-webui 是一个基于 Gradio 构建的网页版操作界面，旨在让用户能够轻松地在本地运行和使用强大的 Stable Diffusion 图像生成模型。它解决了原始模型依赖命令行、操作门槛高且功能分散的痛点，将复杂的 AI 绘图流程整合进一个直观易用的图形化平台。无论是希望快速上手的普通创作者、需要精细控制画面细节的设计师，还是想要深入探索模型潜力的开发者与研究人员，都能从中获益。其核心亮点在于极高的功能丰富度：不仅支持文生图、图生图、局部重绘（Inpainting）和外绘（Outpainting）等基础模式，还独创了注意力机制调整、提示词矩阵、负向提示词以及“高清修复”等高级功能。此外，它内置了 GFPGAN 和 CodeFormer 等人脸修复工具，支持多种神经网络放大算法，并允许用户通过插件系统无限扩展能力。即使是显存有限的设备，stable-diffusion-webui 也提供了相应的优化选项，让高质量的 AI 艺术创作变得触手可及。

★ 162.1k|★★★☆☆|2天前

开发框架图像Agent

everything-claude-code

everything-claude-code 是一套专为 AI 编程助手（如 Claude Code、Codex、Cursor 等）打造的高性能优化系统。它不仅仅是一组配置文件，而是一个经过长期实战打磨的完整框架，旨在解决 AI 代理在实际开发中面临的效率低下、记忆丢失、安全隐患及缺乏持续学习能力等核心痛点。通过引入技能模块化、直觉增强、记忆持久化机制以及内置的安全扫描功能，everything-claude-code 能显著提升 AI 在复杂任务中的表现，帮助开发者构建更稳定、更智能的生产级 AI 代理。其独特的“研究优先”开发理念和针对 Token 消耗的优化策略，使得模型响应更快、成本更低，同时有效防御潜在的攻击向量。这套工具特别适合软件开发者、AI 研究人员以及希望深度定制 AI 工作流的技术团队使用。无论您是在构建大型代码库，还是需要 AI 协助进行安全审计与自动化测试，everything-claude-code 都能提供强大的底层支持。作为一个曾荣获 Anthropic 黑客大奖的开源项目，它融合了多语言支持与丰富的实战钩子（hooks），让 AI 真正成长为懂上

★ 143.9k|★★☆☆☆|今天

开发框架Agent语言模型

ComfyUI

ComfyUI 是一款功能强大且高度模块化的视觉 AI 引擎，专为设计和执行复杂的 Stable Diffusion 图像生成流程而打造。它摒弃了传统的代码编写模式，采用直观的节点式流程图界面，让用户通过连接不同的功能模块即可构建个性化的生成管线。这一设计巧妙解决了高级 AI 绘图工作流配置复杂、灵活性不足的痛点。用户无需具备编程背景，也能自由组合模型、调整参数并实时预览效果，轻松实现从基础文生图到多步骤高清修复等各类复杂任务。ComfyUI 拥有极佳的兼容性，不仅支持 Windows、macOS 和 Linux 全平台，还广泛适配 NVIDIA、AMD、Intel 及苹果 Silicon 等多种硬件架构，并率先支持 SDXL、Flux、SD3 等前沿模型。无论是希望深入探索算法潜力的研究人员和开发者，还是追求极致创作自由度的设计师与资深 AI 绘画爱好者，ComfyUI 都能提供强大的支持。其独特的模块化架构允许社区不断扩展新功能，使其成为当前最灵活、生态最丰富的开源扩散模型工具之一，帮助用户将创意高效转化为现实。

★ 107.9k|★★☆☆☆|昨天

开发框架图像Agent

markitdown

MarkItDown 是一款由微软 AutoGen 团队打造的轻量级 Python 工具，专为将各类文件高效转换为 Markdown 格式而设计。它支持 PDF、Word、Excel、PPT、图片（含 OCR）、音频（含语音转录）、HTML 乃至 YouTube 链接等多种格式的解析，能够精准提取文档中的标题、列表、表格和链接等关键结构信息。在人工智能应用日益普及的今天，大语言模型（LLM）虽擅长处理文本，却难以直接读取复杂的二进制办公文档。MarkItDown 恰好解决了这一痛点，它将非结构化或半结构化的文件转化为模型“原生理解”且 Token 效率极高的 Markdown 格式，成为连接本地文件与 AI 分析 pipeline 的理想桥梁。此外，它还提供了 MCP（模型上下文协议）服务器，可无缝集成到 Claude Desktop 等 LLM 应用中。这款工具特别适合开发者、数据科学家及 AI 研究人员使用，尤其是那些需要构建文档检索增强生成（RAG）系统、进行批量文本分析或希望让 AI 助手直接“阅读”本地文件的用户。虽然生成的内容也具备一定可读性，但其核心优势在于为机器

★ 93.4k|★★☆☆☆|昨天

插件开发框架

LLMs-from-scratch

LLMs-from-scratch 是一个基于 PyTorch 的开源教育项目，旨在引导用户从零开始一步步构建一个类似 ChatGPT 的大型语言模型（LLM）。它不仅是同名技术著作的官方代码库，更提供了一套完整的实践方案，涵盖模型开发、预训练及微调的全过程。该项目主要解决了大模型领域“黑盒化”的学习痛点。许多开发者虽能调用现成模型，却难以深入理解其内部架构与训练机制。通过亲手编写每一行核心代码，用户能够透彻掌握 Transformer 架构、注意力机制等关键原理，从而真正理解大模型是如何“思考”的。此外，项目还包含了加载大型预训练权重进行微调的代码，帮助用户将理论知识延伸至实际应用。 LLMs-from-scratch 特别适合希望深入底层原理的 AI 开发者、研究人员以及计算机专业的学生。对于不满足于仅使用 API，而是渴望探究模型构建细节的技术人员而言，这是极佳的学习资源。其独特的技术亮点在于“循序渐进”的教学设计：将复杂的系统工程拆解为清晰的步骤，配合详细的图表与示例，让构建一个虽小但功能完备的大模型变得触手可及。无论你是想夯实理论基础，还是为未来研发更大规模的模型做准备

★ 90.1k|★★★☆☆|昨天

语言模型图像Agent