samples-for-ai
samples-for-ai 是一个由微软推出的深度学习示例与项目合集,旨在帮助初学者快速入门人工智能领域。它汇集了多种经典深度学习算法及应用案例,覆盖了 TensorFlow、CNTK、PyTorch、Keras、Caffe2、MXNet、Chainer 和 Theano 等主流框架。
对于想要尝试深度学习但苦于环境配置复杂或不知从何下手的开发者和研究人员来说,samples-for-ai 提供了一站式的解决方案。它不仅整理了各框架的官方示例代码,还特别提供了 Visual Studio 解决方案格式的项目,用户可以直接利用"Visual Studio AI 工具”、"Open Platform for AI"或命令行轻松运行这些样本。这种结构化的组织方式极大地降低了学习门槛,让用户能专注于理解算法逻辑而非纠结于环境搭建。
无论是希望系统学习不同框架差异的学生,还是需要参考标准实现进行模型开发的工程师,都能从中获益。其独特的亮点在于对多框架的统一管理和对微软生态工具链(如 OpenPAI)的无缝支持,使得从本地调试到集群提交作业的流程变得简单顺畅。通过阅读和运行这些经过验证的代码,用户可以高效地掌握深度学习核心概念,为后续的创新研究打下坚实基础。
使用场景
某高校人工智能实验室的研究生团队正试图快速复现经典深度学习论文,以验证新提出的改进算法,但团队成员对 TensorFlow、CNTK 和 PyTorch 等多种框架的底层配置尚不熟悉。
没有 samples-for-ai 时
- 环境搭建耗时极长:成员需独自摸索不同框架(如 Theano 或 Caffe2)的依赖库版本冲突问题,往往花费数天仍无法跑通"Hello World"。
- 代码结构混乱难懂:从网络各处零散下载的示例代码风格迥异,缺乏统一规范,导致阅读和修改成本极高。
- 多框架切换困难:团队想对比不同框架在同一任务(如图像分类)上的表现,却因找不到标准化的对照样本而被迫放弃。
- 调试无从下手:遇到报错时,由于缺乏官方维护的完整工程模板,难以判断是代码逻辑错误还是环境配置缺失。
使用 samples-for-ai 后
- 一键启动开发:直接利用提供的 Visual Studio 解决方案或命令行脚本,快速拉取已配置好的 CNTK、TensorFlow 等经典算法项目,当天即可开始实验。
- 代码规范统一:所有样本均按标准工程结构组织,涵盖数据下载、模型定义到训练评估的全流程,成员可迅速理解并在此基础上修改。
- 轻松实现横向对比:借助按框架分类的独立解决方案,团队能迅速在同一数据集上运行 Keras、MXNet 等不同后端的相同算法,高效完成性能基准测试。
- 排错效率提升:基于微软官方维护的稳定基线代码,任何异常均可快速定位为自定义修改部分的问题,大幅减少无效调试时间。
samples-for-ai 通过提供标准化、多框架覆盖的入门级工程模板,将深度学习新手的环境配置与代码磨合周期从“周”级缩短至“小时”级。
运行环境要求
- Windows
- Linux
未说明 (取决于所选用的具体深度学习框架,如 CNTK, TensorFlow, PyTorch 等)
未说明

快速开始
人工智能示例
“人工智能示例”是一个深度学习示例和项目集合。它包含了多种框架下的经典深度学习算法和应用,是初学者入门深度学习的良好起点。
为方便用户使用以下工具开始深度学习,我们提供了 Visual Studio 解决方案格式的示例:
每个解决方案包含一个或多个示例项目。这些解决方案按其所使用的不同深度学习框架进行划分:
- CNTK(支持 BrainScript 和 Python 语言)
- TensorFlow
- PyTorch
- Caffe2
- Keras
- MXNet
- Chainer
- Theano
入门指南
1. 先决条件
使用一键安装程序设置深度学习框架 已移至此处,请访问以获取详细信息。
2. 下载数据
3. 运行示例
贡献
本项目欢迎贡献和建议。大多数贡献都需要您签署贡献者许可协议 (CLA),声明您有权并将您的贡献权利授予我们。有关详情,请访问 https://cla.microsoft.com。
当您提交拉取请求时,CLA 机器人会自动判断您是否需要提供 CLA,并相应地标记或评论您的 PR。只需按照机器人提供的指示操作即可。对于使用我们 CLA 的所有仓库,您只需执行此操作一次。
本项目已采用 微软开源行为准则。更多信息请参阅 行为准则常见问题解答 或发送电子邮件至 opencode@microsoft.com 提出任何其他问题或意见。
相关项目
AI 开放平台:一个开源平台,提供完整的 AI 模型训练和资源管理功能,易于扩展,支持各种规模的本地部署、云端及混合环境。
NeuronBlocks:一个自然语言处理深度学习建模工具包,帮助工程师像搭乐高积木一样构建深度神经网络模型。该工具的主要目标是最大限度地降低 NLP 深度神经网络模型开发成本,涵盖训练和推理两个阶段。
许可证
大多数示例脚本来自各框架的官方 GitHub 仓库,它们遵循不同的许可证。
CNTK 的脚本采用 MIT 许可证。
TensorFlow 示例脚本采用 Apache 2.0 许可证。原始代码未作修改。
Caffe2 的脚本在不同版本中采用了不同的许可证。目前主分支使用 Apache 2.0 许可证,而 0.7 和 0.8.1 版本则采用 BSD 2-Clause 许可证。我们解决方案中的脚本基于 Caffe2 GitHub 仓库的 0.7 和 0.8.1 版本,因此适用 BSD 2-Clause 许可证。
Keras 的脚本采用 MIT 许可证。
Theano 的脚本采用 BSD 许可证。
MXNet 的脚本采用 Apache 2.0 许可证。原始代码未作修改。
Chainer 的脚本采用 MIT 许可证。
常见问题
相似工具推荐
openclaw
OpenClaw 是一款专为个人打造的本地化 AI 助手,旨在让你在自己的设备上拥有完全可控的智能伙伴。它打破了传统 AI 助手局限于特定网页或应用的束缚,能够直接接入你日常使用的各类通讯渠道,包括微信、WhatsApp、Telegram、Discord、iMessage 等数十种平台。无论你在哪个聊天软件中发送消息,OpenClaw 都能即时响应,甚至支持在 macOS、iOS 和 Android 设备上进行语音交互,并提供实时的画布渲染功能供你操控。 这款工具主要解决了用户对数据隐私、响应速度以及“始终在线”体验的需求。通过将 AI 部署在本地,用户无需依赖云端服务即可享受快速、私密的智能辅助,真正实现了“你的数据,你做主”。其独特的技术亮点在于强大的网关架构,将控制平面与核心助手分离,确保跨平台通信的流畅性与扩展性。 OpenClaw 非常适合希望构建个性化工作流的技术爱好者、开发者,以及注重隐私保护且不愿被单一生态绑定的普通用户。只要具备基础的终端操作能力(支持 macOS、Linux 及 Windows WSL2),即可通过简单的命令行引导完成部署。如果你渴望拥有一个懂你
stable-diffusion-webui
stable-diffusion-webui 是一个基于 Gradio 构建的网页版操作界面,旨在让用户能够轻松地在本地运行和使用强大的 Stable Diffusion 图像生成模型。它解决了原始模型依赖命令行、操作门槛高且功能分散的痛点,将复杂的 AI 绘图流程整合进一个直观易用的图形化平台。 无论是希望快速上手的普通创作者、需要精细控制画面细节的设计师,还是想要深入探索模型潜力的开发者与研究人员,都能从中获益。其核心亮点在于极高的功能丰富度:不仅支持文生图、图生图、局部重绘(Inpainting)和外绘(Outpainting)等基础模式,还独创了注意力机制调整、提示词矩阵、负向提示词以及“高清修复”等高级功能。此外,它内置了 GFPGAN 和 CodeFormer 等人脸修复工具,支持多种神经网络放大算法,并允许用户通过插件系统无限扩展能力。即使是显存有限的设备,stable-diffusion-webui 也提供了相应的优化选项,让高质量的 AI 艺术创作变得触手可及。
everything-claude-code
everything-claude-code 是一套专为 AI 编程助手(如 Claude Code、Codex、Cursor 等)打造的高性能优化系统。它不仅仅是一组配置文件,而是一个经过长期实战打磨的完整框架,旨在解决 AI 代理在实际开发中面临的效率低下、记忆丢失、安全隐患及缺乏持续学习能力等核心痛点。 通过引入技能模块化、直觉增强、记忆持久化机制以及内置的安全扫描功能,everything-claude-code 能显著提升 AI 在复杂任务中的表现,帮助开发者构建更稳定、更智能的生产级 AI 代理。其独特的“研究优先”开发理念和针对 Token 消耗的优化策略,使得模型响应更快、成本更低,同时有效防御潜在的攻击向量。 这套工具特别适合软件开发者、AI 研究人员以及希望深度定制 AI 工作流的技术团队使用。无论您是在构建大型代码库,还是需要 AI 协助进行安全审计与自动化测试,everything-claude-code 都能提供强大的底层支持。作为一个曾荣获 Anthropic 黑客大奖的开源项目,它融合了多语言支持与丰富的实战钩子(hooks),让 AI 真正成长为懂上
ComfyUI
ComfyUI 是一款功能强大且高度模块化的视觉 AI 引擎,专为设计和执行复杂的 Stable Diffusion 图像生成流程而打造。它摒弃了传统的代码编写模式,采用直观的节点式流程图界面,让用户通过连接不同的功能模块即可构建个性化的生成管线。 这一设计巧妙解决了高级 AI 绘图工作流配置复杂、灵活性不足的痛点。用户无需具备编程背景,也能自由组合模型、调整参数并实时预览效果,轻松实现从基础文生图到多步骤高清修复等各类复杂任务。ComfyUI 拥有极佳的兼容性,不仅支持 Windows、macOS 和 Linux 全平台,还广泛适配 NVIDIA、AMD、Intel 及苹果 Silicon 等多种硬件架构,并率先支持 SDXL、Flux、SD3 等前沿模型。 无论是希望深入探索算法潜力的研究人员和开发者,还是追求极致创作自由度的设计师与资深 AI 绘画爱好者,ComfyUI 都能提供强大的支持。其独特的模块化架构允许社区不断扩展新功能,使其成为当前最灵活、生态最丰富的开源扩散模型工具之一,帮助用户将创意高效转化为现实。
gemini-cli
gemini-cli 是一款由谷歌推出的开源 AI 命令行工具,它将强大的 Gemini 大模型能力直接集成到用户的终端环境中。对于习惯在命令行工作的开发者而言,它提供了一条从输入提示词到获取模型响应的最短路径,无需切换窗口即可享受智能辅助。 这款工具主要解决了开发过程中频繁上下文切换的痛点,让用户能在熟悉的终端界面内直接完成代码理解、生成、调试以及自动化运维任务。无论是查询大型代码库、根据草图生成应用,还是执行复杂的 Git 操作,gemini-cli 都能通过自然语言指令高效处理。 它特别适合广大软件工程师、DevOps 人员及技术研究人员使用。其核心亮点包括支持高达 100 万 token 的超长上下文窗口,具备出色的逻辑推理能力;内置 Google 搜索、文件操作及 Shell 命令执行等实用工具;更独特的是,它支持 MCP(模型上下文协议),允许用户灵活扩展自定义集成,连接如图像生成等外部能力。此外,个人谷歌账号即可享受免费的额度支持,且项目基于 Apache 2.0 协议完全开源,是提升终端工作效率的理想助手。
markitdown
MarkItDown 是一款由微软 AutoGen 团队打造的轻量级 Python 工具,专为将各类文件高效转换为 Markdown 格式而设计。它支持 PDF、Word、Excel、PPT、图片(含 OCR)、音频(含语音转录)、HTML 乃至 YouTube 链接等多种格式的解析,能够精准提取文档中的标题、列表、表格和链接等关键结构信息。 在人工智能应用日益普及的今天,大语言模型(LLM)虽擅长处理文本,却难以直接读取复杂的二进制办公文档。MarkItDown 恰好解决了这一痛点,它将非结构化或半结构化的文件转化为模型“原生理解”且 Token 效率极高的 Markdown 格式,成为连接本地文件与 AI 分析 pipeline 的理想桥梁。此外,它还提供了 MCP(模型上下文协议)服务器,可无缝集成到 Claude Desktop 等 LLM 应用中。 这款工具特别适合开发者、数据科学家及 AI 研究人员使用,尤其是那些需要构建文档检索增强生成(RAG)系统、进行批量文本分析或希望让 AI 助手直接“阅读”本地文件的用户。虽然生成的内容也具备一定可读性,但其核心优势在于为机器