Artificial-Intelligence-Deep-Learning-Machine-Learning-Tutorials
Artificial-Intelligence-Deep-Learning-Machine-Learning-Tutorials 是一个全面且持续更新的开源教程集合,旨在帮助学习者系统掌握深度学习、人工智能及机器学习的核心知识与实战技能。它汇集了从基础理论到行业应用的大量资源,覆盖计算机视觉、自然语言处理,以及气候能源、医疗健康、自动驾驶等垂直领域,有效解决了初学者难以寻找系统化学习路径、开发者缺乏行业落地案例参考的痛点。
这份教程库特别适合 AI 开发者、数据科学家、研究人员以及希望转型进入 AI 领域的工程师使用。无论是想夯实 Python 数据分析基础(如 Pandas、NumPy),还是深入钻研 PyTorch、TensorFlow、Uber Pyro 等主流框架,都能在这里找到对应的 IPython Notebook 代码示例和详细指南。
其独特亮点在于紧跟技术前沿,不仅包含传统的机器学习算法,还每日更新涉及 GPU 编程、以数据为中心的 AI(Data-Centric AI)以及 Web3 与可持续 AI 结合等新兴主题。所有教程均针对 NVIDIA GPU 环境进行了优化加速,并提供了来自 Netflix、Uber 等科技巨头的实际项目案例。如果你渴望在实战中提升技能,或探索 AI 在特定行业的创新应用,这里将是你不可或缺的学习伴侣。
使用场景
某医疗科技公司的算法团队正致力于开发基于深度学习的早期肺癌 CT 影像筛查系统,急需快速掌握从数据预处理到概率建模的全栈技术。
没有 Artificial-Intelligence-Deep-Learning-Machine-Learning-Tutorials 时
- 资源分散且筛选成本高:工程师需在 GitHub、博客和技术论坛间反复跳转,难以区分过时的 Theano 教程与最新的 PyTorch 实战指南,浪费大量调研时间。
- 行业落地参考缺失:通用深度学习教程缺乏医疗、能源等垂直领域的具体案例,团队难以理解如何将抽象模型(如贝叶斯回归)映射到具体的病灶识别任务中。
- 前沿技术跟进滞后:对于 GPU 加速编程、可持续 AI 及 Web3 结合等 2023-2024 新兴话题,缺乏系统性的入门路径,导致技术选型保守,无法利用最新算力优化模型。
使用 Artificial-Intelligence-Deep-Learning-Machine-Learning-Tutorials 后
- 一站式权威索引:直接通过目录定位到 Uber Pyro 的概率编程教程或 Netflix VectorFlow 实例,快速获取经过验证的代码片段,将环境搭建与基础学习周期缩短 50%。
- 垂直场景精准对标:参考列表中针对医药与健康行业的专项应用案例,团队迅速复现了适用于小样本医疗数据的半监督学习模型,显著提升了诊断准确率。
- 技术栈实时同步:依托每日更新的机制,工程师立即掌握了基于 NVIDIA GPU 的最新优化技巧及 Data Centric AI 理念,确保系统架构在未来三年内保持技术领先性。
Artificial-Intelligence-Deep-Learning-Machine-Learning-Tutorials 通过提供结构化、实时更新且涵盖多行业的教程索引,将研发团队从繁琐的信息检索中解放出来,使其能专注于核心算法的创新与落地。
运行环境要求
- 未说明
需要 NVIDIA GPU(明确提及所有教程均由 NVIDIA GPU 支持和加速),具体型号、显存大小及 CUDA 版本未说明
未说明

快速开始
2023-2024 新列表:机器学习/深度学习/AI + Web3 教程
嗨,感谢您的光临!
我将每天更新这个教程网站,添加2022年至2024年所有相关主题,尤其是关于GPU编程、以数据为中心的AI、以及诸如Web3AI.js(DeFi、DAO、NFT)等新兴话题,还有更多内容。
注意:所有这些教程都在NVIDIA GPU上得到支持和加速
更重要的是,ML/DL/AI在交通、医学/医疗保健等行业领域的应用,将是我密切关注并乐于与您分享的内容。
最后,为了使这个网站更加实用、不那么枯燥,我非常需要您的帮助,请多多建议、评论或贡献吧!
索引
深度学习
使用IPython Notebook及其他编程工具,如Torch/Lua/D语言,来演示深度学习功能。
优步-Pyro概率论教程
更多PyRo教程:
- PyRo示例/完整示例
- PyRo示例/变分自编码器
- PyRo示例/贝叶斯回归
- PyRo示例/深度马尔可夫模型
- PyRo示例/AIR(Attend Infer Repeat)
- PyRo示例/半监督变分自编码器
- PyRo示例/高斯混合模型
- PyRo示例/高斯过程
- PyRo示例/贝叶斯优化
- 完整的PyRo代码
Netflix-VectorFlow教程
PyTorch教程
| 等级 | 描述 |
|---|---|
| 初学者/Zakizhou | 学习来自Facebook的PyTorch基础知识。 |
| 中级/Quanvuong | 学习来自Facebook的PyTorch中级内容。 |
| 高级/Chsasank | 学习来自Facebook的PyTorch高级内容。 |
| 通过示例学习PyTorch - NumPy、张量与自动微分 | 核心来说,PyTorch提供了两大特性:一个类似于NumPy的n维张量,但它可以在GPU上运行;以及用于构建和训练神经网络的自动微分功能。 |
| PyTorch - 认识autograd.Variable、梯度、神经网络 | 在这里,我们从张量的基础知识开始,用Variable模块包裹张量,玩转nn.Module,并实现前向和反向传播函数。 |
tensor-flow-tutorials
- pkmital/tensorflow_tutorials
- nlintz/TensorFlow-Tutorials
- alrojo/tensorflow-tutorial
- BinRoot/TensorFlow-Book
| 笔记本 | 描述 |
|---|---|
| tsf-basics | 学习 TensorFlow 中的基本操作,TensorFlow 是 Google 开发的用于各种感知和语言理解任务的库。 |
| tsf-linear | 在 TensorFlow 中实现线性回归。 |
| tsf-logistic | 在 TensorFlow 中实现逻辑回归。 |
| tsf-nn | 在 TensorFlow 中实现最近邻算法。 |
| tsf-alex | 在 TensorFlow 中实现 AlexNet。 |
| tsf-cnn | 在 TensorFlow 中实现卷积神经网络。 |
| tsf-mlp | 在 TensorFlow 中实现多层感知机。 |
| tsf-rnn | 在 TensorFlow 中实现循环神经网络。 |
| tsf-gpu | 学习 TensorFlow 中的基本多 GPU 计算。 |
| tsf-gviz | 学习 TensorFlow 中的图可视化。 |
| tsf-lviz | 学习 TensorFlow 中的损失可视化。 |
tensor-flow-exercises
| 笔记本 | 描述 |
|---|---|
| tsf-not-mnist | 学习简单的数据整理,通过创建包含训练、开发和测试数据集的 pickle 文件来为 TensorFlow 准备数据。 |
| tsf-fully-connected | 使用逻辑回归和神经网络在 TensorFlow 中逐步训练更深、更精确的模型。 |
| tsf-regularization | 通过训练全连接网络对 notMNIST 字符进行分类,探索正则化技术。 |
| tsf-convolutions | 在 TensorFlow 中创建卷积神经网络。 |
| tsf-word2vec | 在 TensorFlow 中基于 Text8 数据训练 skip-gram 模型。 |
| tsf-lstm | 在 TensorFlow 中基于 Text8 数据训练 LSTM 字符模型。 |
theano教程
| 笔记本 | 描述 |
|---|---|
| theano-intro | Theano简介,它允许你高效地定义、优化和评估涉及多维数组的数学表达式。它可以利用GPU,并进行高效的符号微分。 |
| theano-scan | 学习扫描操作,这是在Theano图中执行循环的一种机制。 |
| theano-logistic | 在Theano中实现逻辑回归。 |
| theano-rnn | 在Theano中实现循环神经网络。 |
| theano-mlp | 在Theano中实现多层感知器。 |
keras教程
| 笔记本 | 描述 |
|---|---|
| keras | Keras是一个用Python编写的开源神经网络库。它可以运行在TensorFlow或Theano之上。 |
| setup | 了解教程目标以及如何设置你的Keras环境。 |
| intro-deep-learning-ann | 通过Keras和人工神经网络(ANN)入门深度学习。 |
| 感知器和Adaline | 实现感知器和自适应线性神经元。 |
| MLP与MNIST数据 | 对手写数字进行分类,实现MLP,训练并调试ANN |
| theano | 通过处理权重矩阵和梯度来学习Theano。 |
| keras-otto | 通过Kaggle Otto挑战来学习Keras。 |
| ann-mnist | 回顾使用Keras对MNIST数据的简单ANN实现。 |
| 卷积神经网络 | 使用Keras学习卷积神经网络(CNNs)。 |
| conv-net-1 | 使用Keras识别MNIST中的手写数字——第一部分。 |
| conv-net-2 | 使用Keras识别MNIST中的手写数字——第二部分。 |
| keras-models | 使用Keras调用预训练模型,如VGG16、VGG19、ResNet50和Inception v3。 |
| 自动编码器 | 使用Keras学习自动编码器。 |
| rnn-lstm | 使用Keras学习循环神经网络(RNNs)。 |
| lstm-sentence-gen | 使用长短期记忆(LSTM)网络学习RNN,用于句子生成。 |
| nlp-deep-learning | 使用ANN(人工神经网络)学习自然语言处理。 |
| 超参数调优 | 使用keras-wrapper.scikit-learn进行超参数调优。 |
深度学习杂项
| 笔记本 | 描述 |
|---|---|
| deep-dream | 基于Caffe的计算机视觉程序,利用卷积神经网络来发现并增强图像中的模式。 |
scikit-learn
展示 scikit-learn 功能的 IPython 笔记本。
| 笔记本 | 描述 |
|---|---|
| intro | scikit-learn 入门笔记本。scikit-learn 为 Python 增加了对大型多维数组和矩阵的支持,并提供了一个包含大量高级数学函数的库,用于对这些数组进行操作。 |
| knn | 在 scikit-learn 中实现 k 近邻分类器。 |
| linear-reg | 在 scikit-learn 中实现线性回归。 |
| svm | 在 scikit-learn 中实现带核和不带核的支持向量机分类器。 |
| random-forest | 在 scikit-learn 中实现随机森林分类器和回归器。 |
| k-means | 在 scikit-learn 中实现 k 均值聚类。 |
| pca | 在 scikit-learn 中实现主成分分析。 |
| gmm | 在 scikit-learn 中实现高斯混合模型。 |
| validation | 在 scikit-learn 中实现验证与模型选择。 |
statistical-inference-scipy
展示使用 SciPy 功能进行统计推断的 IPython 笔记本。
| 笔记本 | 描述 |
|---|---|
| scipy | SciPy 是基于 Python 的 NumPy 扩展构建的一组数学算法和便捷函数集合。它通过为用户提供用于数据操作和可视化的高级命令和类,显著增强了交互式 Python 会话的功能。 |
| effect-size | 通过分析男性和女性身高的差异,探讨量化效应大小的统计指标。利用行为风险因素监测系统 (BRFSS) 的数据,估算美国成年女性和男性的平均身高及标准差。 |
| sampling | 通过使用 BRFSS 数据分析美国男性和女性的平均体重,探索随机抽样方法。 |
| hypothesis | 通过比较第一胎婴儿与其他婴儿的差异,探讨假设检验的方法。 |
pandas
展示 pandas 功能的 IPython Notebook。
| Notebook | 描述 |
|---|---|
| pandas | 一个用 Python 编写的用于数据处理和分析的软件库。提供用于操作数值表格和时间序列的数据结构及相应操作。 |
| github-data-wrangling | 通过分析 Viz 仓库中的 GitHub 数据,学习如何加载、清洗、合并以及进行特征工程。 |
| Introduction-to-Pandas | Pandas 入门。 |
| Introducing-Pandas-Objects | 学习 Pandas 的对象。 |
| Data Indexing and Selection | 学习 Pandas 中的数据索引与选择。 |
| Operations-in-Pandas | 学习在 Pandas 中对数据进行操作。 |
| Missing-Values | 学习如何在 Pandas 中处理缺失数据。 |
| Hierarchical-Indexing | 学习 Pandas 中的层次化索引。 |
| Concat-And-Append | 学习如何在 Pandas 中合并数据集:使用 concat 和 append。 |
| Merge-and-Join | 学习如何在 Pandas 中合并数据集:使用 merge 和 join。 |
| Aggregation-and-Grouping | 学习 Pandas 中的聚合与分组操作。 |
| Pivot-Tables | 学习 Pandas 中的透视表。 |
| Working-With-Strings | 学习 Pandas 中的向量化字符串操作。 |
| Working-with-Time-Series | 学习如何在 Pandas 中处理时间序列数据。 |
| Performance-Eval-and-Query | 学习高性能 Pandas:eval() 和 query() 方法。 |
matplotlib
演示 matplotlib 功能的 IPython Notebook。
| Notebook | 描述 |
|---|---|
| matplotlib | Python 2D 绘图库,可在多种打印格式和跨平台的交互式环境中生成出版质量的图表。 |
| matplotlib-applied | 将 matplotlib 可视化应用于 Kaggle 竞赛中的探索性数据分析。学习如何创建条形图、直方图、subplot2grid 布局、归一化图表、散点图、子图以及核密度估计图。 |
| Introduction-To-Matplotlib | Matplotlib 入门。 |
| Simple-Line-Plots | 学习 Matplotlib 中的简单折线图。 |
| Simple-Scatter-Plots | 学习 Matplotlib 中的简单散点图。 |
| Errorbars.ipynb | 学习在 Matplotlib 中可视化误差。 |
| Density-and-Contour-Plots | 学习 Matplotlib 中的密度图和等高线图。 |
| Histograms-and-Binnings | 学习 Matplotlib 中的直方图、分箱和密度估计。 |
| Customizing-Legends | 学习自定义 Matplotlib 图例。 |
| Customizing-Colorbars | 学习自定义 Matplotlib 的颜色条。 |
| Multiple-Subplots | 学习 Matplotlib 中的多个子图。 |
| Text-and-Annotation | 学习 Matplotlib 中的文本和注释。 |
| Customizing-Ticks | 学习自定义 Matplotlib 的刻度标签。 |
| Settings-and-Stylesheets | 学习自定义 Matplotlib:配置和样式表。 |
| Three-Dimensional-Plotting | 学习 Matplotlib 中的三维绘图。 |
| Geographic-Data-With-Basemap | 学习使用 basemap 在 Matplotlib 中处理地理数据。 |
| Visualization-With-Seaborn | 学习使用 Seaborn 进行可视化。 |
numpy
演示 NumPy 功能的 IPython 笔记本。
| 笔记本 | 描述 |
|---|---|
| numpy | 为 Python 添加对大型多维数组和矩阵的支持,并提供大量用于操作这些数组的高级数学函数库。 |
| Introduction-to-NumPy | NumPy 简介。 |
| Understanding-Data-Types | 学习 Python 中的数据类型。 |
| The-Basics-Of-NumPy-Arrays | 学习 NumPy 数组的基础知识。 |
| Computation-on-arrays-ufuncs | 学习 NumPy 数组上的计算:通用函数。 |
| Computation-on-arrays-aggregates | 学习聚合操作:NumPy 中的最小值、最大值以及介于两者之间的各种操作。 |
| Computation-on-arrays-broadcasting | 学习数组上的计算:NumPy 中的广播机制。 |
| Boolean-Arrays-and-Masks | 学习 NumPy 中的比较、掩码和布尔逻辑。 |
| Fancy-Indexing | 学习 NumPy 中的高级索引技术。 |
| Sorting | 学习 NumPy 中的数组排序方法。 |
| Structured-Data-NumPy | 学习结构化数据:NumPy 的结构化数组。 |
python-data
面向数据分析的 Python 功能演示 IPython 笔记本。
| 笔记本 | 描述 |
|---|---|
| data structures | 使用元组、列表、字典、集合学习 Python 基础知识。 |
| data structure utilities | 学习 Python 的各种操作,如切片、range、xrange、bisect、sort、sorted、reversed、enumerate、zip 以及列表推导式。 |
| functions | 学习更高级的 Python 特性:函数作为对象、lambda 函数、闭包、*args、**kwargs 柯里化、生成器、生成器表达式、itertools。 |
| datetime | 学习如何使用 Python 处理日期和时间:datetime、strftime、strptime、timedelta。 |
| logging | 学习使用 RotatingFileHandler 和 TimedRotatingFileHandler 进行 Python 日志记录。 |
| pdb | 学习使用交互式源代码调试器在 Python 中进行调试。 |
| unit tests | 学习使用 Nose 单元测试框架进行 Python 测试。 |
kaggle-and-business-analyses
用于 kaggle 竞赛和商业分析的 IPython 笔记本。
| 笔记本 | 描述 |
|---|---|
| titanic | 预测泰坦尼克号乘客的生存情况。学习数据清洗、探索性数据分析和机器学习。 |
| churn-analysis | 预测客户流失。实践逻辑回归、梯度提升分类器、支持向量机、随机森林和 k 最近邻算法。内容包括混淆矩阵、ROC 曲线、特征重要性、预测概率以及校准与区分度的讨论。 |
spark
展示 Spark 和 HDFS 功能的 IPython Notebook。
| Notebook | 描述 |
|---|---|
| spark | 基于内存的集群计算框架,在某些应用场景下速度可提升至 100 倍,非常适合机器学习算法。 |
| hdfs | 可靠地将超大文件存储在大型集群中的多台机器上。 |
mapreduce-python
展示使用 mrjob 实现 Hadoop MapReduce 功能的 IPython Notebook。
| Notebook | 描述 |
|---|---|
| mapreduce-python | 以 Python 运行 MapReduce 作业,可在本地或 Hadoop 集群上执行。演示了如何通过 Python 代码实现 Hadoop Streaming,并结合单元测试及 mrjob 配置文件来分析 Amazon S3 存储桶的日志数据,运行于 Elastic MapReduce 上。Disco 是另一个基于 Python 的替代方案。 |
aws
展示亚马逊云服务(AWS)及其工具功能的 IPython Notebook。
还可查看:
- SAWS:一款功能强大的 AWS 命令行界面(CLI)。
- Awesome AWS:精选的库、开源项目、指南、博客及其他资源列表。
| Notebook | 描述 |
|---|---|
| boto | AWS 官方提供的 Python SDK。 |
| s3cmd | 通过命令行与 S3 进行交互。 |
| s3distcp | 根据指定模式和目标文件,将较小的文件合并并聚合在一起。S3DistCp 也可用于将大量数据从 S3 传输到您的 Hadoop 集群。 |
| s3-parallel-put | 并行上传多个文件至 S3。 |
| redshift | 基于大规模并行处理(MPP)技术构建的快速数据仓库。 |
| kinesis | 实时流式传输数据,每秒可处理数千个数据流。 |
| lambda | 根据事件触发运行代码,并自动管理计算资源。 |
命令
展示 Linux、Git 等各种命令行的 IPython Notebook。
| 笔记本 | 描述 |
|---|---|
| linux | 类 Unix 且大部分符合 POSIX 标准的计算机操作系统。包括磁盘使用情况、文件分割、grep、sed、curl、查看运行中的进程、终端语法高亮以及 Vim。 |
| anaconda | 面向大规模数据处理、预测分析和科学计算的 Python 编程语言发行版,旨在简化包管理和部署。 |
| ipython notebook | 基于 Web 的交互式计算环境,可将代码执行、文本、数学公式、图表和富媒体整合到一个文档中。 |
| git | 分布式版本控制系统,注重速度、数据完整性以及对分布式、非线性工作流的支持。 |
| ruby | 用于与 AWS 命令行交互,以及 Jekyll——一个可托管在 GitHub Pages 上的博客框架。 |
| jekyll | 一种简单、具备博客功能的静态网站生成器,适用于个人、项目或组织的网站。它能渲染 Markdown 或 Textile 和 Liquid 模板,并生成完整的静态网站,可由 Apache HTTP Server、Nginx 或其他 Web 服务器直接提供服务。 |
| pelican | 基于 Python 的 Jekyll 替代方案。 |
| django | 高级 Python Web 框架,鼓励快速开发和简洁实用的设计。可用于分享报告/分析内容及进行博客写作。更轻量级的替代方案包括 Pyramid、Flask、Tornado 和 Bottle。 |
杂项
展示各种功能的 IPython Notebook。
| 笔记本 | 描述 |
|---|---|
| regex | 正则表达式速查表,适用于数据清洗。 |
| algorithmia | Algorithmia 是一个算法市场。该笔记本展示了四种不同的算法:人脸检测、内容摘要、潜在狄利克雷分配和光学字符识别。 |
笔记本安装
anaconda
Anaconda 是面向大规模数据处理、预测分析和科学计算的免费 Python 发行版,旨在简化包管理和部署。
请按照说明安装 Anaconda 或更轻量级的 miniconda。
开发环境搭建
如需详细的搭建指南、脚本和工具来配置您的数据分析开发环境,请参阅 dev-setup 仓库。
运行笔记本
注意:如果您打算通过实践学习(推荐方式),我强烈建议您尽可能自己编写代码,而不是仅仅运行预先写好的代码。如果您仍然想尝试运行这些笔记本,请按以下步骤操作:
要查看交互式内容或修改 IPython 笔记本中的元素,您需要先克隆或下载该仓库,然后运行笔记本。有关 IPython 笔记本的更多信息,请参阅 这里。
$ git clone https://github.com/TarrySingh/Artificial-Intelligence-Deep-Learning-Machine-Learning-Tutorials.git
$ cd Artificial-Intelligence-Deep-Learning-Machine-Learning-Tutorials
$ jupyter notebook
笔记本已在 Python 3.7+ 环境下测试通过。
深度学习博客精选列表
- 一位人类工程师的博客 http://www.erogol.com/ (RSS)
- Aakash Japi http://aakashjapi.com/ (RSS)
- Adit Deshpande https://adeshpande3.github.io/ (RSS)
- 高级分析与R http://advanceddataanalytics.net/ (RSS)
- 数据之地探险 http://blog.smola.org (RSS)
- 敏捷数据科学 http://blog.sense.io/ (RSS)
- Ahmed El Deeb https://medium.com/@D33B (RSS)
- Airbnb 数据博客 http://nerds.airbnb.com/data/ (RSS)
- Alex Castrounis | InnoArchiTech http://www.innoarchitech.com/ (RSS)
- Alex Perrier http://alexperrier.github.io/ (RSS)
- Algobeans | 面向普通人的数据分析教程与实验 https://algobeans.com (RSS)
- 亚马逊AWS AI博客 https://aws.amazon.com/blogs/ai/ (RSS)
- Analytics Vidhya http://www.analyticsvidhya.com/blog/ (RSS)
- Sicara 的大数据分析与可视化 https://blog.sicara.com (RSS)
- Andreas Müller http://peekaboo-vision.blogspot.com/ (RSS)
- Andrej Karpathy 博客 http://karpathy.github.io/ (RSS)
- Andrew Brooks http://brooksandrew.github.io/simpleblog/ (RSS)
- Andrey Kurenkov http://www.andreykurenkov.com/writing/ (RSS)
- Anton Lebedevich 的博客 http://mabrek.github.io/ (RSS)
- Arthur Juliani https://medium.com/@awjuliani (RSS)
- Audun M. Øygard http://www.auduno.com/ (RSS)
- Avi Singh https://avisingh599.github.io/ (RSS)
- 美丽的数据 http://beautifuldata.net/ (RSS)
- Beckerfuffle http://mdbecker.github.io/ (RSS)
- 成为数据科学家 http://www.becomingadatascientist.com/ (RSS)
- Ben Bolte 的博客 http://benjaminbolte.com/ml/ (RSS)
- Ben Frederickson http://www.benfrederickson.com/blog/ (RSS)
- 伯克利人工智能研究 http://bair.berkeley.edu/blog/ (RSS)
- 大型数据 http://bigishdata.com/ (RSS)
- 神经网络博客 http://yerevann.github.io/ (RSS)
- 回归项目博客 http://d10genes.github.io/blog/ (RSS)
- blogR | 科学家分享的R语言技巧 https://drsimonj.svbtle.com/ (RSS)
- mat kelcey 的大脑 http://matpalm.com/blog/ (RSS)
- 关于科学和编程的精彩错误思考 https://arogozhnikov.github.io/ (RSS)
- Bugra Akyildiz http://bugra.github.io/ (RSS)
- 建造巴别塔 https://building-babylon.net/ (RSS)
- Carl Shan http://carlshan.com/ (RSS)
- Chris Stucchio https://www.chrisstucchio.com/blog/index.html (RSS)
- Christophe Bourguignat https://medium.com/@chris_bour (RSS)
- Christopher Nguyen https://medium.com/@ctn (RSS)
- Cloudera 数据科学文章 http://blog.cloudera.com/blog/category/data-science/ (RSS)
- colah 的博客 http://colah.github.io/archive.html (RSS)
- Cortana 智能与机器学习博客 https://blogs.technet.microsoft.com/machinelearning/ (RSS)
- Daniel Forsyth http://www.danielforsyth.me/ (RSS)
- Daniel Homola http://danielhomola.com/category/blog/ (RSS)
- Daniel Nee http://danielnee.com (RSS)
- 基于数据的发明 http://datalab.lu/ (RSS)
- 数据博主 https://www.data-blogger.com/ (RSS)
- Data Labs http://blog.insightdatalabs.com/ (RSS)
- 数据与媒体 http://datameetsmedia.com/ (RSS)
- 数据挖掘者博客 http://blog.data-miners.com/ (RSS)
- 数据挖掘研究 http://www.dataminingblog.com/ (RSS)
- 数据挖掘:文本挖掘、可视化与社交媒体 http://datamining.typepad.com/data_mining/ (RSS)
- Data Piques http://blog.ethanrosenthal.com/ (RSS)
- 数据学校 http://www.dataschool.io/ (RSS)
- 数据科学入门 http://101.datascience.community/ (RSS)
- Facebook 的数据科学 https://research.facebook.com/blog/datascience/ (RSS)
- 数据科学洞察 http://www.datasciencebowl.com/data-science-insights/ (RSS)
- 数据科学教程 https://codementor.io/data-science/tutorial (RSS)
- 数据科学指南 http://datasciencevademecum.wordpress.com/ (RSS)
- Dataaspirant http://dataaspirant.com/ (RSS)
- Dataclysm http://blog.okcupid.com/ (RSS)
- DataGenetics http://datagenetics.com/blog.html (RSS)
- Dataiku https://www.dataiku.com/blog/ (RSS)
- DataKind http://www.datakind.org/blog (RSS)
- DataLook http://blog.datalook.io/ (RSS)
- Datanice https://datanice.wordpress.com/ (RSS)
- Dataquest 博客 https://www.dataquest.io/blog/ (RSS)
- DataRobot http://www.datarobot.com/blog/ (RSS)
- Datascope http://datascopeanalytics.com/blog (RSS)
- DatasFrame http://tomaugspurger.github.io/ (RSS)
- David Mimno http://www.mimno.org/ (RSS)
- Dayne Batten http://daynebatten.com (RSS)
- 深度学习 http://deeplearning.net/blog/ (RSS)
- Deepdish http://deepdish.io/ (RSS)
- Delip Rao http://deliprao.com/ (RSS)
- DENNY 的博客 http://blog.dennybritz.com/ (RSS)
- Dimensionless https://dimensionless.in/blog/ (RSS)
- Distill http://distill.pub/ (RSS)
- District Data Labs http://districtdatalabs.silvrback.com/ (RSS)
- 潜入数据 https://blog.datadive.net/ (RSS)
- Domino 数据实验室博客 http://blog.dominodatalab.com/ (RSS)
- Randal S. Olson 博士 http://www.randalolson.com/blog/ (RSS)
- Drew Conway https://medium.com/@drewconway (RSS)
- Dustin Tran http://dustintran.com/blog/ (RSS)
- Eder Santana https://edersantana.github.io/blog.html (RSS)
- Edwin Chen http://blog.echen.me (RSS)
- EFavDB http://efavdb.com/ (RSS)
- Emilio Ferrara, Ph.D. http://www.emilio.ferrara.name/ (RSS)
- 创业极客精神 http://ianozsvald.com/ (RSS)
- Eric Jonas http://ericjonas.com/archives.html (RSS)
- Eric Siegel http://www.predictiveanalyticsworld.com/blog (RSS)
- Erik Bern http://erikbern.com (RSS)
- ERIN SHELLMAN http://www.erinshellman.com/ (RSS)
- Eugenio Culurciello http://culurciello.github.io/ (RSS)
- Fabian Pedregosa http://fa.bianp.net/ (RSS)
- Fast Forward Labs http://blog.fastforwardlabs.com/ (RSS)
- FastML http://fastml.com/ (RSS)
- Florian Hartl http://florianhartl.com/ (RSS)
- FlowingData http://flowingdata.com/ (RSS)
- 全栈机器学习 http://fullstackml.com/ (RSS)
- GAB41 http://www.lab41.org/gab41/ (RSS)
- Garbled Notes http://www.chioka.in/ (RSS)
- Greg Reda http://www.gregreda.com/blog/ (RSS)
- Hyon S Chu https://medium.com/@adailyventure (RSS)
- i am trask http://iamtrask.github.io/ (RSS)
- I Quant NY http://iquantny.tumblr.com/ (RSS)
- inFERENCe http://www.inference.vc/ (RSS)
- Insight 数据科学 https://blog.insightdatascience.com/ (RSS)
- 灵感信息 http://myinspirationinformation.com/ (RSS)
- Ira Korshunova http://irakorshunova.github.io/ (RSS)
- 我是强盗 https://blogs.princeton.edu/imabandit/ (RSS)
- Jason Toy http://www.jtoy.net/ (RSS)
- Jeremy D. Jackson, PhD http://www.jeremydjacksonphd.com/ (RSS)
- Jesse Steinweg-Woods https://jessesw.com/ (RSS)
- Joe Cauteruccio http://www.joecjr.com/ (RSS)
- John Myles White http://www.johnmyleswhite.com/ (RSS)
- John 的肥皂箱 http://joschu.github.io/ (RSS)
- Jonas Degrave http://317070.github.io/ (RSS)
- 数据之乐 http://www.joyofdata.de/blog/ (RSS)
- Julia Evans http://jvns.ca/ (RSS)
- KDnuggets http://www.kdnuggets.com/ (RSS)
- 跟上最新技术 http://colinpriest.com/ (RSS)
- Kenny Bastani http://www.kennybastani.com/ (RSS)
- Kevin Davenport http://kldavenport.com/ (RSS)
- kevin frans http://kvfrans.com/ (RSS)
- korbonits | 数学 ∩ 数据 http://korbonits.github.io/ (RSS)
- 大规模机器学习 http://bickson.blogspot.com/ (RSS)
- LATERAL 博客 https://blog.lateral.io/ (RSS)
- Lazy Programmer http://lazyprogrammer.me/ (RSS)
- 在这里学习分析 https://learnanalyticshere.wordpress.com/ (RSS)
- LearnDataSci http://www.learndatasci.com/ (RSS)
- 通过数据学习 http://learningwithdata.com/ (RSS)
- 生活、语言、学习 http://daoudclarke.github.io/ (RSS)
- Locke 数据 https://itsalocke.com/blog/ (RSS)
- Louis Dorard http://www.louisdorard.com/blog/ (RSS)
- M.E.Driscoll http://medriscoll.com/ (RSS)
- Machinalis http://www.machinalis.com/blog (RSS)
- 机器学习(理论) http://hunch.net/ (RSS)
- 机器学习与数据科学 http://alexhwoods.com/blog/ (RSS)
- 机器学习 https://charlesmartin14.wordpress.com/ (RSS)
- 机器学习精通 http://machinelearningmastery.com/blog/ (RSS)
- 机器学习博客 https://machinelearningblogs.com/ (RSS)
- 机器学习等 http://yaroslavvb.blogspot.com (RSS)
- 机器学习、数学和物理 https://mlopezm.wordpress.com/ (RSS)
- 机器学习抽认卡 https://machinelearningflashcards.com/ 10美元,一套精美插画的300张抽认卡
- Machined Learnings http://www.machinedlearnings.com/ (RSS)
- 映射巴别塔 https://jack-clark.net/ (RSS)
- MAPR 博客 https://www.mapr.com/blog (RSS)
- MAREK REI http://www.marekrei.com/blog/ (RSS)
- 有点意思 http://blog.mikiobraun.de/ (RSS)
- 数学 ∩ 编程 http://jeremykun.com/ (RSS)
- Matthew Rocklin http://matthewrocklin.com/blog/ (RSS)
- Melody Wolk http://melodywolk.com/projects/ (RSS)
- Mic Farris http://www.micfarris.com/ (RSS)
- Mike Tyka http://mtyka.github.io/ (RSS)
- minimaxir | Max Woolf 的博客 http://minimaxir.com/ (RSS)
- 镜像图像 https://mirror2image.wordpress.com/ (RSS)
- Mitch Crowe http://www.dataphoric.com/ (RSS)
- MLWave http://mlwave.com/ (RSS)
- MLWhiz http://mlwhiz.com/ (RSS)
- 模型既启发又错误 https://peadarcoyle.wordpress.com/ (RSS)
- Moody Rd http://blog.mrtz.org/ (RSS)
- 月球计划 http://jxieeducation.com/ (RSS)
- Mourad Mourafiq http://mourafiq.com/ (RSS)
- 我对数据科学、预测分析和Python的看法 http://shahramabyari.com/ (RSS)
- 自然语言处理博客 http://nlpers.blogspot.fr/ (RSS)
- Neil Lawrence http://inverseprobability.com/blog.html (RSS)
- NLP和深度学习爱好者 http://camron.xyz/ (RSS)
- 没有免费的直觉 http://blog.kaggle.com/ (RSS)
- 白夜 http://nuit-blanche.blogspot.com/ (RSS)
- 数字2147483647 https://no2147483647.wordpress.com/ (RSS)
- 关于机器智能 https://aimatters.wordpress.com/ (RSS)
- 大众的鸦片 数据就是我们的宗教。http://opiateforthemass.es/ (RSS)
- p-value.info http://www.p-value.info/ (RSS)
- Pete Warden 的博客 http://petewarden.com/ (RSS)
- Plotly 博客 http://blog.plot.ly/ (RSS)
- 可能想得太多了 http://allendowney.blogspot.ca/ (RSS)
- Prooffreader.com http://www.prooffreader.com (RSS)
- ProoffreaderPlus http://prooffreaderplus.blogspot.ca/ (RSS)
- 可发表的内容 http://www.sumsar.net/ (RSS)
- PyImageSearch http://www.pyimagesearch.com/ (RSS)
- Python式的漫游 https://jakevdp.github.io/ (RSS)
- quintuitive http://quintuitive.com/ (RSS)
- R语言与数据挖掘 https://rdatamining.wordpress.com/ (RSS)
- R-bloggers http://www.r-bloggers.com/ (RSS)
- R2RT http://r2rt.com/ (RSS)
- Ramiro Gómez http://ramiro.org/notebooks/ (RSS)
- 关于计算机科学、数学和软件工程的随机笔记 http://barmaley-exe.github.io/ (RSS)
- Randy Zwitch http://randyzwitch.com/ (RSS)
- RaRe Technologies http://rare-technologies.com/blog/ (RSS)
- Rayli.Net http://rayli.net/blog/ (RSS)
- Revolutions http://blog.revolutionanalytics.com/ (RSS)
- Rinu Boney http://rinuboney.github.io/ (RSS)
- RNDuja 博客 http://rnduja.github.io/ (RSS)
- Robert Chang https://medium.com/@rchang (RSS)
- 火箭动力数据科学 http://rocketdatascience.org (RSS)
- Sachin Joglekar 的博客 https://codesachin.wordpress.com/ (RSS)
- samim https://medium.com/@samim (RSS)
- Sean J. Taylor http://seanjtaylor.com/ (RSS)
- Sebastian Raschka http://sebastianraschka.com/blog/index.html (RSS)
- Sebastian Ruder http://sebastianruder.com/ (RSS)
- Sebastian 的慢博客 http://www.nowozin.net/sebastian/blog/ (RSS)
- SFL 科学博客 https://sflscientific.com/blog/ (RSS)
- Shakir 的机器学习博客 http://blog.shakirm.com/ (RSS)
- 简单统计 http://simplystatistics.org (RSS)
- Springboard 博客 http://springboard.com/blog
- Startup.ML 博客 http://startup.ml/blog (RSS)
- 统计建模、因果推断和社会科学 http://andrewgelman.com/ (RSS)
- 斯蒂格勒饮食 http://stiglerdiet.com/ (RSS)
- Stitch Fix 技术博客 http://multithreaded.stitchfix.com/blog/ (RSS)
- 随机研发笔记 http://arseny.info/ (RSS)
- Quora 上用统计讲故事 http://datastories.quora.com/ (RSS)
- StreamHacker http://streamhacker.com/ (RSS)
- 下意识的随想 http://blogs.sas.com/content/subconsciousmusings/ (RSS)
- Swan Intelligence http://swanintelligence.com/ (RSS)
- TechnoCalifornia http://technocalifornia.blogspot.se/ (RSS)
- 文本分析博客 | AYLIEN http://blog.aylien.com/ (RSS)
- 愤怒的统计学家 http://angrystatistician.blogspot.com/ (RSS)
- 聪明的机器 https://theclevermachine.wordpress.com/ (RSS)
- 数据营博客 https://www.datacamp.com/community/blog (RSS)
- 数据孵化器 http://blog.thedataincubator.com/ (RSS)
- 数据科学实验室 https://datasciencelab.wordpress.com/ (RSS)
- THE ETZ-FILES http://alexanderetz.com/ (RSS)
- 数据科学 http://www.martingoodson.com (RSS)
- 数据的形状 https://shapeofdata.wordpress.com (RSS)
- 非官方谷歌数据科学博客 http://www.unofficialgoogledatascience.com/ (RSS)
- Tim Dettmers http://timdettmers.com/ (RSS)
- Tombone 的计算机视觉博客 http://www.computervisionblog.com/ (RSS)
- Tommy Blanchard http://tommyblanchard.com/category/projects (RSS)
- Trevor Stephens http://trevorstephens.com/ (RSS)
- Trey Causey http://treycausey.com/ (RSS)
- UW 数据科学博客 http://datasciencedegree.wisconsin.edu/blog/ (RSS)
- Wellecks http://wellecks.wordpress.com/ (RSS)
- Wes McKinney http://wesmckinney.com/archives.html (RSS)
- 当我的MCMC轻轻采样时 http://twiecki.github.io/ (RSS)
- WildML http://www.wildml.com/ (RSS)
- 会为了某些东西做些事情 http://rinzewind.org/blog-en (RSS)
- Will wolf http://willwolf.io/ (RSS)
- WILL 的噪音 http://www.willmcginnis.com/ (RSS)
- William Lyon http://www.lyonwj.com/ (RSS)
- Win-Vector 博客 http://www.win-vector.com/blog/ (RSS)
- Yanir Seroussi http://yanirseroussi.com/ (RSS)
- Zac Stewart http://zacstewart.com/ (RSS)
- ŷhat http://blog.yhat.com/ (RSS)
- 量化之旅 http://outlace.com/ (RSS)
- 大トロ http://blog.otoro.net/ (RSS)
致谢
- 韦斯·麦金尼著《Python数据分析:使用Pandas、NumPy和IPython进行数据清洗》(http://www.amazon.com/Python-Data-Analysis-Wrangling-IPython/dp/1449319793)
- 杰克·范德普拉斯编写的《2015年PyCon scikit-learn教程》(https://github.com/jakevdp/sklearn_pycon2015)
- 杰克·范德普拉斯编写的《Python数据科学手册》(https://github.com/jakevdp/PythonDataScienceHandbook)
- 奥利维埃·格里塞尔编写的《使用scikit-learn和IPython实现并行机器学习》(https://github.com/ogrisel/parallel_ml_tutorial)
- 艾伦·道尼编写的《利用Python计算方法进行统计推断》(https://github.com/AllenDowney/CompStats)
- 埃梅里克·达米安编写的《TensorFlow示例》(https://github.com/aymericdamien/TensorFlow-Examples)
- 帕拉格·K·米塔尔编写的《TensorFlow教程》(https://github.com/pkmital/tensorflow_tutorials)
- 纳森·林茨编写的《TensorFlow教程》(https://github.com/nlintz/TensorFlow-Tutorials)
- 亚历山大·R·约翰森编写的《TensorFlow教程》(https://github.com/alrojo/tensorflow-tutorial)
- 尼尚特·舒克拉编写的《TensorFlow书籍》(https://github.com/BinRoot/TensorFlow-Book)
- mila-udem组织的《2015年暑期学校》(https://github.com/mila-udem/summerschool2015)
- 瓦莱里奥·马焦编写的《深度学习Keras与TensorFlow教程》(https://github.com/leriomaggio/deep-learning-keras-tensorflow)
- Kaggle(https://www.kaggle.com/)
- Yhat博客(http://blog.yhat.com/)
贡献
欢迎贡献!如发现bug或有需求,请提交issue。
联系方式
如有任何问题、疑问或意见,欢迎随时联系我。
- 邮箱:tarry.singh@gmail.com
- Twitter:@tarrysingh
- GitHub:tarrysingh
- LinkedIn:Tarry Singh
- 官网:tarrysingh.com
- Medium:tarry@Medium
- Quora:Tarry在Quora上的回答
许可证
本仓库包含多种内容,其中一部分由Tarry Singh开发,另一部分来自第三方,大部分将由我维护。第三方内容根据其各自提供的许可证进行分发。
最初由Donne Martin创建的内容于2017年以以下许可证发布。此后,我继续开发并维护该仓库,新增了PyTorch、Torch/Lua、MXNET等内容:
我在此仓库中向您提供代码和资源,并采用开源许可证。
版权所有 © 2017 Tarry Singh
根据Apache许可证第2.0版(“许可证”)授权;除非遵守该许可证,否则不得使用本文件。您可以在以下网址获取许可证副本:
http://www.apache.org/licenses/LICENSE-2.0除非适用法律另有规定或双方书面同意,否则软件按“原样”分发,不提供任何形式的保证或条件。有关特定语言的权限及限制,请参阅该许可证。
相似工具推荐
openclaw
OpenClaw 是一款专为个人打造的本地化 AI 助手,旨在让你在自己的设备上拥有完全可控的智能伙伴。它打破了传统 AI 助手局限于特定网页或应用的束缚,能够直接接入你日常使用的各类通讯渠道,包括微信、WhatsApp、Telegram、Discord、iMessage 等数十种平台。无论你在哪个聊天软件中发送消息,OpenClaw 都能即时响应,甚至支持在 macOS、iOS 和 Android 设备上进行语音交互,并提供实时的画布渲染功能供你操控。 这款工具主要解决了用户对数据隐私、响应速度以及“始终在线”体验的需求。通过将 AI 部署在本地,用户无需依赖云端服务即可享受快速、私密的智能辅助,真正实现了“你的数据,你做主”。其独特的技术亮点在于强大的网关架构,将控制平面与核心助手分离,确保跨平台通信的流畅性与扩展性。 OpenClaw 非常适合希望构建个性化工作流的技术爱好者、开发者,以及注重隐私保护且不愿被单一生态绑定的普通用户。只要具备基础的终端操作能力(支持 macOS、Linux 及 Windows WSL2),即可通过简单的命令行引导完成部署。如果你渴望拥有一个懂你
stable-diffusion-webui
stable-diffusion-webui 是一个基于 Gradio 构建的网页版操作界面,旨在让用户能够轻松地在本地运行和使用强大的 Stable Diffusion 图像生成模型。它解决了原始模型依赖命令行、操作门槛高且功能分散的痛点,将复杂的 AI 绘图流程整合进一个直观易用的图形化平台。 无论是希望快速上手的普通创作者、需要精细控制画面细节的设计师,还是想要深入探索模型潜力的开发者与研究人员,都能从中获益。其核心亮点在于极高的功能丰富度:不仅支持文生图、图生图、局部重绘(Inpainting)和外绘(Outpainting)等基础模式,还独创了注意力机制调整、提示词矩阵、负向提示词以及“高清修复”等高级功能。此外,它内置了 GFPGAN 和 CodeFormer 等人脸修复工具,支持多种神经网络放大算法,并允许用户通过插件系统无限扩展能力。即使是显存有限的设备,stable-diffusion-webui 也提供了相应的优化选项,让高质量的 AI 艺术创作变得触手可及。
everything-claude-code
everything-claude-code 是一套专为 AI 编程助手(如 Claude Code、Codex、Cursor 等)打造的高性能优化系统。它不仅仅是一组配置文件,而是一个经过长期实战打磨的完整框架,旨在解决 AI 代理在实际开发中面临的效率低下、记忆丢失、安全隐患及缺乏持续学习能力等核心痛点。 通过引入技能模块化、直觉增强、记忆持久化机制以及内置的安全扫描功能,everything-claude-code 能显著提升 AI 在复杂任务中的表现,帮助开发者构建更稳定、更智能的生产级 AI 代理。其独特的“研究优先”开发理念和针对 Token 消耗的优化策略,使得模型响应更快、成本更低,同时有效防御潜在的攻击向量。 这套工具特别适合软件开发者、AI 研究人员以及希望深度定制 AI 工作流的技术团队使用。无论您是在构建大型代码库,还是需要 AI 协助进行安全审计与自动化测试,everything-claude-code 都能提供强大的底层支持。作为一个曾荣获 Anthropic 黑客大奖的开源项目,它融合了多语言支持与丰富的实战钩子(hooks),让 AI 真正成长为懂上
ComfyUI
ComfyUI 是一款功能强大且高度模块化的视觉 AI 引擎,专为设计和执行复杂的 Stable Diffusion 图像生成流程而打造。它摒弃了传统的代码编写模式,采用直观的节点式流程图界面,让用户通过连接不同的功能模块即可构建个性化的生成管线。 这一设计巧妙解决了高级 AI 绘图工作流配置复杂、灵活性不足的痛点。用户无需具备编程背景,也能自由组合模型、调整参数并实时预览效果,轻松实现从基础文生图到多步骤高清修复等各类复杂任务。ComfyUI 拥有极佳的兼容性,不仅支持 Windows、macOS 和 Linux 全平台,还广泛适配 NVIDIA、AMD、Intel 及苹果 Silicon 等多种硬件架构,并率先支持 SDXL、Flux、SD3 等前沿模型。 无论是希望深入探索算法潜力的研究人员和开发者,还是追求极致创作自由度的设计师与资深 AI 绘画爱好者,ComfyUI 都能提供强大的支持。其独特的模块化架构允许社区不断扩展新功能,使其成为当前最灵活、生态最丰富的开源扩散模型工具之一,帮助用户将创意高效转化为现实。
gemini-cli
gemini-cli 是一款由谷歌推出的开源 AI 命令行工具,它将强大的 Gemini 大模型能力直接集成到用户的终端环境中。对于习惯在命令行工作的开发者而言,它提供了一条从输入提示词到获取模型响应的最短路径,无需切换窗口即可享受智能辅助。 这款工具主要解决了开发过程中频繁上下文切换的痛点,让用户能在熟悉的终端界面内直接完成代码理解、生成、调试以及自动化运维任务。无论是查询大型代码库、根据草图生成应用,还是执行复杂的 Git 操作,gemini-cli 都能通过自然语言指令高效处理。 它特别适合广大软件工程师、DevOps 人员及技术研究人员使用。其核心亮点包括支持高达 100 万 token 的超长上下文窗口,具备出色的逻辑推理能力;内置 Google 搜索、文件操作及 Shell 命令执行等实用工具;更独特的是,它支持 MCP(模型上下文协议),允许用户灵活扩展自定义集成,连接如图像生成等外部能力。此外,个人谷歌账号即可享受免费的额度支持,且项目基于 Apache 2.0 协议完全开源,是提升终端工作效率的理想助手。
markitdown
MarkItDown 是一款由微软 AutoGen 团队打造的轻量级 Python 工具,专为将各类文件高效转换为 Markdown 格式而设计。它支持 PDF、Word、Excel、PPT、图片(含 OCR)、音频(含语音转录)、HTML 乃至 YouTube 链接等多种格式的解析,能够精准提取文档中的标题、列表、表格和链接等关键结构信息。 在人工智能应用日益普及的今天,大语言模型(LLM)虽擅长处理文本,却难以直接读取复杂的二进制办公文档。MarkItDown 恰好解决了这一痛点,它将非结构化或半结构化的文件转化为模型“原生理解”且 Token 效率极高的 Markdown 格式,成为连接本地文件与 AI 分析 pipeline 的理想桥梁。此外,它还提供了 MCP(模型上下文协议)服务器,可无缝集成到 Claude Desktop 等 LLM 应用中。 这款工具特别适合开发者、数据科学家及 AI 研究人员使用,尤其是那些需要构建文档检索增强生成(RAG)系统、进行批量文本分析或希望让 AI 助手直接“阅读”本地文件的用户。虽然生成的内容也具备一定可读性,但其核心优势在于为机器