machine-learning

2.8k 901 中等 2 次阅读昨天开发框架图像语言模型

AI 解读由 AI 自动生成，仅供参考

machine-learning 是一个专为机器学习初学者和学习小组打造的开源学习资源库。它由 Teddy Lee 等多位贡献者维护，旨在帮助对机器学习感兴趣的人更轻松地入门和深入学习。这个项目不仅整理了系统化的学习路径，还提供了丰富的视频教程、博客文章和技术笔记，覆盖从基础的 Python 编程到高级的数据分析与可视化内容。

对于想要自学机器学习但不知从何入手的人来说，machine-learning 提供了一条清晰的学习路线。它解决了初学者常遇到的问题，比如学习资源零散、缺乏结构化指导以及不知道如何选择合适的学习顺序等。通过参考在线优质课程和博客，结合维护者的个人经验与注释，这个项目让学习过程更加高效且有趣。

适合使用 machine-learning 的用户包括开发者、数据科学爱好者以及希望转行到机器学习领域的研究人员。即使是没有编程背景的普通用户，也可以通过其推荐的基础教程逐步掌握所需技能。值得一提的是，该项目特别注重社区协作，鼓励用户通过 Pull Request 分享优质资源，共同完善内容。

独特的亮点在于其“阶梯式”学习设计，将复杂的知识点分解成易于理解的模块，并辅以实际案例和代码示例。无论你是想夯实基础还是探索进阶技术，machine-learning 都是一个值得信赖的学习伙伴。

使用场景

一位刚转行到数据科学领域的开发者小李，正在尝试学习机器学习知识并完成自己的第一个预测模型项目。

没有 machine-learning 时

面对海量的机器学习资料无从下手，不知道哪些内容适合入门学习
缺乏系统化的学习路径，常常在不同知识点之间迷失方向
碰到问题时只能零散地搜索解决方案，效率低下且容易产生挫败感
很难找到合适的代码示例，导致理论学习与实践脱节
学习过程中缺乏社区支持，遇到困难时无人交流

使用 machine-learning 后

借助仓库中整理的视频和博客资源，快速找到了适合入门的学习材料
按照推荐的学习路径逐步掌握 Python、数据分析和可视化等基础知识，学习过程更加清晰有序
通过 Issues 和 Pull Request 功能，与其他学习者和贡献者互动，及时解决疑问
直接使用仓库中的代码示例进行练习，将理论知识快速应用到实际项目中
加入活跃的开源社区，获得更多学习动力和支持，减少孤独感

machine-learning 帮助小李从零基础到独立完成第一个预测模型，显著降低了学习门槛，提升了学习效率。

运行环境要求

操作系统

未说明

GPU

未说明

内存

未说明

依赖

notesREADME 中未明确提及运行环境需求，建议参考推荐的学习资源和相关教程以获取更多信息。

python未说明

快速开始

机器学习自学项目

GitHub contributors GitHub commit activity

贡献者 (Contributors) ✨

_{Teddy Lee}
🏠

_HongJaeKwon
🏠

_{Seungwoo Han}
🏠

_{Tae Heon Kim}
🏠

_{Steve Kwon}
🏠

_{SW Song}
🏠

_K1A2
🏠

_{Wooil Jeong}
🏠

为了让更多人受益，请通过 Pull Request 提交优质的学习资料！

知识分享 (Knowledge Sharings)

我们通过博客和 YouTube 进行知识分享。

目的

This repository is intended for personal study in machine-learning

本仓库旨在帮助更多自学机器学习（Machine Learning）的朋友。

您可以参考在线上由优秀人士分享的讲座和博客进行学习。

虽然我为亲自听过的课程添加了评论，但这些评论包含了很多个人观点。

视频课程合集，播放列表 (Video Lectures)

视频课程是我个人认为的学习顺序。当然，这也与难度相关。

Python（编程语言），数据分析（Pandas、Numpy），可视化（Matplotlib、Seaborn、Bokeh、Folium）

搭配电子书学习的 Python 课程合集 - TeddyNote
人生第一次编程 - Python（金正旭）
- 编程学院院长金正旭提供的 Python 入门课程（3小时）。轻量级课程免费提供。
Python 基础教程 | 金左神的左手编程
为深度学习准备的 Python - 申京植
NumPy（数值计算库）基础 - T学院
一次性掌握 Pandas - TeddyNote
Pandas 笔记（免费电子书）- TeddyNote
巩固 Pandas 基础 - T学院
使用 Pandas 进行时间序列数据分析 - T学院
初学者的 Python 基础速成 - JazzyBoss
Python 数据可视化教程 - JazzyBoss

数学 (Mathematics) & 统计学 (Statistics)

为什么需要直观理解线性代数 - 3Blue1Brown 韩语版
什么是向量？| 线性代数的本质 - 3Blue1Brown 韩语版
线性代数基础 - 3Blue1Brown
Mathematical Monk YouTube（英文）
- 一个非常简单易懂的深度学习相关数学的 YouTube 频道。
为深度学习准备的线性代数 - 正确数学教育研究所
深度学习数学课程 - 众研社 Chanwoo Timothy Lee
- 手写笔记帮助理解深度学习数学原理的课程。

机器学习 (Machine Learning) & 深度学习 (Deep Learning)

Best of ML Python
- 包含了多达 840 个开源机器学习项目的 GitHub 存储库！强烈推荐查看。
Machine Learning with Python
- 包含各种机器学习技术的 Jupyter Notebook 教程集合的 GitHub！
Scikit Learn 官方网站教程
- 使用 Scikit Learn（机器学习库）进行数据管道分析和机器学习库应用。
- YouTube 教程（freeCodeCamp.org）: https://www.youtube.com/watch?v=pqNCD_5r0IU
Machine Learning by Coursera - Andrew Ng
- 专为初学者设计的入门课程。由大师 Andrew Ng 教授亲自讲解，内容通俗易懂。
从零开始的机器学习 - 崔成哲教授（TEAMLAB）
- 在深入机器学习研究之前，推荐先学习 "数据科学的 Python 入门"。不过该课程在 Inflearn 上是付费（33,000韩元），也可以通过 YouTube 收听。
面向所有人的深度学习第一季 (Tensorflow) - 金成勋教授
- 最适合入门的课程。即使不熟悉 TensorFlow，也可以通过示例逐步学习。
只需高中数学即可掌握的人工智能、机器学习、深度学习 - 巴拉姆
- 巴拉姆在 YouTube 频道上公开的深度学习开放课程。讲解简单易懂，非常适合初学者。
深度学习独立入门 - Idea Factory KAIST
- 为初学者设计的深度学习全面理解课程。每节课还提供代码。
CS231n（英文）- 斯坦福大学
- 英文授课课程。如果英语熟练，建议首先观看此课程以整理概念。
CS329S: 机器学习系统设计（2021 冬季）
- 斯坦福 CS 329S 课程大纲。讲义幻灯片和笔记已公开。
- 课程视频链接（YouTube）
通过 Kaggle 实践学习数据科学 - TodayCode
- 专为初学者设计的易懂课程，推荐给尚未接触过 Kaggle 的用户作为入门课程。
用青瓦台国民请愿数据入门 Python 自然语言处理 - TodayCode
Deep Learning by GOOGLE - Udacity
- 平均时长仅约 1 分钟的超短课程。建议有一定中级水平后，通过实战编码来学习（推荐完成作业）。
DEEP LEARNING, Spring 2020 - NYU CENTER FOR DATA SCIENCE
- 深度学习大师 Yann LeCun 和 Alfredo Canziani 的深度学习课程。提供幻灯片和讲座，韩文字幕正在制作中。
泰瑞的深度学习对话
- 不完全是深度学习课程，而是按章节/类别轻松简短地解释相关内容的课程。有趣且易于理解，重点在于概念梳理。
TensorFlow2 课程 - Shin's Lab
- 讲解清晰，并附带对数学的详细说明。讲师表达能力强，不仅讲解代码，还涉及论文内容。
Pytorch Zero To All（英文）- 金成勋教授
面向所有人的强化学习课程 - 金成勋教授
从论文开始的深度学习 - 崔成俊
PyTorch 教程（韩文）
- PyTorch 官方网站提供的官方教程的韩文翻译版本。
PyTorch - 快速入门！韩国用户组官方文档翻译版 by PyTorchKorea 运营团队 TodayCode
- 使用 PyTorch 韩文翻译版的快速入门教程。大约 30 分钟的短视频，但讲解亲切友好！
亚马逊 AWSBoost
- 亚马逊通过 Zoom 提供的机器学习/深度学习培训。还介绍了 SageMaker 的使用方法。

大数据分析师

通过 Kaggle 学习大数据分析师 - 金泰宪
- 持续更新大数据分析师实战问题到 Kaggle，并可结合 Kaggle Notebook 内核和课程一起学习。

按主题分类 (By Subjects)

机器学习自学尝试
按主题分类 (By Subjects)

数学 (Mathmatics)

基础
微分
相似度
- 计算机如何测量两个数据（图像或自然语言）的相似性：欧几里得距离，余弦相似度 - 同斌
线性代数
- 机器学习/深度学习数学入门第4讲 - 线性代数 | T学院
其他
- 图形计算器 - Desmos
  - 图形计算器可以在网页上绘制数学公式的图形并进行可视化。

统计学 (Statistics)

统计综合
- 手算概率分布 - 统计的本质 EOStatistics
  - 强烈推荐给初学者或者首次接触统计学的朋友。讲解非常简单易懂，并全面涵盖了统计学的基本内容。
- 管理统计分析 - 李相哲教授
  - 对统计学初学者来说非常容易理解，讲解通俗易懂。
- 扎实的统计学入门 - 卢庆燮
- 统计公式和概念一次性总结。（离散概率分布、二项分布、连续概率分布、概率密度函数、标准正态分布、标准化公式、随机抽样、样本均值、统计推断、总体均值估计）- 算法城南学院
p-value
- P值(p-value)是什么？- Sapientia a Dei
- P值 - 金成范教授
假设
分布
估计，置信区间
贝叶斯理论
- 贝叶斯定理 - 3Blue1Brown
傅里叶变换
- 傅里叶变换到底是什么？我将画图展示给您看。- 3Blue1Brown
经验模态分解
- [信号处理] EMD（经验模态分解法）
AR, MA, ARMA, ARIMA
- 时间序列分析理论基础

机器学习 (Machine Learning)

梯度下降法 (Gradient Descent)
反向传播 (Back Propagation)
损失函数 (Loss Functions)
- Stanford - CS231n - 损失函数与优化
线性回归 (Linear Regression)
范数 (L1 & L2)
- 机器学习/深度学习数学入门第6讲 - L1/L2正则化 (Regulaization) | T아카데미
- 范数 (L1, L2) - 허민석 님
Lasso, Ridge, ElasticNet
- 正则化模型2 - LASSO, Elastic Net - 김성범 교수님
支持向量机 (Support Vector Machine, SVM)
- SVM模型 (1) - 김성범 교수님
- SVM模型 (2) - 김성범 교수님
K近邻算法 (K-Nearest Neighbors, KNN)
- KNN(K-Nearest Neighbors)最近邻算法 - 허민석님
逻辑回归 (Logistic Regression)
- 逻辑回归模型 1 (逻辑函数, 胜算) - 김성범 교수님
- 逻辑回归模型 2 (参数估计, 解释) - 김성범 교수님
决策树 (Decision Tree)
- 决策树模型 1 (模型概述, 预测树) - 김성범 교수님
- 轻松理解决策树 (Decision Tree)算法 - 허민석님
降维
- PCA降维算法及Python实现 - 허민석 님
- 主成分分析 (Principal Component Analysis, PCA) - 김성범 교수님
聚类 (Clustering)
- 聚类分析导论 - 김성범 교수님

深度学习 (Deep Learning)

概述
- 什么是神经网络？ | 第1章：关于深度学习 - 3Blue1Brown
- 权重初始化
卷积神经网络 (Convolution Neural Networks, CNN)
循环神经网络 (Recurrent Neural Networks, RNN)
生成对抗网络 (Generative Adversarial Network, GAN)
强化学习 (Reinforcement Learning)
- 强化学习 - 金成勋教授
- 强化学习（英文）- David Silver教授
- 强化学习概论（10讲）- PangyoLab
- 轻松实现强化学习（2讲）- PangyoLab
- 入门强化学习（season 1）- T学院
- 入门强化学习（policy gradient）- T学院
- 强化学习相关技巧 - 强化学习 KR
- 强化学习100题 - Koki Saitoh
  - 日语强化学习解题网站。提供评分和解答。除了图画题目外，翻译时可以边翻译边解决。
计算机视觉 (Computer Vision)
- Awesome computer vision
  - 包含了大部分计算机视觉的内容。
- OpenCV教程 - Daehee YUN 技术博客
  - 不仅有Python教程，还提供了C# OpenCV教程。
- 目标检测(Object Detection) - Deeplearning.ai
- 语义分割(Semantic Segmentation) - UNet Keras实现
- 自动驾驶(Self-Driving Car) - Udacity自动驾驶工程师纳米学位的所有项目源代码
- 目标检测介绍 - 假研究所
自然语言处理 (Natural Language Processing, NLP)
- 基于深度学习的自然语言处理 - 赵庆贤教授
- 斯坦福 - 使用深度学习进行自然语言处理
- Transformer(Attention Is All You Need) - 许民锡
- Transformer: Attention Is All You Need（细致的深度学习论文回顾与代码实践）- 同斌
- (CS231n韩文解释) Attention - 宋敎石
- 序列到序列 + 注意力模型 - 许民锡
- Seq2Seq: Sequence to Sequence Learning with Neural Networks - 同斌
- 自然语言语言模型 "BERT"
- 自然语言处理特别讲座 - Tencho
  - 用于自然语言处理的深度学习算法、词嵌入(Word2Vec, TF-IDF)、BERT、GPT
- 从基础到高级的自然语言处理课程 - Ready-To-Use Tech
  - kiyoungkim1 分享的从基础到高级的自然语言处理课程
语音识别 (Speech Recognition)
- 基于深度学习的语音识别基础 - T学院
其他
- 改进深度神经网络：超参数调优
  - Andrew Ng教授亲自讲解的DNN改进思路。如果想深入了解深度学习模型的细节，强烈推荐观看。
- 为什么Batch Norm有效？(Batch Norm的优点) - Andrew Ng教授
- Adam优化算法 - Andrew Ng教授

优化 & AutoML (Optimization & AutoML)

基于遗传算法
- 最短路径搜索人工智能 feat.遗传算法, TSP
基于贝叶斯
- [ML] 贝叶斯优化 (Bayesian Optimization)
基于Hyperband
- Hyperband论文解释
神经架构搜索 (Neural Architecture Search)

元学习 (Meta Learning)

理论
- 元学习：快速学习的学习解释
元强化学习
- 元强化学习解释

主动学习 (Active Learning)

理论
- 主动学习是什么 - 基础

联邦学习 (Federated Learning)

理论
- 联邦学习(Federated Learning)，以及挑战

增量学习 (Incremental Learning)

理论
- 增量/持续学习的几乎一切内容（解释、性能测量方法、研究趋势）

可视化 (Visualization)

Bokeh
- 交互式Web可视化Bokeh - Jazlbof

LLM（大型语言模型）

AutoGPT
- AutoGPT 安装与使用方法 - TeddyNote
  - 自动实现用户设定目标（Goal）的 GPT。
FineTuning（微调）
- KoChatGPT-replica(RLHF) 项目
  - ChatGPT-replica 实践 GitHub。涵盖 GPT 微调、强化学习（PPO）、RLHF（基于人类反馈的强化学习）、ChatGPT 数据集构建等内容，并包含多种 Colab 示例。
- KoAlphaca: 基于 Stanford Alpaca 的韩语 Alpaca 模型（支持 LLAMA 和 Polyglot-ko）
  - 使用与 Stanford Alpaca 模型相同的训练方式，能够理解韩语的 Alpaca 模型。内容包括使用 Lora Peft 进行微调的方法，并介绍了韩语数据集。

朗链 (LangChain)

朗链教程（博客）
YouTube 教程
- 朗链精选 YouTube 教程
  - 全部为外国作者的教程，但讲解简单易懂，示例易于跟随。这是朗链官网推荐的教程页面。

ChatGPT

OpenAI

OpenAI API 参考
- OpenAI API 官方文档
OpenAI 食谱
- OpenAI Python API 食谱。根据不同场景整理了代码和教程，内容详尽。

电子书

生成 AI 应用指南 - 全脑黑客
- 包含各种生成 AI 的应用实例
图像生成 AI 应用 - 全脑黑客
- 包含图像生成、绘画等生成 AI 的应用内容

其他 (Others)

Kaggle & Datacon

如果你是 Kaggle 新手？

Hello Kaggle!

Hello Kaggle! - stevekwon211
- 介绍 Kaggle 的文档，包括入门指南、比赛流程、数据集、API 等说明
韩国仅有的四位 Kaggle 大师访谈
- 李有韩先生访谈 by 赵编程
文科生如何成为世界排名 24 的 Kaggle 大师 - Upstage
- 激励文科生的 Kaggle 大师之路视频

Kaggle 教程 | PyTorch 基础

Pytorch 深度学习爱好者教程 ,DATAI
- 从 PyTorch 基本操作（Tensor 运算）到线性回归、逻辑回归、ANN、CNN
条件生成对抗网络 ,Arpan Dhatt
- CGAN（条件 GAN）结构理解及基于 MNIST 数据的建模实践
Pytorch 动物面部分类 - CNNs, Mehmet -lauda- Tekman
- 使用 AFHQ（动物面部图像）进行深度学习分类建模实践
基础 GAN 架构概述 - Seungwon Song
- 使用 MNIST（数字数据）实现深度学习图像生成器
使用条件 GAN 生成时尚图像 - Seungwon Song
- 使用 Fashion MNIST（服装图像）实现条件深度学习图像生成器

Kaggle 教程 | 图像/目标检测

[训练] SIIM COVID-19 检测: 🔥FasterRCNN🔥 - Heroseo
- 通过胸部 X 光检测新冠
Tensorflow 中的 Yolo v3 目标检测 - heartkilla
- 使用 Tensorflow 和 Yolo v3 的目标检测解决方案
SIIM COVID-19 检测 🔱 10+ 步骤教程 (1) - Seungwon Song
- 用于新冠检测的特征工程和图像检测

Kaggle 教程 | 自然语言处理

初学者到中级自然语言处理指南 - NowYSM
- 使用 sklearn + 逻辑回归进行情感分析（正/负面表达判断）
深度学习 NLP Quora 解决方案 - NowYSM
- 使用深度学习（Keras）检测恶意问题（可能引发社会问题的低质量提问）
新手快速入门 NLP😁 九步走 - Seungwon Song
- 使用灾难推特实现假新闻检测器

Kaggle 教程 | R 机器学习

R 语言入门：第一步 - Rachael Tatman
- 学习 R 基本用法
R 语言入门：加载数据到 R - Rachael Tatman
- 使用 R 处理数据的方法
R 语言入门：汇总数据 - Rachael Tatman
- 管道(%>%) 语法理解、数据聚合与总结
R 语言入门：绘制数据 - Rachael Tatman
- ggplot2 库的使用方法及可视化技术理解
欢迎来到 R 语言的数据科学世界 - Rachael Tatman
- 使用 modelr 库进行机器学习、决策树理解

Kaggle 获胜解决方案

Kaggle 竞赛获胜解决方案

讲座 & 演讲

结构化数据

结构化数据分析技巧 - T学院
- Kaggle、Datacon 竞赛（结构化数据）分析技巧、方法论讲座

演讲

深度学习从业者的两次 Kaggle 参赛经历 - 金日斗 (Kakao) 先生

笔记本

特征工程技术 - Chris Deotte

Kaggle & Dacon 比赛分类

入门 (For Beginners)

Titanic: Machine Learning from Disaster
- 泰坦尼克号生存预测比赛。死亡/生还分类比赛
Bike Sharing Demand
- 自行车需求预测比赛。预测需求的回归预测（regression）比赛
Home Credit Default Risk
- 信用违约风险预测比赛（ROC-AUC）
House Prices: Advanced Regression Technique
- 房价预测比赛（回归预测）

视觉 (Vision)

时间序列 (Time Series)

语音

TensorFlow Speech Recognition Challenge

博客 (Blogs)

Teddylee777 博客
- 数据分析、机器学习、深度学习博客
生虾寿司店
- 统计相关知识整理得很好的博客
数据科学学校
- 数据分析、机器学习、深度学习学习者必看的网站。笔记本整理得很好，运营者还教授数学课程。
工科生的数学整理笔记
- 整理了机器学习和深度学习必备数学知识的博客
TensorFlow 博客
- 不需要过多解释。处理 TensorFlow 的人不可能不知道朴海善先生的博客。他还翻译了很多好书。
Python Kim
- 金成勋教授“面向所有人的深度学习第一季”每节课内容整理的博客
安秀斌的博客
- 可视化相关内容整理得非常好的博客
LOVIT X DATA SCIENCE 博客
- 以研究内容为中心的数据科学相关博客。发布了许多专业性内容。
Google - Tensorflow 入门 (英文)
- Google 官方文档站点，Tensorflow 基本实现方法教程
Laon People - 机器学习
ratsgo's blog
- 不仅是自然语言处理领域，其他深度学习相关文章质量也很高。不过有些部分理解起来有点难度。
SuA Lab 李虎成的博客
- 整理了许多高水平论文的文章。论文研究总结的内容也很好。
每周一篇自然语言处理博客 - Weekly NLP
- 每周发布一篇自然语言处理相关的博客文章，质量也非常优秀。
韩语嵌入实验
- 韩语嵌入书籍教程页面。对韩语自然语言处理感兴趣的人可以看看。
推荐系统 - 算法趋势整理
- 推荐系统算法趋势详细整理的博客
Team AI Korea
AI Dev - 人工智能开发者聚会
TensorFlow 韩文文档
Agustinus Kristiadi's Blog (英文)
Colah's Blog (英文)
强化学习整理 - 崔泰浩

GitHub 仓库

教程 (Tutorial)

斯坦福课程韩文翻译 repo - AIKorea.org
- 斯坦福课程摘要的韩文翻译 GitHub 仓库。
使用 Python 的机器学习 (Machine Learning with Python)
- 包含涵盖各种机器学习技术的 Jupyter Notebook 教程的 GitHub！
PyTorch 教程 (pytorch-tutorial)
- 获得超过 10,000 颗星的 PyTorch 教程 GitHub。
Atcold 的深度学习（使用 PyTorch）(Deep Learning (with PyTorch) by Atcold)
- 使用 PyTorch 的教程 ipynb 笔记本整理得非常好的教程 GitHub。
TensorFlow 示例源代码 (TensorFlow Example Source Code)
TensorFlow 官方 GitHub（韩文版）
- TensorFlow 官方运营的 GitHub，包含教程和指南。
崔成俊的 GitHub
- 包含许多使用 TensorFlow 的教程。
TensorFlow 2.0 教程 - 许民锡 (Tensorflow2.0 Tutorial - 허민석님)
- 许民锡在 YouTube 上进行的 TensorFlow 2.0 讲座及其实验资料的 GitHub。
学习 Python 人工智能框架 - jjerry-k (Learning Python A.I Framework - jjerry-k)
- 使用 TensorFlow、PyTorch、MxNet 实现从基础模型到各种 ImageNet 等内容的整理 GitHub。
最佳 ML Python (Best of ML Python)
- 收集了多达 840 个开源 ML 项目 GitHub 的存储库。
验证码破解器 (CaptchaCracker)
- 提供用于识别验证码图像的深度学习模型创建和应用功能的 Python 模块。
韩语预训练语言模型 - kiyoungkim1 (Pretrained Language Models For Korean - kiyoungkim1)
- 共享预训练自然语言处理模型的 GitHub。
LangChain 教程 (LangChain Tutorial)
- LangChain 教程。包含各种示例、食谱 (cookbook) 和用例等。
LangChain 韩文教程 (LangChain 한국어 튜토리얼)
- 将 LangChain 食谱翻译成韩文的韩文教程。
OpenAI API 韩文教程 (OpenAI API 한국어 튜토리얼)
- 将 OpenAI Cookbook 翻译成韩文并添加韩文示例的教程。
Awesome LLM
- 精选的大规模语言模型论文列表，特别是与 ChatGPT 相关的内容。

讲座 (Lecture)

金成勋教授 - 深度学习从零到精通 (김성훈 교수님 - Deep Learning Zero To All)
- 金成勋教授的 YouTube 讲座（从零开始的深度学习）GitHub。
深度学习公开课 - 巴拉姆 (deepLearningOpenLecture - 바람님)
- YouTube 频道巴拉姆的深度学习讲座实验文件 GitHub。

自然语言处理 (Natural Language Processing)

韩语嵌入 GitHub (한국어 임베딩 깃헙)
- 可以获取韩语嵌入书籍相关资料的 GitHub。可以下载数据集。
使用 TensorFlow 2 和机器学习入门自然语言处理 (텐서플로2와 머신러닝으로 시작하는 자연어처리)
- 最近出版的《使用 TensorFlow 2 和机器学习入门自然语言处理》一书的示例代码整理的 GitHub。
自然语言处理实践 GitHub - 金雄坤 (자연어 처리 실무 깃헙 - 김웅곤님)
- 涵盖 BERT、Transformer 等实际编码。（提供 colab 文件）
国民银行 - KB-ALBERT-KO (국민은행 - KB-ALBERT-KO)
- 国民银行公开的韩语 ALBERT 模型。
Kakao Khaiii 形态分析器 (카카오 Khaiii 형태소 분석기)
- Kakao 开发的形态分析器 (Khaiii) 官方 GitHub。
韩语自然语言处理技术集合 (한글 자연어처리 기법 모음)
- 可直接运行的 Colab 文件。汇集了各种韩语数据预处理技术。
文本分析 - 高丽大学 DSBA 康필성教授 (Text Analysis - 고려대 DSBA 강필성 교수님)
- 讲义幻灯片和教材都整理得非常清晰的 GitHub。讲解轻松且节奏缓慢，因此易于理解。
TTS - mozilla
- 用于文本转语音的深度学习。高级文本转语音生成 GitHub。
自然语言处理综合工具包 aka.PORORO - KakaoBrain (자연어처리 종합선물세트 aka.뽀로로 - 카카오브레인)
- PORORO：基于深度学习的自然语言处理全合一平台。强烈推荐尝试！

计算机视觉 (Computer Vision)

视觉处理相关教程 GitHub (Vision 처리 관련 튜토리얼 깃헙)
- 存储计算机视觉相关处理和 OpenCV 相关教程的 GitHub。

信号处理 (Signal Processing)

生物信号处理相关教程 GitHub (생체신호처리 관련 튜토리얼 깃헙)
- 存储脑电图 (EEG)、心电图 (ECG)、肌电图 (EMG) 相关信号处理教程的 GitHub。

生成对抗网络 (GAN)

Keras GAN
- 使用 Keras 实现的 GAN。
Keras-DCGAN
- DCGAN 的教程。
Keras-WGAN
美术馆中的 GAN 深度学习 (미술관에 GAN 딥러닝)
- GAN 相关翻译书籍的实验用 GitHub 仓库。提供了多种易于查看的示例。
GAN 动物园 (Gan ZOO)
- 几乎涵盖了所有 GAN 相关论文的 GitHub。

论文

terryum - awesome-deep-learning-papers
- 非常好地整理了深度学习相关论文的 GitHub。
必读论文 (Papers You Must Read (PYMR))
- 高丽大学 Data Science & Business Analytics Lab 分享的学习机器学习必读论文列表（Notion）。

书籍示例

Python 编程技巧 (Effective Python) - 吉备出版社
- 提供学习 Python 的书籍练习题和示例源代码。
Pandas、Numpy、可视化 - Python 数据科学手册教程 (Pandas, Numpy, Visualization - Python Data Science Handbook 튜토리얼)
- 整理得很好的 Python 数据科学手册教程 colab。可以进行 Pandas、Numpy、可视化相关的实践。
Python 数据科学手册 (Python Data Science Handbook)
- （蜥蜴书）Python 数据科学手册 GitHub。获得超过 28K 颗星。
大家的深度学习（修订第 2 版）- 吉备出版社
- 提供大家的深度学习练习题和示例源代码。
掌握机器学习的技术 with Python、Scikit-learn (2020)
- 提供书籍的练习题和示例源代码。
动手学机器学习 (핸즈온 머신러닝)
- 动手学机器学习书籍的示例和源代码提供。
Python 机器学习终极指南
- 权哲民的 Python 机器学习终极指南 GitHub。结合 Inflearn 上的课程和书籍一起看效果更佳。
强化学习第二版 by Sutton 练习解答 (Reinforcement Learning-2ndEdition by Sutton Exercise Solutions)
- 强化学习第二版（原书作者 Richard S. Sutton、Andrew G. Barto）解题代码 GitHub。
Python 深度学习 TensorFlow
- 信息文化社出版的 Python 深度学习 TensorFlow（2021）GitHub。包含书籍的示例代码。
Dacon 竞赛第一名解决方案
- WikiBooks - Dacon 竞赛第一名解决方案书籍的示例代码 GitHub。

网站 (Web Sites)

Toolify AI
- 提供热门 AI 网站和工具的排名，并为每个工具（网站）提供简要说明、用户数量等信息。
GPTers 社区
- 使用 ChatGPT 的社区。由多个利用和扩展 ChatGPT 的小组组成，各小组分享有关 ChatGPT 的实用信息。
机器学习术语表
- 谷歌开发者网站整理的机器学习术语表。
pandas 教程
- pandas 教程（主要围绕核心 API 展开的教程）
20 分钟掌握 matplotlib
- 快速浏览 matplotlib 的 20 分钟教程（主要围绕核心 API 展开的教程）
各类 CheatSheet 汇总
- 包含 Python、pandas、numpy、matplotlib、seaborn 等各种 CheatSheet 的汇总。
Paper With Code
- 提供与论文相关的 GitHub 存储库。
Codetorial
- 不仅包括 numpy、matplotlib、tensorflow，还整理了 Python 中常用库的教程。
Keras 示例
- Keras 官方文档提供的示例集合。代码不超过 300 行，包含多种基础示例。
自然语言处理 100 题
- 自然语言处理相关问题的 100 道题目的练习网站。
自然语言(NLP) 处理基础整理
Machine Learning Mastery(英文)
- 可以通过 Python 代码直接实现机器学习概念。提供的 Python 代码示例非常优秀。
Deep Note
- 向 Jupyter Notebook 发起挑战的数据科学 Notebook。感兴趣的朋友可以试试！
OpenAI Spinning Up
- OpenAI 的强化学习教学资料。
TensorFlow 的 GUI
- 使用图形界面创建 TensorFlow 模型。
arXiv - 论文存储库
- 论文存储库。几乎可以找到所有关于人工智能、编程等领域的论文。
arXiv sanity
- 在特定时间段内查看某个主题的热门 arXiv 论文。
Hugging Face - 每日论文
- 每日更新的最新 AI/ML 论文精选。提供每日/每周/每月趋势、主题标签、摘要以及代码/数据链接。
PyTorch 入门课程 5 个
- 微软 Learn 平台。涵盖 PyTorch 基础、使用 PyTorch 进行图像/自然语言/音频处理的课程。
PyTorch 教程（韩文）
- PyTorch 官方网站提供的教程的韩文翻译版本。
PyTorch 自然语言处理入门 - 金基贤
- 金基贤分享的使用 PyTorch 进行自然语言处理的入门文档。
机器学习职业指南
- 机器学习：综合指南。了解在动态的 ML 领域中取得卓越成果的路径、技能、行业洞察和技巧。

Wiki Docs

动手学深度学习
- 一本交互式深度学习教材，包含代码、数学和讨论，强烈推荐，但韩文翻译并不完美。一定要看看！
Python 入门
- 如果你想通过书本学习 Python！
初学者的 Python 300 题
- 包含 300 道 Python 基础语法题目。
机器学习讲义笔记
- Andrew Ng 教授课程内容的整理笔记。整理得非常好。
使用 PyTorch 开始深度学习入门
- 如果想通过 WikiDocs 学习 PyTorch。
使用深度学习进行自然语言处理入门
- 自然语言处理 WikiDocs（基于 TensorFlow）。
使用深度学习进行自然语言处理进阶
- 整理自赵庆贤教授的课程笔记。
用 Python 学习算法交易
- 一个可以通过证券公司联机 API 实现交易的 Python Wiki！
大数据 - Hadoop 和 Hive 入门
- 包含 Hadoop 和 Hive 的相关内容。
大数据 - Scala 和 Spark 入门
- 如果想学习 Scala 和 Spark。
生成式 AI 应用 - 全脑黑客
- 包含使用生成式 AI 的各种示例。
图像生成 AI 应用 - 全脑黑客
- 包含使用生成式 AI 进行图像生成/应用的内容。

YouTube 频道 (YouTube Channel)

3Blue1Brown 韩语频道
- 3Blue1Brown 频道的韩语版本，轻松解释人工智能所需的数学知识。非常感谢！
SKPlanet TAcademy
- 不仅提供人工智能课程，还免费提供科技领域其他优质课程。
面包哥的开发发展国
- 展示各种有趣的 AI 项目并提供简单解答。
韩曜燮 - 深度学习
- 提供论文解读及实现的讲解视频。
李有翰 - Kaggle
- 包含 Kaggle 内核评论和各种 Kaggle 技巧的视频。
许敏硕 - Minsuk Heo
- 包含许多深度学习相关视频，PPT 清晰且讲解简洁易懂。
工科生的数学笔记
- 工科生数学笔记博客的延续，轻松讲解数学的教学视频频道。
赫彭海姆
- 有趣且易于理解的机器学习和深度学习教学频道。
下班后折腾
- 涵盖 Kaggle 教程和各种机器学习工具的频道。适合冷静学习的 YouTube 频道。
泰迪笔记
- 主要涵盖 TensorFlow 相关视频。涉及数据分析、机器学习和深度学习主题的 YouTube 频道。
StatQuest with Josh Starmer
- 通过插图轻松简洁地解释机器学习背后的统计学原理的频道。
Venelin Valkov
- 介绍使用机器学习的示例和信息的频道。
sentdex
- 专注于机器学习项目的频道。
统计的本质 EOStatistics
- 统计理论讲解轻松易懂的 YouTube 频道。特别是手算统计的讲解非常适合初学者。
Upstage
- 由金成勋教授、李活石和朴恩贞创立的人工智能（AI）专业企业 Upstage 的 YouTube 频道。发布面向初学者的 Kaggle 相关视频，以及其他有用的信息。
AI 朋友
- 一个以产-学-研为中心的非营利研究团体，分享人工智能技术。通过 YouTube 直播邀请嘉宾进行约 2 小时的演讲 / 录制并分享。

论文阅读 (YouTube)

数据科学家的故事 (Data Scientist Story)

编程技术达人 Worri

数据科学家李智英

转折点TP，求职专家YouTube频道

深度学习好兄 DL bro

对机器学习、深度学习、人工智能、数据分析研究生感兴趣吗？- 深度学习好兄 DL bro

为想学习数据科学的人准备的文章

为想学习数据科学的人准备的文章

Facebook群组 (Facebook Groups)

TensorFlow Korea
- TensorFlow 韩国
PyTorch KR
- PyTorch 韩国
Kaggle Korea
- Kaggle 韩国
Recommender System KR
- 推荐系统
A.I. Lookbook
- 可视化
AI Korea
- AI 韩国
Reinforcement Learning KR
- 强化学习韩国
统计分析研究会
- 统计学分析研究会 (Statistics Analysis Study)
GNN KR
- 图神经网络

库 (Library)

Tensorflow
- 深度神经网络
PyTorch
- 深度神经网络
Scikit-learn
- 机器学习
BindsNET
- 基于Pytorch的脉冲神经网络
NengoDL
- 基于Tensorflow的脉冲神经网络
HpBandster
- 基于超带宽和贝叶斯-超带宽的参数优化库

开放数据

文化大数据平台
PublicDataReader
- 可以使用Python SDK查询公共数据并返回Pandas DataFrame
综合数据地图
首尔开放数据广场
Papers with Code|Datasets
公共数据门户
Open Data Inception
AI Hub
- 政府支持的AI相关数据、软件、计算资源支持、竞赛等平台
Appen
汇集开放数据的GitHub仓库
VisualData - 视觉相关数据集
韩国数据交易所
Korpora: Korean Corpora Archives - 韩语自然语言处理相关数据集
KorQuAD2.0 - 韩语问答数据集
大家的语料库 - 国立国语院
Microsoft Azure Dataset
PhysioNet 医疗开放数据集

TensorFlow认证

TensorFlow认证获取流程

大数据分析师

大数据分析师实操(Kaggle) - KIM TAE HEON
- 可在Kaggle上以模拟考试形式练习大数据分析师实操题

其他

Machine Learning 快速上手指南

本指南旨在帮助中国开发者快速上手 machine-learning 开源工具，涵盖环境准备、安装步骤和基本使用示例。

环境准备

系统要求

操作系统：支持 Linux、macOS 和 Windows（推荐使用 WSL2）
Python 版本：3.8 或更高版本
包管理工具：pip

前置依赖

在开始之前，请确保已安装以下依赖：

NumPy
Pandas
Matplotlib
Scikit-learn

可以通过以下命令安装这些依赖：

pip install numpy pandas matplotlib scikit-learn

如果需要加速安装，可以使用国内镜像源（如阿里云）：

pip install numpy pandas matplotlib scikit-learn -i https://mirrors.aliyun.com/pypi/simple/

安装步骤

克隆项目代码到本地：

git clone https://github.com/teddylee777/machine-learning.git
cd machine-learning

安装项目依赖：
```
pip install -r requirements.txt
```

验证安装是否成功：

python -c "import sklearn; print(sklearn.__version__)"

基本使用

以下是一个简单的机器学习示例，使用 Scikit-learn 进行线性回归：

from sklearn.linear_model import LinearRegression
import numpy as np

# 准备数据
X = np.array([[1], [2], [3], [4], [5]])
y = np.array([1, 3, 2, 3, 5])

# 创建并训练模型
model = LinearRegression()
model.fit(X, y)

# 预测新数据
new_data = np.array([[6]])
prediction = model.predict(new_data)
print(f"预测结果: {prediction[0]}")

运行上述代码后，您将看到模型对新数据的预测结果。

通过以上步骤，您已经完成了 machine-learning 工具的基本安装和使用。更多高级功能和教程，请参考项目的 README 文件或相关视频资源。

常见问题

如何修复 .all-contributorsrc 文件的 JSON 格式错误？

为什么强化学习代码说明视频链接无法打开？

是否可以在 README 文件中添加目录以便快速导航？

相似工具推荐

stable-diffusion-webui

stable-diffusion-webui 是一个基于 Gradio 构建的网页版操作界面，旨在让用户能够轻松地在本地运行和使用强大的 Stable Diffusion 图像生成模型。它解决了原始模型依赖命令行、操作门槛高且功能分散的痛点，将复杂的 AI 绘图流程整合进一个直观易用的图形化平台。无论是希望快速上手的普通创作者、需要精细控制画面细节的设计师，还是想要深入探索模型潜力的开发者与研究人员，都能从中获益。其核心亮点在于极高的功能丰富度：不仅支持文生图、图生图、局部重绘（Inpainting）和外绘（Outpainting）等基础模式，还独创了注意力机制调整、提示词矩阵、负向提示词以及“高清修复”等高级功能。此外，它内置了 GFPGAN 和 CodeFormer 等人脸修复工具，支持多种神经网络放大算法，并允许用户通过插件系统无限扩展能力。即使是显存有限的设备，stable-diffusion-webui 也提供了相应的优化选项，让高质量的 AI 艺术创作变得触手可及。

★ 162.1k|★★★☆☆|今天

开发框架图像Agent

everything-claude-code

everything-claude-code 是一套专为 AI 编程助手（如 Claude Code、Codex、Cursor 等）打造的高性能优化系统。它不仅仅是一组配置文件，而是一个经过长期实战打磨的完整框架，旨在解决 AI 代理在实际开发中面临的效率低下、记忆丢失、安全隐患及缺乏持续学习能力等核心痛点。通过引入技能模块化、直觉增强、记忆持久化机制以及内置的安全扫描功能，everything-claude-code 能显著提升 AI 在复杂任务中的表现，帮助开发者构建更稳定、更智能的生产级 AI 代理。其独特的“研究优先”开发理念和针对 Token 消耗的优化策略，使得模型响应更快、成本更低，同时有效防御潜在的攻击向量。这套工具特别适合软件开发者、AI 研究人员以及希望深度定制 AI 工作流的技术团队使用。无论您是在构建大型代码库，还是需要 AI 协助进行安全审计与自动化测试，everything-claude-code 都能提供强大的底层支持。作为一个曾荣获 Anthropic 黑客大奖的开源项目，它融合了多语言支持与丰富的实战钩子（hooks），让 AI 真正成长为懂上

★ 139k|★★☆☆☆|今天

开发框架Agent语言模型

ComfyUI

ComfyUI 是一款功能强大且高度模块化的视觉 AI 引擎，专为设计和执行复杂的 Stable Diffusion 图像生成流程而打造。它摒弃了传统的代码编写模式，采用直观的节点式流程图界面，让用户通过连接不同的功能模块即可构建个性化的生成管线。这一设计巧妙解决了高级 AI 绘图工作流配置复杂、灵活性不足的痛点。用户无需具备编程背景，也能自由组合模型、调整参数并实时预览效果，轻松实现从基础文生图到多步骤高清修复等各类复杂任务。ComfyUI 拥有极佳的兼容性，不仅支持 Windows、macOS 和 Linux 全平台，还广泛适配 NVIDIA、AMD、Intel 及苹果 Silicon 等多种硬件架构，并率先支持 SDXL、Flux、SD3 等前沿模型。无论是希望深入探索算法潜力的研究人员和开发者，还是追求极致创作自由度的设计师与资深 AI 绘画爱好者，ComfyUI 都能提供强大的支持。其独特的模块化架构允许社区不断扩展新功能，使其成为当前最灵活、生态最丰富的开源扩散模型工具之一，帮助用户将创意高效转化为现实。

★ 107.7k|★★☆☆☆|2天前

开发框架图像Agent

NextChat

NextChat 是一款轻量且极速的 AI 助手，旨在为用户提供流畅、跨平台的大模型交互体验。它完美解决了用户在多设备间切换时难以保持对话连续性，以及面对众多 AI 模型不知如何统一管理的痛点。无论是日常办公、学习辅助还是创意激发，NextChat 都能让用户随时随地通过网页、iOS、Android、Windows、MacOS 或 Linux 端无缝接入智能服务。这款工具非常适合普通用户、学生、职场人士以及需要私有化部署的企业团队使用。对于开发者而言，它也提供了便捷的自托管方案，支持一键部署到 Vercel 或 Zeabur 等平台。 NextChat 的核心亮点在于其广泛的模型兼容性，原生支持 Claude、DeepSeek、GPT-4 及 Gemini Pro 等主流大模型，让用户在一个界面即可自由切换不同 AI 能力。此外，它还率先支持 MCP（Model Context Protocol）协议，增强了上下文处理能力。针对企业用户，NextChat 提供专业版解决方案，具备品牌定制、细粒度权限控制、内部知识库整合及安全审计等功能，满足公司对数据隐私和个性化管理的高标准要求。

★ 87.6k|★★☆☆☆|今天

开发框架语言模型

ML-For-Beginners

ML-For-Beginners 是由微软推出的一套系统化机器学习入门课程，旨在帮助零基础用户轻松掌握经典机器学习知识。这套课程将学习路径规划为 12 周，包含 26 节精炼课程和 52 道配套测验，内容涵盖从基础概念到实际应用的完整流程，有效解决了初学者面对庞大知识体系时无从下手、缺乏结构化指导的痛点。无论是希望转型的开发者、需要补充算法背景的研究人员，还是对人工智能充满好奇的普通爱好者，都能从中受益。课程不仅提供了清晰的理论讲解，还强调动手实践，让用户在循序渐进中建立扎实的技能基础。其独特的亮点在于强大的多语言支持，通过自动化机制提供了包括简体中文在内的 50 多种语言版本，极大地降低了全球不同背景用户的学习门槛。此外，项目采用开源协作模式，社区活跃且内容持续更新，确保学习者能获取前沿且准确的技术资讯。如果你正寻找一条清晰、友好且专业的机器学习入门之路，ML-For-Beginners 将是理想的起点。

★ 85k|★★☆☆☆|今天

图像数据工具视频

ragflow

RAGFlow 是一款领先的开源检索增强生成（RAG）引擎，旨在为大语言模型构建更精准、可靠的上下文层。它巧妙地将前沿的 RAG 技术与智能体（Agent）能力相结合，不仅支持从各类文档中高效提取知识，还能让模型基于这些知识进行逻辑推理和任务执行。在大模型应用中，幻觉问题和知识滞后是常见痛点。RAGFlow 通过深度解析复杂文档结构（如表格、图表及混合排版），显著提升了信息检索的准确度，从而有效减少模型“胡编乱造”的现象，确保回答既有据可依又具备时效性。其内置的智能体机制更进一步，使系统不仅能回答问题，还能自主规划步骤解决复杂问题。这款工具特别适合开发者、企业技术团队以及 AI 研究人员使用。无论是希望快速搭建私有知识库问答系统，还是致力于探索大模型在垂直领域落地的创新者，都能从中受益。RAGFlow 提供了可视化的工作流编排界面和灵活的 API 接口，既降低了非算法背景用户的上手门槛，也满足了专业开发者对系统深度定制的需求。作为基于 Apache 2.0 协议开源的项目，它正成为连接通用大模型与行业专有知识之间的重要桥梁。

★ 77.1k|★★★☆☆|昨天

Agent图像开发框架