machine-learning
machine-learning 是一个专为机器学习初学者和学习小组打造的开源学习资源库。它由 Teddy Lee 等多位贡献者维护,旨在帮助对机器学习感兴趣的人更轻松地入门和深入学习。这个项目不仅整理了系统化的学习路径,还提供了丰富的视频教程、博客文章和技术笔记,覆盖从基础的 Python 编程到高级的数据分析与可视化内容。
对于想要自学机器学习但不知从何入手的人来说,machine-learning 提供了一条清晰的学习路线。它解决了初学者常遇到的问题,比如学习资源零散、缺乏结构化指导以及不知道如何选择合适的学习顺序等。通过参考在线优质课程和博客,结合维护者的个人经验与注释,这个项目让学习过程更加高效且有趣。
适合使用 machine-learning 的用户包括开发者、数据科学爱好者以及希望转行到机器学习领域的研究人员。即使是没有编程背景的普通用户,也可以通过其推荐的基础教程逐步掌握所需技能。值得一提的是,该项目特别注重社区协作,鼓励用户通过 Pull Request 分享优质资源,共同完善内容。
独特的亮点在于其“阶梯式”学习设计,将复杂的知识点分解成易于理解的模块,并辅以实际案例和代码示例。无论你是想夯实基础还是探索进阶技术,machine-learning 都是一个值得信赖的学习伙伴。
使用场景
一位刚转行到数据科学领域的开发者小李,正在尝试学习机器学习知识并完成自己的第一个预测模型项目。
没有 machine-learning 时
- 面对海量的机器学习资料无从下手,不知道哪些内容适合入门学习
- 缺乏系统化的学习路径,常常在不同知识点之间迷失方向
- 碰到问题时只能零散地搜索解决方案,效率低下且容易产生挫败感
- 很难找到合适的代码示例,导致理论学习与实践脱节
- 学习过程中缺乏社区支持,遇到困难时无人交流
使用 machine-learning 后
- 借助仓库中整理的视频和博客资源,快速找到了适合入门的学习材料
- 按照推荐的学习路径逐步掌握 Python、数据分析和可视化等基础知识,学习过程更加清晰有序
- 通过 Issues 和 Pull Request 功能,与其他学习者和贡献者互动,及时解决疑问
- 直接使用仓库中的代码示例进行练习,将理论知识快速应用到实际项目中
- 加入活跃的开源社区,获得更多学习动力和支持,减少孤独感
machine-learning 帮助小李从零基础到独立完成第一个预测模型,显著降低了学习门槛,提升了学习效率。
运行环境要求
- 未说明
未说明
未说明

快速开始
贡献者 (Contributors) ✨
![]() Teddy Lee 🏠 |
![]() HongJaeKwon 🏠 |
![]() Seungwoo Han 🏠 |
![]() Tae Heon Kim 🏠 |
![]() Steve Kwon 🏠 |
![]() SW Song 🏠 |
![]() K1A2 🏠 |
![]() Wooil Jeong 🏠 |
为了让更多人受益,请通过 Pull Request 提交优质的学习资料!
知识分享 (Knowledge Sharings)
我们通过博客和 YouTube 进行知识分享。
目的
This repository is intended for personal study in machine-learning
本仓库旨在帮助更多自学机器学习(Machine Learning)的朋友。
您可以参考在线上由优秀人士分享的讲座和博客进行学习。
虽然我为亲自听过的课程添加了评论,但这些评论包含了很多个人观点。
视频课程合集,播放列表 (Video Lectures)
视频课程是我个人认为的学习顺序。当然,这也与难度相关。
Python(编程语言),数据分析(Pandas、Numpy),可视化(Matplotlib、Seaborn、Bokeh、Folium)
- 搭配电子书学习的 Python 课程合集 - TeddyNote
- 人生第一次编程 - Python(金正旭)
- 编程学院院长金正旭提供的 Python 入门课程(3小时)。轻量级课程免费提供。
- Python 基础教程 | 金左神的左手编程
- 为深度学习准备的 Python - 申京植
- NumPy(数值计算库)基础 - T学院
- 一次性掌握 Pandas - TeddyNote
- Pandas 笔记(免费电子书)- TeddyNote
- 巩固 Pandas 基础 - T学院
- 使用 Pandas 进行时间序列数据分析 - T学院
- 初学者的 Python 基础速成 - JazzyBoss
- Python 数据可视化教程 - JazzyBoss
数学 (Mathematics) & 统计学 (Statistics)
- 为什么需要直观理解线性代数 - 3Blue1Brown 韩语版
- 什么是向量?| 线性代数的本质 - 3Blue1Brown 韩语版
- 线性代数基础 - 3Blue1Brown
- Mathematical Monk YouTube(英文)
- 一个非常简单易懂的深度学习相关数学的 YouTube 频道。
- 为深度学习准备的线性代数 - 正确数学教育研究所
- 深度学习数学课程 - 众研社 Chanwoo Timothy Lee
- 手写笔记帮助理解深度学习数学原理的课程。
机器学习 (Machine Learning) & 深度学习 (Deep Learning)
- Best of ML Python
- 包含了多达 840 个开源机器学习项目的 GitHub 存储库!强烈推荐查看。
- Machine Learning with Python
- 包含各种机器学习技术的 Jupyter Notebook 教程集合的 GitHub!
- Scikit Learn 官方网站教程
- 使用 Scikit Learn(机器学习库)进行数据管道分析和机器学习库应用。
- YouTube 教程(freeCodeCamp.org): https://www.youtube.com/watch?v=pqNCD_5r0IU
- Machine Learning by Coursera - Andrew Ng
- 专为初学者设计的入门课程。由大师 Andrew Ng 教授亲自讲解,内容通俗易懂。
- 从零开始的机器学习 - 崔成哲教授(TEAMLAB)
- 在深入机器学习研究之前,推荐先学习 "数据科学的 Python 入门"。不过该课程在 Inflearn 上是付费(33,000韩元),也可以通过 YouTube 收听。
- 面向所有人的深度学习 第一季 (Tensorflow) - 金成勋教授
- 最适合入门的课程。即使不熟悉 TensorFlow,也可以通过示例逐步学习。
- 只需高中数学即可掌握的人工智能、机器学习、深度学习 - 巴拉姆
- 巴拉姆在 YouTube 频道上公开的深度学习开放课程。讲解简单易懂,非常适合初学者。
- 深度学习独立入门 - Idea Factory KAIST
- 为初学者设计的深度学习全面理解课程。每节课还提供代码。
- CS231n(英文)- 斯坦福大学
- 英文授课课程。如果英语熟练,建议首先观看此课程以整理概念。
- CS329S: 机器学习系统设计(2021 冬季)
- 斯坦福 CS 329S 课程大纲。讲义幻灯片和笔记已公开。
- 课程视频链接(YouTube)
- 通过 Kaggle 实践学习数据科学 - TodayCode
- 专为初学者设计的易懂课程,推荐给尚未接触过 Kaggle 的用户作为入门课程。
- 用青瓦台国民请愿数据入门 Python 自然语言处理 - TodayCode
- Deep Learning by GOOGLE - Udacity
- 平均时长仅约 1 分钟的超短课程。建议有一定中级水平后,通过实战编码来学习(推荐完成作业)。
- DEEP LEARNING, Spring 2020 - NYU CENTER FOR DATA SCIENCE
- 深度学习大师 Yann LeCun 和 Alfredo Canziani 的深度学习课程。提供幻灯片和讲座,韩文字幕正在制作中。
- 泰瑞的深度学习对话
- 不完全是深度学习课程,而是按章节/类别轻松简短地解释相关内容的课程。有趣且易于理解,重点在于概念梳理。
- TensorFlow2 课程 - Shin's Lab
- 讲解清晰,并附带对数学的详细说明。讲师表达能力强,不仅讲解代码,还涉及论文内容。
- Pytorch Zero To All(英文)- 金成勋教授
- 面向所有人的强化学习课程 - 金成勋教授
- 从论文开始的深度学习 - 崔成俊
- PyTorch 教程(韩文)
- PyTorch 官方网站提供的官方教程的韩文翻译版本。
- PyTorch - 快速入门!韩国用户组官方文档翻译版 by PyTorchKorea 运营团队 TodayCode
- 使用 PyTorch 韩文翻译版的快速入门教程。大约 30 分钟的短视频,但讲解亲切友好!
- 亚马逊 AWSBoost
- 亚马逊通过 Zoom 提供的机器学习/深度学习培训。还介绍了 SageMaker 的使用方法。
大数据分析师
- 通过 Kaggle 学习大数据分析师 - 金泰宪
- 持续更新大数据分析师实战问题到 Kaggle,并可结合 Kaggle Notebook 内核和课程一起学习。
按主题分类 (By Subjects)
- 机器学习自学尝试
- 按主题分类 (By Subjects)
- 数学 (Mathmatics)
- 统计学 (Statistics)
- 机器学习 (Machine Learning)
- 深度学习 (Deep Learning)
- 优化与自动机器学习 (Optimization & AutoML)
- 元学习 (Meta Learning)
- 主动学习 (Active Learning)
- 联邦学习 (Federated Learning)
- 增量学习 (Incremental Learning)
- 可视化 (Visualization)
- 大语言模型 (LLM - Large Language Model)
- LangChain
- ChatGPT
- 其他 (Others)
- Kaggle & Datacon
- 博客 (Blogs)
- GitHub存储库 (GitHub)
- 网站 (Web Sites)
- Wiki Docs
- YouTube频道 (YouTube Channel)
- 论文阅读 (YouTube)
- 数据科学家故事 (Data Scientist Story)
- Facebook群组 (Facebook Groups)
- 库 (Library)
- 开放数据
- TensorFlow认证
- 大数据分析师
- 其他
数学 (Mathmatics)
基础
微分
相似度
线性代数
其他
- 图形计算器 - Desmos
- 图形计算器可以在网页上绘制数学公式的图形并进行可视化。
- 图形计算器 - Desmos
统计学 (Statistics)
- 统计综合
- 手算概率分布 - 统计的本质 EOStatistics
- 强烈推荐给初学者或者首次接触统计学的朋友。讲解非常简单易懂,并全面涵盖了统计学的基本内容。
- 管理统计分析 - 李相哲教授
- 对统计学初学者来说非常容易理解,讲解通俗易懂。
- 扎实的统计学入门 - 卢庆燮
- 统计公式和概念一次性总结。(离散概率分布、二项分布、连续概率分布、概率密度函数、标准正态分布、标准化公式、随机抽样、样本均值、统计推断、总体均值估计)- 算法城南学院
- 手算概率分布 - 统计的本质 EOStatistics
- p-value
- 假设
- 分布
- 估计,置信区间
- 贝叶斯理论
- 傅里叶变换
- 经验模态分解
- AR, MA, ARMA, ARIMA
机器学习 (Machine Learning)
梯度下降法 (Gradient Descent)
反向传播 (Back Propagation)
损失函数 (Loss Functions)
线性回归 (Linear Regression)
- 最小二乘法证明 - 테디노트
- 最小二乘估计量证明 - jbstatistics
- 最小二乘法 - 最小二乘准则 第1部分 - patrickJMT
- 最小二乘法 - 最小二乘准则 第2部分 - patrickJMT
- 机器学习基础 - 一次性彻底理解线性回归(只需30分钟!)- 동빈나
- 回归分析证明 - 使用最小二乘法(Least Square Method)进行参数估计 - Data Scientist이지영님
- 理解线性回归(Linear Regression) - 허민석님
- 线性与非线性的区别 - 허민석님
- 机器学习/深度学习数学入门 第5讲 - 回归分析 (Regression) | T아카데미
范数 (L1 & L2)
Lasso, Ridge, ElasticNet
支持向量机 (Support Vector Machine, SVM)
K近邻算法 (K-Nearest Neighbors, KNN)
逻辑回归 (Logistic Regression)
决策树 (Decision Tree)
降维
聚类 (Clustering)
深度学习 (Deep Learning)
概述
卷积神经网络 (Convolution Neural Networks, CNN)
循环神经网络 (Recurrent Neural Networks, RNN)
生成对抗网络 (Generative Adversarial Network, GAN)
强化学习 (Reinforcement Learning)
- 强化学习 - 金成勋教授
- 强化学习(英文)- David Silver教授
- 强化学习概论(10讲)- PangyoLab
- 轻松实现强化学习(2讲)- PangyoLab
- 入门强化学习(season 1)- T学院
- 入门强化学习(policy gradient)- T学院
- 强化学习相关技巧 - 强化学习 KR
- 强化学习100题 - Koki Saitoh
- 日语强化学习解题网站。提供评分和解答。除了图画题目外,翻译时可以边翻译边解决。
计算机视觉 (Computer Vision)
- Awesome computer vision
- 包含了大部分计算机视觉的内容。
- OpenCV教程 - Daehee YUN 技术博客
- 不仅有Python教程,还提供了C# OpenCV教程。
- 目标检测(Object Detection) - Deeplearning.ai
- 语义分割(Semantic Segmentation) - UNet Keras实现
- 自动驾驶(Self-Driving Car) - Udacity自动驾驶工程师纳米学位的所有项目源代码
- 目标检测介绍 - 假研究所
- Awesome computer vision
自然语言处理 (Natural Language Processing, NLP)
- 基于深度学习的自然语言处理 - 赵庆贤教授
- 斯坦福 - 使用深度学习进行自然语言处理
- Transformer(Attention Is All You Need) - 许民锡
- Transformer: Attention Is All You Need(细致的深度学习论文回顾与代码实践)- 同斌
- (CS231n韩文解释) Attention - 宋敎石
- 序列到序列 + 注意力模型 - 许民锡
- Seq2Seq: Sequence to Sequence Learning with Neural Networks - 同斌
- 自然语言语言模型 "BERT"
- 自然语言处理特别讲座 - Tencho
- 用于自然语言处理的深度学习算法、词嵌入(Word2Vec, TF-IDF)、BERT、GPT
- 从基础到高级的自然语言处理课程 - Ready-To-Use Tech
- kiyoungkim1 分享的从基础到高级的自然语言处理课程
语音识别 (Speech Recognition)
其他
- 改进深度神经网络:超参数调优
- Andrew Ng教授亲自讲解的DNN改进思路。如果想深入了解深度学习模型的细节,强烈推荐观看。
- 为什么Batch Norm有效?(Batch Norm的优点) - Andrew Ng教授
- Adam优化算法 - Andrew Ng教授
- 改进深度神经网络:超参数调优
优化 & AutoML (Optimization & AutoML)
- 基于遗传算法
- 基于贝叶斯
- 基于Hyperband
- 神经架构搜索 (Neural Architecture Search)
元学习 (Meta Learning)
- 理论
- 元强化学习
主动学习 (Active Learning)
- 理论
联邦学习 (Federated Learning)
增量学习 (Incremental Learning)
可视化 (Visualization)
- Bokeh
LLM(大型语言模型)
- AutoGPT
- AutoGPT 安装与使用方法 - TeddyNote
- 自动实现用户设定目标(Goal)的 GPT。
- AutoGPT 安装与使用方法 - TeddyNote
- FineTuning(微调)
- KoChatGPT-replica(RLHF) 项目
- ChatGPT-replica 实践 GitHub。涵盖 GPT 微调、强化学习(PPO)、RLHF(基于人类反馈的强化学习)、ChatGPT 数据集构建等内容,并包含多种 Colab 示例。
- KoAlphaca: 基于 Stanford Alpaca 的韩语 Alpaca 模型(支持 LLAMA 和 Polyglot-ko)
- 使用与 Stanford Alpaca 模型相同的训练方式,能够理解韩语的 Alpaca 模型。内容包括使用 Lora Peft 进行微调的方法,并介绍了韩语数据集。
- KoChatGPT-replica(RLHF) 项目
朗链 (LangChain)
- 朗链教程(博客)
- 朗链(langchain) 的 OpenAI GPT 模型(ChatOpenAI)使用方法
- 朗链(langchain) + HuggingFace 模型使用方法
- 朗链(langchain) + 聊天(chat) - ConversationChain、模板使用方法
- 朗链(langchain) + 结构化数据(CSV, Excel) - 基于 ChatGPT 的数据分析
- 朗链(langchain) + 网站爬取 - 网站文档摘要
- 朗链(langchain) + 网站信息提取 - 模式使用方法
- 朗链(langchain) + PDF 文档摘要, Map-Reduce
- 朗链(langchain) + 基于 PDF 的问答(Question-Answering)
- YouTube 教程
- 朗链精选 YouTube 教程
- 全部为外国作者的教程,但讲解简单易懂,示例易于跟随。这是朗链官网推荐的教程页面。
- 朗链精选 YouTube 教程
ChatGPT
OpenAI
- OpenAI API 参考
- OpenAI API 官方文档
- OpenAI 食谱
- OpenAI Python API 食谱。根据不同场景整理了代码和教程,内容详尽。
电子书
- 生成 AI 应用指南 - 全脑黑客
- 包含各种生成 AI 的应用实例
- 图像生成 AI 应用 - 全脑黑客
- 包含图像生成、绘画等生成 AI 的应用内容
其他 (Others)
- 管道
- Azure 机器学习
- 数据库
- Facebook Prophet
Kaggle & Datacon
如果你是 Kaggle 新手?
Hello Kaggle!
- Hello Kaggle! - stevekwon211
- 介绍 Kaggle 的文档,包括入门指南、比赛流程、数据集、API 等说明
- 韩国仅有的四位 Kaggle 大师访谈
- 李有韩先生访谈 by 赵编程
- 文科生如何成为世界排名 24 的 Kaggle 大师 - Upstage
- 激励文科生的 Kaggle 大师之路视频
Kaggle 教程 | PyTorch 基础
- Pytorch 深度学习爱好者教程 ,DATAI
- 从 PyTorch 基本操作(Tensor 运算)到线性回归、逻辑回归、ANN、CNN
- 条件生成对抗网络 ,Arpan Dhatt
- CGAN(条件 GAN)结构理解及基于 MNIST 数据的建模实践
- Pytorch 动物面部分类 - CNNs, Mehmet -lauda- Tekman
- 使用 AFHQ(动物面部图像)进行深度学习分类建模实践
- 基础 GAN 架构概述 - Seungwon Song
- 使用 MNIST(数字数据)实现深度学习图像生成器
- 使用条件 GAN 生成时尚图像 - Seungwon Song
- 使用 Fashion MNIST(服装图像)实现条件深度学习图像生成器
Kaggle 教程 | 图像/目标检测
- [训练] SIIM COVID-19 检测: 🔥FasterRCNN🔥 - Heroseo
- 通过胸部 X 光检测新冠
- Tensorflow 中的 Yolo v3 目标检测 - heartkilla
- 使用 Tensorflow 和 Yolo v3 的目标检测解决方案
- SIIM COVID-19 检测 🔱 10+ 步骤教程 (1) - Seungwon Song
- 用于新冠检测的特征工程和图像检测
Kaggle 教程 | 自然语言处理
- 初学者到中级自然语言处理指南 - NowYSM
- 使用 sklearn + 逻辑回归进行情感分析(正/负面表达判断)
- 深度学习 NLP Quora 解决方案 - NowYSM
- 使用深度学习(Keras)检测恶意问题(可能引发社会问题的低质量提问)
- 新手快速入门 NLP😁 九步走 - Seungwon Song
- 使用灾难推特实现假新闻检测器
Kaggle 教程 | R 机器学习
- R 语言入门:第一步 - Rachael Tatman
- 学习 R 基本用法
- R 语言入门:加载数据到 R - Rachael Tatman
- 使用 R 处理数据的方法
- R 语言入门:汇总数据 - Rachael Tatman
管道(%>%)语法理解、数据聚合与总结
- R 语言入门:绘制数据 - Rachael Tatman
ggplot2库的使用方法及可视化技术理解
- 欢迎来到 R 语言的数据科学世界 - Rachael Tatman
- 使用
modelr库进行机器学习、决策树理解
- 使用
Kaggle 获胜解决方案
讲座 & 演讲
结构化数据
- 结构化数据分析技巧 - T学院
- Kaggle、Datacon 竞赛(结构化数据)分析技巧、方法论讲座
演讲
笔记本
Kaggle & Dacon 比赛分类
入门 (For Beginners)
- Titanic: Machine Learning from Disaster
- 泰坦尼克号生存预测比赛。死亡/生还分类比赛
- Bike Sharing Demand
- 自行车需求预测比赛。预测需求的回归预测(regression)比赛
- Home Credit Default Risk
- 信用违约风险预测比赛(ROC-AUC)
- House Prices: Advanced Regression Technique
- 房价预测比赛(回归预测)
视觉 (Vision)
- Digit Recognizer
- Facial Keypoints Detection
- Dogs vs. Cats
- Right Whale Recognition
- Intel & MobileODT Cervical Cancer Screening
时间序列 (Time Series)
- Web Traffic Time Series Forecasting
- Recruit Restaurant Visitor Forecasting
- Corporación Favorita Grocery Sales Forecasting
- Rossmann Store Sales
语音
博客 (Blogs)
- Teddylee777 博客
- 数据分析、机器学习、深度学习博客
- 生虾寿司店
- 统计相关知识整理得很好的博客
- 数据科学学校
- 数据分析、机器学习、深度学习学习者必看的网站。笔记本整理得很好,运营者还教授数学课程。
- 工科生的数学整理笔记
- 整理了机器学习和深度学习必备数学知识的博客
- TensorFlow 博客
- 不需要过多解释。处理 TensorFlow 的人不可能不知道朴海善先生的博客。他还翻译了很多好书。
- Python Kim
- 金成勋教授“面向所有人的深度学习第一季”每节课内容整理的博客
- 安秀斌的博客
- 可视化相关内容整理得非常好的博客
- LOVIT X DATA SCIENCE 博客
- 以研究内容为中心的数据科学相关博客。发布了许多专业性内容。
- Google - Tensorflow 入门 (英文)
- Google 官方文档站点,Tensorflow 基本实现方法教程
- Laon People - 机器学习
- ratsgo's blog
- 不仅是自然语言处理领域,其他深度学习相关文章质量也很高。不过有些部分理解起来有点难度。
- SuA Lab 李虎成的博客
- 整理了许多高水平论文的文章。论文研究总结的内容也很好。
- 每周一篇自然语言处理博客 - Weekly NLP
- 每周发布一篇自然语言处理相关的博客文章,质量也非常优秀。
- 韩语嵌入实验
- 韩语嵌入书籍教程页面。对韩语自然语言处理感兴趣的人可以看看。
- 推荐系统 - 算法趋势整理
- 推荐系统算法趋势详细整理的博客
- Team AI Korea
- AI Dev - 人工智能开发者聚会
- TensorFlow 韩文文档
- Agustinus Kristiadi's Blog (英文)
- Colah's Blog (英文)
- 强化学习整理 - 崔泰浩
GitHub 仓库
教程 (Tutorial)
- 斯坦福课程韩文翻译 repo - AIKorea.org
- 斯坦福课程摘要的韩文翻译 GitHub 仓库。
- 使用 Python 的机器学习 (Machine Learning with Python)
- 包含涵盖各种机器学习技术的 Jupyter Notebook 教程的 GitHub!
- PyTorch 教程 (pytorch-tutorial)
- 获得超过 10,000 颗星的 PyTorch 教程 GitHub。
- Atcold 的深度学习(使用 PyTorch)(Deep Learning (with PyTorch) by Atcold)
- 使用 PyTorch 的教程 ipynb 笔记本整理得非常好的教程 GitHub。
- TensorFlow 示例源代码 (TensorFlow Example Source Code)
- TensorFlow 官方 GitHub(韩文版)
- TensorFlow 官方运营的 GitHub,包含教程和指南。
- 崔成俊的 GitHub
- 包含许多使用 TensorFlow 的教程。
- TensorFlow 2.0 教程 - 许民锡 (Tensorflow2.0 Tutorial - 허민석님)
- 许民锡在 YouTube 上进行的 TensorFlow 2.0 讲座及其实验资料的 GitHub。
- 学习 Python 人工智能框架 - jjerry-k (Learning Python A.I Framework - jjerry-k)
- 使用 TensorFlow、PyTorch、MxNet 实现从基础模型到各种 ImageNet 等内容的整理 GitHub。
- 最佳 ML Python (Best of ML Python)
- 收集了多达 840 个开源 ML 项目 GitHub 的存储库。
- 验证码破解器 (CaptchaCracker)
- 提供用于识别验证码图像的深度学习模型创建和应用功能的 Python 模块。
- 韩语预训练语言模型 - kiyoungkim1 (Pretrained Language Models For Korean - kiyoungkim1)
- 共享预训练自然语言处理模型的 GitHub。
- LangChain 教程 (LangChain Tutorial)
- LangChain 教程。包含各种示例、食谱 (cookbook) 和用例等。
- LangChain 韩文教程 (LangChain 한국어 튜토리얼)
- 将 LangChain 食谱翻译成韩文的韩文教程。
- OpenAI API 韩文教程 (OpenAI API 한국어 튜토리얼)
- 将 OpenAI Cookbook 翻译成韩文并添加韩文示例的教程。
- Awesome LLM
- 精选的大规模语言模型论文列表,特别是与 ChatGPT 相关的内容。
讲座 (Lecture)
- 金成勋教授 - 深度学习从零到精通 (김성훈 교수님 - Deep Learning Zero To All)
- 金成勋教授的 YouTube 讲座(从零开始的深度学习)GitHub。
- 深度学习公开课 - 巴拉姆 (deepLearningOpenLecture - 바람님)
- YouTube 频道巴拉姆的深度学习讲座实验文件 GitHub。
自然语言处理 (Natural Language Processing)
- 韩语嵌入 GitHub (한국어 임베딩 깃헙)
- 可以获取韩语嵌入书籍相关资料的 GitHub。可以下载数据集。
- 使用 TensorFlow 2 和机器学习入门自然语言处理 (텐서플로2와 머신러닝으로 시작하는 자연어처리)
- 最近出版的《使用 TensorFlow 2 和机器学习入门自然语言处理》一书的示例代码整理的 GitHub。
- 自然语言处理实践 GitHub - 金雄坤 (자연어 처리 실무 깃헙 - 김웅곤님)
- 涵盖 BERT、Transformer 等实际编码。(提供 colab 文件)
- 国民银行 - KB-ALBERT-KO (국민은행 - KB-ALBERT-KO)
- 国民银行公开的韩语 ALBERT 模型。
- Kakao Khaiii 形态分析器 (카카오 Khaiii 형태소 분석기)
- Kakao 开发的形态分析器 (Khaiii) 官方 GitHub。
- 韩语自然语言处理技术集合 (한글 자연어처리 기법 모음)
- 可直接运行的 Colab 文件。汇集了各种韩语数据预处理技术。
- 文本分析 - 高丽大学 DSBA 康필성教授 (Text Analysis - 고려대 DSBA 강필성 교수님)
- 讲义幻灯片和教材都整理得非常清晰的 GitHub。讲解轻松且节奏缓慢,因此易于理解。
- TTS - mozilla
- 用于文本转语音的深度学习。高级文本转语音生成 GitHub。
- 自然语言处理综合工具包 aka.PORORO - KakaoBrain (자연어처리 종합선물세트 aka.뽀로로 - 카카오브레인)
- PORORO:基于深度学习的自然语言处理全合一平台。强烈推荐尝试!
计算机视觉 (Computer Vision)
- 视觉处理相关教程 GitHub (Vision 처리 관련 튜토리얼 깃헙)
- 存储计算机视觉相关处理和 OpenCV 相关教程的 GitHub。
信号处理 (Signal Processing)
- 生物信号处理相关教程 GitHub (생체신호처리 관련 튜토리얼 깃헙)
- 存储脑电图 (EEG)、心电图 (ECG)、肌电图 (EMG) 相关信号处理教程的 GitHub。
生成对抗网络 (GAN)
- Keras GAN
- 使用 Keras 实现的 GAN。
- Keras-DCGAN
- DCGAN 的教程。
- Keras-WGAN
- 美术馆中的 GAN 深度学习 (미술관에 GAN 딥러닝)
- GAN 相关翻译书籍的实验用 GitHub 仓库。提供了多种易于查看的示例。
- GAN 动物园 (Gan ZOO)
- 几乎涵盖了所有 GAN 相关论文的 GitHub。
论文
- terryum - awesome-deep-learning-papers
- 非常好地整理了深度学习相关论文的 GitHub。
- 必读论文 (Papers You Must Read (PYMR))
- 高丽大学 Data Science & Business Analytics Lab 分享的学习机器学习必读论文列表(Notion)。
书籍示例
- Python 编程技巧 (Effective Python) - 吉备出版社
- 提供学习 Python 的书籍练习题和示例源代码。
- Pandas、Numpy、可视化 - Python 数据科学手册教程 (Pandas, Numpy, Visualization - Python Data Science Handbook 튜토리얼)
- 整理得很好的 Python 数据科学手册教程 colab。可以进行 Pandas、Numpy、可视化相关的实践。
- Python 数据科学手册 (Python Data Science Handbook)
- (蜥蜴书)Python 数据科学手册 GitHub。获得超过 28K 颗星。
- 大家的深度学习(修订第 2 版)- 吉备出版社
- 提供大家的深度学习练习题和示例源代码。
- 掌握机器学习的技术 with Python、Scikit-learn (2020)
- 提供书籍的练习题和示例源代码。
- 动手学机器学习 (핸즈온 머신러닝)
- 动手学机器学习书籍的示例和源代码提供。
- Python 机器学习终极指南
- 权哲民的 Python 机器学习终极指南 GitHub。结合 Inflearn 上的课程和书籍一起看效果更佳。
- 强化学习第二版 by Sutton 练习解答 (Reinforcement Learning-2ndEdition by Sutton Exercise Solutions)
- 强化学习第二版(原书作者 Richard S. Sutton、Andrew G. Barto)解题代码 GitHub。
- Python 深度学习 TensorFlow
- 信息文化社出版的 Python 深度学习 TensorFlow(2021)GitHub。包含书籍的示例代码。
- Dacon 竞赛第一名解决方案
- WikiBooks - Dacon 竞赛第一名解决方案书籍的示例代码 GitHub。
网站 (Web Sites)
-
- 提供热门 AI 网站和工具的排名,并为每个工具(网站)提供简要说明、用户数量等信息。
-
- 使用 ChatGPT 的社区。由多个利用和扩展 ChatGPT 的小组组成,各小组分享有关 ChatGPT 的实用信息。
-
- 谷歌开发者网站整理的机器学习术语表。
-
- pandas 教程(主要围绕核心 API 展开的教程)
-
- 快速浏览 matplotlib 的 20 分钟教程(主要围绕核心 API 展开的教程)
-
- 包含 Python、pandas、numpy、matplotlib、seaborn 等各种 CheatSheet 的汇总。
-
- 提供与论文相关的 GitHub 存储库。
-
- 不仅包括 numpy、matplotlib、tensorflow,还整理了 Python 中常用库的教程。
-
- Keras 官方文档提供的示例集合。代码不超过 300 行,包含多种基础示例。
-
- 自然语言处理相关问题的 100 道题目的练习网站。
-
- 可以通过 Python 代码直接实现机器学习概念。提供的 Python 代码示例非常优秀。
-
- 向 Jupyter Notebook 发起挑战的数据科学 Notebook。感兴趣的朋友可以试试!
-
- OpenAI 的强化学习教学资料。
-
- 使用图形界面创建 TensorFlow 模型。
-
- 论文存储库。几乎可以找到所有关于人工智能、编程等领域的论文。
-
- 在特定时间段内查看某个主题的热门 arXiv 论文。
-
- 每日更新的最新 AI/ML 论文精选。提供每日/每周/每月趋势、主题标签、摘要以及代码/数据链接。
-
- 微软 Learn 平台。涵盖 PyTorch 基础、使用 PyTorch 进行图像/自然语言/音频处理的课程。
-
- PyTorch 官方网站提供的教程的韩文翻译版本。
-
- 金基贤分享的使用 PyTorch 进行自然语言处理的入门文档。
-
- 机器学习:综合指南。了解在动态的 ML 领域中取得卓越成果的路径、技能、行业洞察和技巧。
Wiki Docs
- 动手学深度学习
- 一本交互式深度学习教材,包含代码、数学和讨论,强烈推荐,但韩文翻译并不完美。一定要看看!
- Python 入门
- 如果你想通过书本学习 Python!
- 初学者的 Python 300 题
- 包含 300 道 Python 基础语法题目。
- 机器学习讲义笔记
- Andrew Ng 教授课程内容的整理笔记。整理得非常好。
- 使用 PyTorch 开始深度学习入门
- 如果想通过 WikiDocs 学习 PyTorch。
- 使用深度学习进行自然语言处理入门
- 自然语言处理 WikiDocs(基于 TensorFlow)。
- 使用深度学习进行自然语言处理进阶
- 整理自赵庆贤教授的课程笔记。
- 用 Python 学习算法交易
- 一个可以通过证券公司联机 API 实现交易的 Python Wiki!
- 大数据 - Hadoop 和 Hive 入门
- 包含 Hadoop 和 Hive 的相关内容。
- 大数据 - Scala 和 Spark 入门
- 如果想学习 Scala 和 Spark。
- 生成式 AI 应用 - 全脑黑客
- 包含使用生成式 AI 的各种示例。
- 图像生成 AI 应用 - 全脑黑客
- 包含使用生成式 AI 进行图像生成/应用的内容。
YouTube 频道 (YouTube Channel)
- 3Blue1Brown 韩语频道
- 3Blue1Brown 频道的韩语版本,轻松解释人工智能所需的数学知识。非常感谢!
- SKPlanet TAcademy
- 不仅提供人工智能课程,还免费提供科技领域其他优质课程。
- 面包哥的开发发展国
- 展示各种有趣的 AI 项目并提供简单解答。
- 韩曜燮 - 深度学习
- 提供论文解读及实现的讲解视频。
- 李有翰 - Kaggle
- 包含 Kaggle 内核评论和各种 Kaggle 技巧的视频。
- 许敏硕 - Minsuk Heo
- 包含许多深度学习相关视频,PPT 清晰且讲解简洁易懂。
- 工科生的数学笔记
- 工科生数学笔记博客的延续,轻松讲解数学的教学视频频道。
- 赫彭海姆
- 有趣且易于理解的机器学习和深度学习教学频道。
- 下班后折腾
- 涵盖 Kaggle 教程和各种机器学习工具的频道。适合冷静学习的 YouTube 频道。
- 泰迪笔记
- 主要涵盖 TensorFlow 相关视频。涉及数据分析、机器学习和深度学习主题的 YouTube 频道。
- StatQuest with Josh Starmer
- 通过插图轻松简洁地解释机器学习背后的统计学原理的频道。
- Venelin Valkov
- 介绍使用机器学习的示例和信息的频道。
- sentdex
- 专注于机器学习项目的频道。
- 统计的本质 EOStatistics
- 统计理论讲解轻松易懂的 YouTube 频道。特别是手算统计的讲解非常适合初学者。
- Upstage
- 由金成勋教授、李活石和朴恩贞创立的人工智能(AI)专业企业 Upstage 的 YouTube 频道。发布面向初学者的 Kaggle 相关视频,以及其他有用的信息。
- AI 朋友
- 一个以产-学-研为中心的非营利研究团体,分享人工智能技术。通过 YouTube 直播邀请嘉宾进行约 2 小时的演讲 / 录制并分享。
论文阅读 (YouTube)
数据科学家的故事 (Data Scientist Story)
编程技术达人 Worri
数据科学家李智英
转折点TP,求职专家YouTube频道
- 数据科学家 & 机器学习工程师?现职人员全告诉你!(ft.自然语言处理10年经验) - 转折点TP,求职专家YouTube频道
- 数据科学家的年薪?就业前景?十年经验工程师全解析!- 转折点TP,求职专家YouTube频道
- 机器学习与数据科学家职业规划?学历?加班?十年专家全面解答!- 转折点TP,求职专家YouTube频道
深度学习好兄 DL bro
为想学习数据科学的人准备的文章
Facebook群组 (Facebook Groups)
- TensorFlow Korea
- TensorFlow 韩国
- PyTorch KR
- PyTorch 韩国
- Kaggle Korea
- Kaggle 韩国
- Recommender System KR
- 推荐系统
- A.I. Lookbook
- 可视化
- AI Korea
- AI 韩国
- Reinforcement Learning KR
- 强化学习韩国
- 统计分析研究会
- 统计学分析研究会 (Statistics Analysis Study)
- GNN KR
- 图神经网络
库 (Library)
- Tensorflow
- 深度神经网络
- PyTorch
- 深度神经网络
- Scikit-learn
- 机器学习
- BindsNET
- 基于Pytorch的脉冲神经网络
- NengoDL
- 基于Tensorflow的脉冲神经网络
- HpBandster
- 基于超带宽和贝叶斯-超带宽的参数优化库
开放数据
- 文化大数据平台
- PublicDataReader
- 可以使用Python SDK查询公共数据并返回Pandas DataFrame
- 综合数据地图
- 首尔开放数据广场
- Papers with Code|Datasets
- 公共数据门户
- Open Data Inception
- AI Hub
- 政府支持的AI相关数据、软件、计算资源支持、竞赛等平台
- Appen
- 汇集开放数据的GitHub仓库
- VisualData - 视觉相关数据集
- 韩国数据交易所
- Korpora: Korean Corpora Archives - 韩语自然语言处理相关数据集
- KorQuAD2.0 - 韩语问答数据集
- 大家的语料库 - 国立国语院
- Microsoft Azure Dataset
- PhysioNet 医疗开放数据集
TensorFlow认证
大数据分析师
- 大数据分析师实操(Kaggle) - KIM TAE HEON
- 可在Kaggle上以模拟考试形式练习大数据分析师实操题
其他
常见问题
相似工具推荐
stable-diffusion-webui
stable-diffusion-webui 是一个基于 Gradio 构建的网页版操作界面,旨在让用户能够轻松地在本地运行和使用强大的 Stable Diffusion 图像生成模型。它解决了原始模型依赖命令行、操作门槛高且功能分散的痛点,将复杂的 AI 绘图流程整合进一个直观易用的图形化平台。 无论是希望快速上手的普通创作者、需要精细控制画面细节的设计师,还是想要深入探索模型潜力的开发者与研究人员,都能从中获益。其核心亮点在于极高的功能丰富度:不仅支持文生图、图生图、局部重绘(Inpainting)和外绘(Outpainting)等基础模式,还独创了注意力机制调整、提示词矩阵、负向提示词以及“高清修复”等高级功能。此外,它内置了 GFPGAN 和 CodeFormer 等人脸修复工具,支持多种神经网络放大算法,并允许用户通过插件系统无限扩展能力。即使是显存有限的设备,stable-diffusion-webui 也提供了相应的优化选项,让高质量的 AI 艺术创作变得触手可及。
everything-claude-code
everything-claude-code 是一套专为 AI 编程助手(如 Claude Code、Codex、Cursor 等)打造的高性能优化系统。它不仅仅是一组配置文件,而是一个经过长期实战打磨的完整框架,旨在解决 AI 代理在实际开发中面临的效率低下、记忆丢失、安全隐患及缺乏持续学习能力等核心痛点。 通过引入技能模块化、直觉增强、记忆持久化机制以及内置的安全扫描功能,everything-claude-code 能显著提升 AI 在复杂任务中的表现,帮助开发者构建更稳定、更智能的生产级 AI 代理。其独特的“研究优先”开发理念和针对 Token 消耗的优化策略,使得模型响应更快、成本更低,同时有效防御潜在的攻击向量。 这套工具特别适合软件开发者、AI 研究人员以及希望深度定制 AI 工作流的技术团队使用。无论您是在构建大型代码库,还是需要 AI 协助进行安全审计与自动化测试,everything-claude-code 都能提供强大的底层支持。作为一个曾荣获 Anthropic 黑客大奖的开源项目,它融合了多语言支持与丰富的实战钩子(hooks),让 AI 真正成长为懂上
ComfyUI
ComfyUI 是一款功能强大且高度模块化的视觉 AI 引擎,专为设计和执行复杂的 Stable Diffusion 图像生成流程而打造。它摒弃了传统的代码编写模式,采用直观的节点式流程图界面,让用户通过连接不同的功能模块即可构建个性化的生成管线。 这一设计巧妙解决了高级 AI 绘图工作流配置复杂、灵活性不足的痛点。用户无需具备编程背景,也能自由组合模型、调整参数并实时预览效果,轻松实现从基础文生图到多步骤高清修复等各类复杂任务。ComfyUI 拥有极佳的兼容性,不仅支持 Windows、macOS 和 Linux 全平台,还广泛适配 NVIDIA、AMD、Intel 及苹果 Silicon 等多种硬件架构,并率先支持 SDXL、Flux、SD3 等前沿模型。 无论是希望深入探索算法潜力的研究人员和开发者,还是追求极致创作自由度的设计师与资深 AI 绘画爱好者,ComfyUI 都能提供强大的支持。其独特的模块化架构允许社区不断扩展新功能,使其成为当前最灵活、生态最丰富的开源扩散模型工具之一,帮助用户将创意高效转化为现实。
NextChat
NextChat 是一款轻量且极速的 AI 助手,旨在为用户提供流畅、跨平台的大模型交互体验。它完美解决了用户在多设备间切换时难以保持对话连续性,以及面对众多 AI 模型不知如何统一管理的痛点。无论是日常办公、学习辅助还是创意激发,NextChat 都能让用户随时随地通过网页、iOS、Android、Windows、MacOS 或 Linux 端无缝接入智能服务。 这款工具非常适合普通用户、学生、职场人士以及需要私有化部署的企业团队使用。对于开发者而言,它也提供了便捷的自托管方案,支持一键部署到 Vercel 或 Zeabur 等平台。 NextChat 的核心亮点在于其广泛的模型兼容性,原生支持 Claude、DeepSeek、GPT-4 及 Gemini Pro 等主流大模型,让用户在一个界面即可自由切换不同 AI 能力。此外,它还率先支持 MCP(Model Context Protocol)协议,增强了上下文处理能力。针对企业用户,NextChat 提供专业版解决方案,具备品牌定制、细粒度权限控制、内部知识库整合及安全审计等功能,满足公司对数据隐私和个性化管理的高标准要求。
ML-For-Beginners
ML-For-Beginners 是由微软推出的一套系统化机器学习入门课程,旨在帮助零基础用户轻松掌握经典机器学习知识。这套课程将学习路径规划为 12 周,包含 26 节精炼课程和 52 道配套测验,内容涵盖从基础概念到实际应用的完整流程,有效解决了初学者面对庞大知识体系时无从下手、缺乏结构化指导的痛点。 无论是希望转型的开发者、需要补充算法背景的研究人员,还是对人工智能充满好奇的普通爱好者,都能从中受益。课程不仅提供了清晰的理论讲解,还强调动手实践,让用户在循序渐进中建立扎实的技能基础。其独特的亮点在于强大的多语言支持,通过自动化机制提供了包括简体中文在内的 50 多种语言版本,极大地降低了全球不同背景用户的学习门槛。此外,项目采用开源协作模式,社区活跃且内容持续更新,确保学习者能获取前沿且准确的技术资讯。如果你正寻找一条清晰、友好且专业的机器学习入门之路,ML-For-Beginners 将是理想的起点。
ragflow
RAGFlow 是一款领先的开源检索增强生成(RAG)引擎,旨在为大语言模型构建更精准、可靠的上下文层。它巧妙地将前沿的 RAG 技术与智能体(Agent)能力相结合,不仅支持从各类文档中高效提取知识,还能让模型基于这些知识进行逻辑推理和任务执行。 在大模型应用中,幻觉问题和知识滞后是常见痛点。RAGFlow 通过深度解析复杂文档结构(如表格、图表及混合排版),显著提升了信息检索的准确度,从而有效减少模型“胡编乱造”的现象,确保回答既有据可依又具备时效性。其内置的智能体机制更进一步,使系统不仅能回答问题,还能自主规划步骤解决复杂问题。 这款工具特别适合开发者、企业技术团队以及 AI 研究人员使用。无论是希望快速搭建私有知识库问答系统,还是致力于探索大模型在垂直领域落地的创新者,都能从中受益。RAGFlow 提供了可视化的工作流编排界面和灵活的 API 接口,既降低了非算法背景用户的上手门槛,也满足了专业开发者对系统深度定制的需求。作为基于 Apache 2.0 协议开源的项目,它正成为连接通用大模型与行业专有知识之间的重要桥梁。







