materiais-de-estudos-sobre-data-science-deep-machine-learning

659 129 非常简单 1 次阅读 2天前MIT其他数据工具开发框架

AI 解读由 AI 自动生成，仅供参考

materiais-de-estudos-sobre-data-science-deep-machine-learning 是一个专为初学者打造的葡萄牙语人工智能学习指南。它系统性地整理了数据科学与机器学习领域的免费及付费资源，涵盖学习路径规划、精选视频频道、在线课程、专业书籍、数学基础、编程语言（Python/R）教程以及实战数据集等全方位内容。

该资源库主要解决了新手在面对海量且碎片化的学习资料时，难以构建清晰知识体系和寻找高质量入门材料的痛点。通过提供结构化的“学习路线图”，它帮助用户从理论基础平滑过渡到项目实战，甚至包含作品集构建指导和自由职业建议，极大地降低了入行门槛。

虽然内容以葡萄牙语为主，但其独特的价值在于作者亲身验证的学习轨迹与经验总结。它不仅罗列链接，更分享了从完成基础课程到参与科研项目的真实成长历程，为学习者提供了可参考的榜样和避坑指南。

非常适合想要入门数据科学、机器学习或深度学习的初学者使用，尤其是熟悉葡萄牙语或希望了解拉美地区 AI 教育资源的开发者与学生。对于需要系统化教学大纲的教育者而言，这也是一份极具参考价值的课程素材库。

使用场景

一名零基础的葡萄牙语学生想转行数据科学，面对海量且分散的学习资源感到无从下手。

没有 materiais-de-estudos-sobre-data-science-deep-machine-learning 时

资源筛选困难：在谷歌和 YouTube 上盲目搜索"Python 教程”或“机器学习入门”，被大量过时、付费或英文内容淹没，难以辨别质量。
学习路径缺失：不清楚该先学数学基础还是直接写代码，缺乏系统性的路线图，导致学习碎片化，经常半途而废。
本地化内容匮乏：很难找到高质量的葡萄牙语（PT-BR）免费教材和课程，语言障碍大大增加了入门门槛。
实战方向迷茫：不知道去哪里找适合新手的练习数据集，也不了解如何构建第一个作品集项目来证明能力。

使用 materiais-de-estudos-sobre-data-science-deep-machine-learning 后

精选资源直达：直接获取仓库中整理好的免费 PT-BR 核心链接，涵盖从基础数学到 TensorFlow 的优质频道与书籍，节省 90% 的搜索时间。
清晰成长路线：参考作者亲测的“学习旅程”和推荐路线图，按部就班地从 Python 基础过渡到深度学习，建立结构化知识体系。
母语无障碍学习：依托专门筛选的葡语内容池，包括 Udemy 课程和本地博客，让初学者能用最熟悉的语言攻克复杂概念。
实战项目指引：利用推荐的初学者数据集和作品集构建建议，快速复现如"ENEM 成绩地图可视化”等具体案例，积累求职资本。

materiais-de-estudos-sobre-data-science-deep-machine-learning 将散乱的知识点编织成清晰的葡语学习地图，让数据科学入门从“大海捞针”变为“按图索骥”。

运行环境要求

GPU

未说明

内存

未说明

依赖

notes该仓库并非一个可运行的 AI 软件工具，而是一个关于数据科学和机器学习（初学者级别）的学习资料汇总列表。内容主要包含指向外部课程、书籍、视频、文章和数据集的链接（多为葡萄牙语）。因此，它没有操作系统、GPU、内存或特定 Python 库的安装需求。用户只需具备浏览器即可访问所列资源，若需实践链接中的教程，则需根据具体教程的要求自行配置环境（通常涉及 Python、Pandas、TensorFlow 等基础数据科学库）。

python未说明

materiais-de-estudos-sobre-data-science-deep-machine-learning hero image

快速开始

数据科学与机器学习学习资料（入门级）

本仓库旨在整理关于数据科学和人工智能的学习资料，其中大部分为免费资源，并以巴西葡萄牙语提供。最初，我创建这个仓库是为了归类在搜索资料过程中找到的各种链接。如今，我会不断添加我认为对初学者重要的各类资源。

欢迎大家贡献内容。

我在疫情期间学习

内容列表

我的学习路径/旅程
关于该领域的简介
学习动机
学习路径/建议/路线图
进阶时可使用的资源
免费及付费书籍
数学
Python语言
R语言
部分库的教程
- TensorFlow
- Pandas
人工智能基础
YouTube频道
包含挑战/问题的网站
Udemy/Udacity/Coursera课程
- Udemy
- Udacity
- Coursera
面向初学者的数据集
代码仓库
构建作品集的技巧
数据科学自由职业者
略显离题的内容

我的学习路径/旅程

已完成的课程及专业/学术经历

2020
- [已完成] 数据分析Python - 数据科学学院 [证书]
- [已完成] 大数据导论 - FIA商学院（Coursera） [证书]
- [暂停中] 2020年Python数据科学全栈训练营
- [暂停中] 密歇根大学Python应用数据科学综合课程项目
- 在数据工程领域实习：编写脚本以支持FIEG观测站的ETL流程。
2021
- 数据挖掘领域的科研启蒙项目（2020/2021）
- [进行中] Luiz Miranda的Python 3从基础到高级课程（Udemy）
- [进行中] Stack Tecnologias的零基础数据科学课程（原Minerando Dados）
- 人工智能研究中心奖学金获得者

目前完成的项目

使用Folium绘制高考平均分地图：利用Folium库（一种便于在地图上可视化数据的工具）绘制高考平均分地图。绘图时考虑了各州的边界，因此共有27个学校组。使用了两个数据集。[Medium]
戈亚尼亚市COVID-19仪表盘：该项目采用数据科学方法，开发了一个用于监测戈亚尼亚市COVID-19确诊病例和死亡人数的仪表盘。该仪表盘包含图表和地图，展示了当地的相关数据。

关于该领域的简介

学习动机

学习路径/学习建议/路线图

这些链接中的内容可供希望制定学习计划或简单了解所需学习内容的人参考。它们帮助我更好地理解了这个领域，让我清楚自己目前所处的位置以及接下来应该往哪个方向发展。

数据科学家或机器学习学生的成长路径 - 奥德米尔·德皮耶里 Jr | [LinkedIn]
数据科学统计学习路径 - 罗尼森·卢卡斯 | [GitHub]
如何制定成为数据科学家的学习计划？（数据科学路线图） - 动态编程 | [YouTube]
我的数据科学学习路径 - 莱蒂西亚·杰罗拉/掷骰子 | [Medium]
如何成为一名数据科学家 - 马科斯·席尔瓦 | [Medium]
入门数据科学（DS） - 莱蒂西亚·席尔瓦 - ColaboraDados
数据科学家路线图 l VOYAGER方法
作为数据科学家的第一步：Pandas简介！ - 维尼修斯·菲格雷多 | [Medium]
按照这个计划学习数据科学所需的数学知识 - 第31期直播 - 马里奥·菲略 - 数据科学 | [pt-br] [YouTube]
用5步掌握数据科学中的Python - 娜娜·雷思兹
完整的机器学习学习计划 | [pt-br] [GitHub]
学习机器学习的学习技巧 | [pt-br]
数据科学与机器学习 - 一条学习路径 | [pt-br] [Medium]
人工智能学习路径 - 韦斯利·阿尔梅达 | [pt-br][LinkedIn]
人工智能课程内容列表 | [pt-br]（注：我并不是在推荐这些课程，因为我本人也没有上过，而是提供这个页面，以便大家可以根据其中的内容来制定学习计划等。）
到底需要掌握哪些数学知识才能真正进入机器学习领域？ | [pt-br][Medium]
无需花费即可学习深度学习 | [pt-br][Medium]
掌握机器学习的秘诀 | [pt-br][Medium]
数据科学家的隔离期，该学些什么？ | [pt-br][Medium]
人工智能课程（2019年） - USP
如何入门数据科学？（成为一名数据科学家） | [YouTube]
如果今天要重新开始学习数据科学，我会怎么做 | [YouTube]
遵循这份学习地图，学习数据科学（成为一名数据科学家） | [YouTube]
机器学习中的数学 - Didática Tech | [pt-br] [YouTube]（关于如何学习数学的建议）
终于：可靠来源公布了巴西数据科学家的薪资！（马里奥·菲略 - 数据科学） | [pt-br] [YouTube]
按照这个计划学习数据科学所需的数学知识 - 第31期直播 - 马里奥·菲略 - 数据科学 | [pt-br] [YouTube]

随着学习进展可使用的内容

这些练习和总结可以在学习过程中加以利用。

面向初学者的数据科学工作坊 - 娜娜·雷思兹 | [GitHub]
包含葡萄牙语内容的机器学习学习计划 | [GitHub]
更快的数据科学教育：“这些微型课程是获得独立开展数据科学项目所需技能的最快方式。” | [Kaggle][英语]

免费与付费书籍

由业内专业人士推荐的书籍。这些推荐来自直播和Medium上的文章。（葡萄牙语和英语）

Python数据科学手册 - “这是杰克·范德普拉斯的《Python数据科学手册》的Jupyter笔记本版本；内容可在GitHub上获取。”
Python数据分析：使用Pandas、NumPy和IPython处理数据
从零开始的数据科学——用Python掌握入门规则，作者乔尔·格鲁斯
使用Python和Pandas进行数据分析——丹尼尔·陈
如何用统计学说谎——达雷尔·赫夫
动手实践：使用Scikit-Learn和TensorFlow的机器学习
数据科学家实用统计学——安德鲁·布鲁斯、彼得·C·布鲁斯
数据故事讲述：面向商业专业人士的数据可视化指南——作者科尔·努斯鲍默·克纳夫利克
商业智能与数据分析在企业管理中的应用——作者杜尔孙·德伦
数据科学必备数学
数据科学在商业中的应用：你需要了解的数据挖掘与分析思维
深度学习——伊恩·古德费洛/约书亚·本吉奥/阿伦·库维尔：备受业内人士推荐。| 英文
深度学习书籍——数据科学学院 | 葡萄牙语
数据科学导论：基础与应用——IME/ USP/ 佩德罗·莫雷廷/ 朱利奥·辛格 | 葡萄牙语
深度学习的工作原理——ICMC/ USP/ 莫阿西尔·蓬蒂/ 加布里埃尔·科斯塔 | 葡萄牙语

数学

根据我的研究，学习数学的一个好方法是按需学习。例如，在需要时再学习相关数学内容，这样可以避免遗忘，而如果我们先学完所有人工智能所需的前置知识再开始学习，很可能会出现遗忘的情况。不过，如果有必要，最好还是先简单回顾一下基础数学。

Python语言

Neps Academy的Python课程 | 葡萄牙语（免费）
使用Python的计算机科学导论第一部分
数据科学学院（DSA）的Python数据分析课程 | 葡萄牙语（免费）
Didática Tech的机器学习与数据分析Python课程 | 葡萄牙语 [YouTube]
Didática Tech的Python初学者课程 | 葡萄牙语 [YouTube]
最好的Python课程——祖鲁巴贝尔 | 葡萄牙语 [YouTube]
解决问题（C和Python）——离散宇宙 | 葡萄牙语 [YouTube]
面向初学者的Python数据分析课程系列 | 葡萄牙语 [YouTube]
为你准备的35门最佳免费Python课程——Linux忍者 | 葡萄牙语
学习Python用于数据科学——Siraj Raval | 英语 [YouTube]

R语言

Didática Tech的R语言机器学习课程 | 葡萄牙语 [YouTube]
弗鲁米嫩塞联邦大学/UFF的R语言统计学课程
祖鲁巴贝尔的R语言编程课程 | 葡萄牙语 [YouTube]

部分库的相关课程

TensorFlow

Didática Tech的TensorFlow初学者课程 | 葡萄牙语 [YouTube]
TensorFlow简介——Siraj Raval | 英语 [YouTube]

Pandas

Pandas 葡萄牙语教程 - Zurubabel | [pt-br] [Youtube]
Pandas 简单入门 | [Medium]
Pandas 技巧 - 动态编程 | [pt-br] [Youtube]

人工智能基础

人工智能 - Zurubabel | [pt-br] [Youtube]
人工智能基础 - 数据科学学院 (DSA) | [pt-br]（免费）
机器学习与人工智能入门迷你课程 | 也可见于 diegonogare.net | [pt-br] [Youtube]

机器学习

面向数据科学家的机器学习 - LEG/UFPR/Eduardo Ferreira) | [pt-br] [Youtube]
机器学习入门 - Didática Tech) | [pt-br] [Youtube]
机器学习 - Zurubabel) | [pt-br] [Youtube]
机器学习算法 - Didática Tech) | [pt-br] [Youtube]
3个月内学会机器学习 - Siraj Raval | [英语] [Youtube]
黑客的机器学习 - Siraj Raval | [英语] [Youtube]
不列颠哥伦比亚大学的机器学习 | [英语][Youtube]
泰坦尼克号数据集的机器学习教程 | [pt-br] [Youtube]

神经网络/深度学习

UFG 深度学习课程 - Deep Learning Brasil | [pt-br] [Youtube]
葡萄牙语深度学习 - Sandeco | [pt-br] [Youtube]
UFG/Cyberlabs Academy 深度学习课程 | [pt-br] [Youtube]
葡萄牙语深度学习 - Zurubabel | [pt-br] [Youtube]
Python 中的机器学习 - 动态编程 | [Youtube]
人工智能与机器学习 - 离散宇宙 | [pt-br] [Youtube]
圣保罗大学课程 | 健康领域的人工智能：机器学习的应用 - Canal USP | [pt-br] [Youtube]
圣保罗大学人工神经网络 | [pt-br]
CS224N：使用深度学习进行自然语言处理 | 2019年冬季 [英语][Youtube]
MIT 6.S191：深度学习导论 [英语] [Youtube]
深度学习入门（Udacity Nanodegree）- Siraj Raval | [英语] [Youtube]
神经网络与深度学习（深度学习专项课程第一课）- Deepearning.ai | [英语] [Youtube]
实用深度学习（面向编码人员，第3版） | [英语] [Youtube]

数据科学

EstaTiDados 学习路径 – 数据科学（统计学、商业、故事讲述、仪表盘、机器学习、网页抓取、情感分析和大数据） | [pt-br]] [Youtube]
(大数据基础 2.0 - 数据科学学院 (DSA) | [pt-br]（免费）
应用数据科学 - 动态编程 | [Youtube]
微软 Power BI 用于数据科学 - 数据科学学院 (DSA) | [pt-br]（免费）
数据科学入门 2.0 - 数据科学学院 (DSA) | [pt-br]（免费）
Zuruba 的数据科学 - Zurubabel | [pt-br] [Youtube]
数据探索性分析 - Zurubabel | [pt-br] [Youtube]
按你的方式做数据科学 - Jose A Dianes/GitHub | [英语] [Youtube]

YouTube 频道

关于人工智能的各种内容。

包含挑战/问题的网站

优德米/优达学城/ Coursera 课程

有些是免费的（无证书），另一些则需要付费。

优德米

Coursera

优达学城

代码仓库

这些仓库包含内容、学习路径、技巧和练习，也就是说，它们拥有大量关于人工智能的资料。

初学者用数据集

(整理) * [UCI 机器学习库：数据集](https://archive.ics.uci.edu/ml/datasets.php) * [谷歌数据集搜索](https://datasetsearch.research.google.com/)

搭建作品集的建议

数据科学作品集必备的 5 种项目类型（成为数据科学家） | [YouTube] https://blog.academiain1.com.br/big-data-voce-conhece-os-4-tipos-de-analise-de-dados/ https://blog.toccato.com.br/aprenda-como-fazer-uma-analise-de-dados-eficiente-em-6-passos/ (整理) https://blog-in1-com-br.cdn.ampproject.org/v/s/blog.in1.com.br/como-criar-uma-modelagem-de-dados-de-forma-eficaz?hs_amp=true&amp_js_v=0.1#referrer=https%3A%2F%2Fwww.google.com&amp_tf=Fonte%3A%20%251%24s&ampshare=https%3A%2F%2Fblog.in1.com.br%2Fcomo-criar-uma-modelagem-de-dados-de-forma-eficaz (整理) https://sigmoidal.ai/guia-basico-de-pre-processamento-de-dados/ (整理) https://sigmoidal.ai/como-tratar-dados-ausentes-com-pandas/ https://medium.com/databootcamp/meu-checklist-de-projetos-de-aprendizado-de-m%C3%A1quina-34328850d7ab

数据科学自由职业者

如何成为数据科学自由职业者 - 马里奥·菲略

或多或少偏离主题的内容

代表性

对 Python 开发者有用网站

有用链接

播客

开源项目

指南：如何参与开源贡献

文章

materiais-de-estudos-sobre-data-science-deep-machine-learning 快速上手指南

注意：本项目并非一个可安装的软件工具或代码库，而是一个精选学习资源清单。它主要汇集了面向初学者的数据科学（Data Science）和机器学习（Machine Learning）学习资料，且内容绝大多数为葡萄牙语（PT-BR）。

因此，本指南将指导你如何获取并利用这份资源清单来构建你的学习路径，而非执行传统的软件安装命令。

1. 环境准备

由于本项目是文档和资源链接的集合，无需特定的操作系统或复杂的依赖环境。你只需要具备以下基础条件即可开始：

硬件要求：任意能运行浏览器的电脑（Windows, macOS, Linux）。
前置知识：
- 基础的计算机操作能力。
- 语言提示：原仓库资源主要为葡萄牙语。如果你不熟悉葡语，建议配合浏览器翻译插件（如 Chrome 自带翻译或 DeepL）使用，或者将其作为寻找通用技术概念（如 Python, Pandas, TensorFlow）的索引，再结合中文社区资料深入学习。
推荐工具：
- Git（用于克隆仓库到本地）
- Markdown 阅读器（可选，用于在本地舒适地阅读 README.md）
- Python 环境（当你跟随清单中的教程开始实践时需要，建议安装 Anaconda 或 Miniconda）

2. 获取资源步骤

你可以通过以下两种方式访问这份学习清单：

方式一：在线直接浏览（推荐）

直接访问 GitHub 仓库页面查看整理好的目录和链接：

仓库地址：materiais-de-estudos-sobre-data-science-deep-machine-learning

方式二：克隆到本地

如果你希望离线阅读或贡献内容，可以使用 Git 克隆仓库：

git clone https://github.com/WendelMarques/materiais-de-estudos-sobre-data-science-deep-machine-learning.git
cd materiais-de-estudos-sobre-data-science-deep-machine-learning

3. 基本使用指南

本项目的核心用法是按照目录结构制定学习计划。以下是基于仓库内容的推荐学习流程：

第一步：了解领域概况

在开始深入技术细节前，先阅读 "UM POUCO SOBRE A ÁREA" (关于该领域) 部分的文章，理解人工智能、机器学习和深度学习之间的区别。

行动：点击 README 中对应的 Medium 文章或播客链接进行科普阅读。

第二步：制定学习路线图

参考 "TRILHAS/ DICAS DE ESTUDOS/ ROADMAPS" (学习路径/建议/路线图) 章节。这里列出了多位从业者推荐的学习顺序。

行动：选择一条适合你当前水平的路线图（例如："Trilha para Cientista de Dados"），将其作为你的主学习大纲。

第三步：夯实数学与编程基础

根据路线图，进入 "Matemática" (数学) 和 "Linguagem Python" (Python 语言) 章节。

数学：涵盖从基础数学到机器学习专用数学的内容。

编程：重点学习 Python 及其数据科学库（Pandas, NumPy 等）。虽然链接多为葡语教程，但代码是通用的。

实践示例（跟随教程学习后，在本地 Python 环境中尝试）：

import pandas as pd

# 加载数据集 (参考仓库中 "Datasets para iniciantes" 部分获取数据)
df = pd.read_csv('seu_dataset.csv')

# 查看前几行数据
print(df.head())

# 进行简单的数据统计
print(df.describe())

第四步：进阶学习与实战

当掌握基础后，利用 "Fundamentos IA" (AI 基础) 和 "Sites com desafios/ problemas" (挑战/问题网站) 部分。

核心内容：机器学习算法、神经网络、深度学习框架（TensorFlow 等）。
实战：前往 Kaggle 或其他挑战网站，应用所学知识解决实际问题。仓库作者也分享了自己的项目案例（如 "Mapeamento de médias do ENEM"），可供参考。

第五步：构建作品集与求职

参考 "Dicas para montar portifólio" (作品集建议) 和 "Freelancer em Data Science" 部分，了解如何将你的练习项目转化为职业资本。

特别提示：由于该仓库资源主要针对巴西社区（PT-BR），对于中国开发者而言，最佳的“打开方式”是将其作为一个全面的主题索引。你可以利用它发现未知的优质概念或开源项目，然后利用这些关键词在中文社区（如知乎、CSDN、GitHub 中文区）或国际英文社区寻找更匹配你语言习惯的详细教程。

相似工具推荐

openclaw

OpenClaw 是一款专为个人打造的本地化 AI 助手，旨在让你在自己的设备上拥有完全可控的智能伙伴。它打破了传统 AI 助手局限于特定网页或应用的束缚，能够直接接入你日常使用的各类通讯渠道，包括微信、WhatsApp、Telegram、Discord、iMessage 等数十种平台。无论你在哪个聊天软件中发送消息，OpenClaw 都能即时响应，甚至支持在 macOS、iOS 和 Android 设备上进行语音交互，并提供实时的画布渲染功能供你操控。这款工具主要解决了用户对数据隐私、响应速度以及“始终在线”体验的需求。通过将 AI 部署在本地，用户无需依赖云端服务即可享受快速、私密的智能辅助，真正实现了“你的数据，你做主”。其独特的技术亮点在于强大的网关架构，将控制平面与核心助手分离，确保跨平台通信的流畅性与扩展性。 OpenClaw 非常适合希望构建个性化工作流的技术爱好者、开发者，以及注重隐私保护且不愿被单一生态绑定的普通用户。只要具备基础的终端操作能力（支持 macOS、Linux 及 Windows WSL2），即可通过简单的命令行引导完成部署。如果你渴望拥有一个懂你

★ 349.3k|★★★☆☆|昨天

Agent开发框架图像

stable-diffusion-webui

stable-diffusion-webui 是一个基于 Gradio 构建的网页版操作界面，旨在让用户能够轻松地在本地运行和使用强大的 Stable Diffusion 图像生成模型。它解决了原始模型依赖命令行、操作门槛高且功能分散的痛点，将复杂的 AI 绘图流程整合进一个直观易用的图形化平台。无论是希望快速上手的普通创作者、需要精细控制画面细节的设计师，还是想要深入探索模型潜力的开发者与研究人员，都能从中获益。其核心亮点在于极高的功能丰富度：不仅支持文生图、图生图、局部重绘（Inpainting）和外绘（Outpainting）等基础模式，还独创了注意力机制调整、提示词矩阵、负向提示词以及“高清修复”等高级功能。此外，它内置了 GFPGAN 和 CodeFormer 等人脸修复工具，支持多种神经网络放大算法，并允许用户通过插件系统无限扩展能力。即使是显存有限的设备，stable-diffusion-webui 也提供了相应的优化选项，让高质量的 AI 艺术创作变得触手可及。

★ 162.1k|★★★☆☆|2天前

开发框架图像Agent

everything-claude-code

everything-claude-code 是一套专为 AI 编程助手（如 Claude Code、Codex、Cursor 等）打造的高性能优化系统。它不仅仅是一组配置文件，而是一个经过长期实战打磨的完整框架，旨在解决 AI 代理在实际开发中面临的效率低下、记忆丢失、安全隐患及缺乏持续学习能力等核心痛点。通过引入技能模块化、直觉增强、记忆持久化机制以及内置的安全扫描功能，everything-claude-code 能显著提升 AI 在复杂任务中的表现，帮助开发者构建更稳定、更智能的生产级 AI 代理。其独特的“研究优先”开发理念和针对 Token 消耗的优化策略，使得模型响应更快、成本更低，同时有效防御潜在的攻击向量。这套工具特别适合软件开发者、AI 研究人员以及希望深度定制 AI 工作流的技术团队使用。无论您是在构建大型代码库，还是需要 AI 协助进行安全审计与自动化测试，everything-claude-code 都能提供强大的底层支持。作为一个曾荣获 Anthropic 黑客大奖的开源项目，它融合了多语言支持与丰富的实战钩子（hooks），让 AI 真正成长为懂上

★ 143.9k|★★☆☆☆|今天

开发框架Agent语言模型

ComfyUI

ComfyUI 是一款功能强大且高度模块化的视觉 AI 引擎，专为设计和执行复杂的 Stable Diffusion 图像生成流程而打造。它摒弃了传统的代码编写模式，采用直观的节点式流程图界面，让用户通过连接不同的功能模块即可构建个性化的生成管线。这一设计巧妙解决了高级 AI 绘图工作流配置复杂、灵活性不足的痛点。用户无需具备编程背景，也能自由组合模型、调整参数并实时预览效果，轻松实现从基础文生图到多步骤高清修复等各类复杂任务。ComfyUI 拥有极佳的兼容性，不仅支持 Windows、macOS 和 Linux 全平台，还广泛适配 NVIDIA、AMD、Intel 及苹果 Silicon 等多种硬件架构，并率先支持 SDXL、Flux、SD3 等前沿模型。无论是希望深入探索算法潜力的研究人员和开发者，还是追求极致创作自由度的设计师与资深 AI 绘画爱好者，ComfyUI 都能提供强大的支持。其独特的模块化架构允许社区不断扩展新功能，使其成为当前最灵活、生态最丰富的开源扩散模型工具之一，帮助用户将创意高效转化为现实。

★ 107.9k|★★☆☆☆|昨天

开发框架图像Agent

markitdown

MarkItDown 是一款由微软 AutoGen 团队打造的轻量级 Python 工具，专为将各类文件高效转换为 Markdown 格式而设计。它支持 PDF、Word、Excel、PPT、图片（含 OCR）、音频（含语音转录）、HTML 乃至 YouTube 链接等多种格式的解析，能够精准提取文档中的标题、列表、表格和链接等关键结构信息。在人工智能应用日益普及的今天，大语言模型（LLM）虽擅长处理文本，却难以直接读取复杂的二进制办公文档。MarkItDown 恰好解决了这一痛点，它将非结构化或半结构化的文件转化为模型“原生理解”且 Token 效率极高的 Markdown 格式，成为连接本地文件与 AI 分析 pipeline 的理想桥梁。此外，它还提供了 MCP（模型上下文协议）服务器，可无缝集成到 Claude Desktop 等 LLM 应用中。这款工具特别适合开发者、数据科学家及 AI 研究人员使用，尤其是那些需要构建文档检索增强生成（RAG）系统、进行批量文本分析或希望让 AI 助手直接“阅读”本地文件的用户。虽然生成的内容也具备一定可读性，但其核心优势在于为机器

★ 93.4k|★★☆☆☆|昨天

插件开发框架

LLMs-from-scratch

LLMs-from-scratch 是一个基于 PyTorch 的开源教育项目，旨在引导用户从零开始一步步构建一个类似 ChatGPT 的大型语言模型（LLM）。它不仅是同名技术著作的官方代码库，更提供了一套完整的实践方案，涵盖模型开发、预训练及微调的全过程。该项目主要解决了大模型领域“黑盒化”的学习痛点。许多开发者虽能调用现成模型，却难以深入理解其内部架构与训练机制。通过亲手编写每一行核心代码，用户能够透彻掌握 Transformer 架构、注意力机制等关键原理，从而真正理解大模型是如何“思考”的。此外，项目还包含了加载大型预训练权重进行微调的代码，帮助用户将理论知识延伸至实际应用。 LLMs-from-scratch 特别适合希望深入底层原理的 AI 开发者、研究人员以及计算机专业的学生。对于不满足于仅使用 API，而是渴望探究模型构建细节的技术人员而言，这是极佳的学习资源。其独特的技术亮点在于“循序渐进”的教学设计：将复杂的系统工程拆解为清晰的步骤，配合详细的图表与示例，让构建一个虽小但功能完备的大模型变得触手可及。无论你是想夯实理论基础，还是为未来研发更大规模的模型做准备

★ 90.1k|★★★☆☆|昨天

语言模型图像Agent

使用场景

没有 materiais-de-estudos-sobre-data-science-deep-machine-learning 时

使用 materiais-de-estudos-sobre-data-science-deep-machine-learning 后

运行环境要求

快速开始

数据科学与机器学习学习资料（入门级）

内容列表

我的学习路径/旅程

关于该领域的简介

学习动机

学习路径/学习建议/路线图

随着学习进展可使用的内容

免费与付费书籍

数学

数学基础

数据科学中的数学

机器学习/深度学习中的数学

Python语言

R语言

部分库的相关课程

TensorFlow

Pandas

人工智能基础

机器学习

神经网络/深度学习

数据科学

YouTube 频道

包含挑战/问题的网站

优德米/优达学城/ Coursera 课程

优德米

Coursera

优达学城

代码仓库

初学者用数据集

搭建作品集的建议

数据科学自由职业者

或多或少偏离主题的内容

代表性

对 Python 开发者有用网站

有用链接

播客

开源项目

文章

materiais-de-estudos-sobre-data-science-deep-machine-learning 快速上手指南

1. 环境准备

2. 获取资源步骤

方式一：在线直接浏览（推荐）

方式二：克隆到本地

3. 基本使用指南

第一步：了解领域概况

第二步：制定学习路线图

第三步：夯实数学与编程基础

第四步：进阶学习与实战

第五步：构建作品集与求职

相似工具推荐

openclaw

stable-diffusion-webui

everything-claude-code

ComfyUI

markitdown

LLMs-from-scratch