awesome-data-analysis

GitHub
978 128 非常简单 1 次阅读 今天CC0-1.0数据工具Agent其他开发框架图像
AI 解读 由 AI 自动生成,仅供参考

awesome-data-analysis 是一个专为数据分析和数据科学领域打造的精选资源库,汇集了超过 500 个高质量的学习资料、工具库、路线图、速查表及面试指南。面对数据科学领域技术栈繁杂、学习资源分散的痛点,它将原本零散的信息进行了系统化梳理与分类,帮助用户快速定位所需内容。

该资源库覆盖面极广,不仅包含 Python、SQL、统计学基础等核心技能,还深入探讨了机器学习、MLOps、自然语言处理、时间序列分析以及云端基础设施等进阶主题。其独特的亮点在于结构清晰,从基础的数据清洗、可视化到复杂的工程化部署应有尽有,同时提供了专门的生产力提升建议(如 VS Code 插件)和职业发展指导。

无论是刚入门希望建立知识体系的新手,还是寻求高效解决方案的资深工程师、研究人员,都能从中获益。对于准备求职面试的从业者,这里整理的实战笔记和面试题更是宝贵的备考资料。awesome-data-analysis 致力于让数据探索之路更加高效顺畅,是每一位数据工作者值得收藏的“导航地图”。

使用场景

某电商公司的初级数据分析师小李,正面临紧急任务:需要在两天内完成对用户流失数据的探索性分析(EDA)并构建预测模型,但他对技术栈选型和高效工具链缺乏系统认知。

没有 awesome-data-analysis 时

  • 资源检索低效:在谷歌和 GitHub 上盲目搜索"Python EDA 库”或“时间序列教程”,耗费大量时间筛选过时或质量参差不齐的内容。
  • 技术盲区明显:不知道存在 ydata-profiling 等自动化 EDA 工具,仍手动编写重复的代码绘制基础分布图,严重拖慢进度。
  • 学习路径混乱:面对机器学习、SQL 优化和 MLOps 等众多领域,缺乏清晰的路线图(Roadmap),不知该优先补充哪项技能以解决当前瓶颈。
  • 面试与实战脱节:手头只有零散的代码片段,缺乏系统的速查表(Cheatsheets)和面试指南,难以将理论知识快速转化为可落地的解决方案。

使用 awesome-data-analysis 后

  • 一站式精准获取:直接通过其 curated 列表找到经过社区验证的 500+ 资源,瞬间锁定最适合电商场景的 Pandas 高级技巧和 Scikit-learn 最佳实践。
  • 工具链全面升级:在"Automated EDA"板块发现并应用了自动化可视化工具,将原本需要半天的数据清洗与绘图工作压缩至 1 小时内完成。
  • 成长路径清晰:参考"Roadmaps"章节规划了从数据清洗到模型部署的学习顺序,并利用"Interview Prep"资源快速补齐统计学假设检验的知识短板。
  • 效率显著提升:借助详细的速查表和精选 Jupyter Notebook 案例,快速复用了成熟的特征工程代码,确保了项目按时高质量交付。

awesome-data-analysis 不仅是一个资源清单,更是数据科学家从迷茫摸索走向高效实战的加速器和导航仪。

运行环境要求

操作系统
  • Linux
  • macOS
  • Windows
GPU

未说明

内存

未说明

依赖
notes该项目是一个 curated list(资源清单),本身不是一个可执行的软件工具,因此没有特定的运行环境、GPU 或内存需求。它列出了用于数据分析的各种工具、库和学习资源(主要基于 Python 生态)。用户需根据清单中具体选择的某个工具或库去查阅其各自的环境要求。
python未说明
pandas
numpy
polars
dask
vaex
scikit-learn
matplotlib
seaborn
jupyter
sqlalchemy
awesome-data-analysis hero image

快速开始

令人惊叹的数据分析 Awesome

网页 欢迎提交PR CC0

500+ 精选数据分析与数据科学资源:工具、库、学习路线图、速查表、面试指南等。

📖 为了更舒适的阅读体验: 网页版

🌱 想要改进吗? 在此提出建议欢迎参与讨论

🌟 让我们一起让数据分析更加高效!GitHub 星标

用心维护


📑 目录


🏆 优秀数据科学仓库

精心挑选的高质量 GitHub 仓库集合,供您获取灵感和学习参考。

⬆ 返回目录


🗺️ 路线图

逐步指南和技能树,助你掌握数据科学和分析。

⬆ 返回目录


🐍 Python

资源

用于学习和精通Python编程的资源合集。

⬆ 返回目录


使用Pandas和NumPy进行数据处理

关于如何使用Pandas和NumPy的教程及最佳实践。

⬆ 返回目录


用于数据分析的实用Python工具

一系列用于高效数据处理、清洗、可视化、验证和分析的Python库。

数据处理与转换

  • Pandas - 功能强大的 Python 数据分析与操作库,提供灵活的数据结构。
  • NumPy - Python 中用于科学计算的基础包,支持多维数组。
  • Pandas DQ - 用于数据类型校正和 DataFrame 自动清洗的工具。
  • Vaex - 高性能的 Python 库,支持惰性加载的大规模 DataFrame。
  • Polars - 面向 DataFrame 的多线程、向量化查询引擎。
  • Fugue - 提供 Pandas、Spark 和 Dask 的统一接口。
  • TheFuzz - 模糊字符串匹配(Levenshtein 距离)。
  • DateUtil - 扩展标准 Python datetime 功能的工具。
  • Arrow - 增强日期和时间处理功能。
  • Pendulum - 支持时区的 datetime 替代品。
  • Dask - 用于数组和 DataFrame 的并行计算框架。
  • Modin - 通过分布式计算加速 Pandas。
  • Pandarallel - 为 Pandas DataFrame 提供并行操作。
  • DataCleaner - 自动清理和准备数据集的 Python 工具。
  • Pandas Flavor - 为 Pandas 添加自定义方法。
  • Pandas DataReader - 从各种在线源读取数据到 Pandas DataFrame。
  • Sklearn Pandas - 连接 Pandas 和 Scikit-learn 的桥梁。
  • CuPy - 一个兼容 NumPy 的数组库,利用 NVIDIA CUDA 加速高性能计算。
  • Numba - 一种 JIT 编译器,可将 Python 和 NumPy 的子集代码转换为高效的机器码。
  • Pandas Stubs - Pandas 的类型存根文件,改善 IDE 自动补全功能。
  • Petl - 用于数据清洗和转换的 ETL 工具。

⬆ 返回目录


自动化 EDA 和可视化工具

  • AutoViz - 一行代码即可实现自动数据可视化。
  • Sweetviz - 自动 EDA 并支持数据集比较。
  • Lux - 在 Jupyter 中自动可视化 DataFrame。
  • YData Profiling - 数据质量剖析与探索性数据分析。
  • Missingno - 可视化缺失数据模式。
  • Vizro - 低代码工具箱,用于构建数据可视化应用。
  • Yellowbrick - 机器学习的可视化诊断工具。
  • Great Tables - 使用 Python 创建精美的展示表格。
  • DataMapPlot - 制作精美的数据地图图表。
  • Datashader - 快速且准确地渲染超大规模数据。
  • PandasAI - 使用 LLM 和 RAG 进行对话式数据分析。
  • Mito - Jupyter 扩展,提升代码编写效率。
  • D-Tale - 浏览器中的交互式数据可视化界面。
  • Pandasgui - 用于查看和筛选 DataFrame 的 GUI。
  • PyGWalker - 用于 DataFrame 可视化分析的交互式 UI。
  • QGrid - Jupyter 中的交互式 DataFrame 网格。
  • Pivottablejs - 在 Jupyter 中使用交互式 PivotTable.js 表格。

⬆ 返回目录


数据质量与验证

  • PyOD - 异常值与异常检测。
  • Alibi Detect - 异常值、对抗样本及数据漂移检测。
  • Pandera - 通过声明式模式进行数据验证。
  • Cerberus - 基于模式的数据验证。
  • Pydantic - 使用 Python 类型注解进行数据验证。
  • Dora - 自动化 EDA:预处理、特征工程、可视化。
  • Great Expectations - 数据验证与测试。

⬆ 返回目录


特征工程与选择

⬆ 返回目录


专用数据工具

  • cuDF - 一个用于加载、连接和聚合数据的 GPU DataFrame 库。
  • Faker - 生成用于测试的虚假数据。
  • Mimesis - 生成逼真的测试数据。
  • Geopy - 地理编码地址并计算距离。
  • PySAL - 空间分析函数。
  • Scattertext - 文档类型之间语言差异的精美可视化。
  • IGraph - 用于创建和操作图与网络的库,提供多种语言的绑定。
  • Joblib - Python 的轻量级流水线库,特别适用于保存和加载大型 NumPy 数组。
  • ImageIO - 提供简单接口来读取和写入各种图像数据的库。
  • Texthero - 文本预处理、表示和可视化。
  • Geopandas - 使用 pandas 进行地理数据操作。
  • NetworkX - 网络分析与图论。
  • Chardet - 用于检测文本和文件字符编码的 Python 库。

⬆ 返回目录


🗃️ SQL 与数据库

资源

SQL 教程和数据库设计原则。

⬆ 返回目录


工具

一系列用于无缝访问和操作数据库的库和驱动程序。

  • PyODBC - 用于 ODBC 数据库访问的 Python 库。
  • SQLAlchemy - Python 的 SQL 工具包和 ORM。
  • Psycopg2 - PostgreSQL 数据库适配器。
  • MySQL Connector/Python - Python 的 MySQL 驱动程序。
  • PonyORM - 支持动态查询生成的 Python ORM。
  • PyMongo - 官方的 MongoDB Python 驱动程序。
  • SQLiteviz - 用于探索 SQLite 数据库并可视化查询结果的工具。
  • SQLite - 用 C 语言实现的小型、快速、自包含、高可靠性且功能齐全的 SQL 数据库引擎。
  • DB Browser for SQLite - 高质量、可视化、开源的工具,可用于创建、设计和编辑与 SQLite 兼容的数据库文件。
  • DBeaver - 开发人员、SQL 程序员和管理员使用的免费通用数据库工具和 SQL 客户端。
  • Beekeeper Studio - 现代、易用的 SQL 客户端和数据库管理器,具有简洁的跨平台界面。
  • SQLFluff - 模块化的 SQL 静态分析工具和自动格式化工具,旨在强制执行一致的代码风格并捕获 SQL 代码中的错误。
  • PyMySQL - 纯 Python 实现的 MySQL 客户端库,用于从 Python 应用程序中与 MySQL 数据库交互。
  • Vanna.AI - 基于 AI 的工具,可根据自然语言问题生成 SQL 查询。
  • SQLChat - 基于聊天的 SQL 客户端,允许用户使用自然语言对话查询数据库。
  • Records - 通过 Python 语法向数据库执行 SQL 查询。
  • Dataset - 类似 JSON 的接口,用于操作 SQL 数据库。
  • SQLGlot - 无依赖的 SQL 解析器、转译器和优化器,专为 Python 设计。
  • TDengine - 开源大数据平台,专为时序数据、物联网和工业监控设计。
  • TimescaleDB - 开源的时序 SQL 数据库,针对快速数据插入和复杂查询进行了优化。
  • DuckDB - 内存中的分析型数据库,用于快速执行 SQL 查询。

⬆ 返回目录


📊 数据可视化

资源

色彩理论、图表选择指南和故事讲述技巧。

⬆ 返回目录


工具

用于静态、交互式和3D可视化的库。

  • Matplotlib - 一个功能全面的Python库,可用于创建静态、动画和交互式可视化。
  • Seaborn - 一个基于Matplotlib的统计数据可视化库。
  • Plotly - 一个用于创建交互式图表和仪表板的库。
  • Altair - 一个声明式的Python统计可视化库。
  • Bokeh - 一个用于在现代浏览器中创建交互式可视化的库。
  • HoloViews - 一个可以轻松构建复杂可视化工具。
  • Geopandas - Pandas的一个扩展,专门处理地理空间数据。
  • Folium - 一个用于在交互式地图上可视化数据的库。
  • Pygal - 一个Python SVG图表库。
  • Plotnine - 一个适用于Python的图形语法库。
  • Bqplot - 一个适用于IPython/Jupyter笔记本的绘图库。
  • PyPalettes - 一个包含超过2500种颜色映射的Python库。
  • Deck.gl - 一个基于WebGL的框架,用于对大型数据集进行视觉化探索性数据分析。
  • Python for Geo - Contextily:为GeoPandas中的图表添加背景底图。
  • OSMnx - 一个方便从OpenStreetMap下载、建模、分析和可视化街道网络的软件包。
  • Apache ECharts - 一个功能强大、交互式的图表和可视化库,适用于基于浏览器的应用程序。
  • VisPy - 一个高性能的交互式2D/3D数据可视化库,利用OpenGL的强大功能。
  • Glumpy - 一个基于OpenGL的Python科学可视化库,速度快、可扩展且美观。
  • Pandas-bokeh - Bokeh的Pandas绘图后端。
  • QGIS - 一个免费、开源、跨平台的地理信息系统(GIS)。
  • Flourish - 一个无需编码即可创建交互式数据可视化和故事的平台。

⬆ 返回目录


📈 仪表板与商业智能

资源

使用各种工具和框架构建及优化仪表板和可视化效果的教程。

⬆ 返回目录


工具

用于构建自定义仪表板解决方案的框架。

  • Dash - 用于创建交互式Web应用的框架。
  • Streamlit - 简化的数据应用开发框架。
  • Panel - 用于创建自定义交互式Web应用和仪表板的Python库。
  • Gradio - 用于创建和分享机器学习应用的工具。
  • OpenSearch Dashboards - 面向OpenSearch数据的强大数据可视化与仪表板工具,由Kibana分叉而来。
  • GridStack.js - 用于构建可拖拽、可调整大小且响应式的仪表板布局的库。
  • Tremor - 基于React的库,通过预构建的图表、KPI等组件快速搭建仪表板。
  • Appsmith - 开源平台,可快速构建和部署内部工具、管理面板及CRUD应用。
  • Grafanalib - 用于以代码形式生成Grafana仪表板配置的Python库。
  • H2O Wave - Python框架,用于快速构建和部署面向AI与分析的实时Web应用和仪表板。
  • Shiny for Python - 流行R Shiny框架的Python版本。
  • Voilà - 将Jupyter笔记本转换为独立的Web应用。
  • Reflex - 用于构建Web应用的全栈Python框架。
  • Taipy - 用于构建Web应用和交互式仪表板的Python库。
  • Evidence - 使用SQL和Markdown生成报表的商业智能平台。

⬆ 返回目录


软件

用于数据可视化和仪表板创建的领先工具与平台列表。

  • Tableau - 领先的数据可视化软件。
  • Microsoft Power BI - 用于数据可视化的商业分析工具。
  • QlikView - 数据可视化与商业智能工具。
  • Metabase - 用户友好的开源BI工具。
  • Apache Superset - 开源的数据探索与可视化平台。
  • Preset - 提供Apache Superset托管版本的现代商业智能平台。
  • Metabase - 为公司内所有人提供分析与商业智能的最简单方式。
  • Redash - 用于可视化和共享数据洞察的工具。
  • Grafana - 仪表板与监控工具。
  • Datawrapper - 用户友好的图表和地图制作工具。
  • ChartBlocks - 在线图表制作平台。
  • Infogram - 用于创建信息图和可视化内容的工具。
  • Google Data Studio - 免费的交互式仪表板和报告制作工具。
  • Rath - 新一代自动化数据探索与可视化平台。
  • Kibana - Elastic Stack(Elasticsearch、Logstash、Beats)的官方可视化与仪表板工具。

⬆ 返回目录


🕸️ 网页抓取与爬虫

资源

使用Python进行网页抓取的宝贵资源、教程和库集合。

⬆ 返回目录


工具

用于网络爬虫的库和工具列表。

  • Requests - 一个简单而优雅的 Python HTTP 库。
  • BeautifulSoup - 用于解析 HTML 和 XML 文档的库。
  • Selenium - 一个用于测试目的的 Web 应用程序自动化工具。
  • Scrapy - 一个开源且协作式的 Python 网络爬虫框架。
  • Browser Use - 一个用于浏览器自动化和网络爬取的库。
  • Gerapy - 基于 Scrapy、Scrapyd、Django 和 Vue.js 的分布式爬虫管理框架。
  • AutoScraper - 一个智能、自动、快速且轻量级的 Python 网络爬虫。
  • Feedparser - 一个用于在 Python 中解析信息源的库。
  • Trafilatura - 一个用于在网络上收集文本和元数据的 Python 及命令行工具。
  • You-Get - 一个小型命令行实用程序,用于从网上下载媒体内容(视频、音频、图片)。
  • MechanicalSoup - 一个用于自动化与网站交互的 Python 库。
  • ScrapeGraph AI - 一个基于 AI 的 Python 爬虫。
  • Snscrape - 一个用 Python 编写的社交网络服务爬虫。
  • Ferret - 一个网络爬取系统,允许你使用简单的查询语言声明式地描述要提取的数据。
  • Grab - 一个用于构建网络爬虫应用的 Python 框架,提供用于异步请求的高级 API。
  • Playwright - Playwright 浏览器自动化库的 Python 版本。
  • PyQuery - 一个类似于 jQuery 的库,用于在 Python 中解析 HTML 文档。
  • Helium - 一个高层次的 Selenium 封装,便于进行 Web 自动化。
  • Scrapling - 一个用于构建网络爬虫和抓取器的框架。
  • Crawl4AI - 一个专为 AI 和数据提取任务设计的高级网络爬虫框架。

回到目录


🔢 数学

一系列学习数学的资源,特别是在数据科学和机器学习背景下的资源。

回到目录


🎲 统计学与概率论

资源

一系列专注于统计学和概率论的资源,包括教程和综合指南。

回到目录


工具

专注于统计与概率的工具集合。

  • SciPy - 科学计算和统计的基础库。
  • Statsmodels - 用于统计建模、检验及数据探索。
  • PyMC - Python中的概率编程库,支持灵活的贝叶斯建模。
  • Pingouin - 相较于SciPy,具有更好易用性的统计包。
  • scikit-posthocs - 用于数据分析的事后检验工具。
  • Lifelines - Python中的生存分析与事件历史分析工具。
  • scikit-survival - 基于scikit-learn的生存分析库,用于时间至事件预测。
  • Bootstrap - 用于自助法置信区间估计的方法。
  • PyStan - Stan的Python接口,用于贝叶斯统计建模。
  • ArviZ - 提供可视化诊断的贝叶斯模型探索性分析工具。
  • PyGAM - Python库,用于广义加性模型,内置平滑与正则化功能。
  • NumPyro - 基于JAX的概率编程库,适用于高性能贝叶斯建模。
  • Causal Impact - R包的Python实现,利用贝叶斯结构化时间序列模型进行因果推断。
  • DoWhy - Python库,支持显式建模与检验因果假设。
  • Patsy - 用于描述统计模型并构建设计矩阵的Python库。
  • Pomegranate - 快速且灵活的Python概率建模库,支持GPU加速。
  • Pgmpy - 使用图模型进行概率与因果推理的Python库。

⬆ 返回目录


🧪 A/B测试

专注于A/B测试的相关资源集合。

⬆ 返回目录


⏳ 时间序列分析

资源

用于理解时间序列基础及分析技术的资源集合。

⬆ 返回目录


工具

用于处理时间数据的工具集合。

  • Facebook Prophet - 基于加法模型的时间序列预测程序。
  • Uber Orbit - 用于贝叶斯时间序列预测与推断的Python包。
  • sktime - 与scikit-learn兼容的统一时间序列机器学习框架。
  • GluonTS - 基于MXNet的概率时间序列建模工具包。
  • Time-Series-Library - 用于基于深度学习的时间序列分析与预测的库。
  • TimesFM - Google Research推出的预训练时间序列基础模型,可用于零样本预测。
  • PyTorch Forecasting - 基于PyTorch的神经网络时间序列预测库。
  • Time-series-prediction - 时间序列预测方法与实现的集合。
  • PlotJuggler - 实时可视化与分析时间序列数据日志的工具。
  • TSFresh - 自动从时间序列数据中提取特征。
  • pmdarima - 用于ARIMA建模及时间序列分析的Python库。
  • Kats - Facebook Research推出的时间序列数据分析工具包。

⬆ 返回目录


⚙️ 数据工程

资源

一系列资源,帮助您构建和管理健壮的数据管道与基础设施。

⬆ 返回目录


工具

一系列用于构建、部署和管理数据管道与基础设施的工具。

  • dbt-core - 一个使用SQL和Jinja在数据仓库中进行数据转换的框架。
  • Apache Spark - 一个用于大规模数据处理和分析的统一引擎。
  • Apache Kafka - 一个分布式事件流平台,用于构建实时数据管道。
  • Dagster - 一个用于机器学习、数据分析和ETL的数据编排工具。
  • Apache Airflow - 一个用于以编程方式编写、调度和监控工作流的平台。
  • Apache Hive - 一个数据仓库软件,允许使用SQL读取、写入和管理分布在分布式存储中的大型数据集。
  • Apache Hadoop - 一个框架,可在计算机集群上对大型数据集进行分布式处理。
  • Luigi - 一个用于构建复杂且批处理型数据管道的Python模块。
  • Apache Iceberg - 一种用于超大规模分析数据集的高性能表格式。
  • Apache Cassandra - 一个高度可扩展的分布式NoSQL数据库,专为在大量商品化服务器上处理海量数据而设计。
  • Apache Flink - 一个用于无界和有界数据流上的状态化计算框架(实时流处理)。
  • Apache Beam - 一个用于定义批处理和流式数据并行处理管道的统一模型。
  • Apache Pulsar - 一个云原生的分布式消息传递和流媒体平台。
  • Delta Lake - 一个存储层,为Apache Spark和大数据工作负载带来ACID事务特性。
  • Apache Hudi - 一个开放的数据湖仓平台,基于高性能的开放表格式构建。
  • Trino - 一个分布式SQL查询引擎,专为快速查询大型数据集而设计。
  • DataHub - 一个面向现代数据栈的元数据平台。
  • OpenLineage - 一个用于收集和分析数据血缘关系的开放框架。
  • Kedro - 一个用于创建可重复、可维护且模块化的数据科学代码的框架。
  • Apache Calcite - 一个动态数据管理框架,支持SQL解析、优化和联邦查询。
  • Prefect - 一个用于构建弹性数据管道的工作流编排工具。
  • Apache Arrow - 一种通用的列式数据格式及多语言工具箱,用于高效的数据交换。
  • Kestra - 一个开源的事件驱动型编排工具,简化数据工作流管理。
  • Conductor - 一个用于运行复杂多步骤工作流和业务流程的编排引擎。

⬆ 返回目录


📖 自然语言处理(NLP)

资源

一些用于学习和应用Python中自然语言处理技术的资源。

⬆ 返回目录


工具

一系列用于自然语言处理的强大库和框架。

  • Natural Language Toolkit (NLTK) - 一个用于构建处理人类语言数据的 Python 程序的领先平台。
  • TextBlob - 一个用于处理文本数据的简单库。
  • SpaCy - 一个用于 Python 中高级 NLP 的开源软件库。
  • BERT - 一个基于 Transformer 的 NLP 任务模型。
  • Flair - 一个用于最先进 NLP 的简单框架。
  • OpenHands - 一个用于构建大型语言模型应用的库和框架。
  • Stanford CoreNLP - 一套 Java 核心 NLP 工具,提供基础的语言分析能力。
  • John Snow Labs Spark-NLP - 基于 Apache Spark 构建的最先进的自然语言处理库。
  • TextAttack - 一个用于 NLP 中对抗攻击、数据增强和模型训练的 Python 框架。
  • Gensim - 一个用于 Python 的主题建模和自然语言处理库。
  • Stanza - 来自斯坦福 NLP 小组的多语言 Python NLP 库。
  • SentenceTransformers - 一个用于最先进句子和文本嵌入的框架。
  • LangExtract - 谷歌使用语言模型从文本中提取结构化信息的库。
  • Rasa - 一个用于构建上下文感知 AI 助手和聊天机器人的开源框架。

⬆ 返回目录


🤖 机器学习与人工智能

资源

一系列帮助您学习和应用机器学习概念与技术的资源。

⬆ 返回目录


工具

用于开发和部署机器学习模型的一系列工具。

机器学习

  • Scikit-learn - 经典算法和模型构建的机器学习库。
  • XGBoost - 针对基于树的模型优化的分布式梯度提升库。
  • LightGBM - 快速、分布式、高性能的梯度提升框架。
  • CatBoost - 支持分类特征的高性能梯度提升决策树。
  • H2O-3 - 开源分布式机器学习平台。
  • cuML - RAPIDS 提供的 GPU 加速机器学习算法。
  • dlib - 包含机器学习算法和工具的现代 C++ 工具包。
  • SHAP - 基于博弈论的方法,用于解释任何机器学习模型的输出。
  • InterpretML - 拟合可解释模型并解释黑盒机器学习。
  • Optuna - 超参数优化框架。

深度学习

  • TensorFlow - 用于机器学习和深度学习的端到端开源平台。
  • PyTorch - 强有力支持研究与生产的深度学习框架。
  • PyTorch Lightning - 用于高性能 AI 研究的 PyTorch 封装。
  • PyTorch Ignite - 帮助训练和评估神经网络的高级库。
  • Keras - 运行在 TensorFlow 之上的高级神经网络 API。
  • Fast.ai - 简化快速且准确训练神经网络的深度学习库。
  • HuggingFace Transformers - 用于最先进机器学习模型的模型定义框架。
  • HuggingFace Diffusers - 用于最先进的预训练扩散模型的库。
  • PEFT - 用于高效微调大型预训练模型的库。
  • YOLOv5 - 实时目标检测系统。
  • Ultralytics - YOLOv8 及其他计算机视觉模型。
  • ONNX - 用于机器学习互操作性的开放标准。
  • PyTorch Geometric - PyTorch 的几何深度学习扩展库。
  • Pyro - 结合 Python 和 PyTorch 的深度通用概率编程。
  • Skorch - 与 Scikit-learn 兼容的神经网络库。
  • Sonnet - DeepMind 用于构建复杂神经网络的库。
  • JAX - 对 Python + NumPy 程序进行可组合变换:求导、向量化、编译为 GPU/TPU 等。
  • TensorFlow Models - TensorFlow 官方仓库,包含模型和示例。
  • Fenn - 一个简单的框架,通过提供预制的训练器、模板、日志记录、配置管理等功能,自动化 ML/DL 工作流。

回到目录


🚀 MLOps

资源

用于机器学习运维的材料和精选列表。

回到目录


工具

用于部署、监控和维护机器学习系统的平台和实用工具。

  • ColossalAI - 高性能分布式训练框架。
  • DVC - 适用于机器学习项目的版本控制系统。
  • Evidently - 用于分析和监控数据及模型漂移的工具。
  • Deepchecks - 用于机器学习模型和数据验证的工具。
  • Sematic - 使用原生 Python 构建、调试和执行机器学习流水线的工具。
  • netdata - 实时性能监控工具。
  • meilisearch - 快速的开源搜索引擎。
  • vLLM - 面向大语言模型的高吞吐量、内存高效的推理库。
  • haystack - 用于构建搜索和问答系统的 LLM 框架。
  • Kubeflow - 面向 Kubernetes 的机器学习工具包。
  • Seldon Core - 用于在生产环境中部署和监控机器学习模型的开源平台。
  • Feast - 机器学习特征存储,负责管理和为模型提供特征数据。
  • BentoML - 用于构建、交付和扩展机器学习应用的框架。
  • MLflow - 用于管理机器学习完整生命周期的开源平台。
  • Wandb - 用于实验跟踪、数据集版本控制和模型管理的工具。
  • Comet ML - 用于跟踪、比较和优化机器学习实验的平台。
  • Netflix Metaflow - 一种人性化的 Python 库,帮助科学家和工程师构建并管理实际的数据科学项目。
  • mindsdb - 将 AI 集成到数据库和应用程序中的平台。
  • KServe - 标准化的无服务器推理平台,用于在 Kubernetes 上部署和提供机器学习模型服务。
  • SQLFlow - 为 SQL 引入机器学习功能,允许使用 SQL 语法进行模型训练和预测。
  • Jina AI Serve - 用于构建和部署通过 gRPC、HTTP 和 WebSockets 进行通信的 AI 服务的框架。
  • LiteLLM - 统一接口,可调用所有 LLM API(OpenAI、Anthropic、Cohere 等),并保持一致的输出格式。

⬆ 返回目录


🧠 人工智能应用与平台

资源

专注于AI应用和平台的资源合集。

⬆ 返回目录


工具

用于构建和部署AI驱动解决方案的框架、平台和终端用户应用合集。

AI智能体与自动化

  • n8n - 用于连接 API 和服务的工作流自动化平台。
  • crewAI - 用于编排角色扮演型 AI 代理的框架。
  • autogen - 用于构建多智能体对话系统的框架。
  • AutoGPT - 能够完成复杂任务的自主 AI 代理。
  • LangGraph - 使用 LLM 构建具有状态和多主体应用的框架,支持循环和控制流。
  • Agents.md - 用于构建智能体式 AI 系统的开源框架。
  • OpenManus - 用于构建和部署 AI 代理的开源平台。
  • youtu-agent - 腾讯云推出的多模态智能代理框架。
  • trae-agent - 具有执行增强推理能力的工具使用型推理代理。
  • deepagents - LangChain 框架,用于构建复杂的多智能体系统。
  • mem0 - 用于长期上下文和个性化交互的 AI 记忆系统。
  • web-ui - 基于 AI 的浏览器自动化框架,用于网页交互。
  • Agent-S - 开源智能体框架,能够像人类一样自主与计算机 GUI 交互。
  • Mastra - 开源 AI 代理平台,用于构建和扩展生产级自主代理。
  • Langflow - 强大的可视化平台,用于构建和部署 AI 驱动的智能体及工作流。
  • agenticSeek - 用于构建和部署具备高级推理与工具使用能力的 AI 代理的框架。
  • Flowise - 开源 UI 可视化工具,用于构建自定义 LLM 编排流程和 AI 代理。
  • MetaGPT - 多智能体框架,模拟软件公司中的不同角色以完成项目开发。
  • Local Deep Research - 本地 AI 研究助手,可搜索网络、论文和文档。
  • Gptme - AI 代理命令行界面,能够编写代码、使用终端、浏览网页并在本地运行。
  • Rowboat - 开源 AI 同事,通过学习用户的邮件和会议内容来自动化起草、准备和任务处理。
  • Everyrow - 基于 AI 的数据操作 SDK。提供语义去重、模糊合并和智能排序功能,适用于数据分析工作流。
  • Personal Ai Infrastructure - 用于构建具备记忆、技能和学习能力的个人 AI 助手的框架。
  • N8N Workflows - n8n 自动化平台的即用型工作流模板集合。
  • Skyvern - 基于 LLM 和计算机视觉的 AI 浏览器自动化工具。兼容 Playwright 的 SDK + 无代码工作流。
  • OpenWork - 开源桌面替代方案,类似于 Claude Cowork,可在本地运行智能体、技能和 MCP,并支持团队协作功能。
  • DeepAnalyze - 自主数据科学智能体 LLM,无需人工干预即可独立完成各类以数据为中心的任务。

开发框架与工具

  • LangChain - 用于开发语言模型驱动应用的框架。
  • LlamaIndex - 具备 RAG 功能的 LLM 应用数据框架。
  • openai-python - OpenAI API 的官方 Python 库。
  • openai-agents-python - OpenAI 官方的 AI 代理构建框架。
  • ragflow - 开源 RAG(检索增强生成)工作流平台。
  • firecrawl - 用于 AI 应用的网页爬取和数据提取服务。
  • Fabric - 利用 AI 增强人类能力的框架。
  • Dyad - 开源平台,用于构建使用自定义 API 密钥的 AI 应用。
  • Langflow - 强大的可视化平台,用于构建和部署 AI 驱动的智能体及工作流。
  • NeMo - NVIDIA 提供的可扩展生成式 AI 框架,适用于 LLM、多模态和语音 AI。
  • Deepcode - 基于 AI 的代理框架,可从科研论文和文本中自动生成代码。

代码生成与辅助

  • gpt-engineer - 基于 AI 的代码生成工具。
  • gpt-pilot - AI 配对程序员,可编写整个应用程序。
  • tabby - 自托管的 AI 编码助手。

模型部署与平台

  • Ollama - 用于在本地运行大型语言模型的工具。
  • OpenLLM - 用于在生产环境中运行大型语言模型的开放平台。
  • LocalAI - 自托管、以本地优先的 AI 模型部署平台。
  • dify - 可视化的 LLM 应用开发平台。
  • LLaMA-Factory - 易用的 LLM 微调框架。
  • unsloth - 用于更快速、更节省内存的 LLM 微调库。
  • LocalGPT - 完全私密的本地文档智能平台,可通过本地 LLM 与您的文档进行对话。

AI 可靠性与调试

  • DeepEval - 类似 Pytest 的 LLM 单元测试框架。提供 RAG、智能体、幻觉、摘要等指标,以及自定义评估标准。
  • RAGAS - LLM 应用评估工具包。包含指标、测试生成和优化建议,可用于改进 RAG 流程和智能体。
  • Phoenix - AI 可观测性平台。提供追踪、数据集、实验和试用环境等功能,用于排查和评估 LLM 应用。
  • WFGY - RAG 和 AI 代理的开源调试基础设施。包括 16 种 RAG 故障问题地图和 TXT 应力测试引擎。

终端用户应用

  • open-webui - 用于与各类大模型交互的Web界面。
  • ComfyUI - 面向Stable Diffusion的可视化节点式界面。
  • lobe-chat - 现代化的AI对话界面。
  • LibreChat - 开源的ChatGPT替代品。
  • quivr - 个人第二大脑及AI助手。
  • upscayl - 基于AI的图像超分辨率工具。
  • facefusion - AI人脸换脸与增强工具。
  • DocsGPT - 基于文档的问答系统。
  • Deep Research - 面向任何主题的迭代式深度研究的AI研究助手。
  • Screenpipe - 本地AI,可根据屏幕和音频记录、搜索并自动化任务。
  • Jaaz - 开源多模态创意助手,也是面向本地图像/视频生成的、注重隐私的Canva/Manus替代方案。
  • DeepTutor - 具备文档问答、习题生成及深度研究能力的AI个性化学习助手。

其他工具

  • Bagel - 开源统一多模态模型,用于理解和生成图像。
  • Whisper - 强大的语音识别模型,适用于转录和翻译。
  • ChatTTS - 针对自然、富有表现力的日常对话优化的生成式TTS模型,支持细粒度韵律控制。
  • NeuTTS - 设备端TTS模型,可通过音频样本实现即时语音克隆。
  • Everything Claude Code - 一套资源、指南和工具,用于高效使用Claude Code AI助手。

⬆ 返回目录


☁️ 云平台与基础设施

资源

一系列用于掌握云原生技术、容器化及基础设施管理的资源集合。

⬆ 返回目录


工具

用于容器化、编排、基础设施即代码以及云原生开发的工具。

容器化与编排

  • Docker - 一个用于在容器中开发、交付和运行应用程序的开放平台。
  • Docker Compose - 一个用于定义和运行多容器 Docker 应用程序的工具。
  • Kubernetes - 一个生产级的容器编排系统。
  • Kompose - 一个将 Docker Compose 转换为 Kubernetes 的工具。

基础设施即代码

  • Terraform - 一个基础设施即代码工具。
  • OpenTofu - Terraform 的开源分支。
  • Pulumi - 一个使用熟悉编程语言的现代 IaC 平台。
  • CDK8s - 使用熟悉语言定义 Kubernetes 应用程序。

CI/CD 和 GitOps

  • Jenkins - 一个开源自动化服务器。
  • Argo CD - 一种声明式的 GitOps 持续交付工具。
  • Argo Workflows - 一个基于容器的工作流引擎。
  • Tekton - 一个 Kubernetes 原生的 CI/CD 框架。
  • Spinnaker - 一个多云持续交付平台。
  • Dagger - 一个用于 CI/CD 流程的可移植开发工具包。

服务网格与 API 网关

  • Traefik - 一个现代化的 HTTP 反向代理和负载均衡器。
  • Kong - 一个云原生 API 网关。
  • Apache APISIX - 一个动态 API 网关。
  • Envoy Gateway - 一个管理 Envoy Proxy 作为网关的项目。
  • Higress - 一个基于 Istio 的云原生 API 网关。
  • Meshery - 一个服务网格管理工具。

Kubernetes 生态系统

  • Helm - 一个用于 Kubernetes 的软件包管理器。
  • Kustomize - 一个用于 Kubernetes 配置定制的工具。
  • Kubernetes Dashboard - 一个基于 Web 的 Kubernetes 用户界面。
  • Skaffold - 一个用于 Kubernetes 的持续开发工具。
  • Tilt - 一个用于 Kubernetes 的本地开发工具。
  • Flagger - 一个渐进式交付操作符。
  • KubeVela - 一个应用交付平台。
  • KubeSphere - 一个 Kubernetes 多云管理平台。

开发者平台与控制平面

  • Crossplane - 一个云原生控制平面。
  • Artifact Hub - 提供 Kubernetes 包和 Helm 图表。
  • Devtron - 一个 Kubernetes 控制面板。
  • Harness - 一个端到端的开发者平台。

其他工具

  • Vagrant - 一个用于构建和管理可移植虚拟开发环境的工具,支持基础设施即代码。

⬆ 返回目录


⚡ 生产力

资源

一系列旨在提升生产力的资源。

  • Positron - 一款新一代数据科学 IDE。
  • Nanobrowser - 一个开源的 AI 网络自动化工具,采用多智能体系统,直接在浏览器中运行。
  • Best of Jupyter - 一份列出值得关注的 Jupyter Notebook、Hub 和 Lab 项目的排名列表。
  • Deepnote - 一个兼容 Jupyter 的 AI 原生数据科学笔记本平台,具备实时协作、环境管理和集成功能。
  • AFFiNE - 一个集笔记、文档和数据可视化于一体的全能工作空间。
  • Marimo - 一个响应式的 Python 笔记本,适用于可重复且交互式的数据科学。
  • ChatGPT 数据科学提示 - 一组专为使用 ChatGPT 的数据科学家设计的实用提示。
  • Gamma.app - 一个由 AI 驱动的平台,用于创建和分享演示文稿及文档。
  • Cookiecutter Data Science - 一个用于数据科学项目的标准化项目结构。
  • Learn Regex - 一本包含示例和练习的全面正则表达式学习指南。
  • Awesome Regex - 一个精选的正则表达式工具、库和学习资源集合。
  • The Markdown Guide - 一本全面的 Markdown 学习指南。
  • Readme-AI - 一个可以自动为你的项目生成 README.md 文件的工具。
  • Markdown Here - 一个允许用户以 Markdown 格式撰写邮件并在发送前渲染的浏览器扩展。
  • MarkText - 一个简单而优雅的 Markdown 编辑器,适用于文档编写。
  • QuarkDown - 一个轻量级的 Markdown 处理器,用于快速渲染文档。
  • screenshot-to-code - 一个 AI 工具,能够将截图转换为各种前端技术栈的代码。
  • Codebeautify - 一个一体化的在线代码格式化和美化工具,支持 Python、SQL、JSON 等多种语言。
  • Notion - 一个集笔记记录和任务管理于一体的全能工作空间。
  • Trello - 一个可视化的项目管理工具。
  • Habitica - 一个习惯养成和提高生产力的应用,将你的生活视为角色扮演游戏。
  • Bujo - 一套帮助你改变工作和生活方式的工具。
  • Parabola - 一个由 AI 驱动的工作流构建工具,用于整理数据。
  • Asana - 一个用于跟踪工作和项目的项目管理平台。
  • Puter - 一个开源的基于浏览器的计算环境和云操作系统。
  • Milkdown - 一个受 Typora 启发的插件驱动、所见即所得的 Markdown 编辑器框架。
  • PDFMathTranslate - 一个 AI 工具,用于双语科学 PDF 翻译,同时保留公式、图表和版面布局。

⬆ 返回目录


有用的 Linux 工具

一系列用于提升 Linux 环境下生产力和功能性的工具。

  • tldr-pages - 基于社区维护的简化版手册页,附带实用示例。
  • Bat - 具有语法高亮功能的 cat 替代工具。
  • Exa - 现代化的 ls 替代工具。
  • Ripgrep - 更快的 grep 替代工具。
  • Zoxide - 智能化的 cd 命令。
  • Peek - 简单易用的动画 GIF 屏幕录制工具。
  • CopyQ - 具有高级功能的剪贴板管理器。
  • Translate Shell - 使用 Google Translate、Bing Translator、Yandex.Translate 等的命令行翻译工具。
  • Espanso - 用 Rust 编写的跨平台文本扩展工具。
  • Flameshot - 功能强大且易于使用的截图软件。
  • DrawIO Desktop - 开源流程图、工艺流程图等绘图软件。
  • Inkscape - 强大、免费且开源的矢量图形编辑器,用于创建和编辑可视化内容。
  • Rclone - 用于管理云存储文件的命令行工具。
  • Rsync - 快速且多功能的文件复制工具,可在网络或本地同步两个位置之间的文件和目录。
  • Timeshift - Linux 系统还原工具,使用 rsync+硬链接或 BTRFS 快照来创建文件系统快照。
  • Backintime - 方便且可高度配置的增量备份图形界面工具。
  • Fzf - 命令行模糊查找工具。
  • Osquery - 基于 SQL 的操作系统监控、分析与仪表化工具。
  • GNU Parallel - 用于并行执行任务的工具。
  • HTop - 交互式进程查看器。
  • Ncdu - 带有 ncurses 界面的磁盘使用情况分析工具。
  • Thefuck - 用于纠正之前输入的错误命令的工具。
  • Miller - 用于查询、处理和格式化多种文件格式(如 CSV、JSON 等)数据的工具,类似于 awk/sed/cut 对数据的操作。
  • jq - 命令行 JSON 处理器,用于解析和操作 JSON 数据。
  • yq - 可移植的命令行 YAML 处理器(类似于 jq 用于 YAML 和 XML)。
  • q - 直接在命令行上对 CSV 或 TSV 文件运行 SQL 查询。
  • VisiData - 终端中用于表格数据探索的交互式多功能工具。
  • csvkit - 一套用于处理 CSV 数据的命令行工具。
  • httpie - 用于 API 测试和调试的现代化命令行 HTTP 客户端。
  • glances - 跨平台的系统监控工具,用于资源使用情况分析。
  • hyperfine - 用于性能测试的命令行基准测试工具。
  • termgraph - 在终端中绘制基本图表,便于快速数据可视化。
  • fd - 简单、快速且用户友好的 find 替代工具。
  • dust - 用 Rust 编写的更直观的 du 替代工具。
  • bottom - 跨平台的图形化进程/系统监控工具。
  • Keychain - 用于管理和安全存储密码及密钥的工具。

⬆ 返回目录


有用的 VS Code 扩展

一系列用于增强 Visual Studio Code 功能和提升工作效率的扩展。

⬆ 返回目录


📚 技能提升与职业发展

实践资源

一系列资源,旨在提升数据分析及相关领域的技能并推动您的职业发展。

⬆ 返回目录


精选 Jupyter 笔记本

一系列精选的 Jupyter 笔记本,用于支持数据科学和分析领域的学习与探索。

⬆ 返回目录


数据来源与数据集

一系列用于访问数据集和数据来源的资源,供分析和项目使用。

⬆ 返回目录


简历与面试技巧

多种资源助您准备面试并提升简历质量。

回到目录


📋 备忘录

跨多个领域的备忘录合集,便于快速参考与学习。

GoalKicker 编程笔记

回到目录


Python

回到目录


数据科学与机器学习

⬆ 返回目录


Linux 与 Git

⬆ 返回目录


概率与统计

⬆ 返回目录


SQL 与数据库

⬆ 返回目录


杂项

⬆ 返回目录


📦 其他 Python 库

这是一系列补充性的 Python 库,它们能够提升开发流程、自动化任务,并在核心数据分析工具之外保持项目的高质量。

代码质量与开发

  • Black - 不妥协的 Python 代码格式化工具。
  • Pre-commit - 用于管理提交前钩子的框架。
  • Pylint - Python 代码静态分析工具。
  • Mypy - Python 的可选静态类型检查。
  • Rich - 终端中的富文本和美观格式。
  • Icecream - 无需使用 print 的调试工具。
  • Pandas-log - 记录 Pandas 操作以追踪数据转换过程。
  • PandasVet - Pandas 代码风格验证工具。
  • Pydeps - Python 模块依赖关系图。
  • PyForest - 自动化数据科学中的 Python 导入。
  • Complexipy - 由 Rust 编写的超快速 Python 认知复杂性分析工具。

⬆ 返回目录


文档与文件处理

  • Sphinx - 文档生成工具。
  • Pdoc - Python 项目的 API 文档生成工具。
  • Mkdocs - 使用 Markdown 编写项目文档。
  • OpenPyXL - 读写 Excel 文件。
  • Tablib - 将数据导出为 XLSX、JSON、CSV 格式。
  • PyPDF2 - 读取和写入 PDF 文件。
  • Python-docx - 读取和写入 Word 文档。
  • CleverCSV - 针对混乱数据的智能 CSV 读取工具。
  • Python-markdownify - 将 HTML 转换为 Markdown。
  • Xlwings - Python 与 Excel 的集成工具。
  • Xmltodict - 将 XML 转换为 Python 字典。
  • MarkItDown - 用于将文件和 Office 文档转换为 Markdown 的 Python 工具。
  • Jupyter-book - 基于 Jupyter 笔记本构建出版级书籍。
  • WeasyPrint - 将 HTML 转换为 PDF。
  • PyMuPDF - 高级 PDF 操作库。
  • Camelot - PDF 表格提取库。
  • Marker - 快速且高精度的 PDF 和文档转换工具,同时保留布局。

⬆ 返回目录


Web 与 API

  • HTTPX - 新一代 Python HTTP 客户端。
  • FastAPI - 用于构建 API 的现代 Web 框架。
  • Flask - 用于构建应用和 API 的轻量级 Python Web 框架。
  • Typer - 用于构建命令行应用程序的库。
  • Requests-cache - 为 requests 库提供持久化缓存。
  • Aiohttp - 基于 asyncio 和 Python 的异步 HTTP 客户端/服务器框架。

⬆ 返回目录


其他

  • UV - 极其快速的 Python 包管理器和解析器。
  • Funcy - 为 Python 提供的高级函数式工具。
  • Pillow - 图像处理库。
  • Ftfy - 修复损坏的 Unicode 字符串。
  • JmesPath - 查询 JSON 数据(类似于 SQL 的 JSON 查询)。
  • Glom - 转换嵌套数据结构。
  • Diagrams - 以代码形式绘制云架构图。
  • Pytest - 用于编写小型测试的框架。
  • Pampy - 用于 Python 字典的模式匹配。
  • Pygorithm - 学习所有主要算法的 Python 模块。
  • GitPython - 用于与 Git 仓库交互的 Python 库。
  • TQDM - 为循环和操作添加进度条。
  • Loguru - 简化的 Python 日志记录工具。
  • Click - 美观的命令行界面。
  • Poetry - Python 依赖管理和打包工具。
  • Hydra - 优雅的配置管理工具。
  • papermill - 用于参数化并以编程方式执行 Jupyter 笔记本的工具。
  • Python Telegram Bot - 支持异步的纯 Python Telegram Bot API 框架。

⬆ 返回目录


📝 更多精彩列表

精心整理的其他主题和技术领域的精彩列表。

⬆ 返回目录


🌐 额外资源与工具

涵盖广泛领域的学习、开发和探索资源与工具。

⬆ 返回目录


🤝 贡献

我们欢迎您的贡献!

请参阅 CONTRIBUTING.md 了解如何添加资源。

⬆ 返回目录


📜 许可证

CC0

本作品已根据 CC0 1.0 Universal 许可协议奉献至公有领域。

⬆ 返回目录

相似工具推荐

stable-diffusion-webui

stable-diffusion-webui 是一个基于 Gradio 构建的网页版操作界面,旨在让用户能够轻松地在本地运行和使用强大的 Stable Diffusion 图像生成模型。它解决了原始模型依赖命令行、操作门槛高且功能分散的痛点,将复杂的 AI 绘图流程整合进一个直观易用的图形化平台。 无论是希望快速上手的普通创作者、需要精细控制画面细节的设计师,还是想要深入探索模型潜力的开发者与研究人员,都能从中获益。其核心亮点在于极高的功能丰富度:不仅支持文生图、图生图、局部重绘(Inpainting)和外绘(Outpainting)等基础模式,还独创了注意力机制调整、提示词矩阵、负向提示词以及“高清修复”等高级功能。此外,它内置了 GFPGAN 和 CodeFormer 等人脸修复工具,支持多种神经网络放大算法,并允许用户通过插件系统无限扩展能力。即使是显存有限的设备,stable-diffusion-webui 也提供了相应的优化选项,让高质量的 AI 艺术创作变得触手可及。

162.1k|★★★☆☆|今天
开发框架图像Agent

everything-claude-code

everything-claude-code 是一套专为 AI 编程助手(如 Claude Code、Codex、Cursor 等)打造的高性能优化系统。它不仅仅是一组配置文件,而是一个经过长期实战打磨的完整框架,旨在解决 AI 代理在实际开发中面临的效率低下、记忆丢失、安全隐患及缺乏持续学习能力等核心痛点。 通过引入技能模块化、直觉增强、记忆持久化机制以及内置的安全扫描功能,everything-claude-code 能显著提升 AI 在复杂任务中的表现,帮助开发者构建更稳定、更智能的生产级 AI 代理。其独特的“研究优先”开发理念和针对 Token 消耗的优化策略,使得模型响应更快、成本更低,同时有效防御潜在的攻击向量。 这套工具特别适合软件开发者、AI 研究人员以及希望深度定制 AI 工作流的技术团队使用。无论您是在构建大型代码库,还是需要 AI 协助进行安全审计与自动化测试,everything-claude-code 都能提供强大的底层支持。作为一个曾荣获 Anthropic 黑客大奖的开源项目,它融合了多语言支持与丰富的实战钩子(hooks),让 AI 真正成长为懂上

139k|★★☆☆☆|今天
开发框架Agent语言模型

ComfyUI

ComfyUI 是一款功能强大且高度模块化的视觉 AI 引擎,专为设计和执行复杂的 Stable Diffusion 图像生成流程而打造。它摒弃了传统的代码编写模式,采用直观的节点式流程图界面,让用户通过连接不同的功能模块即可构建个性化的生成管线。 这一设计巧妙解决了高级 AI 绘图工作流配置复杂、灵活性不足的痛点。用户无需具备编程背景,也能自由组合模型、调整参数并实时预览效果,轻松实现从基础文生图到多步骤高清修复等各类复杂任务。ComfyUI 拥有极佳的兼容性,不仅支持 Windows、macOS 和 Linux 全平台,还广泛适配 NVIDIA、AMD、Intel 及苹果 Silicon 等多种硬件架构,并率先支持 SDXL、Flux、SD3 等前沿模型。 无论是希望深入探索算法潜力的研究人员和开发者,还是追求极致创作自由度的设计师与资深 AI 绘画爱好者,ComfyUI 都能提供强大的支持。其独特的模块化架构允许社区不断扩展新功能,使其成为当前最灵活、生态最丰富的开源扩散模型工具之一,帮助用户将创意高效转化为现实。

107.7k|★★☆☆☆|2天前
开发框架图像Agent

NextChat

NextChat 是一款轻量且极速的 AI 助手,旨在为用户提供流畅、跨平台的大模型交互体验。它完美解决了用户在多设备间切换时难以保持对话连续性,以及面对众多 AI 模型不知如何统一管理的痛点。无论是日常办公、学习辅助还是创意激发,NextChat 都能让用户随时随地通过网页、iOS、Android、Windows、MacOS 或 Linux 端无缝接入智能服务。 这款工具非常适合普通用户、学生、职场人士以及需要私有化部署的企业团队使用。对于开发者而言,它也提供了便捷的自托管方案,支持一键部署到 Vercel 或 Zeabur 等平台。 NextChat 的核心亮点在于其广泛的模型兼容性,原生支持 Claude、DeepSeek、GPT-4 及 Gemini Pro 等主流大模型,让用户在一个界面即可自由切换不同 AI 能力。此外,它还率先支持 MCP(Model Context Protocol)协议,增强了上下文处理能力。针对企业用户,NextChat 提供专业版解决方案,具备品牌定制、细粒度权限控制、内部知识库整合及安全审计等功能,满足公司对数据隐私和个性化管理的高标准要求。

87.6k|★★☆☆☆|今天
开发框架语言模型

ML-For-Beginners

ML-For-Beginners 是由微软推出的一套系统化机器学习入门课程,旨在帮助零基础用户轻松掌握经典机器学习知识。这套课程将学习路径规划为 12 周,包含 26 节精炼课程和 52 道配套测验,内容涵盖从基础概念到实际应用的完整流程,有效解决了初学者面对庞大知识体系时无从下手、缺乏结构化指导的痛点。 无论是希望转型的开发者、需要补充算法背景的研究人员,还是对人工智能充满好奇的普通爱好者,都能从中受益。课程不仅提供了清晰的理论讲解,还强调动手实践,让用户在循序渐进中建立扎实的技能基础。其独特的亮点在于强大的多语言支持,通过自动化机制提供了包括简体中文在内的 50 多种语言版本,极大地降低了全球不同背景用户的学习门槛。此外,项目采用开源协作模式,社区活跃且内容持续更新,确保学习者能获取前沿且准确的技术资讯。如果你正寻找一条清晰、友好且专业的机器学习入门之路,ML-For-Beginners 将是理想的起点。

85k|★★☆☆☆|今天
图像数据工具视频

ragflow

RAGFlow 是一款领先的开源检索增强生成(RAG)引擎,旨在为大语言模型构建更精准、可靠的上下文层。它巧妙地将前沿的 RAG 技术与智能体(Agent)能力相结合,不仅支持从各类文档中高效提取知识,还能让模型基于这些知识进行逻辑推理和任务执行。 在大模型应用中,幻觉问题和知识滞后是常见痛点。RAGFlow 通过深度解析复杂文档结构(如表格、图表及混合排版),显著提升了信息检索的准确度,从而有效减少模型“胡编乱造”的现象,确保回答既有据可依又具备时效性。其内置的智能体机制更进一步,使系统不仅能回答问题,还能自主规划步骤解决复杂问题。 这款工具特别适合开发者、企业技术团队以及 AI 研究人员使用。无论是希望快速搭建私有知识库问答系统,还是致力于探索大模型在垂直领域落地的创新者,都能从中受益。RAGFlow 提供了可视化的工作流编排界面和灵活的 API 接口,既降低了非算法背景用户的上手门槛,也满足了专业开发者对系统深度定制的需求。作为基于 Apache 2.0 协议开源的项目,它正成为连接通用大模型与行业专有知识之间的重要桥梁。

77.1k|★★★☆☆|2天前
Agent图像开发框架