[{"data":1,"prerenderedAt":-1},["ShallowReactive",2],{"similar-miguelgfierro--ai_projects":3,"tool-miguelgfierro--ai_projects":64},[4,17,27,35,43,56],{"id":5,"name":6,"github_repo":7,"description_zh":8,"stars":9,"difficulty_score":10,"last_commit_at":11,"category_tags":12,"status":16},3808,"stable-diffusion-webui","AUTOMATIC1111\u002Fstable-diffusion-webui","stable-diffusion-webui 是一个基于 Gradio 构建的网页版操作界面，旨在让用户能够轻松地在本地运行和使用强大的 Stable Diffusion 图像生成模型。它解决了原始模型依赖命令行、操作门槛高且功能分散的痛点，将复杂的 AI 绘图流程整合进一个直观易用的图形化平台。\n\n无论是希望快速上手的普通创作者、需要精细控制画面细节的设计师，还是想要深入探索模型潜力的开发者与研究人员，都能从中获益。其核心亮点在于极高的功能丰富度：不仅支持文生图、图生图、局部重绘（Inpainting）和外绘（Outpainting）等基础模式，还独创了注意力机制调整、提示词矩阵、负向提示词以及“高清修复”等高级功能。此外，它内置了 GFPGAN 和 CodeFormer 等人脸修复工具，支持多种神经网络放大算法，并允许用户通过插件系统无限扩展能力。即使是显存有限的设备，stable-diffusion-webui 也提供了相应的优化选项，让高质量的 AI 艺术创作变得触手可及。",162132,3,"2026-04-05T11:01:52",[13,14,15],"开发框架","图像","Agent","ready",{"id":18,"name":19,"github_repo":20,"description_zh":21,"stars":22,"difficulty_score":23,"last_commit_at":24,"category_tags":25,"status":16},1381,"everything-claude-code","affaan-m\u002Feverything-claude-code","everything-claude-code 是一套专为 AI 编程助手（如 Claude Code、Codex、Cursor 等）打造的高性能优化系统。它不仅仅是一组配置文件，而是一个经过长期实战打磨的完整框架，旨在解决 AI 代理在实际开发中面临的效率低下、记忆丢失、安全隐患及缺乏持续学习能力等核心痛点。\n\n通过引入技能模块化、直觉增强、记忆持久化机制以及内置的安全扫描功能，everything-claude-code 能显著提升 AI 在复杂任务中的表现，帮助开发者构建更稳定、更智能的生产级 AI 代理。其独特的“研究优先”开发理念和针对 Token 消耗的优化策略，使得模型响应更快、成本更低，同时有效防御潜在的攻击向量。\n\n这套工具特别适合软件开发者、AI 研究人员以及希望深度定制 AI 工作流的技术团队使用。无论您是在构建大型代码库，还是需要 AI 协助进行安全审计与自动化测试，everything-claude-code 都能提供强大的底层支持。作为一个曾荣获 Anthropic 黑客大奖的开源项目，它融合了多语言支持与丰富的实战钩子（hooks），让 AI 真正成长为懂上",138956,2,"2026-04-05T11:33:21",[13,15,26],"语言模型",{"id":28,"name":29,"github_repo":30,"description_zh":31,"stars":32,"difficulty_score":23,"last_commit_at":33,"category_tags":34,"status":16},2271,"ComfyUI","Comfy-Org\u002FComfyUI","ComfyUI 是一款功能强大且高度模块化的视觉 AI 引擎，专为设计和执行复杂的 Stable Diffusion 图像生成流程而打造。它摒弃了传统的代码编写模式，采用直观的节点式流程图界面，让用户通过连接不同的功能模块即可构建个性化的生成管线。\n\n这一设计巧妙解决了高级 AI 绘图工作流配置复杂、灵活性不足的痛点。用户无需具备编程背景，也能自由组合模型、调整参数并实时预览效果，轻松实现从基础文生图到多步骤高清修复等各类复杂任务。ComfyUI 拥有极佳的兼容性，不仅支持 Windows、macOS 和 Linux 全平台，还广泛适配 NVIDIA、AMD、Intel 及苹果 Silicon 等多种硬件架构，并率先支持 SDXL、Flux、SD3 等前沿模型。\n\n无论是希望深入探索算法潜力的研究人员和开发者，还是追求极致创作自由度的设计师与资深 AI 绘画爱好者，ComfyUI 都能提供强大的支持。其独特的模块化架构允许社区不断扩展新功能，使其成为当前最灵活、生态最丰富的开源扩散模型工具之一，帮助用户将创意高效转化为现实。",107662,"2026-04-03T11:11:01",[13,14,15],{"id":36,"name":37,"github_repo":38,"description_zh":39,"stars":40,"difficulty_score":23,"last_commit_at":41,"category_tags":42,"status":16},3704,"NextChat","ChatGPTNextWeb\u002FNextChat","NextChat 是一款轻量且极速的 AI 助手，旨在为用户提供流畅、跨平台的大模型交互体验。它完美解决了用户在多设备间切换时难以保持对话连续性，以及面对众多 AI 模型不知如何统一管理的痛点。无论是日常办公、学习辅助还是创意激发，NextChat 都能让用户随时随地通过网页、iOS、Android、Windows、MacOS 或 Linux 端无缝接入智能服务。\n\n这款工具非常适合普通用户、学生、职场人士以及需要私有化部署的企业团队使用。对于开发者而言，它也提供了便捷的自托管方案，支持一键部署到 Vercel 或 Zeabur 等平台。\n\nNextChat 的核心亮点在于其广泛的模型兼容性，原生支持 Claude、DeepSeek、GPT-4 及 Gemini Pro 等主流大模型，让用户在一个界面即可自由切换不同 AI 能力。此外，它还率先支持 MCP（Model Context Protocol）协议，增强了上下文处理能力。针对企业用户，NextChat 提供专业版解决方案，具备品牌定制、细粒度权限控制、内部知识库整合及安全审计等功能，满足公司对数据隐私和个性化管理的高标准要求。",87618,"2026-04-05T07:20:52",[13,26],{"id":44,"name":45,"github_repo":46,"description_zh":47,"stars":48,"difficulty_score":23,"last_commit_at":49,"category_tags":50,"status":16},2268,"ML-For-Beginners","microsoft\u002FML-For-Beginners","ML-For-Beginners 是由微软推出的一套系统化机器学习入门课程，旨在帮助零基础用户轻松掌握经典机器学习知识。这套课程将学习路径规划为 12 周，包含 26 节精炼课程和 52 道配套测验，内容涵盖从基础概念到实际应用的完整流程，有效解决了初学者面对庞大知识体系时无从下手、缺乏结构化指导的痛点。\n\n无论是希望转型的开发者、需要补充算法背景的研究人员，还是对人工智能充满好奇的普通爱好者，都能从中受益。课程不仅提供了清晰的理论讲解，还强调动手实践，让用户在循序渐进中建立扎实的技能基础。其独特的亮点在于强大的多语言支持，通过自动化机制提供了包括简体中文在内的 50 多种语言版本，极大地降低了全球不同背景用户的学习门槛。此外，项目采用开源协作模式，社区活跃且内容持续更新，确保学习者能获取前沿且准确的技术资讯。如果你正寻找一条清晰、友好且专业的机器学习入门之路，ML-For-Beginners 将是理想的起点。",84991,"2026-04-05T10:45:23",[14,51,52,53,15,54,26,13,55],"数据工具","视频","插件","其他","音频",{"id":57,"name":58,"github_repo":59,"description_zh":60,"stars":61,"difficulty_score":10,"last_commit_at":62,"category_tags":63,"status":16},3128,"ragflow","infiniflow\u002Fragflow","RAGFlow 是一款领先的开源检索增强生成（RAG）引擎，旨在为大语言模型构建更精准、可靠的上下文层。它巧妙地将前沿的 RAG 技术与智能体（Agent）能力相结合，不仅支持从各类文档中高效提取知识，还能让模型基于这些知识进行逻辑推理和任务执行。\n\n在大模型应用中，幻觉问题和知识滞后是常见痛点。RAGFlow 通过深度解析复杂文档结构（如表格、图表及混合排版），显著提升了信息检索的准确度，从而有效减少模型“胡编乱造”的现象，确保回答既有据可依又具备时效性。其内置的智能体机制更进一步，使系统不仅能回答问题，还能自主规划步骤解决复杂问题。\n\n这款工具特别适合开发者、企业技术团队以及 AI 研究人员使用。无论是希望快速搭建私有知识库问答系统，还是致力于探索大模型在垂直领域落地的创新者，都能从中受益。RAGFlow 提供了可视化的工作流编排界面和灵活的 API 接口，既降低了非算法背景用户的上手门槛，也满足了专业开发者对系统深度定制的需求。作为基于 Apache 2.0 协议开源的项目，它正成为连接通用大模型与行业专有知识之间的重要桥梁。",77062,"2026-04-04T04:44:48",[15,14,13,26,54],{"id":65,"github_repo":66,"name":67,"description_en":68,"description_zh":69,"ai_summary_zh":69,"readme_en":70,"readme_zh":71,"quickstart_zh":72,"use_case_zh":73,"hero_image_url":74,"owner_login":75,"owner_name":76,"owner_avatar_url":77,"owner_bio":78,"owner_company":79,"owner_location":80,"owner_email":78,"owner_twitter":75,"owner_website":81,"owner_url":82,"languages":83,"stars":120,"forks":121,"last_commit_at":122,"license":123,"difficulty_score":23,"env_os":124,"env_gpu":125,"env_ram":126,"env_deps":127,"category_tags":140,"github_topics":141,"view_count":23,"oss_zip_url":78,"oss_zip_packed_at":78,"status":16,"created_at":152,"updated_at":153,"faqs":154,"releases":187},2904,"miguelgfierro\u002Fai_projects","ai_projects","AI projects","ai_projects 是一个汇集了多个机器学习领域实战项目的开源资源库，旨在通过代码与文章相结合的方式，帮助学习者深入理解人工智能的核心概念。它主要解决了 AI 学习过程中理论抽象、难以落地的问题，提供了从卷积神经网络（CNN）基础、迁移学习策略，到大规模文本分类、数据生成技巧、t-SNE 降维可视化以及 DeepSpeed 分布式训练等全方位的教学案例。\n\n每个项目都配有详细的 Jupyter Notebook 代码演示和对应的深度技术博客文章，涵盖了 MXNet、PyTorch、Sklearn 等多种主流框架，并展示了如何在 Azure 云端部署或利用 CUDA 加速等实用技术亮点。无论是希望系统入门的开发者、需要复现算法的研究人员，还是想要拓展技术视野的数据科学家，都能在这里找到有价值的参考。通过“代码 + 解析”的模式，ai_projects 让复杂的算法原理变得直观易懂，是提升工程实践能力与理论认知的优质学习平台。","[![Issues](https:\u002F\u002Fimg.shields.io\u002Fgithub\u002Fissues\u002Fmiguelgfierro\u002Fai_projects.svg)](https:\u002F\u002Fgithub.com\u002Fmiguelgfierro\u002Fai_projects\u002Fissues)\n[![Pull requests](https:\u002F\u002Fimg.shields.io\u002Fgithub\u002Fissues-pr\u002Fmiguelgfierro\u002Fai_projects.svg)](https:\u002F\u002Fgithub.com\u002Fmiguelgfierro\u002Fai_projects\u002Fpulls)\n[![Commits](https:\u002F\u002Fimg.shields.io\u002Fgithub\u002Fcommit-activity\u002Fy\u002Fmiguelgfierro\u002Fai_projects.svg?color=success)](https:\u002F\u002Fgithub.com\u002Fmiguelgfierro\u002Fai_projects\u002Fcommits\u002Fmaster)\n[![Last commit](https:\u002F\u002Fimg.shields.io\u002Fgithub\u002Flast-commit\u002Fmiguelgfierro\u002Fai_projects.svg)](https:\u002F\u002Fgithub.com\u002Fmiguelgfierro\u002Fai_projects\u002Fcommits\u002Fmaster)\n\n[![Linkedin](https:\u002F\u002Fimg.shields.io\u002Fbadge\u002FLinkedin-Follow%20Miguel-blue?logo=linkedin)](https:\u002F\u002Fwww.linkedin.com\u002Fcomm\u002Fmynetwork\u002Fdiscovery-see-all?usecase=PEOPLE_FOLLOWS&followMember=miguelgfierro)\n[![Blog](https:\u002F\u002Fimg.shields.io\u002Fbadge\u002FBlog-Visit%20miguelgfierro.com-blue.svg)](https:\u002F\u002Fmiguelgfierro.com?utm_source=github&utm_medium=profile&utm_campaign=ai_projects)\n\n\n# AI projects\n\nThis repo contains AI projects in multiple areas of machine learning. Many of these projects have associated articles on the blog [sciblog](https:\u002F\u002Fmiguelgfierro.com\u002F).\n\nYou can find a list of most the post I made in [this file](miguelgfierro_posts.txt).\n\n## Featured projects\n\n* [Introduction to Convolutional Neural Networks](A_Gentle_Introduction_to_CNN\u002FIntro_CNN.ipynb): In this project we explain what is a convolution and how to compute a CNN using MXNet deep learning library with the MNIST character recognition dataset. Here the [blog entry](https:\u002F\u002Fmiguelgfierro.com\u002Fblog\u002F2016\u002Fa-gentle-introduction-to-convolutional-neural-networks\u002F?utm_source=github&utm_medium=repo-entry&utm_campaign=cnn-intro).\n\n* [Introduction to Transfer Learning](A_Gentle_Introduction_to_Transfer_Learning\u002FIntro_Transfer_Learning.ipynb): In this project we use PyTorch to explain the basic methodologies of transfer learning (finetuning and freezing) and analyze in which case is better to use each of them. Here the [blog entry](https:\u002F\u002Fmiguelgfierro.com\u002Fblog\u002F2017\u002Fa-gentle-introduction-to-transfer-learning-for-image-classification\u002F?utm_source=github&utm_medium=repo-entry&utm_campaign=transfer-learning).\n\n* [Cloud-Scale Text Classification With Convolutional Neural Networks](Cloud-Scale_Text_Classification_with_CNNs_on_Azure): In these notebooks we show how to perform character level convolutions for sentiment analysis using Char-CNN and VDCNN models. Here the [blog entry](https:\u002F\u002Fmiguelgfierro.com\u002Fblog\u002F2019\u002Fcloud-scale-text-classification-with-convolutional-neural-networks\u002F?utm_source=github&utm_medium=repo-entry&utm_campaign=charcnn).\n\n* [Introduction to Data Generation](Data_Generation\u002Fdata_generation.ipynb): In this notebook we show a number of simple techniques to generate new data in images, text and time series. Here the [blog entry](https:\u002F\u002Fmiguelgfierro.com\u002Fblog\u002F2019\u002Frevisiting-the-revisit-of-the-unreasonable-effectiveness-of-data\u002F?utm_source=github&utm_medium=repo-entry&utm_campaign=data-gen).\n\n* [Introduction to Dimensionality Reduction with t-SNE](Dimensionality_Reduction_with_TSNE\u002Fdimensionality_reduction.ipynb): In this project we use sklearn and CUDA to show an example of t-SNE algorithm. We use a CNN to generate high-dimensional features from images and then show how they can be projected and visualized into a 2-dimensional space. Here the [blog entry](https:\u002F\u002Fmiguelgfierro.com\u002Fblog\u002F2018\u002Fa-gentle-explanation-of-dimensionality-reduction-with-t-sne\u002F?utm_source=github&utm_medium=repo-entry&utm_campaign=tsne).\n\n* [Introduction to Distributed Training with DeepSpeed](Distributed_Training_with_DeepSpeed): In this project we show how to use DeepSpeed to perform distributed training with PyTorch. Here the [blog entry](https:\u002F\u002Fmiguelgfierro.com\u002Fblog\u002F2022\u002Fa-gentle-introduction-to-distributed-training-with-deepspeed\u002F?utm_source=github&utm_medium=repo-entry&utm_campaign=deepspeed).\n\n* [Introduction to Fraud Detection](Intro_to_Fraud_Detection\u002Ffraud_detection.ipynb): In this notebook we design a real-time fraud detection model using LightGBM on GPU (also available on CPU). The model is then operationalized through an API using Flask and websockets. Here the [blog entry](https:\u002F\u002Fgithub.com\u002Fmiguelgfierro\u002Fai_projects\u002Fblob\u002Fmaster\u002FIntro_to_Fraud_Detection\u002Ffraud_detection.ipynb?utm_source=github&utm_medium=repo-entry&utm_campaign=fraud).\n\n* [Introduction to Machine Learning API](Intro_to_Machine_Learning_API\u002FIntro_to_Cloud_ML_with_Flask_and_CNTK.ipynb): In this notebook we show how to create an image classification API. The system works with a pretrained CNN using CNTK deep learning library. The API is setup with Flask for managing the end point services and CherryPy as the backend server. Here the [blog entry](https:\u002F\u002Fmiguelgfierro.com\u002Fblog\u002F2017\u002Fhow-to-deploy-an-image-classification-api-based-on-deep-learning\u002F?utm_source=github&utm_medium=repo-entry&utm_campaign=ml-api).\n\n* [Introduction to Recommendation Systems with Deep Autoencoders](Intro_to_Recommendation_Systems\u002FIntro_Recommender.ipynb): In this notebook we make an overview to recommendation systems and implement a recommendation API using a deep autoencoder with PyTorch and the Netflix dataset. Here the [blog entry](https:\u002F\u002Fmiguelgfierro.com\u002Fblog\u002F2018\u002Fintroduction-to-recommendation-systems-with-deep-autoencoders\u002F?utm_source=github&utm_medium=repo-entry&utm_campaign=reco-deep-autoencoder).\n\n* [Introduction to Natural Language Processing with fastText](Intro_to_NLP_with_fastText\u002FIntro_to_NLP.ipynb): In this project we show how to implement text classification, sentiment analysis and word embedding using the library fastText. We also show a way to represent the word embeddings in a reduced space using t-SNE algorithm. Here the [blog entry](https:\u002F\u002Fmiguelgfierro.com\u002Fblog\u002F2017\u002Fa-gentle-introduction-to-text-classification-and-sentiment-analysis\u002F?utm_source=github&utm_medium=repo-entry&utm_campaign=fasttext).\n\n* [Time Series Forecasting of Stock Price](Time_Series_Forecasting_of_Stock_Price\u002FStock_Price_Forecasting.ipynb): In this tutorial we show how to implement a simple stock forecasting model using different variants of LSTMs and Keras. Here the [blog entry](https:\u002F\u002Fmiguelgfierro.com\u002Fblog\u002F2018\u002Fstock-price-prediction-with-lstms\u002F?utm_source=github&utm_medium=repo-entry&utm_campaign=stock-forecasting).\n\n* [Visualization of Football Matches with Datashader](Visualization_of_Football_Matches\u002Fvisualization_football.ipynb): In this notebook we explain how to visualize all matches in the UEFA Champions League since its beginning using the python library datashader. To create the project we use the Lean Startup method. Here the [blog entry](https:\u002F\u002Fmiguelgfierro.com\u002Fblog\u002F2016\u002Fhow-to-develop-a-data-science-project-using-the-lean-startup-method\u002F?utm_source=github&utm_medium=repo-entry&utm_campaign=datashader).\n\n## Machine Learning reference architecture\n\n![](.\u002FML_reference_architecture.svg)\n","[![问题](https:\u002F\u002Fimg.shields.io\u002Fgithub\u002Fissues\u002Fmiguelgfierro\u002Fai_projects.svg)](https:\u002F\u002Fgithub.com\u002Fmiguelgfierro\u002Fai_projects\u002Fissues)\n[![拉取请求](https:\u002F\u002Fimg.shields.io\u002Fgithub\u002Fissues-pr\u002Fmiguelgfierro\u002Fai_projects.svg)](https:\u002F\u002Fgithub.com\u002Fmiguelgfierro\u002Fai_projects\u002Fpulls)\n[![提交次数](https:\u002F\u002Fimg.shields.io\u002Fgithub\u002Fcommit-activity\u002Fy\u002Fmiguelgfierro\u002Fai_projects.svg?color=success)](https:\u002F\u002Fgithub.com\u002Fmiguelgfierro\u002Fai_projects\u002Fcommits\u002Fmaster)\n[![最近一次提交](https:\u002F\u002Fimg.shields.io\u002Fgithub\u002Flast-commit\u002Fmiguelgfierro\u002Fai_projects.svg)](https:\u002F\u002Fgithub.com\u002Fmiguelgfierro\u002Fai_projects\u002Fcommits\u002Fmaster)\n\n[![LinkedIn](https:\u002F\u002Fimg.shields.io\u002Fbadge\u002FLinkedin-Follow%20Miguel-blue?logo=linkedin)](https:\u002F\u002Fwww.linkedin.com\u002Fcomm\u002Fmynetwork\u002Fdiscovery-see-all?usecase=PEOPLE_FOLLOWS&followMember=miguelgfierro)\n[![博客](https:\u002F\u002Fimg.shields.io\u002Fbadge\u002FBlog-Visit%20miguelgfierro.com-blue.svg)](https:\u002F\u002Fmiguelgfierro.com?utm_source=github&utm_medium=profile&utm_campaign=ai_projects)\n\n\n# AI项目\n\n这个仓库包含了多个机器学习领域的AI项目。其中许多项目都与我的博客[sciblog](https:\u002F\u002Fmiguelgfierro.com\u002F)上的文章相关联。\n\n你可以在[这个文件](miguelgfierro_posts.txt)中找到我发布的大部分文章列表。\n\n## 精选项目\n\n* [卷积神经网络入门](A_Gentle_Introduction_to_CNN\u002FIntro_CNN.ipynb)：在这个项目中，我们解释了什么是卷积，并使用MXNet深度学习库结合MNIST手写数字识别数据集来实现CNN的计算。相关博客文章请见[这里](https:\u002F\u002Fmiguelgfierro.com\u002Fblog\u002F2016\u002Fa-gentle-introduction-to-convolutional-neural-networks\u002F?utm_source=github&utm_medium=repo-entry&utm_campaign=cnn-intro)。\n\n* [迁移学习入门](A_Gentle_Introduction_to_Transfer_Learning\u002FIntro_Transfer_Learning.ipynb)：在这个项目中，我们使用PyTorch来讲解迁移学习的基本方法（微调和冻结），并分析在什么情况下应该分别采用这两种方法。相关博客文章请见[这里](https:\u002F\u002Fmiguelgfierro.com\u002Fblog\u002F2017\u002Fa-gentle-introduction-to-transfer-learning-for-image-classification\u002F?utm_source=github&utm_medium=repo-entry&utm_campaign=transfer-learning)。\n\n* [基于卷积神经网络的云规模文本分类（Azure平台)](Cloud-Scale_Text_Classification_with_CNNs_on_Azure)：在这些笔记本中，我们展示了如何使用Char-CNN和VDCNN模型进行字符级别的卷积操作，以实现情感分析。相关博客文章请见[这里](https:\u002F\u002Fmiguelgfierro.com\u002Fblog\u002F2019\u002Fcloud-scale-text-classification-with-convolutional-neural-networks\u002F?utm_source=github&utm_medium=repo-entry&utm_campaign=charcnn)。\n\n* [数据生成入门](Data_Generation\u002Fdata_generation.ipynb)：在这个笔记本中，我们介绍了一些简单的技术，用于生成图像、文本和时间序列中的新数据。相关博客文章请见[这里](https:\u002F\u002Fmiguelgfierro.com\u002Fblog\u002F2019\u002Frevisiting-the-revisit-of-the-unreasonable-effectiveness-of-data\u002F?utm_source=github&utm_medium=repo-entry&utm_campaign=data-gen)。\n\n* [t-SNE降维入门](Dimensionality_Reduction_with_TSNE\u002Fdimensionality_reduction.ipynb)：在这个项目中，我们使用sklearn和CUDA展示了一个t-SNE算法的例子。我们利用CNN从图像中提取高维特征，然后将其投影并可视化到二维空间中。相关博客文章请见[这里](https:\u002F\u002Fmiguelgfierro.com\u002Fblog\u002F2018\u002Fa-gentle-explanation-of-dimensionality-reduction-with-t-sne\u002F?utm_source=github&utm_medium=repo-entry&utm_campaign=tsne)。\n\n* [DeepSpeed分布式训练入门](Distributed_Training_with_DeepSpeed)：在这个项目中，我们展示了如何使用DeepSpeed进行PyTorch的分布式训练。相关博客文章请见[这里](https:\u002F\u002Fmiguelgfierro.com\u002Fblog\u002F2022\u002Fa-gentle-introduction-to-distributed-training-with-deepspeed\u002F?utm_source=github&utm_medium=repo-entry&utm_campaign=deepspeed)。\n\n* [欺诈检测入门](Intro_to_Fraud_Detection\u002Ffraud_detection.ipynb)：在这个笔记本中，我们设计了一个基于LightGBM的实时欺诈检测模型，该模型可在GPU上运行（也可在CPU上运行）。随后通过Flask和WebSockets将模型部署为API服务。相关博客文章请见[这里](https:\u002F\u002Fgithub.com\u002Fmiguelgfierro\u002Fai_projects\u002Fblob\u002Fmaster\u002FIntro_to_Fraud_Detection\u002Ffraud_detection.ipynb?utm_source=github&utm_medium=repo-entry&utm_campaign=fraud)。\n\n* [机器学习API入门](Intro_to_Machine_Learning_API\u002FIntro_to_Cloud_ML_with_Flask_and_CNTK.ipynb)：在这个笔记本中，我们展示了如何创建一个图像分类API。系统使用CNTK深度学习库中的预训练CNN。API通过Flask管理端点服务，后端服务器则使用CherryPy。相关博客文章请见[这里](https:\u002F\u002Fmiguelgfierro.com\u002Fblog\u002F2017\u002Fhow-to-deploy-an-image-classification-api-based-on-deep-learning\u002F?utm_source=github&utm_medium=repo-entry&utm_campaign=ml-api)。\n\n* [深度自编码器推荐系统入门](Intro_to_Recommendation_Systems\u002FIntro_Recommender.ipynb)：在这个笔记本中，我们概述了推荐系统，并使用PyTorch和Netflix数据集实现了一个基于深度自编码器的推荐API。相关博客文章请见[这里](https:\u002F\u002Fmiguelgfierro.com\u002Fblog\u002F2018\u002Fintroduction-to-recommendation-systems-with-deep-autoencoders\u002F?utm_source=github&utm_medium=repo-entry&utm_campaign=reco-deep-autoencoder)。\n\n* [fastText自然语言处理入门](Intro_to_NLP_with_fastText\u002FIntro_to_NLP.ipynb)：在这个项目中，我们展示了如何使用fastText库实现文本分类、情感分析和词嵌入。同时，我们也演示了如何利用t-SNE算法将词嵌入表示在低维空间中。相关博客文章请见[这里](https:\u002F\u002Fmiguelgfierro.com\u002Fblog\u002F2017\u002Fa-gentle-introduction-to-text-classification-and-sentiment-analysis\u002F?utm_source=github&utm_medium=repo-entry&utm_campaign=fasttext)。\n\n* [股票价格的时间序列预测](Time_Series_Forecasting_of_Stock_Price\u002FStock_Price_Forecasting.ipynb)：本教程展示了如何使用不同变体的LSTM和Keras实现一个简单的股票预测模型。相关博客文章请见[这里](https:\u002F\u002Fmiguelgfierro.com\u002Fblog\u002F2018\u002Fstock-price-prediction-with-lstms\u002F?utm_source=github&utm_medium=repo-entry&utm_campaign=stock-forecasting)。\n\n* [使用Datashader可视化足球比赛](Visualization_of_Football_Matches\u002Fvisualization_football.ipynb)：在这个笔记本中，我们介绍了如何使用Python库datashader来可视化自UEFA冠军联赛创立以来的所有比赛。该项目采用精益创业方法开发。相关博客文章请见[这里](https:\u002F\u002Fmiguelgfierro.com\u002Fblog\u002F2016\u002Fhow-to-develop-a-data-science-project-using-the-lean-startup-method\u002F?utm_source=github&utm_medium=repo-entry&utm_campaign=datashader)。\n\n## 机器学习参考架构\n\n![](.\u002FML_reference_architecture.svg)","# ai_projects 快速上手指南\n\n`ai_projects` 是一个汇集了多个机器学习领域实战项目的开源仓库，涵盖卷积神经网络（CNN）、迁移学习、文本分类、数据生成、降维可视化、分布式训练及推荐系统等主题。大多数项目都配有详细的 Jupyter Notebook 教程和对应的博客文章。\n\n## 环境准备\n\n在开始之前，请确保您的开发环境满足以下要求：\n\n*   **操作系统**：Linux, macOS 或 Windows (建议 Linux 以获得最佳兼容性)\n*   **Python 版本**：Python 3.6+ (推荐 Python 3.8 或 3.9)\n*   **前置依赖**：\n    *   `git`：用于克隆代码仓库\n    *   `pip` 或 `conda`：用于管理 Python 包\n    *   **GPU 支持**（可选但推荐）：部分项目（如 DeepSpeed, LightGBM GPU 版, CNN 训练）需要 NVIDIA GPU 及对应的 CUDA 驱动。\n\n由于该项目包含多个不同技术栈的子项目（涉及 PyTorch, MXNet, CNTK, fastText, Keras 等），建议为每个子项目单独创建虚拟环境，或安装一个包含常用深度学习库的通用环境。\n\n**通用依赖安装命令：**\n```bash\npip install numpy pandas matplotlib scikit-learn jupyterlab\n```\n\n> **提示**：国内用户建议使用清华源或阿里源加速安装：\n> ```bash\n> pip install -i https:\u002F\u002Fpypi.tuna.tsinghua.edu.cn\u002Fsimple numpy pandas matplotlib scikit-learn jupyterlab\n> ```\n\n## 安装步骤\n\n1.  **克隆仓库**\n    将项目代码下载到本地：\n    ```bash\n    git clone https:\u002F\u002Fgithub.com\u002Fmiguelgfierro\u002Fai_projects.git\n    cd ai_projects\n    ```\n\n2.  **安装特定项目依赖**\n    由于不同文件夹下的项目依赖不同，请进入您想要运行的具体项目目录，并根据该目录下的 `requirements.txt`（如果有）或 Notebook 开头的导入语句安装依赖。\n\n    *示例：以“迁移学习入门”项目为例（基于 PyTorch）：*\n    ```bash\n    cd A_Gentle_Introduction_to_Transfer_Learning\n    pip install torch torchvision\n    # 国内加速安装\n    # pip install -i https:\u002F\u002Fpypi.tuna.tsinghua.edu.cn\u002Fsimple torch torchvision\n    ```\n\n    *示例：以“欺诈检测”项目为例（基于 LightGBM 和 Flask）：*\n    ```bash\n    cd Intro_to_Fraud_Detection\n    pip install lightgbm flask websockets\n    ```\n\n## 基本使用\n\n本项目主要通过 Jupyter Notebook (`.ipynb`) 提供交互式教程。以下是运行最简单示例的步骤：\n\n1.  **启动 Jupyter Lab**\n    在项目根目录或具体子项目目录下启动服务：\n    ```bash\n    jupyter lab\n    ```\n    或者使用经典的 Jupyter Notebook：\n    ```bash\n    jupyter notebook\n    ```\n\n2.  **选择并运行教程**\n    在浏览器打开的界面中，导航至您感兴趣的项目文件夹，点击对应的 `.ipynb` 文件。\n    \n    *   **入门推荐**：\n        *   **CNN 基础**：打开 `A_Gentle_Introduction_to_CNN\u002FIntro_CNN.ipynb`\n        *   **迁移学习**：打开 `A_Gentle_Introduction_to_Transfer_Learning\u002FIntro_Transfer_Learning.ipynb`\n        *   **NLP 基础**：打开 `Intro_to_NLP_with_fastText\u002FIntro_to_NLP.ipynb`\n\n3.  **执行代码**\n    在 Notebook 界面中，按顺序点击单元格（Cell）左侧的运行按钮（或按 `Shift + Enter`），即可逐步执行代码、查看数据预处理过程、模型训练输出及可视化结果。\n\n> **注意**：首次运行某些项目时，代码可能会自动下载数据集（如 MNIST, Netflix 数据集等），请确保网络连接畅通。如果下载缓慢，可查阅对应博客文章看是否有手动下载数据集的说明。","某电商公司的算法工程师小李正面临紧急任务：需要在三天内构建一个能识别虚假评论的文本分类模型，并可视化高维特征以向非技术背景的产品经理汇报。\n\n### 没有 ai_projects 时\n- **从零摸索架构**：缺乏现成的字符级卷积神经网络（Char-CNN）参考代码，需花费大量时间查阅论文并手动复现基础结构，极易出错。\n- **数据增强困难**：面对样本不平衡问题，不知道如何针对文本数据生成高质量合成样本，导致模型对少数类欺诈评论识别率低。\n- **结果解释性差**：无法将模型提取的高维特征直观地降维展示，只能用枯燥的准确率数字汇报，难以让业务方理解模型原理。\n- **调试成本高昂**：在尝试迁移学习策略时，不清楚何时该冻结层、何时该微调，反复试错消耗了宝贵的开发时间。\n\n### 使用 ai_projects 后\n- **快速落地模型**：直接复用仓库中“云规模文本分类”项目的 Char-CNN 和 VDCNN 代码，半天内即可完成基线模型搭建与训练。\n- **高效解决数据瓶颈**：参考“数据生成”笔记本中的技巧，快速生成多样化的伪造评论数据，显著提升了模型的泛化能力。\n- **可视化沟通顺畅**：利用\"t-SNE 降维”项目代码，将复杂的文本特征映射为清晰的二维散点图，直观展示了真假评论的聚类效果，汇报一次通过。\n- **策略选择明确**：借助“迁移学习”指南中的对比分析，迅速确定了最适合当前数据量的微调策略，避免了无效实验。\n\nai_projects 将原本需要数周的理论验证与代码编写工作压缩至几天，让团队能专注于业务逻辑优化而非重复造轮子。","https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002Fmiguelgfierro_ai_projects_d10a01bd.png","miguelgfierro","Miguel Fierro","https:\u002F\u002Foss.gittoolsai.com\u002Favatars\u002Fmiguelgfierro_00669d15.png",null,"@Microsoft ","Mars, the only planet inhabited by robots","https:\u002F\u002Fmiguelgfierro.com","https:\u002F\u002Fgithub.com\u002Fmiguelgfierro",[84,88,92,96,100,104,107,111,114,117],{"name":85,"color":86,"percentage":87},"Jupyter Notebook","#DA5B0B",96,{"name":89,"color":90,"percentage":91},"Python","#3572A5",2.8,{"name":93,"color":94,"percentage":95},"C++","#f34b7d",0.8,{"name":97,"color":98,"percentage":99},"R","#198CE7",0.2,{"name":101,"color":102,"percentage":103},"Cuda","#3A4E3A",0.1,{"name":105,"color":106,"percentage":103},"JavaScript","#f1e05a",{"name":108,"color":109,"percentage":110},"HTML","#e34c26",0,{"name":112,"color":113,"percentage":110},"Perl","#0298c3",{"name":115,"color":116,"percentage":110},"CSS","#663399",{"name":118,"color":119,"percentage":110},"C","#555555",857,191,"2026-03-30T13:02:52","NOASSERTION","","部分项目支持 GPU 加速（如 t-SNE、LightGBM、DeepSpeed），具体型号和显存未说明；需 CUDA 支持","未说明",{"notes":128,"python":126,"dependencies":129},"该仓库包含多个独立的机器学习项目，每个项目依赖不同的深度学习框架（如 PyTorch, MXNet, CNTK, Keras）和库。部分项目明确提到使用 GPU 进行加速（例如通过 CUDA 运行 t-SNE、在 GPU 上运行 LightGBM、使用 DeepSpeed 进行分布式训练）。由于是项目合集，没有统一的环境配置文件，建议根据具体要运行的子项目目录查看其对应的 Notebook 或博客文章以获取详细的版本要求。",[130,131,132,133,134,135,136,137,138,139],"MXNet","PyTorch","scikit-learn","LightGBM","Flask","CherryPy","fastText","Keras","CNTK","Datashader",[51,54,13],[142,143,144,145,146,147,148,149,150,151],"machine-learning","artificial-intelligence","deep-learning","neural-networks","examples","code-examples","programming-exercise","data-science","big-data","analytics","2026-03-27T02:49:30.150509","2026-04-06T07:05:52.095071",[155,160,164,169,173,178,182],{"id":156,"question_zh":157,"answer_zh":158,"source_url":159},13431,"如何理解 Deepreco-autoencoder 项目的数据格式、文件夹结构以及训练\u002F验证集的创建方式？","关于数据格式和评估方法的详细说明可以在官方 Notebook 中找到。如果您的测试数据位于文件中，请查看 Notebook 中的\"Evaluation\"（评估）部分；如果数据是通过 API 请求获取的，则需参考\"API\"部分。链接：https:\u002F\u002Fgithub.com\u002Fmiguelgfierro\u002Fsciblog_support\u002Fblob\u002Fmaster\u002FIntro_to_Recommendation_Systems\u002FIntro_Recommender.ipynb","https:\u002F\u002Fgithub.com\u002Fmiguelgfierro\u002Fai_projects\u002Fissues\u002F68",{"id":161,"question_zh":162,"answer_zh":163,"source_url":159},13432,"如何使用该算法预测训练数据中未出现的电影与用户组合的评分？","根据维护者的回复，使用该算法预测训练数据中不存在的新用户 - 电影组合的评分应该没有问题（shouldn't be a problem）。该模型设计支持对未见过的数据进行推断。",{"id":165,"question_zh":166,"answer_zh":167,"source_url":168},13433,"进行 PyTorch 迁移学习时有哪些推荐的数据集？","推荐的数据集包括：\n1. LSUN (Large-Scale Scene Understanding)：包含卧室、桥梁、教室等场景的大规模数据集。\n2. SUN：LSUN 的较小版本。\n3. The Simpsons dataset：Kaggle 上的辛普森人物识别数据集，包含 20 个角色文件夹。\n4. Ships in Satellite Imagery：卫星图像中的船只分类数据集（船\u002F非船）。\n5. Amazon Planet：相关行星图像数据集。","https:\u002F\u002Fgithub.com\u002Fmiguelgfierro\u002Fai_projects\u002Fissues\u002F45",{"id":170,"question_zh":171,"answer_zh":172,"source_url":168},13434,"在使用 PyTorch 预训练模型（如 ResNets）时，图像输入需要进行什么预处理？","使用预训练模型时，输入图像必须使用特定的均值（mean）和标准差（std）进行初始化。具体代码实现可参考 PyTorch ImageNet 示例中的第 89-101 行：https:\u002F\u002Fgithub.com\u002Fpytorch\u002Fexamples\u002Fblob\u002F42e5b996718797e45c46a25c55b031e6768f8440\u002Fimagenet\u002Fmain.py#L89-L101。此外，还可以利用 `torchsample` 和 `pytorch-tnt` 等实用工具库。",{"id":174,"question_zh":175,"answer_zh":176,"source_url":177},13435,"自然语言处理（NLP）领域有哪些有效的数据增强技术或资源？","推荐的 NLP 数据增强资源包括：\n1. EDA (Easy Data Augmentation)：适用于小数据集，可提升 2-3% 的性能。GitHub: https:\u002F\u002Fgithub.com\u002Fjasonwei20\u002Feda_nlp\n2. UDA (Unsupervised Data Augmentation)：一种半监督学习方法，在多种语言和视觉任务中达到最先进水平。GitHub: https:\u002F\u002Fgithub.com\u002Fgoogle-research\u002Fuda\n3. LeakGAN：用于文本生成。论文：https:\u002F\u002Farxiv.org\u002Fabs\u002F1709.08624","https:\u002F\u002Fgithub.com\u002Fmiguelgfierro\u002Fai_projects\u002Fissues\u002F104",{"id":179,"question_zh":180,"answer_zh":181,"source_url":177},13436,"计算机视觉（CV）领域有哪些先进的数据生成和增强方法？","推荐的 CV 数据增强方法和库包括：\n1. 使用 GANs 进行数据生成：https:\u002F\u002Farxiv.org\u002Fabs\u002F1711.04340\n2. AutoAugment：用于目标检测，在 COCO 验证集上达到 SOTA (50.7 mAP)。代码：https:\u002F\u002Fgithub.com\u002Ftensorflow\u002Ftpu\u002Ftree\u002Fmaster\u002Fmodels\u002Fofficial\u002Fdetection\n3. imgaug：一个强大的图像增强库。GitHub: https:\u002F\u002Fgithub.com\u002Faleju\u002Fimgaug\n4. UDA (Unsupervised Data Augmentation)：同样适用于视觉任务。",{"id":183,"question_zh":184,"answer_zh":185,"source_url":186},13437,"如何实现实时欺诈地图，即在调用 API 时若有欺诈行为则立即在地图上显示新点？","实现实时地图更新可以参考以下技术方案：\n1. 使用 Web Sockets 将 Flask 转换为实时服务器：https:\u002F\u002Fsecdevops.ai\u002Fweekend-project-part-2-turning-flask-into-a-real-time-websocket-server-using-flask-socketio-ab6b45f1d896\n2. 参考现有的实时地图项目源码，如 crimemap, flask-real-time-map, real_time_dashboard 等。\n3. 利用 amCharts 的 API 功能动态更新地图坐标、触发动画或改变颜色。","https:\u002F\u002Fgithub.com\u002Fmiguelgfierro\u002Fai_projects\u002Fissues\u002F85",[]]