[{"data":1,"prerenderedAt":-1},["ShallowReactive",2],{"tool-jatinshah--ufldl_tutorial":3,"similar-jatinshah--ufldl_tutorial":49},{"id":4,"github_repo":5,"name":6,"description_en":7,"description_zh":8,"ai_summary_zh":8,"readme_en":9,"readme_zh":10,"quickstart_zh":11,"use_case_zh":12,"hero_image_url":13,"owner_login":14,"owner_name":15,"owner_avatar_url":16,"owner_bio":17,"owner_company":17,"owner_location":18,"owner_email":17,"owner_twitter":14,"owner_website":17,"owner_url":19,"languages":20,"stars":25,"forks":26,"last_commit_at":27,"license":28,"difficulty_score":29,"env_os":30,"env_gpu":30,"env_ram":30,"env_deps":31,"category_tags":38,"github_topics":40,"view_count":29,"oss_zip_url":17,"oss_zip_packed_at":17,"status":44,"created_at":45,"updated_at":46,"faqs":47,"releases":48},4845,"jatinshah\u002Fufldl_tutorial","ufldl_tutorial","Stanford Unsupervised Feature Learning and Deep Learning Tutorial","ufldl_tutorial 是斯坦福大学推出的无监督特征学习与深度学习经典教程的代码实现集合。它旨在帮助学习者从零开始掌握深度神经网络的核心原理，通过动手实践解决“如何从无标签数据中自动提取有效特征”以及“如何构建深层网络进行分类”等关键问题。\n\n这套资源非常适合人工智能领域的初学者、高校学生及研究人员使用。不同于仅提供黑盒调用的现代框架，ufldl_tutorial 强调算法底层的数学推导与代码落地。其独特亮点在于提供了稀疏自编码器、PCA 白化预处理、软最大回归、自我学习范式以及堆叠自编码器等模块的向量化实现。用户可以直接在 MNIST 手写数字和 STL-10 图像数据集上运行代码，直观地观察特征可视化效果，并逐步深入理解卷积神经网络（CNN）的构建过程。对于希望夯实理论基础、透彻理解反向传播与特征提取机制的开发者而言，这是一份不可多得的实战指南。","## Stanford Unsupervised Feature Learning and Deep Learning Tutorial\n\nTutorial Website: http:\u002F\u002Fufldl.stanford.edu\u002Fwiki\u002Findex.php\u002FUFLDL_Tutorial\n\n### Sparse Autoencoder\nSparse Autoencoder vectorized implementation, learning\u002Fvisualizing features on MNIST data\n\n* [load_MNIST.py](load_MNIST.py): Load MNIST images\n* [sample_images.py](sample_images.py): Load sample images for testing sparse auto-encoder\n* [gradient.py](gradient.py): Functions to compute & check cost and gradient\n* [display_network.py](display_network.py): Display visualized features\n* [sparse_autoencoder.py](sparse_autoencoder.py): Sparse autoencoder cost & gradient functions\n* [train.py](train.py): Train sparse autoencoder with MNIST data and visualize learnt featured\n\n### Preprocessing: PCA & Whitening\nImplement PCA, PCA whitening & ZCA whitening\n\n* [pca_gen.py](pca_gen.py)\n\n### Softmax Regression\nClassify MNIST digits via softmax regression (multivariate logistic regression)\n\n* [softmax.py](softmax.py): Softmax regression cost & gradient functions\n* [softmax_exercise](softmax_exercise.py): Classify MNIST digits\n\n### Self-Taught Learning and Unsupervised Feature Learning\nClassify MNIST digits via self-taught learning paradigm, i.e. learn features via sparse autoencoder using digits 5-9 as unlabelled examples and train softmax regression on digits 0-4 as labelled examples\n\n* [stl_exercise.py](stl_exercise.py): Classify MNIST digits via self-taught learning\n\n### Building Deep Networks for Classification (Stacked Sparse Autoencoder)\nStacked sparse autoencoder for MNIST digit classification\n\n* [stacked_autoencoder.py](stacked_autoencoder.py): Stacked auto encoder cost & gradient functions\n* [stacked_ae_exercise.py](stacked_ae_exercise.py): Classify MNIST digits\n\n### Linear Decoders with Auto encoders\nLearn features on 8x8 patches of 96x96 STL-10 color images via linear decoder (sparse autoencoder with linear activation function in output layer)\n\n* [linear_decoder_exercise.py](linear_decoder_exercise.py)\n\n### Working with Large Images (Convolutional Neural Networks)\nClassify 64x64 STL-10 images using features learnt via linear decoder (previous section) and convolutional neural networks\n\n* [cnn.py](cnn.py): Convolution neural networks. Convolve & Pooling functions\n* [cnn_exercise.py](cnn_exercise.py): Classify STL-10 images\n","## 斯坦福无监督特征学习与深度学习教程\n\n教程网站：http:\u002F\u002Fufldl.stanford.edu\u002Fwiki\u002Findex.php\u002FUFLDL_Tutorial\n\n### 稀疏自编码器\n稀疏自编码器的向量化实现，在MNIST数据上学习并可视化特征。\n\n* [load_MNIST.py](load_MNIST.py)：加载MNIST图像\n* [sample_images.py](sample_images.py)：加载用于测试稀疏自编码器的样本图像\n* [gradient.py](gradient.py)：计算并检查损失和梯度的函数\n* [display_network.py](display_network.py)：显示可视化后的特征\n* [sparse_autoencoder.py](sparse_autoencoder.py)：稀疏自编码器的损失和梯度函数\n* [train.py](train.py)：使用MNIST数据训练稀疏自编码器，并可视化学习到的特征\n\n### 预处理：PCA与白化\n实现PCA、PCA白化及ZCA白化。\n\n* [pca_gen.py](pca_gen.py)\n\n### Softmax回归\n通过softmax回归（多元逻辑回归）对MNIST数字进行分类。\n\n* [softmax.py](softmax.py)：Softmax回归的损失和梯度函数\n* [softmax_exercise](softmax_exercise.py)：对MNIST数字进行分类\n\n### 自学式学习与无监督特征学习\n采用自学式学习范式对MNIST数字进行分类，即利用5-9的数字作为未标注样本，通过稀疏自编码器学习特征；再以0-4的数字作为标注样本，训练Softmax回归模型。\n\n* [stl_exercise.py](stl_exercise.py)：通过自学式学习对MNIST数字进行分类\n\n### 构建用于分类的深度网络（堆叠稀疏自编码器）\n用于MNIST数字分类的堆叠稀疏自编码器。\n\n* [stacked_autoencoder.py](stacked_autoencoder.py)：堆叠自编码器的损失和梯度函数\n* [stacked_ae_exercise.py](stacked_ae_exercise.py)：对MNIST数字进行分类\n\n### 带有线性解码器的自编码器\n通过线性解码器（输出层使用线性激活函数的稀疏自编码器），在96×96的STL-10彩色图像的8×8小块上学习特征。\n\n* [linear_decoder_exercise.py](linear_decoder_exercise.py)\n\n### 处理大尺寸图像（卷积神经网络）\n利用前一节中通过线性解码器学到的特征，结合卷积神经网络，对64×64的STL-10图像进行分类。\n\n* [cnn.py](cnn.py)：卷积神经网络。包含卷积与池化函数\n* [cnn_exercise.py](cnn_exercise.py)：对STL-10图像进行分类","# ufldl_tutorial 快速上手指南\n\n本指南基于斯坦福大学无监督特征学习与深度学习教程（UFLDL Tutorial）的开源实现，帮助开发者快速在本地运行稀疏自编码器、软最大回归及卷积神经网络等经典算法示例。\n\n## 环境准备\n\n*   **操作系统**：Linux, macOS 或 Windows (需配置 Python 环境)\n*   **Python 版本**：推荐 Python 3.6+ (部分旧版代码可能依赖 Python 2.7，建议优先尝试 Python 3)\n*   **核心依赖**：\n    *   `numpy`：数值计算\n    *   `scipy`：科学计算与优化算法\n    *   `matplotlib`：图像可视化\n    *   `Pillow` (可选)：图像处理\n\n**国内加速方案**：\n建议使用清华或阿里镜像源安装依赖，以提升下载速度：\n```bash\npip install numpy scipy matplotlib -i https:\u002F\u002Fpypi.tuna.tsinghua.edu.cn\u002Fsimple\n```\n\n## 安装步骤\n\n1.  **克隆仓库**\n    从 GitHub 获取源代码：\n    ```bash\n    git clone https:\u002F\u002Fgithub.com\u002Fufldl\u002Fufldl_tutorial.git\n    cd ufldl_tutorial\n    ```\n\n2.  **验证依赖**\n    确保已安装上述核心库。若未安装，执行：\n    ```bash\n    pip install -r requirements.txt\n    ```\n    *(注：若仓库中无 requirements.txt 文件，请手动执行“环境准备”中的安装命令)*\n\n3.  **数据准备**\n    首次运行脚本时（如 `load_MNIST.py`），程序通常会自动下载 MNIST 数据集。若自动下载失败，可手动从 [http:\u002F\u002Fyann.lecun.com\u002Fexdb\u002Fmnist\u002F](http:\u002F\u002Fyann.lecun.com\u002Fexdb\u002Fmnist\u002F) 下载数据文件并放置于项目根目录或脚本指定的数据文件夹中。\n\n## 基本使用\n\n以下以**稀疏自编码器（Sparse Autoencoder）**在 MNIST 数据集上的训练与可视化为例，展示最基础的使用流程。\n\n### 1. 运行训练与可视化\n执行 `train.py` 脚本，该脚本将加载 MNIST 数据，训练稀疏自编码器，并可视化学习到的特征权重。\n\n```bash\npython train.py\n```\n\n**预期输出**：\n*   终端将打印迭代过程中的代价函数（Cost）变化。\n*   训练完成后，将弹出一个窗口显示学习到的特征图像（类似边缘检测算子）。\n\n### 2. 其他模块示例\n本项目包含多个独立模块，可根据需求直接运行对应的 exercise 文件：\n\n*   **PCA 与白化处理**：\n    ```bash\n    python pca_gen.py\n    ```\n*   **Softmax 回归分类**：\n    ```bash\n    python softmax_exercise.py\n    ```\n*   **自我学习（Self-Taught Learning）**：\n    ```bash\n    python stl_exercise.py\n    ```\n*   **堆叠自编码器（深度网络）**：\n    ```bash\n    python stacked_ae_exercise.py\n    ```\n*   **卷积神经网络 (CNN)**：\n    ```bash\n    python cnn_exercise.py\n    ```\n\n> **注意**：部分涉及大型数据集（如 STL-10）或深层网络的脚本（如 `cnn_exercise.py`）可能需要较长的训练时间，建议在具备 GPU 加速的环境或通过调整代码中的迭代次数进行测试。","某计算机视觉初创团队正尝试利用少量标注数据，构建一个能识别工业零件缺陷的分类模型。\n\n### 没有 ufldl_tutorial 时\n- 团队面对海量无标签的零件图像束手无策，只能放弃利用这些数据，导致模型训练样本严重不足。\n- 手动推导稀疏自编码器的代价函数与梯度公式极易出错，调试神经网络反向传播过程耗费数周时间。\n- 缺乏标准的 PCA 白化预处理代码，输入数据的特征分布不均，直接导致后续分类器收敛极慢甚至不收敛。\n- 无法直观理解网络学到的特征含义，面对“黑盒”模型不敢贸然部署到生产线。\n\n### 使用 ufldl_tutorial 后\n- 直接复用“自学式学习”模块，成功利用未标注的缺陷图片预训练特征提取器，仅需少量标注数据即可训练出高精度 Softmax 分类器。\n- 调用现成的向量化梯度计算与检查函数，快速验证了数学推导的正确性，将算法调试周期从数周缩短至两天。\n- 集成内置的 PCA 及 ZCA 白化脚本，标准化了图像预处理流程，显著提升了模型训练的稳定性与速度。\n- 通过可视化工具直接观测到网络提取的边缘与纹理特征，确认模型确实学到了零件的关键缺陷模式，增强了部署信心。\n\nufldl_tutorial 将复杂的无监督学习理论转化为可执行的代码模板，帮助开发者低成本地实现了从小样本数据中挖掘高价值特征的目标。","https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002Fjatinshah_ufldl_tutorial_9fcee276.png","jatinshah","Jatin Shah","https:\u002F\u002Foss.gittoolsai.com\u002Favatars\u002Fjatinshah_8fdccc5d.png",null,"Singapore","https:\u002F\u002Fgithub.com\u002Fjatinshah",[21],{"name":22,"color":23,"percentage":24},"Python","#3572A5",100,696,329,"2026-01-20T03:26:21","MIT",2,"未说明",{"notes":32,"python":30,"dependencies":33},"该项目为斯坦福大学早期的无监督特征学习教程代码，主要基于传统的数值计算库（如 NumPy、SciPy）实现，未使用现代深度学习框架（如 TensorFlow 或 PyTorch）。代码中包含大量已废弃的 Python 2 语法（如 print 语句），在现代 Python 3 环境中运行前需要手动修改代码。涉及的数据集（MNIST, STL-10）需自行下载并放置于指定目录。由于是教学演示代码，对硬件资源要求较低，普通 CPU 即可运行。",[34,35,36,37],"numpy","scipy","matplotlib","Pillow",[39],"开发框架",[41,42,43],"deep-learning","deep-learning-tutorial","convolutional-neural-networks","ready","2026-03-27T02:49:30.150509","2026-04-07T13:29:04.081693",[],[],[50,62,70,79,87,96],{"id":51,"name":52,"github_repo":53,"description_zh":54,"stars":55,"difficulty_score":56,"last_commit_at":57,"category_tags":58,"status":44},4358,"openclaw","openclaw\u002Fopenclaw","OpenClaw 是一款专为个人打造的本地化 AI 助手，旨在让你在自己的设备上拥有完全可控的智能伙伴。它打破了传统 AI 助手局限于特定网页或应用的束缚，能够直接接入你日常使用的各类通讯渠道，包括微信、WhatsApp、Telegram、Discord、iMessage 等数十种平台。无论你在哪个聊天软件中发送消息，OpenClaw 都能即时响应，甚至支持在 macOS、iOS 和 Android 设备上进行语音交互，并提供实时的画布渲染功能供你操控。\n\n这款工具主要解决了用户对数据隐私、响应速度以及“始终在线”体验的需求。通过将 AI 部署在本地，用户无需依赖云端服务即可享受快速、私密的智能辅助，真正实现了“你的数据，你做主”。其独特的技术亮点在于强大的网关架构，将控制平面与核心助手分离，确保跨平台通信的流畅性与扩展性。\n\nOpenClaw 非常适合希望构建个性化工作流的技术爱好者、开发者，以及注重隐私保护且不愿被单一生态绑定的普通用户。只要具备基础的终端操作能力（支持 macOS、Linux 及 Windows WSL2），即可通过简单的命令行引导完成部署。如果你渴望拥有一个懂你",349277,3,"2026-04-06T06:32:30",[59,39,60,61],"Agent","图像","数据工具",{"id":63,"name":64,"github_repo":65,"description_zh":66,"stars":67,"difficulty_score":56,"last_commit_at":68,"category_tags":69,"status":44},3808,"stable-diffusion-webui","AUTOMATIC1111\u002Fstable-diffusion-webui","stable-diffusion-webui 是一个基于 Gradio 构建的网页版操作界面，旨在让用户能够轻松地在本地运行和使用强大的 Stable Diffusion 图像生成模型。它解决了原始模型依赖命令行、操作门槛高且功能分散的痛点，将复杂的 AI 绘图流程整合进一个直观易用的图形化平台。\n\n无论是希望快速上手的普通创作者、需要精细控制画面细节的设计师，还是想要深入探索模型潜力的开发者与研究人员，都能从中获益。其核心亮点在于极高的功能丰富度：不仅支持文生图、图生图、局部重绘（Inpainting）和外绘（Outpainting）等基础模式，还独创了注意力机制调整、提示词矩阵、负向提示词以及“高清修复”等高级功能。此外，它内置了 GFPGAN 和 CodeFormer 等人脸修复工具，支持多种神经网络放大算法，并允许用户通过插件系统无限扩展能力。即使是显存有限的设备，stable-diffusion-webui 也提供了相应的优化选项，让高质量的 AI 艺术创作变得触手可及。",162132,"2026-04-05T11:01:52",[39,60,59],{"id":71,"name":72,"github_repo":73,"description_zh":74,"stars":75,"difficulty_score":29,"last_commit_at":76,"category_tags":77,"status":44},1381,"everything-claude-code","affaan-m\u002Feverything-claude-code","everything-claude-code 是一套专为 AI 编程助手（如 Claude Code、Codex、Cursor 等）打造的高性能优化系统。它不仅仅是一组配置文件，而是一个经过长期实战打磨的完整框架，旨在解决 AI 代理在实际开发中面临的效率低下、记忆丢失、安全隐患及缺乏持续学习能力等核心痛点。\n\n通过引入技能模块化、直觉增强、记忆持久化机制以及内置的安全扫描功能，everything-claude-code 能显著提升 AI 在复杂任务中的表现，帮助开发者构建更稳定、更智能的生产级 AI 代理。其独特的“研究优先”开发理念和针对 Token 消耗的优化策略，使得模型响应更快、成本更低，同时有效防御潜在的攻击向量。\n\n这套工具特别适合软件开发者、AI 研究人员以及希望深度定制 AI 工作流的技术团队使用。无论您是在构建大型代码库，还是需要 AI 协助进行安全审计与自动化测试，everything-claude-code 都能提供强大的底层支持。作为一个曾荣获 Anthropic 黑客大奖的开源项目，它融合了多语言支持与丰富的实战钩子（hooks），让 AI 真正成长为懂上",142651,"2026-04-06T23:34:12",[39,59,78],"语言模型",{"id":80,"name":81,"github_repo":82,"description_zh":83,"stars":84,"difficulty_score":29,"last_commit_at":85,"category_tags":86,"status":44},2271,"ComfyUI","Comfy-Org\u002FComfyUI","ComfyUI 是一款功能强大且高度模块化的视觉 AI 引擎，专为设计和执行复杂的 Stable Diffusion 图像生成流程而打造。它摒弃了传统的代码编写模式，采用直观的节点式流程图界面，让用户通过连接不同的功能模块即可构建个性化的生成管线。\n\n这一设计巧妙解决了高级 AI 绘图工作流配置复杂、灵活性不足的痛点。用户无需具备编程背景，也能自由组合模型、调整参数并实时预览效果，轻松实现从基础文生图到多步骤高清修复等各类复杂任务。ComfyUI 拥有极佳的兼容性，不仅支持 Windows、macOS 和 Linux 全平台，还广泛适配 NVIDIA、AMD、Intel 及苹果 Silicon 等多种硬件架构，并率先支持 SDXL、Flux、SD3 等前沿模型。\n\n无论是希望深入探索算法潜力的研究人员和开发者，还是追求极致创作自由度的设计师与资深 AI 绘画爱好者，ComfyUI 都能提供强大的支持。其独特的模块化架构允许社区不断扩展新功能，使其成为当前最灵活、生态最丰富的开源扩散模型工具之一，帮助用户将创意高效转化为现实。",107888,"2026-04-06T11:32:50",[39,60,59],{"id":88,"name":89,"github_repo":90,"description_zh":91,"stars":92,"difficulty_score":29,"last_commit_at":93,"category_tags":94,"status":44},4721,"markitdown","microsoft\u002Fmarkitdown","MarkItDown 是一款由微软 AutoGen 团队打造的轻量级 Python 工具，专为将各类文件高效转换为 Markdown 格式而设计。它支持 PDF、Word、Excel、PPT、图片（含 OCR）、音频（含语音转录）、HTML 乃至 YouTube 链接等多种格式的解析，能够精准提取文档中的标题、列表、表格和链接等关键结构信息。\n\n在人工智能应用日益普及的今天，大语言模型（LLM）虽擅长处理文本，却难以直接读取复杂的二进制办公文档。MarkItDown 恰好解决了这一痛点，它将非结构化或半结构化的文件转化为模型“原生理解”且 Token 效率极高的 Markdown 格式，成为连接本地文件与 AI 分析 pipeline 的理想桥梁。此外，它还提供了 MCP（模型上下文协议）服务器，可无缝集成到 Claude Desktop 等 LLM 应用中。\n\n这款工具特别适合开发者、数据科学家及 AI 研究人员使用，尤其是那些需要构建文档检索增强生成（RAG）系统、进行批量文本分析或希望让 AI 助手直接“阅读”本地文件的用户。虽然生成的内容也具备一定可读性，但其核心优势在于为机器",93400,"2026-04-06T19:52:38",[95,39],"插件",{"id":97,"name":98,"github_repo":99,"description_zh":100,"stars":101,"difficulty_score":56,"last_commit_at":102,"category_tags":103,"status":44},4487,"LLMs-from-scratch","rasbt\u002FLLMs-from-scratch","LLMs-from-scratch 是一个基于 PyTorch 的开源教育项目，旨在引导用户从零开始一步步构建一个类似 ChatGPT 的大型语言模型（LLM）。它不仅是同名技术著作的官方代码库，更提供了一套完整的实践方案，涵盖模型开发、预训练及微调的全过程。\n\n该项目主要解决了大模型领域“黑盒化”的学习痛点。许多开发者虽能调用现成模型，却难以深入理解其内部架构与训练机制。通过亲手编写每一行核心代码，用户能够透彻掌握 Transformer 架构、注意力机制等关键原理，从而真正理解大模型是如何“思考”的。此外，项目还包含了加载大型预训练权重进行微调的代码，帮助用户将理论知识延伸至实际应用。\n\nLLMs-from-scratch 特别适合希望深入底层原理的 AI 开发者、研究人员以及计算机专业的学生。对于不满足于仅使用 API，而是渴望探究模型构建细节的技术人员而言，这是极佳的学习资源。其独特的技术亮点在于“循序渐进”的教学设计：将复杂的系统工程拆解为清晰的步骤，配合详细的图表与示例，让构建一个虽小但功能完备的大模型变得触手可及。无论你是想夯实理论基础，还是为未来研发更大规模的模型做准备",90106,"2026-04-06T11:19:32",[78,60,59,39]]