[{"data":1,"prerenderedAt":-1},["ShallowReactive",2],{"similar-FighterLYL--GraphNeuralNetwork":3,"tool-FighterLYL--GraphNeuralNetwork":65},[4,23,32,40,49,57],{"id":5,"name":6,"github_repo":7,"description_zh":8,"stars":9,"difficulty_score":10,"last_commit_at":11,"category_tags":12,"status":22},2268,"ML-For-Beginners","microsoft\u002FML-For-Beginners","ML-For-Beginners 是由微软推出的一套系统化机器学习入门课程，旨在帮助零基础用户轻松掌握经典机器学习知识。这套课程将学习路径规划为 12 周，包含 26 节精炼课程和 52 道配套测验，内容涵盖从基础概念到实际应用的完整流程，有效解决了初学者面对庞大知识体系时无从下手、缺乏结构化指导的痛点。\n\n无论是希望转型的开发者、需要补充算法背景的研究人员，还是对人工智能充满好奇的普通爱好者，都能从中受益。课程不仅提供了清晰的理论讲解，还强调动手实践，让用户在循序渐进中建立扎实的技能基础。其独特的亮点在于强大的多语言支持，通过自动化机制提供了包括简体中文在内的 50 多种语言版本，极大地降低了全球不同背景用户的学习门槛。此外，项目采用开源协作模式，社区活跃且内容持续更新，确保学习者能获取前沿且准确的技术资讯。如果你正寻找一条清晰、友好且专业的机器学习入门之路，ML-For-Beginners 将是理想的起点。",84991,2,"2026-04-05T10:45:23",[13,14,15,16,17,18,19,20,21],"图像","数据工具","视频","插件","Agent","其他","语言模型","开发框架","音频","ready",{"id":24,"name":25,"github_repo":26,"description_zh":27,"stars":28,"difficulty_score":29,"last_commit_at":30,"category_tags":31,"status":22},3128,"ragflow","infiniflow\u002Fragflow","RAGFlow 是一款领先的开源检索增强生成（RAG）引擎，旨在为大语言模型构建更精准、可靠的上下文层。它巧妙地将前沿的 RAG 技术与智能体（Agent）能力相结合，不仅支持从各类文档中高效提取知识，还能让模型基于这些知识进行逻辑推理和任务执行。\n\n在大模型应用中，幻觉问题和知识滞后是常见痛点。RAGFlow 通过深度解析复杂文档结构（如表格、图表及混合排版），显著提升了信息检索的准确度，从而有效减少模型“胡编乱造”的现象，确保回答既有据可依又具备时效性。其内置的智能体机制更进一步，使系统不仅能回答问题，还能自主规划步骤解决复杂问题。\n\n这款工具特别适合开发者、企业技术团队以及 AI 研究人员使用。无论是希望快速搭建私有知识库问答系统，还是致力于探索大模型在垂直领域落地的创新者，都能从中受益。RAGFlow 提供了可视化的工作流编排界面和灵活的 API 接口，既降低了非算法背景用户的上手门槛，也满足了专业开发者对系统深度定制的需求。作为基于 Apache 2.0 协议开源的项目，它正成为连接通用大模型与行业专有知识之间的重要桥梁。",77062,3,"2026-04-04T04:44:48",[17,13,20,19,18],{"id":33,"name":34,"github_repo":35,"description_zh":36,"stars":37,"difficulty_score":29,"last_commit_at":38,"category_tags":39,"status":22},519,"PaddleOCR","PaddlePaddle\u002FPaddleOCR","PaddleOCR 是一款基于百度飞桨框架开发的高性能开源光学字符识别工具包。它的核心能力是将图片、PDF 等文档中的文字提取出来，转换成计算机可读取的结构化数据，让机器真正“看懂”图文内容。\n\n面对海量纸质或电子文档，PaddleOCR 解决了人工录入效率低、数字化成本高的问题。尤其在人工智能领域，它扮演着连接图像与大型语言模型（LLM）的桥梁角色，能将视觉信息直接转化为文本输入，助力智能问答、文档分析等应用场景落地。\n\nPaddleOCR 适合开发者、算法研究人员以及有文档自动化需求的普通用户。其技术优势十分明显：不仅支持全球 100 多种语言的识别，还能在 Windows、Linux、macOS 等多个系统上运行，并灵活适配 CPU、GPU、NPU 等各类硬件。作为一个轻量级且社区活跃的开源项目，PaddleOCR 既能满足快速集成的需求，也能支撑前沿的视觉语言研究，是处理文字识别任务的理想选择。",74939,"2026-04-05T23:16:38",[19,13,20,18],{"id":41,"name":42,"github_repo":43,"description_zh":44,"stars":45,"difficulty_score":46,"last_commit_at":47,"category_tags":48,"status":22},3215,"awesome-machine-learning","josephmisiti\u002Fawesome-machine-learning","awesome-machine-learning 是一份精心整理的机器学习资源清单，汇集了全球优秀的机器学习框架、库和软件工具。面对机器学习领域技术迭代快、资源分散且难以甄选的痛点，这份清单按编程语言（如 Python、C++、Go 等）和应用场景（如计算机视觉、自然语言处理、深度学习等）进行了系统化分类，帮助使用者快速定位高质量项目。\n\n它特别适合开发者、数据科学家及研究人员使用。无论是初学者寻找入门库，还是资深工程师对比不同语言的技术选型，都能从中获得极具价值的参考。此外，清单还延伸提供了免费书籍、在线课程、行业会议、技术博客及线下聚会等丰富资源，构建了从学习到实践的全链路支持体系。\n\n其独特亮点在于严格的维护标准：明确标记已停止维护或长期未更新的项目，确保推荐内容的时效性与可靠性。作为机器学习领域的“导航图”，awesome-machine-learning 以开源协作的方式持续更新，旨在降低技术探索门槛，让每一位从业者都能高效地站在巨人的肩膀上创新。",72149,1,"2026-04-03T21:50:24",[20,18],{"id":50,"name":51,"github_repo":52,"description_zh":53,"stars":54,"difficulty_score":46,"last_commit_at":55,"category_tags":56,"status":22},2234,"scikit-learn","scikit-learn\u002Fscikit-learn","scikit-learn 是一个基于 Python 构建的开源机器学习库，依托于 SciPy、NumPy 等科学计算生态，旨在让机器学习变得简单高效。它提供了一套统一且简洁的接口，涵盖了从数据预处理、特征工程到模型训练、评估及选择的全流程工具，内置了包括线性回归、支持向量机、随机森林、聚类等在内的丰富经典算法。\n\n对于希望快速验证想法或构建原型的数据科学家、研究人员以及 Python 开发者而言，scikit-learn 是不可或缺的基础设施。它有效解决了机器学习入门门槛高、算法实现复杂以及不同模型间调用方式不统一的痛点，让用户无需重复造轮子，只需几行代码即可调用成熟的算法解决分类、回归、聚类等实际问题。\n\n其核心技术亮点在于高度一致的 API 设计风格，所有估算器（Estimator）均遵循相同的调用逻辑，极大地降低了学习成本并提升了代码的可读性与可维护性。此外，它还提供了强大的模型选择与评估工具，如交叉验证和网格搜索，帮助用户系统地优化模型性能。作为一个由全球志愿者共同维护的成熟项目，scikit-learn 以其稳定性、详尽的文档和活跃的社区支持，成为连接理论学习与工业级应用的最",65628,"2026-04-05T10:10:46",[20,18,14],{"id":58,"name":59,"github_repo":60,"description_zh":61,"stars":62,"difficulty_score":10,"last_commit_at":63,"category_tags":64,"status":22},3364,"keras","keras-team\u002Fkeras","Keras 是一个专为人类设计的深度学习框架，旨在让构建和训练神经网络变得简单直观。它解决了开发者在不同深度学习后端之间切换困难、模型开发效率低以及难以兼顾调试便捷性与运行性能的痛点。\n\n无论是刚入门的学生、专注算法的研究人员，还是需要快速落地产品的工程师，都能通过 Keras 轻松上手。它支持计算机视觉、自然语言处理、音频分析及时间序列预测等多种任务。\n\nKeras 3 的核心亮点在于其独特的“多后端”架构。用户只需编写一套代码，即可灵活选择 TensorFlow、JAX、PyTorch 或 OpenVINO 作为底层运行引擎。这一特性不仅保留了 Keras 一贯的高层易用性，还允许开发者根据需求自由选择：利用 JAX 或 PyTorch 的即时执行模式进行高效调试，或切换至速度最快的后端以获得最高 350% 的性能提升。此外，Keras 具备强大的扩展能力，能无缝从本地笔记本电脑扩展至大规模 GPU 或 TPU 集群，是连接原型开发与生产部署的理想桥梁。",63927,"2026-04-04T15:24:37",[20,14,18],{"id":66,"github_repo":67,"name":68,"description_en":69,"description_zh":70,"ai_summary_zh":70,"readme_en":71,"readme_zh":72,"quickstart_zh":73,"use_case_zh":74,"hero_image_url":75,"owner_login":76,"owner_name":77,"owner_avatar_url":78,"owner_bio":77,"owner_company":77,"owner_location":77,"owner_email":77,"owner_twitter":77,"owner_website":77,"owner_url":79,"languages":80,"stars":89,"forks":90,"last_commit_at":91,"license":77,"difficulty_score":10,"env_os":92,"env_gpu":93,"env_ram":93,"env_deps":94,"category_tags":103,"github_topics":104,"view_count":10,"oss_zip_url":77,"oss_zip_packed_at":77,"status":22,"created_at":108,"updated_at":109,"faqs":110,"releases":151},4041,"FighterLYL\u002FGraphNeuralNetwork","GraphNeuralNetwork","《深入浅出图神经网络：GNN原理解析》配套代码","GraphNeuralNetwork 是畅销书《深入浅出图神经网络：GNN 原理解析》的官方配套代码仓库，旨在帮助读者将理论知识转化为实际动手能力。它通过提供完整的 Python 实现，解决了图神经网络（GNN）学习中“原理易懂但代码难复现”的痛点，让用户能直观地观察算法运行过程并验证核心概念。\n\n该项目涵盖了基于 GCN 的节点分类、GraphSage 示例、图分类任务以及图自编码器等多个经典场景，并内置了 Cora 等常用数据集的处理逻辑，支持开箱即用。代码基于 PyTorch、NumPy 和 SciPy 等主流科学计算库构建，结构清晰且注释详尽，同时作者还贴心地提供了书籍内容的勘误文档，确保技术细节的准确性。\n\nGraphNeuralNetwork 特别适合人工智能领域的研究人员、高校学生以及希望深入理解图算法的开发者使用。无论是用于学术研究的基准测试，还是作为入门 GNN 领域的实践教材，它都能提供坚实的技术支撑。对于想要系统掌握图神经网络从理论推导到工程落地全过程的学习者而言，这是一个不可多得的优质资源。","# GraphNeuralNetwork\n《深入浅出图神经网络：GNN原理解析》配套代码\n\n### 关于勘误\n\n>由于作者水平有限，时间仓促，书中难免会有一些错误或不准确的地方，给读者朋友造成了困扰，表示抱歉。\n仓库中提供了目前已经发现的一些问题的[勘误](.\u002F勘误.pdf),在此向指正这些错误的读者朋友表示感谢。\n\n* 在5.4节图滤波器的介绍中，存在一些描述错误和概念模糊的问题，可能给读者理解造成偏差，勘误中对相关问题进行了更正\n\n### 环境依赖\n```\npython>=3.6\njupyter\nscipy\nnumpy\nmatplotlib\ntorch>=1.2.0\n```\n\n### Getting Start\n\n* [x] [Chapter5: 基于GCN的节点分类](.\u002Fchapter5)\n* [x] [Chapter7: GraphSage示例](.\u002Fchapter7)\n* [x] [Chapter8: 图分类示例](.\u002Fchapter8)\n* [x] [Chapter9: 图自编码器](.\u002Fchapter9)\n\n### FAQ\n\n1. Cora数据集无法下载\n\nCora数据集地址是：[kimiyoung\u002Fplanetoid](https:\u002F\u002Fgithub.com\u002Fkimiyoung\u002Fplanetoid\u002Ftree\u002Fmaster\u002Fdata)。\n~~仓库中提供了一份使用到的cora数据，可以分别将它放在 `chapter5\u002Fcora\u002Fraw` 或者 `chapter7\u002Fcora\u002Fraw` 目录下。~~\n新代码直接使用本地数据.\n","# 图神经网络\n《深入浅出图神经网络：GNN原理解析》配套代码\n\n### 关于勘误\n\n>由于作者水平有限，时间仓促，书中难免会有一些错误或不准确的地方，给读者朋友造成了困扰，表示抱歉。\n仓库中提供了目前已经发现的一些问题的[勘误](.\u002F勘误.pdf),在此向指正这些错误的读者朋友表示感谢。\n\n* 在5.4节图滤波器的介绍中，存在一些描述错误和概念模糊的问题，可能给读者理解造成偏差，勘误中对相关问题进行了更正\n\n### 环境依赖\n```\npython>=3.6\njupyter\nscipy\nnumpy\nmatplotlib\ntorch>=1.2.0\n```\n\n### 开始使用\n\n* [x] [第5章：基于GCN的节点分类](.\u002Fchapter5)\n* [x] [第7章：GraphSage示例](.\u002Fchapter7)\n* [x] [第8章：图分类示例](.\u002Fchapter8)\n* [x] [第9章：图自编码器](.\u002Fchapter9)\n\n### 常见问题解答\n\n1. Cora数据集无法下载\n\nCora数据集地址是：[kimiyoung\u002Fplanetoid](https:\u002F\u002Fgithub.com\u002Fkimiyoung\u002Fplanetoid\u002Ftree\u002Fmaster\u002Fdata)。\n~~仓库中提供了一份使用到的cora数据，可以分别将它放在 `chapter5\u002Fcora\u002Fraw` 或者 `chapter7\u002Fcora\u002Fraw` 目录下。~~\n新代码直接使用本地数据.","# GraphNeuralNetwork 快速上手指南\n\n本指南基于《深入浅出图神经网络：GNN 原理解析》配套代码，帮助开发者快速搭建环境并运行示例。\n\n## 环境准备\n\n在开始之前，请确保您的系统满足以下要求：\n\n*   **操作系统**：Linux \u002F macOS \u002F Windows\n*   **Python 版本**：>= 3.6\n*   **核心依赖库**：\n    *   `jupyter`\n    *   `scipy`\n    *   `numpy`\n    *   `matplotlib`\n    *   `torch` (版本 >= 1.2.0)\n\n## 安装步骤\n\n建议使用国内镜像源（如清华源）以加速依赖包的安装。\n\n1.  **克隆项目代码**\n    ```bash\n    git clone \u003C项目仓库地址>\n    cd GraphNeuralNetwork\n    ```\n\n2.  **安装 Python 依赖**\n    使用 pip 配合清华镜像源安装所需库：\n    ```bash\n    pip install -r requirements.txt -i https:\u002F\u002Fpypi.tuna.tsinghua.edu.cn\u002Fsimple\n    ```\n    *注：若项目中无 `requirements.txt` 文件，请直接运行以下命令安装核心依赖：*\n    ```bash\n    pip install jupyter scipy numpy matplotlib torch>=1.2.0 -i https:\u002F\u002Fpypi.tuna.tsinghua.edu.cn\u002Fsimple\n    ```\n\n## 基本使用\n\n本项目已内置多个章节的示例代码，可直接通过 Jupyter Notebook 运行。\n\n1.  **启动 Jupyter Notebook**\n    在项目根目录下执行：\n    ```bash\n    jupyter notebook\n    ```\n\n2.  **运行示例**\n    浏览器打开后，进入对应章节目录运行 `.ipynb` 文件。目前支持的示例包括：\n    *   **节点分类**：`.\u002Fchapter5` (基于 GCN)\n    *   **GraphSage 示例**：`.\u002Fchapter7`\n    *   **图分类示例**：`.\u002Fchapter8`\n    *   **图自编码器**：`.\u002Fchapter9`\n\n    *说明：新版代码已配置为直接使用本地数据，无需手动下载 Cora 数据集。*","某高校科研团队正在开展学术引用网络分析项目，试图利用图神经网络预测论文的研究领域分类。\n\n### 没有 GraphNeuralNetwork 时\n- **理论落地困难**：研究人员虽理解 GNN 数学原理，但缺乏标准化的 PyTorch 实现代码，从零构建 GCN 或 GraphSage 模型耗时且易出错。\n- **数据预处理繁琐**：处理 Cora 等标准数据集时，需手动编写复杂的邻接矩阵归一化和特征对齐脚本，常因格式问题导致训练失败。\n- **调试成本高昂**：在复现图滤波器或自编码器结构时，由于缺乏参考基线，难以定位是模型架构错误还是超参数设置不当。\n- **知识更新滞后**：书中部分章节（如 5.4 节）存在概念模糊，若无配套勘误和修正代码，极易误导实验方向，造成无效算力消耗。\n\n### 使用 GraphNeuralNetwork 后\n- **快速原型开发**：直接调用 Chapter 5 和 Chapter 7 中成熟的 GCN 与 GraphSage 示例代码，将模型搭建时间从数周缩短至几小时。\n- **流程标准化**：利用内置的数据加载模块自动处理 Cora 数据集的本地化读取与预处理，消除了手动清洗数据的重复劳动。\n- **精准排错验证**：对照书中勘误修正后的代码逻辑，迅速排查图卷积过程中的维度不匹配问题，确保实验结果可复现。\n- **全场景覆盖**：基于 Chapter 8 和 Chapter 9 的模板，轻松扩展至图分类和图自编码器任务，无需重新发明轮子即可验证多种算法效果。\n\nGraphNeuralNetwork 通过提供经校验的配套代码与勘误支持，将抽象的图神经网络理论转化为可立即执行的工程实践，极大降低了科研门槛。","https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002FFighterLYL_GraphNeuralNetwork_2b56db16.png","FighterLYL",null,"https:\u002F\u002Foss.gittoolsai.com\u002Favatars\u002FFighterLYL_a1158574.png","https:\u002F\u002Fgithub.com\u002FFighterLYL",[81,85],{"name":82,"color":83,"percentage":84},"Jupyter Notebook","#DA5B0B",55,{"name":86,"color":87,"percentage":88},"Python","#3572A5",45,1921,477,"2026-04-04T20:11:15","","未说明",{"notes":95,"python":96,"dependencies":97},"本项目为《深入浅出图神经网络：GNN 原理解析》配套代码。新代码版本已支持直接使用本地数据，无需手动下载 Cora 数据集。书中 5.4 节关于图滤波器的描述存在勘误，请参考仓库中的勘误文件。",">=3.6",[98,99,100,101,102],"jupyter","scipy","numpy","matplotlib","torch>=1.2.0",[18],[105,106,107],"gnn","gcn","graph-neural-network","2026-03-27T02:49:30.150509","2026-04-06T08:37:47.610825",[111,116,121,126,131,136,141,146],{"id":112,"question_zh":113,"answer_zh":114,"source_url":115},18391,"安装 torch-scatter 时提示找不到 CUDA 路径或报错，如何在 CPU 环境下安装？","torch_scatter 安装时默认会寻找 CUDA 路径。若需在 CPU 环境下运行，可以通过设置环境变量 FORCE_CPU=1 来屏蔽该行为。请尝试使用以下命令安装：\nFORCE_CPU=1 python -m pip install --verbose --no-cache-dir torch-scatter\n此外，如果提示找不到 torch，可能是电脑上存在多套 Python 环境导致 pip 与 python 不一致，建议改用 python -m pip install ... 的方式确保使用当前 Python 环境对应的 pip。","https:\u002F\u002Fgithub.com\u002FFighterLYL\u002FGraphNeuralNetwork\u002Fissues\u002F26",{"id":117,"question_zh":118,"answer_zh":119,"source_url":120},18392,"Cora 等经典数据集的官方下载链接失效，或者下载后运行代码报 'UnpicklingError' 错误怎么办？","如果原始链接（如 planetoid 仓库）无法访问，可以直接使用本项目仓库中提供的数据集。请将下载好的 cora 数据集保存到本地，并放置于代码预定的目录中。如果仍然出现 'UnpicklingError: invalid load key' 错误，通常是因为下载的文件损坏或格式不对，请务必检查是否使用了仓库 README 中 FAQ 部分指定的正确数据文件或备份链接。","https:\u002F\u002Fgithub.com\u002FFighterLYL\u002FGraphNeuralNetwork\u002Fissues\u002F17",{"id":122,"question_zh":123,"answer_zh":124,"source_url":125},18393,"为什么 Cora 数据集的训练集、验证集和测试集划分比例是 140:500:1000，而不是按样本总数平均划分？","这种划分方式是图神经网络领域的标准惯例，源自 Kipf 和 Welling 的 GCN 论文 (ICLR 2017)。对于 Cora、Citeseer、Pubmed 这三个经典引用网络数据集，标准做法是从每个类别（label）中选取 20 个节点作为训练集。Cora 数据集共有 7 个类别，因此训练集总数为 7 * 20 = 140 个节点。这种划分旨在模拟半监督学习场景，而非随机均匀划分。","https:\u002F\u002Fgithub.com\u002FFighterLYL\u002FGraphNeuralNetwork\u002Fissues\u002F54",{"id":127,"question_zh":128,"answer_zh":129,"source_url":130},18394,"在使用 GraphSAGE 或其他模型训练时，Loss 一直为 NaN（无穷大），可能是什么原因？","这通常是由于输入数据存在问题。特别是在对特征矩阵 x 进行归一化处理后，可能会产生 np.inf（无穷大）的值。你需要检查输入数据，并将这些无穷大值替换为 0。可以在代码中加入如下处理逻辑：\nx[x == np.inf] = 0\n这样可以避免计算过程中出现数值溢出导致 Loss 变为 NaN。","https:\u002F\u002Fgithub.com\u002FFighterLYL\u002FGraphNeuralNetwork\u002Fissues\u002F30",{"id":132,"question_zh":133,"answer_zh":134,"source_url":135},18395,"运行图分类代码更换数据集（如 DBLP_v1）时，报错提示“类值不能为负值”或 one_hot 函数出错，如何解决？","该错误通常是因为传入 one_hot 函数的节点标签（node_labels）中包含负数或非预期的值。one_hot 编码要求标签必须是非负整数。请检查你的数据集标签文件，并在程序中打印 node_labels 的最小值（min(node_labels)）以确认是否存在负数。如果存在，需要对标签数据进行预处理，将其映射到从 0 开始的连续非负整数区间。","https:\u002F\u002Fgithub.com\u002FFighterLYL\u002FGraphNeuralNetwork\u002Fissues\u002F38",{"id":137,"question_zh":138,"answer_zh":139,"source_url":140},18396,"书中关于拉普拉斯矩阵正交分解的特征向量计算结果与代码运行结果符号相反（方向不同），是否正确？","这是正常现象。特征向量的方向（正负号）并不影响其数学性质，因为如果 v 是特征向量，那么 -v 也是对应同一特征值的特征向量。在不同版本的 numpy 库或不同的计算环境下，求解特征值分解时得到的特征向量方向可能会相反。只要特征值对应正确，且特征向量之间保持正交关系，结果就是正确的，不影响后续计算。","https:\u002F\u002Fgithub.com\u002FFighterLYL\u002FGraphNeuralNetwork\u002Fissues\u002F52",{"id":142,"question_zh":143,"answer_zh":144,"source_url":145},18397,"购买了 Kindle 电子版书籍，发现内容有误，如何获取修正后的版本？","电子书的更新通常受限于出版平台（如亚马逊）的流程。建议直接给亚马逊客服发送邮件反馈此问题，请求更新或替换。同时，也可以关注出版社的动态，作者已将勘误信息反馈给出版社，他们正在排查和处理相关问题。在等待期间，可以配合查看项目仓库中提供的勘误 PDF 文件。","https:\u002F\u002Fgithub.com\u002FFighterLYL\u002FGraphNeuralNetwork\u002Fissues\u002F41",{"id":147,"question_zh":148,"answer_zh":149,"source_url":150},18398,"书中提到的“同构图”只有一种节点类型，那为什么还能进行节点分类任务？","这里需要区分“节点类型”和“节点标记（Label）”的概念。同构图是指图中所有节点属于同一种类型（例如都是“论文”），所有边属于同一种关系（例如都是“引用”）。但这并不妨碍节点拥有不同的“标记”或“类别标签”。例如在论文引用图中，虽然节点类型都是论文，但我们可以根据论文的研究领域（如 AI、DB、IR 等）给它们打上不同的分类标签，从而进行节点分类任务。","https:\u002F\u002Fgithub.com\u002FFighterLYL\u002FGraphNeuralNetwork\u002Fissues\u002F49",[]]