[{"data":1,"prerenderedAt":-1},["ShallowReactive",2],{"similar-csuldw--MachineLearning":3,"tool-csuldw--MachineLearning":65},[4,23,32,40,49,57],{"id":5,"name":6,"github_repo":7,"description_zh":8,"stars":9,"difficulty_score":10,"last_commit_at":11,"category_tags":12,"status":22},2268,"ML-For-Beginners","microsoft\u002FML-For-Beginners","ML-For-Beginners 是由微软推出的一套系统化机器学习入门课程，旨在帮助零基础用户轻松掌握经典机器学习知识。这套课程将学习路径规划为 12 周，包含 26 节精炼课程和 52 道配套测验，内容涵盖从基础概念到实际应用的完整流程，有效解决了初学者面对庞大知识体系时无从下手、缺乏结构化指导的痛点。\n\n无论是希望转型的开发者、需要补充算法背景的研究人员，还是对人工智能充满好奇的普通爱好者，都能从中受益。课程不仅提供了清晰的理论讲解，还强调动手实践，让用户在循序渐进中建立扎实的技能基础。其独特的亮点在于强大的多语言支持，通过自动化机制提供了包括简体中文在内的 50 多种语言版本，极大地降低了全球不同背景用户的学习门槛。此外，项目采用开源协作模式，社区活跃且内容持续更新，确保学习者能获取前沿且准确的技术资讯。如果你正寻找一条清晰、友好且专业的机器学习入门之路，ML-For-Beginners 将是理想的起点。",85267,2,"2026-04-18T11:00:28",[13,14,15,16,17,18,19,20,21],"图像","数据工具","视频","插件","Agent","其他","语言模型","开发框架","音频","ready",{"id":24,"name":25,"github_repo":26,"description_zh":27,"stars":28,"difficulty_score":29,"last_commit_at":30,"category_tags":31,"status":22},5784,"funNLP","fighting41love\u002FfunNLP","funNLP 是一个专为中文自然语言处理（NLP）打造的超级资源库，被誉为\"NLP 民工的乐园”。它并非单一的软件工具，而是一个汇集了海量开源项目、数据集、预训练模型和实用代码的综合性平台。\n\n面对中文 NLP 领域资源分散、入门门槛高以及特定场景数据匮乏的痛点，funNLP 提供了“一站式”解决方案。这里不仅涵盖了分词、命名实体识别、情感分析、文本摘要等基础任务的标准工具，还独特地收录了丰富的垂直领域资源，如法律、医疗、金融行业的专用词库与数据集，甚至包含古诗词生成、歌词创作等趣味应用。其核心亮点在于极高的全面性与实用性，从基础的字典词典到前沿的 BERT、GPT-2 模型代码，再到高质量的标注数据和竞赛方案，应有尽有。\n\n无论是刚刚踏入 NLP 领域的学生、需要快速验证想法的算法工程师，还是从事人工智能研究的学者，都能在这里找到急需的“武器弹药”。对于开发者而言，它能大幅减少寻找数据和复现模型的时间；对于研究者，它提供了丰富的基准测试资源和前沿技术参考。funNLP 以开放共享的精神，极大地降低了中文自然语言处理的开发与研究成本，是中文 AI 社区不可或缺的宝藏仓库。",79857,1,"2026-04-08T20:11:31",[19,14,18],{"id":33,"name":34,"github_repo":35,"description_zh":36,"stars":37,"difficulty_score":29,"last_commit_at":38,"category_tags":39,"status":22},5773,"cs-video-courses","Developer-Y\u002Fcs-video-courses","cs-video-courses 是一个精心整理的计算机科学视频课程清单，旨在为自学者提供系统化的学习路径。它汇集了全球知名高校（如加州大学伯克利分校、新南威尔士大学等）的完整课程录像，涵盖从编程基础、数据结构与算法，到操作系统、分布式系统、数据库等核心领域，并深入延伸至人工智能、机器学习、量子计算及区块链等前沿方向。\n\n面对网络上零散且质量参差不齐的教学资源，cs-video-courses 解决了学习者难以找到成体系、高难度大学级别课程的痛点。该项目严格筛选内容，仅收录真正的大学层级课程，排除了碎片化的简短教程或商业广告，确保用户能接触到严谨的学术内容。\n\n这份清单特别适合希望夯实计算机基础的开发者、需要补充特定领域知识的研究人员，以及渴望像在校生一样系统学习计算机科学的自学者。其独特的技术亮点在于分类极其详尽，不仅包含传统的软件工程与网络安全，还细分了生成式 AI、大语言模型、计算生物学等新兴学科，并直接链接至官方视频播放列表，让用户能一站式获取高质量的教育资源，免费享受世界顶尖大学的课堂体验。",79792,"2026-04-08T22:03:59",[18,13,14,20],{"id":41,"name":42,"github_repo":43,"description_zh":44,"stars":45,"difficulty_score":46,"last_commit_at":47,"category_tags":48,"status":22},3128,"ragflow","infiniflow\u002Fragflow","RAGFlow 是一款领先的开源检索增强生成（RAG）引擎，旨在为大语言模型构建更精准、可靠的上下文层。它巧妙地将前沿的 RAG 技术与智能体（Agent）能力相结合，不仅支持从各类文档中高效提取知识，还能让模型基于这些知识进行逻辑推理和任务执行。\n\n在大模型应用中，幻觉问题和知识滞后是常见痛点。RAGFlow 通过深度解析复杂文档结构（如表格、图表及混合排版），显著提升了信息检索的准确度，从而有效减少模型“胡编乱造”的现象，确保回答既有据可依又具备时效性。其内置的智能体机制更进一步，使系统不仅能回答问题，还能自主规划步骤解决复杂问题。\n\n这款工具特别适合开发者、企业技术团队以及 AI 研究人员使用。无论是希望快速搭建私有知识库问答系统，还是致力于探索大模型在垂直领域落地的创新者，都能从中受益。RAGFlow 提供了可视化的工作流编排界面和灵活的 API 接口，既降低了非算法背景用户的上手门槛，也满足了专业开发者对系统深度定制的需求。作为基于 Apache 2.0 协议开源的项目，它正成为连接通用大模型与行业专有知识之间的重要桥梁。",77062,3,"2026-04-04T04:44:48",[17,13,20,19,18],{"id":50,"name":51,"github_repo":52,"description_zh":53,"stars":54,"difficulty_score":46,"last_commit_at":55,"category_tags":56,"status":22},519,"PaddleOCR","PaddlePaddle\u002FPaddleOCR","PaddleOCR 是一款基于百度飞桨框架开发的高性能开源光学字符识别工具包。它的核心能力是将图片、PDF 等文档中的文字提取出来，转换成计算机可读取的结构化数据，让机器真正“看懂”图文内容。\n\n面对海量纸质或电子文档，PaddleOCR 解决了人工录入效率低、数字化成本高的问题。尤其在人工智能领域，它扮演着连接图像与大型语言模型（LLM）的桥梁角色，能将视觉信息直接转化为文本输入，助力智能问答、文档分析等应用场景落地。\n\nPaddleOCR 适合开发者、算法研究人员以及有文档自动化需求的普通用户。其技术优势十分明显：不仅支持全球 100 多种语言的识别，还能在 Windows、Linux、macOS 等多个系统上运行，并灵活适配 CPU、GPU、NPU 等各类硬件。作为一个轻量级且社区活跃的开源项目，PaddleOCR 既能满足快速集成的需求，也能支撑前沿的视觉语言研究，是处理文字识别任务的理想选择。",75916,"2026-04-19T10:54:02",[19,13,20,18],{"id":58,"name":59,"github_repo":60,"description_zh":61,"stars":62,"difficulty_score":29,"last_commit_at":63,"category_tags":64,"status":22},3215,"awesome-machine-learning","josephmisiti\u002Fawesome-machine-learning","awesome-machine-learning 是一份精心整理的机器学习资源清单，汇集了全球优秀的机器学习框架、库和软件工具。面对机器学习领域技术迭代快、资源分散且难以甄选的痛点，这份清单按编程语言（如 Python、C++、Go 等）和应用场景（如计算机视觉、自然语言处理、深度学习等）进行了系统化分类，帮助使用者快速定位高质量项目。\n\n它特别适合开发者、数据科学家及研究人员使用。无论是初学者寻找入门库，还是资深工程师对比不同语言的技术选型，都能从中获得极具价值的参考。此外，清单还延伸提供了免费书籍、在线课程、行业会议、技术博客及线下聚会等丰富资源，构建了从学习到实践的全链路支持体系。\n\n其独特亮点在于严格的维护标准：明确标记已停止维护或长期未更新的项目，确保推荐内容的时效性与可靠性。作为机器学习领域的“导航图”，awesome-machine-learning 以开源协作的方式持续更新，旨在降低技术探索门槛，让每一位从业者都能高效地站在巨人的肩膀上创新。",72149,"2026-04-03T21:50:24",[20,18],{"id":66,"github_repo":67,"name":68,"description_en":69,"description_zh":70,"ai_summary_zh":70,"readme_en":71,"readme_zh":72,"quickstart_zh":73,"use_case_zh":74,"hero_image_url":75,"owner_login":76,"owner_name":77,"owner_avatar_url":78,"owner_bio":79,"owner_company":80,"owner_location":81,"owner_email":82,"owner_twitter":83,"owner_website":84,"owner_url":85,"languages":86,"stars":103,"forks":104,"last_commit_at":105,"license":83,"difficulty_score":29,"env_os":106,"env_gpu":106,"env_ram":106,"env_deps":107,"category_tags":110,"github_topics":83,"view_count":10,"oss_zip_url":83,"oss_zip_packed_at":83,"status":22,"created_at":111,"updated_at":112,"faqs":113,"releases":134},9620,"csuldw\u002FMachineLearning","MachineLearning","Machine learning resources，including algorithm, paper, dataset, example and so on.","MachineLearning 是一个专注于机器学习算法实战的开源资源库，旨在为学习者提供从理论到代码落地的完整路径。它解决了初学者在掌握算法原理后，难以找到规范、可运行的源码及对应数据集进行复现和测试的痛点。\n\n该项目涵盖了逻辑回归、决策树、朴素贝叶斯、KNN、K-Means 聚类、Adaboost、PCA 主成分分析以及 LDA 线性判别分析等经典算法。每个算法目录下均配备了完整的 Python 源码、测试实例及相关数据集，甚至包含了 ROC 曲线绘制和 mRMR 特征选择等实用工具的的实现。此外，项目还提供了基于 Scala 的 Spark 倒排索引示例和 MNIST 数据集加载方法，拓宽了应用场景。\n\nMachineLearning 特别适合计算机专业的学生、AI 入门开发者以及需要快速验证算法原型的研究人员使用。其独特的技术亮点在于所有代码均严格遵循统一的 Python 编码规范，不仅保证了代码的可读性和质量，更是一份极佳的学习范本。无论你是想深入理解算法底层逻辑，还是寻找高质量的教学参考素材，这里都能提供扎实的帮助。","## MachineLearning\n\n机器学习算法代码及个人总结整理，对于算法实现部分，在相应目录中都包含有源码和数据以及测试实例，内容正在不断完善中！如有错误，还望读者指出，非常感谢，若您觉得对你有帮助，可以在右上角给个star哈(#^.^#)。PS:所有代码均符合我们整理出来的这份[编码规范](https:\u002F\u002Fgithub.com\u002Fcsuldw\u002FMachineLearning\u002Fblob\u002Fmaster\u002FPython-coding-standards.md).\n\n## Contents\n\n算法部分目前主要包含如下部分：\n\n- Logistic Regression (二分类):  [源码实现](https:\u002F\u002Fgithub.com\u002Fcsuldw\u002FMachineLearning\u002Ftree\u002Fmaster\u002FLogistic%20Regression) 。包含数据集和源码。\n\n- Decision Tree: 决策树，[源码实现](https:\u002F\u002Fgithub.com\u002Fcsuldw\u002FMachineLearning\u002Ftree\u002Fmaster\u002FDecisionTree).\n\n- ROC: 用于绘制ROC曲线，[源码实现](https:\u002F\u002Fgithub.com\u002Fcsuldw\u002FMachineLearning\u002Ftree\u002Fmaster\u002FROC).\n\n- Naive Bayes：朴素贝叶斯，[源码实现](https:\u002F\u002Fgithub.com\u002Fcsuldw\u002FMachineLearning\u002Ftree\u002Fmaster\u002FNaiveBayes).\n\n- K-NearestNeighbor：K最近邻算法，[源码实现](https:\u002F\u002Fgithub.com\u002Fcsuldw\u002FMachineLearning\u002Ftree\u002Fmaster\u002FKNN).\n\n- K-Means均值聚类：[源码实现](https:\u002F\u002Fgithub.com\u002Fcsuldw\u002FMachineLearning\u002Ftree\u002Fmaster\u002FKmeans).\n\n- Adaboost组合算法：[源码链接](https:\u002F\u002Fgithub.com\u002Fcsuldw\u002FMachineLearning\u002Ftree\u002Fmaster\u002FAdaboost)\n\n- mRMR特征选择方法，[软件使用方法](https:\u002F\u002Fgithub.com\u002Fcsuldw\u002FMachineLearning\u002Ftree\u002Fmaster\u002FmRMR)\n\n- 机器学习算法代码使用汇总，[Python & R Codes](http:\u002F\u002Fwww.csuldw.com\u002F2015\u002F11\u002F21\u002F2015-11-21-machine-learning-algorithms\u002F)\n\n- PCA主要成分分析, [Python实现源码](https:\u002F\u002Fgithub.com\u002Fcsuldw\u002FMachineLearning\u002Ftree\u002Fmaster\u002FPCA)\n\n- LDA线性判别分析（Fisher判别）,[源码实现](https:\u002F\u002Fgithub.com\u002Fcsuldw\u002FMachineLearning\u002Fblob\u002Fmaster\u002FLDA\u002Flda.ipynb)\n\n- spark-demo：使用scala编写的spark实例.\n\t- invertedIndex, [Spark 倒排索引实例源码](https:\u002F\u002Fgithub.com\u002Fcsuldw\u002FMachineLearning\u002Ftree\u002Fmaster\u002Fspark-demo\u002FinvertedIndex)\n\n## Supplementary\n\n- MNIST数据集[加载方法](https:\u002F\u002Fgithub.com\u002Fcsuldw\u002FMachineLearning\u002Ftree\u002Fmaster\u002Fdataset\u002FMNIST).\n\n\n## Contributor\n\n- 刘帝伟, CSU硕士毕业，关注AI、机器学习、深度学习方向，[HomePage](http:\u002F\u002Fwww.csuldw.com).\n\n\n## Contact\n\n如果有任何疑问，可在我的微信公众号后台留言：\n\n\u003C!-- ![](http:\u002F\u002Fwww.csuldw.com\u002Fassets\u002FarticleImg\u002F2019\u002Fcode-main-fun.png) -->\n\n\u003Cdiv style=\"align: center\">\n\u003Cimg src=\"http:\u002F\u002Fwww.csuldw.com\u002Fassets\u002FarticleImg\u002F2019\u002Fcode-main-fun.png\" width=\"50%\" height=\"50%\">\n\u003C\u002Fdiv>\n\n或是发邮件吧：\n\n- E-mail: csu.ldw@csu.edu.cn\n","## 机器学习\n\n机器学习算法代码及个人总结整理，对于算法实现部分，在相应目录中都包含有源码和数据以及测试实例，内容正在不断完善中！如有错误，还望读者指出，非常感谢，若您觉得对你有帮助，可以在右上角给个star哈(#^.^#)。PS:所有代码均符合我们整理出来的这份[编码规范](https:\u002F\u002Fgithub.com\u002Fcsuldw\u002FMachineLearning\u002Fblob\u002Fmaster\u002FPython-coding-standards.md).\n\n## 目录\n\n算法部分目前主要包含如下部分：\n\n- 逻辑回归（二分类）：[源码实现](https:\u002F\u002Fgithub.com\u002Fcsuldw\u002FMachineLearning\u002Ftree\u002Fmaster\u002FLogistic%20Regression) 。包含数据集和源码。\n\n- 决策树：决策树，[源码实现](https:\u002F\u002Fgithub.com\u002Fcsuldw\u002FMachineLearning\u002Ftree\u002Fmaster\u002FDecisionTree).\n\n- ROC：用于绘制ROC曲线，[源码实现](https:\u002F\u002Fgithub.com\u002Fcsuldw\u002FMachineLearning\u002Ftree\u002Fmaster\u002FROC).\n\n- 朴素贝叶斯：朴素贝叶斯，[源码实现](https:\u002F\u002Fgithub.com\u002Fcsuldw\u002FMachineLearning\u002Ftree\u002Fmaster\u002FNaiveBayes).\n\n- K近邻算法：K最近邻算法，[源码实现](https:\u002F\u002Fgithub.com\u002Fcsuldw\u002FMachineLearning\u002Ftree\u002Fmaster\u002FKNN).\n\n- K均值聚类：[源码实现](https:\u002F\u002Fgithub.com\u002Fcsuldw\u002FMachineLearning\u002Ftree\u002Fmaster\u002FKmeans).\n\n- Adaboost组合算法：[源码链接](https:\u002F\u002Fgithub.com\u002Fcsuldw\u002FMachineLearning\u002Ftree\u002Fmaster\u002FAdaboost)\n\n- mRMR特征选择方法，[软件使用方法](https:\u002F\u002Fgithub.com\u002Fcsuldw\u002FMachineLearning\u002Ftree\u002Fmaster\u002FmRMR)\n\n- 机器学习算法代码使用汇总，[Python & R Codes](http:\u002F\u002Fwww.csuldw.com\u002F2015\u002F11\u002F21\u002F2015-11-21-machine-learning-algorithms\u002F)\n\n- PCA主成分分析，[Python实现源码](https:\u002F\u002Fgithub.com\u002Fcsuldw\u002FMachineLearning\u002Ftree\u002Fmaster\u002FPCA)\n\n- LDA线性判别分析（Fisher判别），[源码实现](https:\u002F\u002Fgithub.com\u002Fcsuldw\u002FMachineLearning\u002Fblob\u002Fmaster\u002FLDA\u002Flda.ipynb)\n\n- spark-demo：使用scala编写的spark实例.\n\t- 倒排索引，[Spark 倒排索引实例源码](https:\u002F\u002Fgithub.com\u002Fcsuldw\u002FMachineLearning\u002Ftree\u002Fmaster\u002Fspark-demo\u002FinvertedIndex)\n\n## 补充\n\n- MNIST数据集[加载方法](https:\u002F\u002Fgithub.com\u002Fcsuldw\u002FMachineLearning\u002Ftree\u002Fmaster\u002Fdataset\u002FMNIST).\n\n\n## 贡献者\n\n- 刘帝伟，CSU硕士毕业，关注AI、机器学习、深度学习方向，[主页](http:\u002F\u002Fwww.csuldw.com).\n\n\n## 联系方式\n\n如果有任何疑问，可在我的微信公众号后台留言：\n\n\u003C!-- ![](http:\u002F\u002Fwww.csuldw.com\u002Fassets\u002FarticleImg\u002F2019\u002Fcode-main-fun.png) -->\n\n\u003Cdiv style=\"align: center\">\n\u003Cimg src=\"http:\u002F\u002Fwww.csuldw.com\u002Fassets\u002FarticleImg\u002F2019\u002Fcode-main-fun.png\" width=\"50%\" height=\"50%\">\n\u003C\u002Fdiv>\n\n或是发邮件吧：\n\n- E-mail: csu.ldw@csu.edu.cn","# MachineLearning 快速上手指南\n\n## 环境准备\n\n本项目主要基于 **Python** 实现经典机器学习算法，部分模块包含 Scala (Spark) 示例。\n\n- **操作系统**：Windows \u002F macOS \u002F Linux\n- **语言版本**：Python 3.6+ (推荐 3.8+)\n- **前置依赖**：\n  - 核心库：`numpy`, `pandas`, `matplotlib`, `scikit-learn`\n  - Spark 模块需安装：`scala`, `apache-spark`\n  - Jupyter Notebook (用于运行 `.ipynb` 文件，如 LDA 模块)\n\n建议通过国内镜像源安装依赖以加速下载：\n```bash\npip install numpy pandas matplotlib scikit-learn -i https:\u002F\u002Fpypi.tuna.tsinghua.edu.cn\u002Fsimple\n```\n\n## 安装步骤\n\n本项目为源码学习库，无需执行传统的 `install` 命令，直接克隆仓库即可使用。\n\n1. **克隆仓库**\n   ```bash\n   git clone https:\u002F\u002Fgithub.com\u002Fcsuldw\u002FMachineLearning.git\n   cd MachineLearning\n   ```\n\n2. **验证环境**\n   进入任意算法目录（例如逻辑回归），确认数据与脚本存在：\n   ```bash\n   ls Logistic\\ Regression\u002F\n   ```\n\n## 基本使用\n\n每个算法目录下均包含源码、数据集及测试实例。以下以 **逻辑回归 (Logistic Regression)** 和 **K-Means 聚类** 为例展示使用方法。\n\n### 示例 1：运行逻辑回归 (二分类)\n\n进入对应目录并运行主程序：\n\n```bash\ncd Logistic Regression\npython lr.py\n```\n*注：具体入口文件名请以目录内实际文件为准（通常为 `lr.py` 或 `main.py`），代码会自动加载同目录下的数据集并进行训练与测试。*\n\n### 示例 2：运行 K-Means 聚类\n\n```bash\ncd Kmeans\npython kmeans.py\n```\n\n### 示例 3：查看交互式分析 (LDA\u002FPCA)\n\n对于包含 `.ipynb` 文件的模块（如线性判别分析），建议使用 Jupyter Notebook 打开：\n\n```bash\njupyter notebook LDA\u002Flda.ipynb\n```\n\n### 其他模块说明\n- **ROC 曲线绘制**：进入 `ROC` 目录运行脚本，输入预测结果即可生成曲线。\n- **Spark 示例**：进入 `spark-demo\u002FinvertedIndex`，使用 `spark-submit` 提交 Scala 任务。\n- **编码规范**：所有代码均遵循项目根目录提供的 [Python 编码规范](https:\u002F\u002Fgithub.com\u002Fcsuldw\u002FMachineLearning\u002Fblob\u002Fmaster\u002FPython-coding-standards.md)。\n\n> **提示**：若需使用 MNIST 数据集，请参考 `dataset\u002FMNIST` 目录下的加载方法说明。","某高校数据科学团队的研究生正在开展“基于用户行为数据的电商流失预测”课题研究，需要快速复现多种经典机器学习算法以对比效果。\n\n### 没有 MachineLearning 时\n- **代码从零构建耗时久**：学生需手动编写逻辑回归、决策树等基础算法的底层代码，花费数周时间调试数学公式实现，严重挤占模型调优时间。\n- **数据预处理重复劳动**：面对 MNIST 等标准数据集，每次实验都要重新编写加载和清洗脚本，缺乏统一的标准化处理流程。\n- **评估指标实现困难**：绘制 ROC 曲线或计算特定评估指标时，常因找不到可靠的参考实现而导致结果验证不准确。\n- **代码规范难以统一**：团队成员各自为战，代码风格迥异且缺乏文档注释，导致后期合并代码时冲突频发，维护成本极高。\n- **特征选择方法缺失**：在尝试 mRMR 等高级特征选择方法时，因无现成源码而被迫放弃，限制了模型性能的上限。\n\n### 使用 MachineLearning 后\n- **算法即取即用**：直接调用仓库中已实现的逻辑回归、Adaboost 等源码及对应测试实例，将算法验证周期从数周缩短至几天。\n- **数据集加载标准化**：利用内置的 MNIST 等数据集加载方法，一键完成数据读取与预处理，确保实验输入的一致性。\n- **可视化工具完备**：直接使用专用的 ROC 模块绘制曲线，快速获得准确的模型评估结果，大幅提升实验可信度。\n- **遵循统一编码规范**：所有代码均符合项目整理的 Python 编码规范，结构清晰且注释完善，便于团队协作与二次开发。\n- **高级功能轻松集成**：直接应用 mRMR 特征选择和 PCA 降维等成熟模块，有效提升了特征工程质量和最终模型的准确率。\n\nMachineLearning 通过提供规范、完整且可复用的算法实现与数据资源，让研究人员能从繁琐的底层编码中解放出来，专注于核心业务逻辑的创新与优化。","https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002Fcsuldw_MachineLearning_a38512b1.png","csuldw","D.W","https:\u002F\u002Foss.gittoolsai.com\u002Favatars\u002Fcsuldw_e24480dc.jpg","Machine learning enthusiast.","心似莲花开","ShenZhen","liudiwei99@163.com",null,"http:\u002F\u002Fwww.csuldw.com","https:\u002F\u002Fgithub.com\u002Fcsuldw",[87,91,95,99],{"name":88,"color":89,"percentage":90},"Python","#3572A5",79.7,{"name":92,"color":93,"percentage":94},"Jupyter Notebook","#DA5B0B",19,{"name":96,"color":97,"percentage":98},"Scala","#c22d40",0.9,{"name":100,"color":101,"percentage":102},"Shell","#89e051",0.5,844,682,"2026-04-08T04:34:32","未说明",{"notes":108,"python":106,"dependencies":109},"该项目主要包含经典机器学习算法（如逻辑回归、决策树、KNN、SVM 等）的 Python 源码实现及数据集，部分示例使用 Scala 编写（Spark）。README 中未明确列出具体的操作系统、硬件配置或第三方库版本要求。代码遵循特定的编码规范，建议参考项目链接中的规范文档。由于包含 MNIST 等数据集加载示例，运行特定算法时可能需要安装基础的数值计算库（如 NumPy, Pandas, Scikit-learn），但具体版本需查看各子目录源码。",[106],[18],"2026-03-27T02:49:30.150509","2026-04-20T04:05:14.947832",[114,119,124,129],{"id":115,"question_zh":116,"answer_zh":117,"source_url":118},43190,"访问项目博客文章时浏览器提示“包含恶意软件”，如何正常访问？","这是一个误报或域名解析问题。请将 URL 中的 `csuldw.github.io` 替换为 `www.csuldw.com` 即可正常访问且不会报毒。例如将原链接改为以 www.csuldw.com 开头。","https:\u002F\u002Fgithub.com\u002Fcsuldw\u002FMachineLearning\u002Fissues\u002F1",{"id":120,"question_zh":121,"answer_zh":122,"source_url":123},43189,"在 Ubuntu 上运行 mrmr 程序时报语法错误（Syntax error: \")\" unexpected）且输出文件只有标题，如何解决？","该问题通常是因为系统缺少 C++ 相关库导致的。代码在 CentOS 上运行正常，请检查 Ubuntu 系统是否已安装必要的 C++ 编译库（如 build-essential, g++ 等）。","https:\u002F\u002Fgithub.com\u002Fcsuldw\u002FMachineLearning\u002Fissues\u002F6",{"id":125,"question_zh":126,"answer_zh":127,"source_url":128},43191,"mRMR 代码中的 nrutil.cpp 存在旧式 C 语言语法错误，且部分函数逻辑似乎有问题，该代码是否可用？","该源码直接引用自 http:\u002F\u002Fhome.penglab.com\u002Fproj\u002FmRMR\u002F，本项目主要介绍如何使用该源码。维护者已在 CentOS 6.5 环境下测试通过，未报错。如遇语法兼容性问题，可能是编译器标准差异，建议参考原作者页面或检查编译环境配置。","https:\u002F\u002Fgithub.com\u002Fcsuldw\u002FMachineLearning\u002Fissues\u002F3",{"id":130,"question_zh":131,"answer_zh":132,"source_url":133},43192,"K-means 算法实现中计算的 SSE（误差平方和）偏大，代码是否存在逻辑缺陷？","是的，kmeans.py 第 83 行的判断逻辑不完整。原代码仅判断簇索引是否变化，忽略了距离变小的情况。应将判断条件修改为：`if self._clusterAssment[i, 0] != min_index or self._clusterAssment[i, 1] > min_dist**2:`，以确保当距离减小时也能更新簇分配并标记状态改变。","https:\u002F\u002Fgithub.com\u002Fcsuldw\u002FMachineLearning\u002Fissues\u002F5",[135],{"id":136,"version":137,"summary_zh":83,"released_at":138},342871,"1.1.0","2019-05-15T16:34:12"]