[{"data":1,"prerenderedAt":-1},["ShallowReactive",2],{"similar-hendrycks--math":3,"tool-hendrycks--math":65},[4,23,32,40,49,57],{"id":5,"name":6,"github_repo":7,"description_zh":8,"stars":9,"difficulty_score":10,"last_commit_at":11,"category_tags":12,"status":22},2268,"ML-For-Beginners","microsoft\u002FML-For-Beginners","ML-For-Beginners 是由微软推出的一套系统化机器学习入门课程，旨在帮助零基础用户轻松掌握经典机器学习知识。这套课程将学习路径规划为 12 周，包含 26 节精炼课程和 52 道配套测验，内容涵盖从基础概念到实际应用的完整流程，有效解决了初学者面对庞大知识体系时无从下手、缺乏结构化指导的痛点。\n\n无论是希望转型的开发者、需要补充算法背景的研究人员，还是对人工智能充满好奇的普通爱好者，都能从中受益。课程不仅提供了清晰的理论讲解，还强调动手实践，让用户在循序渐进中建立扎实的技能基础。其独特的亮点在于强大的多语言支持，通过自动化机制提供了包括简体中文在内的 50 多种语言版本，极大地降低了全球不同背景用户的学习门槛。此外，项目采用开源协作模式，社区活跃且内容持续更新，确保学习者能获取前沿且准确的技术资讯。如果你正寻找一条清晰、友好且专业的机器学习入门之路，ML-For-Beginners 将是理想的起点。",85013,2,"2026-04-06T11:09:19",[13,14,15,16,17,18,19,20,21],"图像","数据工具","视频","插件","Agent","其他","语言模型","开发框架","音频","ready",{"id":24,"name":25,"github_repo":26,"description_zh":27,"stars":28,"difficulty_score":29,"last_commit_at":30,"category_tags":31,"status":22},3128,"ragflow","infiniflow\u002Fragflow","RAGFlow 是一款领先的开源检索增强生成（RAG）引擎，旨在为大语言模型构建更精准、可靠的上下文层。它巧妙地将前沿的 RAG 技术与智能体（Agent）能力相结合，不仅支持从各类文档中高效提取知识，还能让模型基于这些知识进行逻辑推理和任务执行。\n\n在大模型应用中，幻觉问题和知识滞后是常见痛点。RAGFlow 通过深度解析复杂文档结构（如表格、图表及混合排版），显著提升了信息检索的准确度，从而有效减少模型“胡编乱造”的现象，确保回答既有据可依又具备时效性。其内置的智能体机制更进一步，使系统不仅能回答问题，还能自主规划步骤解决复杂问题。\n\n这款工具特别适合开发者、企业技术团队以及 AI 研究人员使用。无论是希望快速搭建私有知识库问答系统，还是致力于探索大模型在垂直领域落地的创新者，都能从中受益。RAGFlow 提供了可视化的工作流编排界面和灵活的 API 接口，既降低了非算法背景用户的上手门槛，也满足了专业开发者对系统深度定制的需求。作为基于 Apache 2.0 协议开源的项目，它正成为连接通用大模型与行业专有知识之间的重要桥梁。",77062,3,"2026-04-04T04:44:48",[17,13,20,19,18],{"id":33,"name":34,"github_repo":35,"description_zh":36,"stars":37,"difficulty_score":29,"last_commit_at":38,"category_tags":39,"status":22},519,"PaddleOCR","PaddlePaddle\u002FPaddleOCR","PaddleOCR 是一款基于百度飞桨框架开发的高性能开源光学字符识别工具包。它的核心能力是将图片、PDF 等文档中的文字提取出来，转换成计算机可读取的结构化数据，让机器真正“看懂”图文内容。\n\n面对海量纸质或电子文档，PaddleOCR 解决了人工录入效率低、数字化成本高的问题。尤其在人工智能领域，它扮演着连接图像与大型语言模型（LLM）的桥梁角色，能将视觉信息直接转化为文本输入，助力智能问答、文档分析等应用场景落地。\n\nPaddleOCR 适合开发者、算法研究人员以及有文档自动化需求的普通用户。其技术优势十分明显：不仅支持全球 100 多种语言的识别，还能在 Windows、Linux、macOS 等多个系统上运行，并灵活适配 CPU、GPU、NPU 等各类硬件。作为一个轻量级且社区活跃的开源项目，PaddleOCR 既能满足快速集成的需求，也能支撑前沿的视觉语言研究，是处理文字识别任务的理想选择。",75097,"2026-04-07T22:51:14",[19,13,20,18],{"id":41,"name":42,"github_repo":43,"description_zh":44,"stars":45,"difficulty_score":46,"last_commit_at":47,"category_tags":48,"status":22},3215,"awesome-machine-learning","josephmisiti\u002Fawesome-machine-learning","awesome-machine-learning 是一份精心整理的机器学习资源清单，汇集了全球优秀的机器学习框架、库和软件工具。面对机器学习领域技术迭代快、资源分散且难以甄选的痛点，这份清单按编程语言（如 Python、C++、Go 等）和应用场景（如计算机视觉、自然语言处理、深度学习等）进行了系统化分类，帮助使用者快速定位高质量项目。\n\n它特别适合开发者、数据科学家及研究人员使用。无论是初学者寻找入门库，还是资深工程师对比不同语言的技术选型，都能从中获得极具价值的参考。此外，清单还延伸提供了免费书籍、在线课程、行业会议、技术博客及线下聚会等丰富资源，构建了从学习到实践的全链路支持体系。\n\n其独特亮点在于严格的维护标准：明确标记已停止维护或长期未更新的项目，确保推荐内容的时效性与可靠性。作为机器学习领域的“导航图”，awesome-machine-learning 以开源协作的方式持续更新，旨在降低技术探索门槛，让每一位从业者都能高效地站在巨人的肩膀上创新。",72149,1,"2026-04-03T21:50:24",[20,18],{"id":50,"name":51,"github_repo":52,"description_zh":53,"stars":54,"difficulty_score":46,"last_commit_at":55,"category_tags":56,"status":22},2234,"scikit-learn","scikit-learn\u002Fscikit-learn","scikit-learn 是一个基于 Python 构建的开源机器学习库，依托于 SciPy、NumPy 等科学计算生态，旨在让机器学习变得简单高效。它提供了一套统一且简洁的接口，涵盖了从数据预处理、特征工程到模型训练、评估及选择的全流程工具，内置了包括线性回归、支持向量机、随机森林、聚类等在内的丰富经典算法。\n\n对于希望快速验证想法或构建原型的数据科学家、研究人员以及 Python 开发者而言，scikit-learn 是不可或缺的基础设施。它有效解决了机器学习入门门槛高、算法实现复杂以及不同模型间调用方式不统一的痛点，让用户无需重复造轮子，只需几行代码即可调用成熟的算法解决分类、回归、聚类等实际问题。\n\n其核心技术亮点在于高度一致的 API 设计风格，所有估算器（Estimator）均遵循相同的调用逻辑，极大地降低了学习成本并提升了代码的可读性与可维护性。此外，它还提供了强大的模型选择与评估工具，如交叉验证和网格搜索，帮助用户系统地优化模型性能。作为一个由全球志愿者共同维护的成熟项目，scikit-learn 以其稳定性、详尽的文档和活跃的社区支持，成为连接理论学习与工业级应用的最",65697,"2026-04-07T23:34:58",[20,18,14],{"id":58,"name":59,"github_repo":60,"description_zh":61,"stars":62,"difficulty_score":10,"last_commit_at":63,"category_tags":64,"status":22},3364,"keras","keras-team\u002Fkeras","Keras 是一个专为人类设计的深度学习框架，旨在让构建和训练神经网络变得简单直观。它解决了开发者在不同深度学习后端之间切换困难、模型开发效率低以及难以兼顾调试便捷性与运行性能的痛点。\n\n无论是刚入门的学生、专注算法的研究人员，还是需要快速落地产品的工程师，都能通过 Keras 轻松上手。它支持计算机视觉、自然语言处理、音频分析及时间序列预测等多种任务。\n\nKeras 3 的核心亮点在于其独特的“多后端”架构。用户只需编写一套代码，即可灵活选择 TensorFlow、JAX、PyTorch 或 OpenVINO 作为底层运行引擎。这一特性不仅保留了 Keras 一贯的高层易用性，还允许开发者根据需求自由选择：利用 JAX 或 PyTorch 的即时执行模式进行高效调试，或切换至速度最快的后端以获得最高 350% 的性能提升。此外，Keras 具备强大的扩展能力，能无缝从本地笔记本电脑扩展至大规模 GPU 或 TPU 集群，是连接原型开发与生产部署的理想桥梁。",63927,"2026-04-04T15:24:37",[20,14,18],{"id":66,"github_repo":67,"name":68,"description_en":69,"description_zh":70,"ai_summary_zh":70,"readme_en":71,"readme_zh":72,"quickstart_zh":73,"use_case_zh":74,"hero_image_url":75,"owner_login":76,"owner_name":77,"owner_avatar_url":78,"owner_bio":79,"owner_company":80,"owner_location":81,"owner_email":82,"owner_twitter":76,"owner_website":83,"owner_url":84,"languages":85,"stars":90,"forks":91,"last_commit_at":92,"license":93,"difficulty_score":10,"env_os":94,"env_gpu":95,"env_ram":95,"env_deps":96,"category_tags":99,"github_topics":100,"view_count":10,"oss_zip_url":80,"oss_zip_packed_at":80,"status":22,"created_at":103,"updated_at":104,"faqs":105,"releases":141},5438,"hendrycks\u002Fmath","math","The MATH Dataset (NeurIPS 2021)","MATH 是一个专为评估人工智能数学解题能力而设计的高质量数据集，源自 NeurIPS 2021 的研究成果。它主要解决了现有基准测试难以准确衡量模型在复杂数学领域推理水平的问题。通过收录从代数、几何到微积分等五个核心领域的数千道竞赛级数学题，MATH 为研究者提供了一把严谨的“标尺”，能够真实反映 AI 在面对高难度、多步骤数学问题时的表现。\n\n这套资源非常适合从事自然语言处理、机器学习以及教育科技领域的研究人员和开发者使用。如果你正在训练或评估大语言模型的逻辑推理能力，MATH 提供了标准化的数据加载器和评估代码，能帮助你快速验证模型效果。其独特亮点在于题目难度分级明确且涵盖面广，不仅包含最终答案，还附带详细的解题步骤，这使得它不仅能用于测试，还能作为强化学习或思维链（Chain-of-Thought）训练的优质素材。此外，项目还配套了 AMPS 预训练数据集，进一步支持模型在数学领域的深度优化。无论是学术探索还是工业界应用，MATH 都是提升 AI 数学素养不可或缺的基础设施。","# Measuring Mathematical Problem Solving With the MATH Dataset\nThis is the repository for [Measuring Mathematical Problem Solving With the MATH Dataset](https:\u002F\u002Farxiv.org\u002Fpdf\u002F2103.03874) by\n[Dan Hendrycks](https:\u002F\u002Fdanhendrycks.com\u002F), [Collin Burns](http:\u002F\u002Fcollinpburns.com), [Saurav Kadavath](http:\u002F\u002Fwww.sauravkadavath.com), [Akul Arora](https:\u002F\u002Fgithub.com\u002Fakulaarora), [Steven Basart](https:\u002F\u002Fstevenbas.art), [Eric Tang](https:\u002F\u002Fwww.linkedin.com\u002Fin\u002Feric-tang-185350145\u002F), [Dawn Song](https:\u002F\u002Fpeople.eecs.berkeley.edu\u002F~dawnsong\u002F), and [Jacob Steinhardt](https:\u002F\u002Fwww.stat.berkeley.edu\u002F~jsteinhardt\u002F).\n\nThis repository contains dataset loaders and evaluation code.\n\nDownload the [**MATH dataset here**](https:\u002F\u002Fhuggingface.co\u002Fdatasets\u002Fqwedsacf\u002Fcompetition_math).\n\nDownload the [**AMPS pretraining dataset here**](https:\u002F\u002Fdrive.google.com\u002Ffile\u002Fd\u002F1hQsua3TkpEmcJD_UWQx8dmNdEZPyxw23\u002Fview?usp=sharing).\n\n\u003Cimg align=\"center\" src=\"https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002Fhendrycks_math_readme_92207ca403ab.png\" width=\"750\">\n\n## Citation\n\nIf you find this useful in your research, please consider citing\n\n    @article{hendrycksmath2021,\n      title={Measuring Mathematical Problem Solving With the MATH Dataset},\n      author={Dan Hendrycks and Collin Burns and Saurav Kadavath and Akul Arora and Steven Basart and Eric Tang and Dawn Song and Jacob Steinhardt},\n      journal={NeurIPS},\n      year={2021}\n    }\n","# 使用 MATH 数据集衡量数学问题求解能力\n这是由 [Dan Hendrycks](https:\u002F\u002Fdanhendrycks.com\u002F)、[Collin Burns](http:\u002F\u002Fcollinpburns.com)、[Saurav Kadavath](http:\u002F\u002Fwww.sauravkadavath.com)、[Akul Arora](https:\u002F\u002Fgithub.com\u002Fakulaarora)、[Steven Basart](https:\u002F\u002Fstevenbas.art)、[Eric Tang](https:\u002F\u002Fwww.linkedin.com\u002Fin\u002Feric-tang-185350145\u002F)、[Dawn Song](https:\u002F\u002Fpeople.eecs.berkeley.edu\u002F~dawnsong\u002F) 和 [Jacob Steinhardt](https:\u002F\u002Fwww.stat.berkeley.edu\u002F~jsteinhardt\u002F) 共同撰写的论文 [使用 MATH 数据集衡量数学问题求解能力](https:\u002F\u002Farxiv.org\u002Fpdf\u002F2103.03874) 的代码仓库。\n\n该仓库包含数据集加载器和评估代码。\n\n请在此处下载 [**MATH 数据集**](https:\u002F\u002Fhuggingface.co\u002Fdatasets\u002Fqwedsacf\u002Fcompetition_math)。\n\n请在此处下载 [**AMPS 预训练数据集**](https:\u002F\u002Fdrive.google.com\u002Ffile\u002Fd\u002F1hQsua3TkpEmcJD_UWQx8dmNdEZPyxw23\u002Fview?usp=sharing)。\n\n\u003Cimg align=\"center\" src=\"https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002Fhendrycks_math_readme_92207ca403ab.png\" width=\"750\">\n\n## 引用\n\n如果您在研究中使用了本工作，请考虑引用以下文献：\n\n    @article{hendrycksmath2021,\n      title={使用 MATH 数据集衡量数学问题求解能力},\n      author={Dan Hendrycks, Collin Burns, Saurav Kadavath, Akul Arora, Steven Basart, Eric Tang, Dawn Song, Jacob Steinhardt},\n      journal={NeurIPS},\n      year={2021}\n    }","# MATH 数据集快速上手指南\n\n本指南帮助开发者快速配置并使用 MATH 数据集，用于评估和训练数学问题求解模型。\n\n## 环境准备\n\n- **操作系统**：Linux \u002F macOS \u002F Windows (推荐 Linux)\n- **Python 版本**：3.7 或更高\n- **前置依赖**：\n  - `pip` 包管理工具\n  - `git` (用于克隆代码库)\n  - 建议创建虚拟环境 (如 `venv` 或 `conda`)\n\n## 安装步骤\n\n1. 克隆官方仓库获取评估代码和数据加载器：\n   ```bash\n   git clone https:\u002F\u002Fgithub.com\u002Fhendrycks\u002Fmath.git\n   cd math\n   ```\n\n2. 安装必要的 Python 依赖（如有 `requirements.txt`）：\n   ```bash\n   pip install -r requirements.txt\n   ```\n   *注：若仓库未提供 requirements 文件，通常只需安装基础数据处理库：*\n   ```bash\n   pip install sympy numpy\n   ```\n\n3. 下载数据集：\n   \n   **方案 A：通过 Hugging Face 下载（推荐，国内访问较快）**\n   ```python\n   from datasets import load_dataset\n\n   dataset = load_dataset(\"qwedsacf\u002Fcompetition_math\")\n   ```\n\n   **方案 B：手动下载**\n   - [MATH 数据集下载地址](https:\u002F\u002Fhuggingface.co\u002Fdatasets\u002Fqwedsacf\u002Fcompetition_math)\n   - [AMPS 预训练数据集下载地址](https:\u002F\u002Fdrive.google.com\u002Ffile\u002Fd\u002F1hQsua3TkpEmcJD_UWQx8dmNdEZPyxw23\u002Fview?usp=sharing)\n   \n   下载后解压至项目目录。\n\n## 基本使用\n\n以下是最简单的数据加载与查看示例：\n\n```python\nfrom datasets import load_dataset\n\n# 加载 MATH 数据集\ndataset = load_dataset(\"qwedsacf\u002Fcompetition_math\")\n\n# 查看训练集第一条数据\nprint(dataset[\"train\"][0])\n\n# 输出示例结构：\n# {'problem': 'Find the domain of the expression...', 'solution': '...', 'level': 'Level 1', 'type': 'Algebra', 'answer': '...'}\n```\n\n若使用本地下载的数据文件，可通过标准 JSON 加载方式读取：\n\n```python\nimport json\n\nwith open('train.json', 'r') as f:\n    data = json.load(f)\n    \nprint(data[0]['problem'])\n```","某顶尖高校 AI 实验室的研究团队正致力于训练一个能解决高难度竞赛数学题的大语言模型，急需一套标准化的基准来验证模型的推理能力。\n\n### 没有 math 时\n- **评估标准混乱**：团队只能从网络爬取零散的数学题，题目难度参差不齐，导致不同模型间的性能对比缺乏公信力。\n- **解题过程黑盒**：仅凭最终答案对错无法判断模型是真正学会了逻辑推导，还是单纯靠“猜”或记忆了常见数值。\n- **数据覆盖单一**：自建的测试集往往偏重代数或几何某一领域，难以全面检测模型在组合数学、数论等冷门分支的短板。\n- **复现成本高昂**：由于缺乏统一的数据加载器和评分代码，其他研究人员难以复现实验结果，阻碍了学术社区的协作进展。\n\n### 使用 math 后\n- **基准权威统一**：直接调用 MATH 数据集包含的 12,500 道高质量竞赛题，确保实验结果能与全球顶尖研究在同一维度公平对话。\n- **思维链可量化**：利用数据集中提供的详细逐步解答（step-by-step solutions），不仅能验证答案，还能深入分析模型推理路径的正确性。\n- **能力全景扫描**：涵盖代数、几何、概率等七大数学领域及五个难度等级，精准定位模型在特定知识点上的薄弱环节以便针对性优化。\n- **研发效率飞跃**：借助官方提供的标准化数据加载与评估代码，团队将原本需数周的数据清洗与评测工作缩短至几小时，快速迭代模型版本。\n\nMATH 数据集通过提供高标准、细粒度的数学问题基准，彻底解决了 AI 数学推理能力“测不准、比不了、难复现”的核心痛点。","https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002Fhendrycks_math_92207ca4.png","hendrycks","Dan Hendrycks","https:\u002F\u002Foss.gittoolsai.com\u002Favatars\u002Fhendrycks_1c86a196.jpg","PhD student at UC Berkeley.",null,"Berkeley, California","hendrycks@berkeley.edu","danhendrycks.com","https:\u002F\u002Fgithub.com\u002Fhendrycks",[86],{"name":87,"color":88,"percentage":89},"Python","#3572A5",100,1340,113,"2026-04-07T01:06:31","MIT","","未说明",{"notes":97,"python":95,"dependencies":98},"该仓库主要包含数据集加载器和评估代码，不包含模型训练或推理的具体环境配置。用户需自行从 Hugging Face 下载 MATH 数据集，或从 Google Drive 下载 AMPS 预训练数据集。具体的运行环境（如 Python 版本、依赖库、GPU 需求）取决于用户选择用于评估的底层模型架构，而非此仓库本身强制规定。",[],[18],[68,101,102],"reasoning","logic","2026-03-27T02:49:30.150509","2026-04-08T17:16:14.575513",[106,111,116,121,126,131,136],{"id":107,"question_zh":108,"answer_zh":109,"source_url":110},24671,"运行评估脚本时遇到 'GPT2LMHeadModel' object has no attribute 'generate' 错误，该如何解决？","这是因为 transformers 库版本不兼容导致的。建议将 transformers 库更新到最新版本。维护者确认项目使用的版本为 4.2.2，但其他用户反馈在 4.3.2 版本上也能正常工作。Huggingface 库在不同版本间可能会破坏某些功能，因此升级通常能解决问题。","https:\u002F\u002Fgithub.com\u002Fhendrycks\u002Fmath\u002Fissues\u002F4",{"id":112,"question_zh":113,"answer_zh":114,"source_url":115},24672,"遇到 'AttributeError: module 'transformers' has no attribute 'GPT2_PRETRAINED_MODEL_ARCHIVE_LIST' 错误怎么办？","该错误是由于 transformers 库版本过旧或接口变更引起的。请尝试将 transformers 库升级到 4.3.2 或更高版本。维护者已更新相关脚本以修复此兼容性问题，拉取最新代码通常也能解决。","https:\u002F\u002Fgithub.com\u002Fhendrycks\u002Fmath\u002Fissues\u002F2",{"id":117,"question_zh":118,"answer_zh":119,"source_url":120},24673,"如何在 Huggingface 上获取 MATH 数据集？","MATH 数据集已官方上传至 Huggingface，地址为：https:\u002F\u002Fhuggingface.co\u002Fdatasets\u002Fhendrycks\u002Fcompetition_math。此外，社区也有非官方上传版本：https:\u002F\u002Fhuggingface.co\u002Fdatasets\u002Fmrfakename\u002FMATH。","https:\u002F\u002Fgithub.com\u002Fhendrycks\u002Fmath\u002Fissues\u002F25",{"id":122,"question_zh":123,"answer_zh":124,"source_url":125},24674,"代码中的 `_strip_string` 函数处理百分号（%）时是否存在错误？","代码中使用了 `string.replace(\"\\%\", \"\")`，这看似是转义字符的使用问题。但实际上，数据集中的百分号格式通常为 `50\\%`，因此当前代码逻辑是为了匹配数据格式。只有当模型预测输出为 `50%`（无斜杠）而非 `50\\%` 时，等价性判断 `is_equiv` 才会返回 False。测试集中仅有约 1% 的数据包含百分号，影响范围有限。","https:\u002F\u002Fgithub.com\u002Fhendrycks\u002Fmath\u002Fissues\u002F21",{"id":127,"question_zh":128,"answer_zh":129,"source_url":130},24675,"数据集中发现了一些 LaTeX 格式错误或包含 URL 的异常条目，是否已修复？","是的，维护者已上传修改后的 TAR 文件以修复这些问题。具体包括：移除误插入的 URL（如 intermediate_algebra\u002F44.json）、修正 prealgebra\u002F1117.json 中的折扣符号格式、以及修复 number_theory 和 prealgebra 中其他 LaTeX 排版错误。请下载最新的数据包。","https:\u002F\u002Fgithub.com\u002Fhendrycks\u002Fmath\u002Fissues\u002F10",{"id":132,"question_zh":133,"answer_zh":134,"source_url":135},24676,"预训练 AMPs 时找不到 'no_steps_flist_relative.txt' 等文件列表，如何生成或获取？","这些文件列表缺失是因为部分文件名已被重命名。压缩包中缺失的 'make_flists.py.swp' 是交换文件，运行项目无需此文件。如果文件中缺少特定的 flist 文件，可以忽略它们，或者手动将 'data_file_lists' 文件夹下所有对应的 *.txt 文件合并生成。","https:\u002F\u002Fgithub.com\u002Fhendrycks\u002Fmath\u002Fissues\u002F5",{"id":137,"question_zh":138,"answer_zh":139,"source_url":140},24677,"运行脚本时报错 'No module named 'dataset.aops'' 或 'dataset.deepmind'，缺少这些模块文件？","这是一个导入路径错误。原本代码引用的 'dataset.aops' 或 'dataset.deepmind' 应改为使用 'MATHDataset'。维护者已更新代码修复了此问题，请拉取最新的代码仓库即可解决。","https:\u002F\u002Fgithub.com\u002Fhendrycks\u002Fmath\u002Fissues\u002F1",[]]