[{"data":1,"prerenderedAt":-1},["ShallowReactive",2],{"similar-astroML--astroML":3,"tool-astroML--astroML":65},[4,23,32,40,49,57],{"id":5,"name":6,"github_repo":7,"description_zh":8,"stars":9,"difficulty_score":10,"last_commit_at":11,"category_tags":12,"status":22},2268,"ML-For-Beginners","microsoft\u002FML-For-Beginners","ML-For-Beginners 是由微软推出的一套系统化机器学习入门课程，旨在帮助零基础用户轻松掌握经典机器学习知识。这套课程将学习路径规划为 12 周，包含 26 节精炼课程和 52 道配套测验，内容涵盖从基础概念到实际应用的完整流程，有效解决了初学者面对庞大知识体系时无从下手、缺乏结构化指导的痛点。\n\n无论是希望转型的开发者、需要补充算法背景的研究人员，还是对人工智能充满好奇的普通爱好者，都能从中受益。课程不仅提供了清晰的理论讲解，还强调动手实践，让用户在循序渐进中建立扎实的技能基础。其独特的亮点在于强大的多语言支持，通过自动化机制提供了包括简体中文在内的 50 多种语言版本，极大地降低了全球不同背景用户的学习门槛。此外，项目采用开源协作模式，社区活跃且内容持续更新，确保学习者能获取前沿且准确的技术资讯。如果你正寻找一条清晰、友好且专业的机器学习入门之路，ML-For-Beginners 将是理想的起点。",84991,2,"2026-04-05T10:45:23",[13,14,15,16,17,18,19,20,21],"图像","数据工具","视频","插件","Agent","其他","语言模型","开发框架","音频","ready",{"id":24,"name":25,"github_repo":26,"description_zh":27,"stars":28,"difficulty_score":29,"last_commit_at":30,"category_tags":31,"status":22},3128,"ragflow","infiniflow\u002Fragflow","RAGFlow 是一款领先的开源检索增强生成（RAG）引擎，旨在为大语言模型构建更精准、可靠的上下文层。它巧妙地将前沿的 RAG 技术与智能体（Agent）能力相结合，不仅支持从各类文档中高效提取知识，还能让模型基于这些知识进行逻辑推理和任务执行。\n\n在大模型应用中，幻觉问题和知识滞后是常见痛点。RAGFlow 通过深度解析复杂文档结构（如表格、图表及混合排版），显著提升了信息检索的准确度，从而有效减少模型“胡编乱造”的现象，确保回答既有据可依又具备时效性。其内置的智能体机制更进一步，使系统不仅能回答问题，还能自主规划步骤解决复杂问题。\n\n这款工具特别适合开发者、企业技术团队以及 AI 研究人员使用。无论是希望快速搭建私有知识库问答系统，还是致力于探索大模型在垂直领域落地的创新者，都能从中受益。RAGFlow 提供了可视化的工作流编排界面和灵活的 API 接口，既降低了非算法背景用户的上手门槛，也满足了专业开发者对系统深度定制的需求。作为基于 Apache 2.0 协议开源的项目，它正成为连接通用大模型与行业专有知识之间的重要桥梁。",77062,3,"2026-04-04T04:44:48",[17,13,20,19,18],{"id":33,"name":34,"github_repo":35,"description_zh":36,"stars":37,"difficulty_score":29,"last_commit_at":38,"category_tags":39,"status":22},519,"PaddleOCR","PaddlePaddle\u002FPaddleOCR","PaddleOCR 是一款基于百度飞桨框架开发的高性能开源光学字符识别工具包。它的核心能力是将图片、PDF 等文档中的文字提取出来，转换成计算机可读取的结构化数据，让机器真正“看懂”图文内容。\n\n面对海量纸质或电子文档，PaddleOCR 解决了人工录入效率低、数字化成本高的问题。尤其在人工智能领域，它扮演着连接图像与大型语言模型（LLM）的桥梁角色，能将视觉信息直接转化为文本输入，助力智能问答、文档分析等应用场景落地。\n\nPaddleOCR 适合开发者、算法研究人员以及有文档自动化需求的普通用户。其技术优势十分明显：不仅支持全球 100 多种语言的识别，还能在 Windows、Linux、macOS 等多个系统上运行，并灵活适配 CPU、GPU、NPU 等各类硬件。作为一个轻量级且社区活跃的开源项目，PaddleOCR 既能满足快速集成的需求，也能支撑前沿的视觉语言研究，是处理文字识别任务的理想选择。",74939,"2026-04-05T23:16:38",[19,13,20,18],{"id":41,"name":42,"github_repo":43,"description_zh":44,"stars":45,"difficulty_score":46,"last_commit_at":47,"category_tags":48,"status":22},3215,"awesome-machine-learning","josephmisiti\u002Fawesome-machine-learning","awesome-machine-learning 是一份精心整理的机器学习资源清单，汇集了全球优秀的机器学习框架、库和软件工具。面对机器学习领域技术迭代快、资源分散且难以甄选的痛点，这份清单按编程语言（如 Python、C++、Go 等）和应用场景（如计算机视觉、自然语言处理、深度学习等）进行了系统化分类，帮助使用者快速定位高质量项目。\n\n它特别适合开发者、数据科学家及研究人员使用。无论是初学者寻找入门库，还是资深工程师对比不同语言的技术选型，都能从中获得极具价值的参考。此外，清单还延伸提供了免费书籍、在线课程、行业会议、技术博客及线下聚会等丰富资源，构建了从学习到实践的全链路支持体系。\n\n其独特亮点在于严格的维护标准：明确标记已停止维护或长期未更新的项目，确保推荐内容的时效性与可靠性。作为机器学习领域的“导航图”，awesome-machine-learning 以开源协作的方式持续更新，旨在降低技术探索门槛，让每一位从业者都能高效地站在巨人的肩膀上创新。",72149,1,"2026-04-03T21:50:24",[20,18],{"id":50,"name":51,"github_repo":52,"description_zh":53,"stars":54,"difficulty_score":46,"last_commit_at":55,"category_tags":56,"status":22},2234,"scikit-learn","scikit-learn\u002Fscikit-learn","scikit-learn 是一个基于 Python 构建的开源机器学习库，依托于 SciPy、NumPy 等科学计算生态，旨在让机器学习变得简单高效。它提供了一套统一且简洁的接口，涵盖了从数据预处理、特征工程到模型训练、评估及选择的全流程工具，内置了包括线性回归、支持向量机、随机森林、聚类等在内的丰富经典算法。\n\n对于希望快速验证想法或构建原型的数据科学家、研究人员以及 Python 开发者而言，scikit-learn 是不可或缺的基础设施。它有效解决了机器学习入门门槛高、算法实现复杂以及不同模型间调用方式不统一的痛点，让用户无需重复造轮子，只需几行代码即可调用成熟的算法解决分类、回归、聚类等实际问题。\n\n其核心技术亮点在于高度一致的 API 设计风格，所有估算器（Estimator）均遵循相同的调用逻辑，极大地降低了学习成本并提升了代码的可读性与可维护性。此外，它还提供了强大的模型选择与评估工具，如交叉验证和网格搜索，帮助用户系统地优化模型性能。作为一个由全球志愿者共同维护的成熟项目，scikit-learn 以其稳定性、详尽的文档和活跃的社区支持，成为连接理论学习与工业级应用的最",65628,"2026-04-05T10:10:46",[20,18,14],{"id":58,"name":59,"github_repo":60,"description_zh":61,"stars":62,"difficulty_score":10,"last_commit_at":63,"category_tags":64,"status":22},3364,"keras","keras-team\u002Fkeras","Keras 是一个专为人类设计的深度学习框架，旨在让构建和训练神经网络变得简单直观。它解决了开发者在不同深度学习后端之间切换困难、模型开发效率低以及难以兼顾调试便捷性与运行性能的痛点。\n\n无论是刚入门的学生、专注算法的研究人员，还是需要快速落地产品的工程师，都能通过 Keras 轻松上手。它支持计算机视觉、自然语言处理、音频分析及时间序列预测等多种任务。\n\nKeras 3 的核心亮点在于其独特的“多后端”架构。用户只需编写一套代码，即可灵活选择 TensorFlow、JAX、PyTorch 或 OpenVINO 作为底层运行引擎。这一特性不仅保留了 Keras 一贯的高层易用性，还允许开发者根据需求自由选择：利用 JAX 或 PyTorch 的即时执行模式进行高效调试，或切换至速度最快的后端以获得最高 350% 的性能提升。此外，Keras 具备强大的扩展能力，能无缝从本地笔记本电脑扩展至大规模 GPU 或 TPU 集群，是连接原型开发与生产部署的理想桥梁。",63927,"2026-04-04T15:24:37",[20,14,18],{"id":66,"github_repo":67,"name":68,"description_en":69,"description_zh":70,"ai_summary_zh":70,"readme_en":71,"readme_zh":72,"quickstart_zh":73,"use_case_zh":74,"hero_image_url":75,"owner_login":68,"owner_name":68,"owner_avatar_url":76,"owner_bio":77,"owner_company":77,"owner_location":77,"owner_email":77,"owner_twitter":77,"owner_website":78,"owner_url":79,"languages":80,"stars":89,"forks":90,"last_commit_at":91,"license":92,"difficulty_score":46,"env_os":93,"env_gpu":94,"env_ram":94,"env_deps":95,"category_tags":104,"github_topics":77,"view_count":10,"oss_zip_url":77,"oss_zip_packed_at":77,"status":22,"created_at":105,"updated_at":106,"faqs":107,"releases":143},4298,"astroML\u002FastroML","astroML","Machine learning, statistics, and data mining for astronomy and astrophysics","astroML 是一个专为天文学和天体物理学打造的 Python 开源工具包，旨在将机器学习、统计学与数据挖掘技术高效应用于天文数据分析。面对现代天文观测产生的海量复杂数据，传统分析方法往往难以应对，astroML 通过集成成熟的科学计算库（如 NumPy、SciPy、scikit-learn 和 AstroPy），提供了一套经过验证的算法例程，帮助研究者从噪声中提取关键信息、识别天体模式并进行可视化展示。\n\n这款工具特别适合天文学研究人员、数据科学家以及相关领域的开发者使用。它不仅内置了多种开放天文数据集的加载器，还包含了大量源自经典教材《天文学中的统计、数据挖掘与机器学习》的分析实例，让用户能快速上手并复现前沿研究成果。其独特的技术亮点在于将通用的机器学习算法与天文领域的特定需求（如球面谐波变换、HEALPix 像素化处理）紧密结合，填补了通用 AI 工具在天文垂直场景下的应用空白。无论是进行星系分类、变星探测还是宇宙学参数估计，astroML 都能成为你探索宇宙奥秘的得力助手。",".. -*- mode: rst -*-\n\n=======================================\nAstroML: Machine Learning for Astronomy\n=======================================\n\n.. image:: https:\u002F\u002Fimg.shields.io\u002Fbadge\u002FarXiv-1411.5039-orange.svg?style=flat\n        :target: https:\u002F\u002Farxiv.org\u002Fabs\u002F1411.5039\n        :alt: Reference proceedings\n.. image:: https:\u002F\u002Fgithub.com\u002FastroML\u002FastroML\u002Fworkflows\u002FCI\u002Fbadge.svg\n        :target: https:\u002F\u002Fgithub.com\u002FastroML\u002FastroML\u002Factions?query=workflow%3ACI\n        :alt: Github Actions CI Status\n.. image:: https:\u002F\u002Fimg.shields.io\u002Fpypi\u002Fv\u002FastroML.svg?style=flat\n        :target: https:\u002F\u002Fpypi.python.org\u002Fpypi\u002FastroML\n        :alt: Latest PyPI version\n.. image:: https:\u002F\u002Fimg.shields.io\u002Fpypi\u002Fdm\u002FastroML.svg?style=flat\n        :target: https:\u002F\u002Fpypi.python.org\u002Fpypi\u002FastroML\n        :alt: PyPI download stat\n.. image:: https:\u002F\u002Fimg.shields.io\u002Fbadge\u002Flicense-BSD-blue.svg?style=flat\n        :target: https:\u002F\u002Fgithub.com\u002Fastroml\u002Fastroml\u002Fblob\u002Fmain\u002FLICENSE.rst\n        :alt: License badge\n\nAstroML is a Python module for machine learning and data mining\nbuilt on numpy, scipy, scikit-learn, and matplotlib,\nand distributed under the BSD license.\nIt contains a growing library of statistical and machine learning\nroutines for analyzing astronomical data in python, loaders for several open\nastronomical datasets, and a large suite of examples of analyzing and\nvisualizing astronomical datasets.\n\nThis project was started in 2012 by Jake VanderPlas to accompany the book\n*Statistics, Data Mining, and Machine Learning in Astronomy* by\nZeljko Ivezic, Andrew Connolly, Jacob VanderPlas, and Alex Gray.\n\n\nImportant Links\n===============\n- HTML documentation: https:\u002F\u002Fwww.astroML.org\n- Core source-code repository: https:\u002F\u002Fgithub.com\u002FastroML\u002FastroML\n- Figure source-code repository: https:\u002F\u002Fgithub.com\u002FastroML\u002FastroML-figures\n- Issue Tracker: https:\u002F\u002Fgithub.com\u002FastroML\u002FastroML\u002Fissues\n- Mailing List: https:\u002F\u002Fgroups.google.com\u002Fforum\u002F#!forum\u002Fastroml-general\n\n\nInstallation\n============\n\n**Before installation, make sure your system meets the prerequisites\nlisted in Dependencies, listed below.**\n\nCore\n----\nTo install the core ``astroML`` package in your home directory, use::\n\n  pip install astroML\n\nA conda package for astroML is also available either on the conda-forge or\non the astropy conda channels::\n\n  conda install -c astropy astroML\n\nThe core package is pure python, so installation should be straightforward\non most systems.  To install from source, use::\n\n  python setup.py install\n\nYou can specify an arbitrary directory for installation using::\n\n  python setup.py install --prefix='\u002Fsome\u002Fpath'\n\nTo install system-wide on Linux\u002FUnix systems::\n\n  python setup.py build\n  sudo python setup.py install\n\n\nDependencies\n============\nThere are two levels of dependencies in astroML.  *Core* dependencies are\nrequired for the core ``astroML`` package. *Optional* dependencies are required\nto run some (but not all) of the example scripts.  Individual example scripts\nwill list their optional dependencies at the top of the file.\n\nCore Dependencies\n-----------------\nThe core ``astroML`` package requires the following (some of the\nfunctionality might work with older versions):\n\n- Python_ version 3.6+\n- Numpy_ >= 1.13\n- Scipy_ >= 0.19\n- Scikit-learn_ >= 0.18\n- Matplotlib_ >= 3.0\n- AstroPy_ >= 3.0\n\nOptional Dependencies\n---------------------\nSeveral of the example scripts require specialized or upgraded packages.\nThese requirements are listed at the top of the particular scripts\n\n- HEALPy_ provides an interface to\n  the HEALPix pixelization scheme, as well as fast spherical harmonic\n  transforms.\n\nDevelopment\n===========\nThis package is designed to be a repository for well-written astronomy code,\nand submissions of new routines are encouraged.  After installing the\nversion-control system Git_, you can check out\nthe latest sources from GitHub_ using::\n\n  git clone git:\u002F\u002Fgithub.com\u002FastroML\u002FastroML.git\n\nor if you have write privileges::\n\n  git clone git@github.com:astroML\u002FastroML.git\n\nContribution\n------------\nWe strongly encourage contributions of useful astronomy-related code:\nfor `astroML` to be a relevant tool for the python\u002Fastronomy community,\nit will need to grow with the field of research.  There are a few\nguidelines for contribution:\n\nGeneral\n~~~~~~~\nAny contribution should be done through the github pull request system (for\nmore information, see the\n`help page \u003Chttps:\u002F\u002Fhelp.github.com\u002Farticles\u002Fusing-pull-requests>`_\nCode submitted to ``astroML`` should conform to a BSD-style license,\nand follow the `PEP8 style guide \u003Chttp:\u002F\u002Fwww.python.org\u002Fdev\u002Fpeps\u002Fpep-0008\u002F>`_.\n\nDocumentation and Examples\n~~~~~~~~~~~~~~~~~~~~~~~~~~\nAll submitted code should be documented following the\n`Numpy Documentation Guide`_.  This is a unified documentation style used\nby many packages in the scipy universe.\n\nIn addition, it is highly recommended to create example scripts that show the\nusefulness of the method on an astronomical dataset (preferably making use\nof the loaders in ``astroML.datasets``).  These example scripts are in the\n``examples`` subdirectory of the main source repository.\n\n.. _Numpy Documentation Guide: https:\u002F\u002Fnumpydoc.readthedocs.io\u002Fen\u002Flatest\u002Fformat.html\n\nAuthors\n=======\n\nPackage Author\n--------------\n* Jake Vanderplas https:\u002F\u002Fgithub.com\u002Fjakevdp\n  http:\u002F\u002Fjakevdp.github.com\n\nMaintainer\n----------\n* Brigitta Sipocz https:\u002F\u002Fgithub.com\u002Fbsipocz\n\nContributors\n------------\n\n* Alex Conley\n* Andreas Kopecky\n* Andrew Connolly\n* Asif Imran\n* Benjamin Alan Weaver\n* Brigitta Sipőcz\n* Chris Desira\n* Daniel Andreasen\n* Dino Bektešević\n* Edward Betts\n* Hans Moritz Günther\n* Hugo van Kemenade\n* Jake Vanderplas\n* Jeremy Blow\n* Jonathan Sick\n* Joris van Vugt\n* Juanjo Bazán\n* Julian Taylor\n* Lars Buitinck\n* Michael Radigan\n* Morgan Fouesneau\n* Nicholas Hunt-Walker\n* Ole Streicher\n* Pey Lian Lim\n* Rodrigo Nemmen\n* Ross Fadely\n* Vlad Skripniuk\n* Zlatan Vasović\n* Engineero\n* stonebig\n\n.. _Python: https:\u002F\u002Fwww.python.org\n.. _Numpy: https:\u002F\u002Fwww.numpy.org\n.. _Scipy: https:\u002F\u002Fwww.scipy.org\n.. _Scikit-learn: https:\u002F\u002Fscikit-learn.org\n.. _Matplotlib: https:\u002F\u002Fmatplotlib.org\n.. _AstroPy: http:\u002F\u002Fwww.astropy.org\u002F\n.. _HEALPy: https:\u002F\u002Fgithub.com\u002Fhealpy\u002Fhealpy\n.. _Git: https:\u002F\u002Fgit-scm.com\u002F\n.. _GitHub: https:\u002F\u002Fwww.github.com\n",".. -*- mode: rst -*-\n\n=======================================\nAstroML：天文学中的机器学习\n=======================================\n\n.. image:: https:\u002F\u002Fimg.shields.io\u002Fbadge\u002FarXiv-1411.5039-orange.svg?style=flat\n        :target: https:\u002F\u002Farxiv.org\u002Fabs\u002F1411.5039\n        :alt: 参考论文\n.. image:: https:\u002F\u002Fgithub.com\u002FastroML\u002FastroML\u002Fworkflows\u002FCI\u002Fbadge.svg\n        :target: https:\u002F\u002Fgithub.com\u002FastroML\u002FastroML\u002Factions?query=workflow%3ACI\n        :alt: GitHub Actions CI 状态\n.. image:: https:\u002F\u002Fimg.shields.io\u002Fpypi\u002Fv\u002FastroML.svg?style=flat\n        :target: https:\u002F\u002Fpypi.python.org\u002Fpypi\u002FastroML\n        :alt: 最新 PyPI 版本\n.. image:: https:\u002F\u002Fimg.shields.io\u002Fpypi\u002Fdm\u002FastroML.svg?style=flat\n        :target: https:\u002F\u002Fpypi.python.org\u002Fpypi\u002FastroML\n        :alt: PyPI 下载统计\n.. image:: https:\u002F\u002Fimg.shields.io\u002Fbadge\u002Flicense-BSD-blue.svg?style=flat\n        :target: https:\u002F\u002Fgithub.com\u002Fastroml\u002Fastroml\u002Fblob\u002Fmain\u002FLICENSE.rst\n        :alt: 许可证徽章\n\nAstroML 是一个基于 numpy、scipy、scikit-learn 和 matplotlib 构建的\nPython 机器学习与数据挖掘模块，采用 BSD 许可证进行分发。\n它包含一个不断增长的用于分析天文数据的统计和机器学习例程库、\n多个开放天文数据集的加载器，以及大量分析和可视化天文数据集的示例。\n\n该项目于 2012 年由 Jake VanderPlas 发起，旨在配合 Zeljko Ivezic、\nAndrew Connolly、Jacob VanderPlas 和 Alex Gray 合著的书籍\n《天文学中的统计学、数据挖掘与机器学习》。\n\n重要链接\n========\n- HTML 文档：https:\u002F\u002Fwww.astroML.org\n- 核心源代码仓库：https:\u002F\u002Fgithub.com\u002FastroML\u002FastroML\n- 图表源代码仓库：https:\u002F\u002Fgithub.com\u002FastroML\u002FastroML-figures\n- 问题跟踪器：https:\u002F\u002Fgithub.com\u002FastroML\u002FastroML\u002Fissues\n- 邮件列表：https:\u002F\u002Fgroups.google.com\u002Fforum\u002F#!forum\u002Fastroml-general\n\n\n安装\n====\n\n**在安装之前，请确保您的系统满足下方“依赖项”中列出的先决条件。**\n\n核心\n----\n要在您的主目录中安装 ``astroML`` 核心包，请使用：\n\n  pip install astroML\n\n此外，astroML 的 conda 包也可在 conda-forge 或 astropy 的 conda 通道中获取：\n\n  conda install -c astropy astroML\n\n核心包是纯 Python 实现，因此在大多数系统上安装都应十分顺利。\n若要从源码安装，请执行：\n\n  python setup.py install\n\n您可以通过以下命令指定任意安装目录：\n\n  python setup.py install --prefix='\u002Fsome\u002Fpath'\n\n要在 Linux\u002FUnix 系统上进行全局安装：\n\n  python setup.py build\n  sudo python setup.py install\n\n\n依赖项\n======\nAstroML 中存在两类依赖项。*核心*依赖项是 ``astroML`` 核心包所必需的。\n*可选*依赖项则用于运行部分（而非全部）示例脚本。每个示例脚本会在文件顶部列出其可选依赖项。\n\n核心依赖项\n------------\n``astroML`` 核心包需要以下软件（部分功能可能在较旧版本上也能运行）：\n\n- Python_ 3.6 及以上版本\n- Numpy_ 1.13 或更高版本\n- Scipy_ 0.19 或更高版本\n- Scikit-learn_ 0.18 或更高版本\n- Matplotlib_ 3.0 或更高版本\n- AstroPy_ 3.0 或更高版本\n\n可选依赖项\n------------\n若干示例脚本需要特定或更新的软件包。这些要求会在相应脚本的顶部列出。\n\n- HEALPy_ 提供对 HEALPix 像素化方案的接口，以及快速球谐变换功能。\n\n开发\n====\n本软件包旨在成为高质量天文代码的存储库，我们鼓励提交新的算法实现。\n在安装版本控制系统 Git_ 后，您可以从 GitHub_ 获取最新源码：\n\n  git clone git:\u002F\u002Fgithub.com\u002FastroML\u002FastroML.git\n\n或者，如果您拥有写入权限：\n\n  git clone git@github.com:astroML\u002FastroML.git\n\n贡献\n----\n我们强烈鼓励贡献有用的天文相关代码：为了使 ``astroML`` 成为 Python\n与天文学社区的重要工具，它需要随着研究领域的不断发展而壮大。\n以下是贡献的一些指导原则：\n\n一般规则\n~~~~~~~\n所有贡献都应通过 GitHub 的拉取请求系统完成（更多信息请参阅\n`帮助页面 \u003Chttps:\u002F\u002Fhelp.github.com\u002Farticles\u002Fusing-pull-requests>`_）。\n提交到 ``astroML`` 的代码应遵循 BSD 风格的许可证，并符合\n`PEP8 编码规范 \u003Chttp:\u002F\u002Fwww.python.org\u002Fdev\u002Fpeps\u002Fpep-0008\u002F>`_。\n\n文档与示例\n~~~~~~~~~~\n所有提交的代码都应按照 `Numpy 文档指南`_ 进行文档编写。\n这是 scipy 生态系统中许多软件包所采用的统一文档风格。\n\n此外，强烈建议创建示例脚本，以展示该方法在天文数据集上的实用性，\n最好能利用 ``astroML.datasets`` 中的加载器。这些示例脚本位于主源代码仓库的\n``examples`` 子目录中。\n\n.. _Numpy Documentation Guide: https:\u002F\u002Fnumpydoc.readthedocs.io\u002Fen\u002Flatest\u002Fformat.html\n\n作者\n====\n\n软件包作者\n--------------\n* Jake Vanderplas https:\u002F\u002Fgithub.com\u002Fjakevdp\n  http:\u002F\u002Fjakevdp.github.com\n\n维护者\n------\n* Brigitta Sipocz https:\u002F\u002Fgithub.com\u002Fbsipocz\n\n贡献者\n------\n\n* Alex Conley\n* Andreas Kopecky\n* Andrew Connolly\n* Asif Imran\n* Benjamin Alan Weaver\n* Brigitta Sipőcz\n* Chris Desira\n* Daniel Andreasen\n* Dino Bektešević\n* Edward Betts\n* Hans Moritz Günther\n* Hugo van Kemenade\n* Jake Vanderplas\n* Jeremy Blow\n* Jonathan Sick\n* Joris van Vugt\n* Juanjo Bazán\n* Julian Taylor\n* Lars Buitinck\n* Michael Radigan\n* Morgan Fouesneau\n* Nicholas Hunt-Walker\n* Ole Streicher\n* Pey Lian Lim\n* Rodrigo Nemmen\n* Ross Fadely\n* Vlad Skripniuk\n* Zlatan Vasović\n* Engineero\n* stonebig\n\n.. _Python: https:\u002F\u002Fwww.python.org\n.. _Numpy: https:\u002F\u002Fwww.numpy.org\n.. _Scipy: https:\u002F\u002Fwww.scipy.org\n.. _Scikit-learn: https:\u002F\u002Fscikit-learn.org\n.. _Matplotlib: https:\u002F\u002Fmatplotlib.org\n.. _AstroPy: http:\u002F\u002Fwww.astropy.org\u002F\n.. _HEALPy: https:\u002F\u002Fgithub.com\u002Fhealpy\u002Fhealpy\n.. _Git: https:\u002F\u002Fgit-scm.com\u002F\n.. _GitHub: https:\u002F\u002Fwww.github.com","# AstroML 快速上手指南\n\nAstroML 是一个专为天文学设计的 Python 机器学习与数据挖掘工具包。它基于 NumPy、SciPy、Scikit-learn 和 Matplotlib 构建，提供了丰富的统计算法、天文数据集加载器以及大量分析与可视化示例。\n\n## 环境准备\n\n在开始之前，请确保您的系统满足以下核心依赖要求：\n\n*   **Python**: 版本 3.6 或更高\n*   **NumPy**: >= 1.13\n*   **SciPy**: >= 0.19\n*   **Scikit-learn**: >= 0.18\n*   **Matplotlib**: >= 3.0\n*   **AstroPy**: >= 3.0\n\n> **提示**：部分示例脚本可能需要额外的可选依赖（如 `healpy`），具体需求会在对应脚本文件的顶部注明。\n\n## 安装步骤\n\n您可以选择使用 `pip` 或 `conda` 进行安装。国内用户建议使用国内镜像源以加速下载。\n\n### 方法一：使用 pip 安装（推荐）\n\n使用清华或阿里云镜像源安装核心包：\n\n```bash\npip install astroML -i https:\u002F\u002Fpypi.tuna.tsinghua.edu.cn\u002Fsimple\n```\n\n或者使用默认源：\n\n```bash\npip install astroML\n```\n\n### 方法二：使用 conda 安装\n\n如果您使用 Anaconda 或 Miniconda，可以通过 `astropy` 频道安装：\n\n```bash\nconda install -c astropy astroML\n```\n\n### 方法三：从源码安装\n\n如需获取最新开发版本或自定义安装路径：\n\n```bash\ngit clone git:\u002F\u002Fgithub.com\u002FastroML\u002FastroML.git\ncd astroML\npython setup.py install\n```\n\n## 基本使用\n\nAstroML 的核心功能包括数据集加载、机器学习模型应用以及天文数据可视化。以下是一个最简单的使用示例，演示如何加载内置数据集并进行基础处理。\n\n### 示例：加载数据集并查看信息\n\n```python\nfrom astroml.datasets import fetch_sdss_sspp\n\n# 加载 SDSS SSPP 数据集\ndata = fetch_sdss_sspp()\n\n# 查看数据基本信息\nprint(f\"数据形状: {data.data.shape}\")\nprint(f\"特征名称: {data.feature_names}\")\n\n# 提取特定特征（例如：表面重力 logg）\nlogg = data.data[:, 4] \n\n# 简单的统计描述\nimport numpy as np\nprint(f\"logg 均值: {np.mean(logg)}\")\nprint(f\"logg 标准差: {np.std(logg)}\")\n```\n\n### 示例：结合 Scikit-learn 进行聚类分析\n\n由于 AstroML 深度集成 Scikit-learn，您可以直接使用其算法处理天文数据：\n\n```python\nfrom sklearn.cluster import KMeans\nimport matplotlib.pyplot as plt\n\n# 选取前两个特征进行聚类演示\nX = data.data[:, :2]\n\n# 初始化并训练 K-Means 模型\nkmeans = KMeans(n_clusters=3, random_state=42)\nlabels = kmeans.fit_predict(X)\n\n# 可视化结果\nplt.scatter(X[:, 0], X[:, 1], c=labels, cmap='viridis', s=10, alpha=0.5)\nplt.xlabel(data.feature_names[0])\nplt.ylabel(data.feature_names[1])\nplt.title(\"SDSS Data Clustering with AstroML & Scikit-learn\")\nplt.show()\n```\n\n更多详细示例和高级用法，请访问官方文档：https:\u002F\u002Fwww.astroML.org","某天文台数据团队正致力于从海量巡天观测数据中自动识别罕见的变星候选体，以支持后续的物理机制研究。\n\n### 没有 astroML 时\n- 研究人员需手动编写大量底层代码来清洗带有复杂噪声和缺失值的天文光谱数据，耗时且易出错。\n- 面对高维度的测光特征，缺乏针对天体物理特性优化的降维算法，导致关键信号被冗余数据淹没。\n- 通用机器学习库缺少天文专用的数据加载器，团队不得不花费数周时间解析特定格式（如 FITS）的公开数据集。\n- 难以复现经典文献中的统计模型，每次分析都要重新推导公式并验证数值稳定性，严重拖慢科研进度。\n\n### 使用 astroML 后\n- 直接调用内置的稳健统计例程，一键完成异常值剔除和数据插补，将数据预处理时间从数天缩短至几小时。\n- 利用专为天文数据设计的流形学习算法，高效提取变星光变曲线的核心特征，显著提升了分类模型的准确率。\n- 通过集成的开放数据集加载接口，瞬间获取并标准化 SDSS 等主流巡天数据，让团队能立即投入核心分析。\n- 复用书中经过验证的成熟算法实现，无需重复造轮子，确保了分析结果的可复现性与学术严谨性。\n\nastroML 将天文学家从繁琐的数据工程中解放出来，让他们能专注于利用先进的机器学习技术探索宇宙奥秘。","https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002FastroML_astroML_61a8efb3.png","https:\u002F\u002Foss.gittoolsai.com\u002Favatars\u002FastroML_c905d994.jpg",null,"http:\u002F\u002Fwww.astroML.org","https:\u002F\u002Fgithub.com\u002FastroML",[81,85],{"name":82,"color":83,"percentage":84},"Python","#3572A5",99.8,{"name":86,"color":87,"percentage":88},"Makefile","#427819",0.2,1168,317,"2026-04-02T20:53:31","BSD-2-Clause","Linux, macOS, Windows","未说明",{"notes":96,"python":97,"dependencies":98},"核心包为纯 Python 实现，安装简便。部分示例脚本需要可选依赖（如 healpy），具体需求在各脚本头部列出。支持通过 pip 或 conda（conda-forge 或 astropy 通道）安装。","3.6+",[99,100,101,102,103],"numpy>=1.13","scipy>=0.19","scikit-learn>=0.18","matplotlib>=3.0","astropy>=3.0",[18],"2026-03-27T02:49:30.150509","2026-04-06T17:01:57.499036",[108,113,118,123,128,133,138],{"id":109,"question_zh":110,"answer_zh":111,"source_url":112},19565,"scatter_contour 函数在处理小数据数组时抛出 IndexError 错误，如何解决？","该问题源于 matplotlib 面向对象接口与 MATLAB 风格接口的交互问题。维护者已提交修复，现在您可以直接使用以下代码获取轮廓并添加颜色条：\n```python\npoints, contours = scatter_contour(...)\nplt.colorbar(contours)\n```\n请确保您使用的是包含此修复的最新版本。","https:\u002F\u002Fgithub.com\u002FastroML\u002FastroML\u002Fissues\u002F30",{"id":114,"question_zh":115,"answer_zh":116,"source_url":117},19566,"astroML 是否支持 Python 3？安装时遇到 print 语法错误怎么办？","该兼容性问题已在 astroML 0.3 版本中修复。如果您遇到因 Python 3 的 print 语法导致的安装失败，请升级到 0.3 或更高版本：\n```bash\npip install --upgrade astroML\n```\n当前版本已完全兼容 Python 3.x。","https:\u002F\u002Fgithub.com\u002FastroML\u002FastroML\u002Fissues\u002F37",{"id":119,"question_zh":120,"answer_zh":121,"source_url":122},19567,"运行测试或加载数据时出现 404 错误，提示数据文件无法找到，如何处理？","部分数据文件的 URL 已变更。该问题在 v0.4rc1 及后续版本中通过更新数据 URL 得到解决。此外，项目计划将所有数据文件下载迁移至专用仓库以提高稳定性。\n解决方案：请升级 astroML 到最新版本（v0.4rc1 或更高）：\n```bash\npip install --upgrade astroML\n```\n如果问题依旧，检查网络连接或参考项目文档获取最新的数据源地址。","https:\u002F\u002Fgithub.com\u002FastroML\u002FastroML\u002Fissues\u002F88",{"id":124,"question_zh":125,"answer_zh":126,"source_url":127},19568,"使用 Cminus 函数计算光度函数时，输出结果中出现 NaN 值，原因是什么？","这是一个边缘情况：当排序后的数据满足 `np.sum(x[:j] \u003C xmax[j]) == 0` 时，累积乘积计算会导致除以零从而产生 NaN。这通常发生在数据量较小或特定分布下。\n解决方案：维护者已提出修复方案（见 PR #237），通过将相关项设为 `np.inf` 或使用 0.5 修正法来处理此情况。请更新到包含此修复的最新版本，或手动应用补丁逻辑以避免 NaN 输出。","https:\u002F\u002Fgithub.com\u002FastroML\u002FastroML\u002Fissues\u002F234",{"id":129,"question_zh":130,"answer_zh":131,"source_url":132},19569,"只想使用 hist 函数获取直方图的 bin 边缘而不立即绘图，但图表总是自动弹出，如何禁止这种行为？","该问题已被解决。在较新版本中，`astroML.plotting.hist` 函数的行为已优化，允许仅返回统计信息（如 bin 边缘）而不强制渲染图形。\n建议：请确保您使用的是最新版本的 astroML。如果仍遇到此问题，可以尝试在调用 hist 前后显式控制 matplotlib 的后端或使用 `plt.ioff()` 关闭交互模式，直到需要显示时再调用 `plt.show()`。","https:\u002F\u002Fgithub.com\u002FastroML\u002FastroML\u002Fissues\u002F54",{"id":134,"question_zh":135,"answer_zh":136,"source_url":137},19570,"已安装 astroML_addons，但运行时仍提示\"using slow version\"（使用慢速版本）警告，如何解决？","即使安装了 addons，如果环境变量配置不当或导入路径有误，程序可能仍回退到纯 Python 实现的慢速版本。\n解决步骤：\n1. 确认安装成功：运行 `pip list | grep astroML-add-ons` 查看是否安装。\n2. 检查导入顺序：确保在使用相关功能前没有意外导入了旧版模块。\n3. 验证编译扩展：某些系统可能需要重新编译 C 扩展。尝试卸载后重新安装：\n```bash\npip uninstall astroML-add-ons\npip install astroML-add-ons\n```\n4. 如果是 Ubuntu 等 Linux 系统，确保已安装必要的构建工具（如 `build-essential`, `python-dev`）。","https:\u002F\u002Fgithub.com\u002FastroML\u002FastroML\u002Fissues\u002F13",{"id":139,"question_zh":140,"answer_zh":141,"source_url":142},19571,"在 Mac OS 上运行 nosetests 时出现\"Segmentation fault: 11\"崩溃，是 astroML 的问题吗？","经维护者分析，此段错误（Segfault）并非由 astroML 直接引起，而是底层依赖库 SciPy 在特定平台（如 Mac OS 10.7.5 和 Enthought Python Distribution）上的兼容性问题。\n建议操作：\n1. 尝试更新 SciPy 到最新版本。\n2. 更换 Python 发行版（如使用 Anaconda 而非 EPD）。\n3. 若问题持续，请向 SciPy 官方 issue 列表报告此 bug，因为这属于 SciPy 的平台特定问题。","https:\u002F\u002Fgithub.com\u002FastroML\u002FastroML\u002Fissues\u002F5",[]]