contextualized-topic-models

1.3k 151 简单 1 次阅读 2周前MIT开发框架数据工具语言模型

AI 解读由 AI 自动生成，仅供参考

contextualized-topic-models 是一款专为文本主题挖掘设计的 Python 开源库。它巧妙地将 BERT 等预训练语言模型生成的“上下文嵌入”与传统主题模型相结合，旨在解决传统方法仅依赖词袋模型而忽略词语语境，导致提取出的主题连贯性不足、语义模糊的痛点。

这款工具特别适合自然语言处理领域的研究人员、数据科学家以及需要深入分析大规模文本数据的开发者使用。其核心亮点在于打破了传统模型对词汇表的严格限制：一方面，它提供的 CombinedTM 模式融合了上下文语义与词频统计，能生成更精准、易懂的主题；另一方面，其 ZeroShotTM 模式支持零样本学习，不仅能处理训练集中未出现的新词，还具备强大的跨语言能力，只需使用多语言嵌入即可轻松实现多语种主题分析。此外，项目独有的"Kitty"子模块引入了人机协作机制，帮助用户快速对文档进行分类和命名聚类。得益于灵活的架构设计，用户可以随时接入最新的预训练模型以提升效果，让主题建模更加智能高效。

使用场景

某跨国电商公司的数据团队需要分析全球用户的海量商品评论，以挖掘不同语言市场中的潜在消费趋势和产品痛点。

没有 contextualized-topic-models 时

语义理解浅层化：传统模型仅依赖词袋（BoW）统计词频，无法识别“屏幕清晰”与“显示效果好”的语义相似性，导致生成的主题支离破碎。
多语言处理困难：面对英、法、德等多语种评论，团队需为每种语言单独训练模型并人工对齐主题，耗时且难以保证标准统一。
新词与冷启动问题：对于新兴网络用语或测试集中未出现的词汇，传统模型完全无法处理，导致大量包含关键信息的近期评论被忽略。
主题连贯性差：提取出的主题往往包含无关高频词（如“但是”、“非常”），业务人员难以直接从中提炼出可执行的洞察。

使用 contextualized-topic-models 后

深度语义融合：利用 BERT 等预训练上下文嵌入，模型能精准捕捉词语在特定语境下的含义，将语义相近但措辞不同的评论自动归入同一连贯主题。
零样本跨语言迁移：借助 ZeroShotTM 功能，只需使用多语言嵌入训练一次，即可直接处理未见过的语言数据，无需重新训练即可实现全球话题对齐。
动态适应新表达：基于上下文的表示方法不再受限于固定词表，即使评论中出现新的缩写或流行语，模型也能根据其语境向量将其正确分类。
高可解释性输出：生成的主题关键词高度相关且逻辑清晰，业务团队可直接据此发现“电池续航焦虑”或“包装破损”等具体问题，大幅缩短决策路径。

contextualized-topic-models 通过引入上下文感知能力，将原本杂乱的多语言文本转化为结构清晰、语义连贯的商业洞察，彻底解决了传统主题模型在复杂语境下的失效难题。

运行环境要求

操作系统

未说明

GPU

可选
若需使用 CUDA 加速，需安装与系统分布匹配的 CUDA 版本（具体版本需参考 PyTorch 要求），否则可使用 CPU 运行

内存

未说明

依赖

notes1. 该工具支持多种语言，依赖 HuggingFace 提供的预训练模型（如 BERT、SBERT）。2. 为获得最佳效果，词袋（BoW）大小建议限制在 2000 个术语以内，以避免神经网络重构困难和过拟合。3. 数据预处理至关重要：建议使用未预处理文本生成上下文嵌入（BERT），使用预处理文本构建词袋（BoW）。4. 若使用多语言模型处理英语数据，效果可能不如专用英语模型。5. 包含一个名为'Kitty'的子模块，用于人机协作分类。

python未说明

torch

sentence-transformers (SBERT)

transformers (HuggingFace)

快速开始

=========================== 上下文主题模型

.. image:: https://img.shields.io/pypi/v/contextualized_topic_models.svg :target: https://pypi.python.org/pypi/contextualized_topic_models

.. image:: https://github.com/MilaNLProc/contextualized-topic-models/workflows/Python%20package/badge.svg :target: https://github.com/MilaNLProc/contextualized-topic-models/actions

.. image:: https://readthedocs.org/projects/contextualized-topic-models/badge/?version=latest :target: https://contextualized-topic-models.readthedocs.io/en/latest/?badge=latest :alt: Documentation Status

.. image:: https://img.shields.io/github/contributors/MilaNLProc/contextualized-topic-models :target: https://github.com/MilaNLProc/contextualized-topic-models/graphs/contributors/ :alt: Contributors

.. image:: https://img.shields.io/badge/License-MIT-blue.svg :target: https://lbesson.mit-license.org/ :alt: License

.. image:: https://pepy.tech/badge/contextualized-topic-models :target: https://pepy.tech/project/contextualized-topic-models :alt: Downloads

.. image:: https://colab.research.google.com/assets/colab-badge.svg :target: https://colab.research.google.com/drive/1fXJjr_rwqvpp1IdNQ4dxqN4Dp88cxO97?usp=sharing :alt: Open In Colab

.. image:: https://raw.githubusercontent.com/aleen42/badges/master/src/medium.svg :target: https://medium.com/towards-data-science/contextualized-topic-modeling-with-python-eacl2021-eacf6dfa576 :alt: Medium Blog Post

.. image:: https://img.shields.io/badge/youtube-video-red :target: https://www.youtube.com/watch?v=n1_G8K07KoM :alt: Video Tutorial

上下文主题模型（CTM）是一类利用预训练语言表示（例如BERT）来支持主题建模的主题模型。详细信息请参阅以下论文：

Bianchi, F., Terragni, S., & Hovy, D. (2021). 预训练是热门话题：上下文文档嵌入提升主题一致性。ACL。https://aclanthology.org/2021.acl-short.96/
Bianchi, F., Terragni, S., Hovy, D., Nozza, D., & Fersini, E. (2021). 零样本学习的跨语言上下文主题模型。EACL。https://www.aclweb.org/anthology/2021.eacl-main.143/

.. image:: https://raw.githubusercontent.com/MilaNLProc/contextualized-topic-models/master/img/logo.png :align: center :width: 200px

使用上下文嵌入进行主题建模

我们新推出的主题模型系列支持多种语言（即HuggingFace模型所支持的语言），并提供两种版本：CombinedTM将上下文嵌入与传统的词袋模型相结合，以生成更连贯的主题；ZeroShotTM则是处理测试数据中可能存在缺失词汇的任务的理想选择，同时，如果使用多语言嵌入进行训练，它还具备多语言主题模型的特性！

最大的优势在于，您可以为上下文主题模型使用不同的嵌入方法。因此，当新的嵌入方法发布时，您可以在代码中直接应用，从而进一步提升模型效果。我们不再受限于传统的词袋模型。

此外，我们还推出了Kitty <https://contextualized-topic-models.readthedocs.io/en/latest/kitty.html>_！这是一个全新的子模块，可用于构建人机协作分类器，快速对文档进行分类并创建命名聚类。

.. image:: https://raw.githubusercontent.com/MilaNLProc/contextualized-topic-models/master/img/logo_kitty.png :align: center :width: 200px

教程

您可以阅读我们的Medium博客文章，或者从我们的Colab教程开始：

.. |colab1_2| image:: https://colab.research.google.com/assets/colab-badge.svg :target: https://colab.research.google.com/drive/1fXJjr_rwqvpp1IdNQ4dxqN4Dp88cxO97?usp=sharing :alt: Open In Colab

.. |colab2_2| image:: https://colab.research.google.com/assets/colab-badge.svg :target: https://colab.research.google.com/drive/1bfWUYEypULFk_4Tfff-Pb_n7-tSjEe9v?usp=sharing :alt: Open In Colab

.. |colab3_3| image:: https://colab.research.google.com/assets/colab-badge.svg :target: https://colab.research.google.com/drive/1upTRu4zSm1VMbl633n9qkIDA526l22E_?usp=sharing :alt: Open In Colab

.. |kitty_colab| image:: https://colab.research.google.com/assets/colab-badge.svg :target: https://colab.research.google.com/drive/18mKzaKnmBlBOHb1oiS5MtaTSyq47ys2X?usp=sharing :alt: Open In Colab

+--------------------------------------------------------------------------------+------------------+ | 名称 | 链接 | +================================================================================+==================+ | 在维基百科数据上使用Combined TM（预处理+保存+可视化）（稳定 v2.3.0） | |colab1_2| | +--------------------------------------------------------------------------------+------------------+ | 零样本跨语言主题建模（预处理+可视化）（稳定 v2.3.0） | |colab2_2| | +--------------------------------------------------------------------------------+------------------+ | Kitty：人机协作分类器（高级用法）（稳定 v2.2.0） | |kitty_colab| | +--------------------------------------------------------------------------------+------------------+ | SuperCTM 和 β-CTM（高级用法）（稳定 v2.2.0） | |colab3_3| | +--------------------------------------------------------------------------------+------------------+

概述

简而言之


+ 在 CTMs 中，我们有两种模型：CombinedTM 和 ZeroShotTM，它们适用于不同的场景。
+ 当词袋的大小**限制在不超过 2000 个词项**时，CTMs 的效果会更好。这是因为我们有一个神经网络模型用于重建输入的词袋表示。此外，在 CombinedTM 中，我们会将上下文嵌入投影到词汇空间中，词汇表越大，参数数量越多，训练难度也会增加，并且更容易出现过拟合。不过，这**并不是一个严格的限制**，因此建议您对数据集进行预处理。我们提供了一个预处理流水线，可以帮助您解决这个问题。
+ 请检查您使用的上下文模型，**在英文数据上使用的多语言模型可能无法达到纯英文训练模型那样的效果**。
+ **预处理是关键**。如果您将经过预处理的文本输入到像 BERT 这样的上下文模型中，可能难以获得良好的表示。通常的做法是使用预处理后的文本来构建词袋，而使用未预处理的文本来生成 BERT 嵌入。我们的预处理类可以为您完成这一任务。
+ CTM 使用 `SBERT`_，您可以查看它以更好地理解我们如何创建嵌入。SBERT 允许我们使用任何嵌入模型。您可能需要关注一些设置，例如 `最大长度 <https://www.sbert.net/examples/applications/computing-embeddings/README.html#input-sequence-length>`_。

安装

重要提示：如果您想使用 CUDA，需要安装与您的系统发行版匹配的正确版本的 CUDA 系统，请参阅 pytorch_。

使用 pip 安装包

.. code-block:: bash

pip install -U contextualized_topic_models

模型


需要考虑的一个重要方面是您希望使用哪种模型：结合上下文嵌入和词袋的模型（`CombinedTM <https://contextualized-topic-models.readthedocs.io/en/latest/combined.html>`_）或仅使用上下文嵌入的模型（`ZeroShotTM <https://contextualized-topic-models.readthedocs.io/en/latest/zeroshot.html>`_）。

但请记住，只有使用 `ZeroShotTM <https://contextualized-topic-models.readthedocs.io/en/latest/zeroshot.html>`_ 模型才能进行零样本跨语言主题建模。

上下文主题模型还支持监督学习（SuperCTM）。您可以在`文档 <https://contextualized-topic-models.readthedocs.io/en/latest/introduction.html>`_ 中了解更多相关信息。

.. image:: https://raw.githubusercontent.com/MilaNLProc/contextualized-topic-models/master/img/ctm_both.jpeg
   :align: center
   :width: 800px

我们还有 `Kitty <https://contextualized-topic-models.readthedocs.io/en/latest/kitty.html>`_：一个工具，可用于更简便地进行人工参与的文档分类。这对于文档筛选非常有用。它也支持跨语言操作，因此即使您不懂某种语言，也能用它来筛选该语言的文档！

参考文献
----------

如果您觉得这些内容有用，可以引用以下论文 :)

**ZeroShotTM**

::

    @inproceedings{bianchi-etal-2021-cross,
        title = "Cross-lingual Contextualized Topic Models with Zero-shot Learning",
        author = "Bianchi, Federico and Terragni, Silvia and Hovy, Dirk  and
          Nozza, Debora and Fersini, Elisabetta",
        booktitle = "Proceedings of the 16th Conference of the European Chapter of the Association for Computational Linguistics: Main Volume",
        month = apr,
        year = "2021",
        address = "Online",
        publisher = "Association for Computational Linguistics",
        url = "https://www.aclweb.org/anthology/2021.eacl-main.143",
        pages = "1676--1683",
    }

**CombinedTM**

::

    @inproceedings{bianchi-etal-2021-pre,
        title = "Pre-training is a Hot Topic: Contextualized Document Embeddings Improve Topic Coherence",
        author = "Bianchi, Federico  and
          Terragni, Silvia  and
          Hovy, Dirk",
        booktitle = "Proceedings of the 59th Annual Meeting of the Association for Computational Linguistics and the 11th International Joint Conference on Natural Language Processing (Volume 2: Short Papers)",
        month = aug,
        year = "2021",
        address = "Online",
        publisher = "Association for Computational Linguistics",
        url = "https://aclanthology.org/2021.acl-short.96",
        doi = "10.18653/v1/2021.acl-short.96",
        pages = "759--766",
    }


特定语言与多语言
----------------------------------

以下示例中使用了多语言嵌入模型`:code:`paraphrase-multilingual-mpnet-base-v2`。这意味着您将使用的表示是多语言的。然而，您可能需要更广泛的语言覆盖，或者只需要某一特定语言。请参考文档中的页面，了解如何选择其他语言的模型。在这种情况下，您可以查看 `SBERT`_，以找到最适合的模型。

在这里，您可以阅读更多关于`特定语言与多语言 <https://contextualized-topic-models.readthedocs.io/en/latest/language.html>`_的信息。

快速概览
--------------

为了更好地理解这些主题模型的工作原理，您务必查看`文档 <https://contextualized-topic-models.readthedocs.io/en/latest/introduction.html>`_。

组合主题模型

以下是使用 CombinedTM 的方法。这是一种标准的主题模型，同时也利用了上下文嵌入。CombinedTM 的优点在于它能使主题更加连贯（参见论文 https://arxiv.org/abs/2004.03974）。 n_components=50 指定了主题的数量。

.. code-block:: python

from contextualized_topic_models.models.ctm import CombinedTM
from contextualized_topic_models.utils.data_preparation import TopicModelDataPreparation
from contextualized_topic_models.utils.data_preparation import bert_embeddings_from_file

qt = TopicModelDataPreparation("all-mpnet-base-v2")

training_dataset = qt.fit(text_for_contextual=list_of_unpreprocessed_documents, text_for_bow=list_of_preprocessed_documents)

ctm = CombinedTM(bow_size=len(qt.vocab), contextual_size=768, n_components=50) # 50个主题

ctm.fit(training_dataset) # 运行模型

ctm.get_topics(2)

进阶说明：Combined TM 将词袋与 SBERT 结合，这一过程似乎能提高预测主题的连贯性（https://arxiv.org/pdf/2004.03974.pdf）。

零样本主题模型


我们的 ZeroShotTM 可以用于零样本主题建模。它可以处理在训练阶段未出现过的词汇。更有趣的是，该模型还可以用于跨语言主题建模（详见后续章节）！请参阅相关论文（https://www.aclweb.org/anthology/2021.eacl-main.143）。

.. code-block:: python

from contextualized_topic_models.models.ctm import ZeroShotTM
    from contextualized_topic_models.utils.data_preparation import TopicModelDataPreparation
    from contextualized_topic_models.utils.data_preparation import bert_embeddings_from_file

    text_for_contextual = [
        "你好，这是未经预处理的文本，可以直接输入模型",
        "祝你使用我们的主题模型玩得开心",
    ]

    text_for_bow = [
        "你好 未预处理 给 模型",
        "开心 主题 模型",
    ]

    qt = TopicModelDataPreparation("paraphrase-multilingual-mpnet-base-v2")

    training_dataset = qt.fit(text_for_contextual=text_for_contextual, text_for_bow=text_for_bow)

    ctm = ZeroShotTM(bow_size=len(qt.vocab), contextual_size=768, n_components=50)

    ctm.fit(training_dataset) # 运行模型

    ctm.get_topics(2)


正如你所见，用于处理文本的高级API非常易于使用；
**text_for_bert** 应当用来向模型传递未经预处理的文档列表。
而 **text_for_bow** 则应传入用于构建词袋模型的已预处理文本。

**进阶说明：** 这样，SBERT 可以利用文本中的所有信息来生成文本表示。

使用主题模型
--------------

获取主题
~~~~~~~~~~

一旦模型训练完成，获取主题就非常简单了！

.. code-block:: python

    ctm.get_topics()

为未见文档预测主题

transform 方法会为你处理大部分工作，例如仅根据模型在训练中见过的词汇生成相应的词袋模型。然而，在使用 ZeroShotTM 时，这会遇到一些问题，我们将在下一节中看到。

不过，如果你愿意，也可以手动加载嵌入（参见本文档的进阶部分）。

单语主题建模

如果你使用 CombinedTM，则需要包含用于词袋模型的测试文本：

.. code-block:: python

testing_dataset = qt.transform(text_for_contextual=testing_text_for_contextual, text_for_bow=testing_text_for_bow)

# n_sample 表示从分布中采样的次数（详见文档）
ctm.get_doc_topic_distribution(testing_dataset, n_samples=20) # 返回一个 (n_documents, n_topics) 矩阵，表示每个文档的主题分布

如果你使用 ZeroShotTM，则不需要使用 testing_text_for_bow，因为如果使用不同的测试文档，将会生成不同大小的词袋模型。因此，最好的做法是只传递将输入到上下文模型的文本：

.. code-block:: python

testing_dataset = qt.transform(text_for_contextual=testing_text_for_contextual)

# n_sample 表示从分布中采样的次数（详见文档）
ctm.get_doc_topic_distribution(testing_dataset, n_samples=20)

跨语言主题建模

当你使用多语言嵌入训练完 ZeroShotTM 模型后，你可以通过这个简单的流程来预测其他语言文档的主题（只要该语言被 paraphrase-multilingual-mpnet-base-v2 支持）。

.. code-block:: python

# 这里我们有一篇西班牙语文档
testing_text_for_contextual = [
    "hola, bienvenido",
]

# 由于我们正在进行多语言主题建模，在进行跨语言实验时，ZeroShotTM 不需要词袋模型（这样做没有意义，因为我们是用英语词袋模型训练的，却要使用西班牙语词袋模型）。
testing_dataset = qt.transform(testing_text_for_contextual)

# n_sample 表示从分布中采样的次数（详见文档）
ctm.get_doc_topic_distribution(testing_dataset, n_samples=20) # 返回一个 (n_documents, n_topics) 矩阵，表示每个文档的主题分布

进阶说明： 我们不需要传递西班牙语的词袋模型：两种语言的词袋模型是无法比较的！我们之所以将其传递给模型，只是为了兼容性考虑，但你不能将模型的输出（即训练语言的预测词袋模型）与测试语言的词袋模型进行比较。

开发团队

Federico Bianchi_ f.bianchi@unibocconi.it 博科尼大学
Silvia Terragni_ s.terragni4@campus.unimib.it 米兰-比可卡大学
Dirk Hovy_ dirk.hovy@unibocconi.it 博科尼大学

软件详情

自由软件：MIT 许可证
文档：https://contextualized-topic-models.readthedocs.io。
特别感谢 Stephen Carrow_ 创建了出色的 https://github.com/estebandito22/PyTorchAVITM 包，我们正是基于该包构建了本项目的基石。我们很高兴能够在 MIT 许可证下再次发布这款软件。

致谢

本项目使用 Cookiecutter_ 和 audreyr/cookiecutter-pypackage_ 项目模板创建。为了方便用户使用，我们还引入了 rbo_ 包，其所有权利均归该包作者所有。

注

请记住，这是一个研究工具 :)

.. _PyTorch: https://pytorch.org/get-started/locally/ .. _Cookiecutter: https://github.com/audreyr/cookiecutter .. _预处理: https://github.com/MilaNLProc/contextualized-topic-models#preprocessing .. _跨语言主题建模: https://github.com/MilaNLProc/contextualized-topic-models#cross-lingual-topic-modeling .. _audreyr/cookiecutter-pypackage: https://github.com/audreyr/cookiecutter-pypackage .. _Stephen Carrow : https://github.com/estebandito22 .. _rbo : https://github.com/dlukes/rbo .. _费德里科·比安奇: https://federicobianchi.io .. _西尔维娅·特拉尼亚尼: https://silviatti.github.io/ .. _迪尔克·霍维: https://dirkhovy.com/ .. _SBERT: https://www.sbert.net/docs/pretrained_models.html .. _Hugging Face: https://huggingface.co/models .. _UmBERTo: https://huggingface.co/Musixmatch/umberto-commoncrawl-cased-v1 .. _Medium: https://fbvinid.medium.com/contextualized-topic-modeling-with-python-eacl2021-eacf6dfa576

Contextualized Topic Models (CTM) 快速上手指南

Contextualized Topic Models (CTM) 是一个利用预训练语言模型（如 BERT）的上下文嵌入来增强主题建模效果的 Python 库。它支持多语言，并提供了两种核心模型：CombinedTM（结合词袋与上下文嵌入，主题连贯性更强）和 ZeroShotTM（仅使用上下文嵌入，支持零样本跨语言主题建模）。

环境准备

操作系统: Linux, macOS, Windows
Python 版本: 建议 Python 3.7+
前置依赖:
- PyTorch
- Hugging Face Transformers / Sentence Transformers (SBERT)
GPU 加速 (可选): 如需使用 CUDA 加速，请确保已安装与当前 PyTorch 版本匹配的 CUDA 驱动及 toolkit。

安装步骤

推荐使用 pip 进行安装。国内用户可使用清华或阿里镜像源加速下载。

标准安装：

pip install -U contextualized_topic_models

使用国内镜像源加速安装：

pip install -U contextualized_topic_models -i https://pypi.tuna.tsinghua.edu.cn/simple

基本使用

以下示例展示如何使用 CombinedTM 模型进行主题建模。该流程包含数据预处理、模型训练及主题提取。

1. 导入依赖与准备数据

CTM 的核心优势在于同时利用“原始文本”生成上下文嵌入，以及利用“预处理文本”构建词袋（BoW）。

from contextualized_topic_models.models.ctm import CombinedTM
from contextualized_topic_models.utils.data_preparation import TopicModelDataPreparation

# 假设你已有两份文档列表：
# list_of_unpreprocessed_documents: 原始文本列表（用于 BERT 嵌入）
# list_of_preprocessed_documents: 分词/去停用词后的文本列表（用于词袋模型）

# 初始化数据预处理工具，指定预训练模型（此处使用多语言 mpnet 模型）
qt = TopicModelDataPreparation("all-mpnet-base-v2")

# 拟合数据：生成训练数据集
# text_for_contextual: 传入原始文本
# text_for_bow: 传入预处理后的文本
training_dataset = qt.fit(
    text_for_contextual=list_of_unpreprocessed_documents, 
    text_for_bow=list_of_preprocessed_documents
)

2. 初始化并训练模型

n_components 参数用于设定想要提取的主题数量。注意：为了获得最佳效果，建议将词袋词汇量限制在 2000 个术语以内。

# 初始化 CombinedTM 模型
# bow_size: 词袋词汇表大小
# contextual_size: 上下文嵌入维度 (all-mpnet-base-v2 通常为 768)
# n_components: 主题数量
ctm = CombinedTM(
    bow_size=len(qt.vocab), 
    contextual_size=768, 
    n_components=50 
)

# 训练模型
ctm.fit(training_dataset)

3. 获取主题结果

训练完成后，即可查看生成的主题及其对应的关键词。

# 获取前 2 个主题及其关键词
topics = ctm.get_topics(2)
print(topics)

提示：若需进行跨语言零样本主题建模，请将 CombinedTM 替换为 ZeroShotTM，其余调用方式类似。更多高级用法（如 Kitty 人机交互分类器、SuperCTM 监督模式）请参考官方文档。

常见问题

如何使用 OpenAI、Cohere 等高级模型获取主题表示（embedding）？

运行评估分数时遇到 'numpy.ndarray size changed' 或 'C-API incompatibility' 错误怎么办？

如何处理超过 3GB 的大型数据集以避免内存分配错误？

如何正确配置代码以训练双词（bi-grams）主题模型？

在 Google Colab 中导入库时出现 RuntimeError (API version mismatch) 如何解决？

使用不同预训练模型生成嵌入时，最大序列长度（max_seq_length）应该如何设置？

相似工具推荐

stable-diffusion-webui

stable-diffusion-webui 是一个基于 Gradio 构建的网页版操作界面，旨在让用户能够轻松地在本地运行和使用强大的 Stable Diffusion 图像生成模型。它解决了原始模型依赖命令行、操作门槛高且功能分散的痛点，将复杂的 AI 绘图流程整合进一个直观易用的图形化平台。无论是希望快速上手的普通创作者、需要精细控制画面细节的设计师，还是想要深入探索模型潜力的开发者与研究人员，都能从中获益。其核心亮点在于极高的功能丰富度：不仅支持文生图、图生图、局部重绘（Inpainting）和外绘（Outpainting）等基础模式，还独创了注意力机制调整、提示词矩阵、负向提示词以及“高清修复”等高级功能。此外，它内置了 GFPGAN 和 CodeFormer 等人脸修复工具，支持多种神经网络放大算法，并允许用户通过插件系统无限扩展能力。即使是显存有限的设备，stable-diffusion-webui 也提供了相应的优化选项，让高质量的 AI 艺术创作变得触手可及。

★ 162.1k|★★★☆☆|今天

开发框架图像Agent

everything-claude-code

everything-claude-code 是一套专为 AI 编程助手（如 Claude Code、Codex、Cursor 等）打造的高性能优化系统。它不仅仅是一组配置文件，而是一个经过长期实战打磨的完整框架，旨在解决 AI 代理在实际开发中面临的效率低下、记忆丢失、安全隐患及缺乏持续学习能力等核心痛点。通过引入技能模块化、直觉增强、记忆持久化机制以及内置的安全扫描功能，everything-claude-code 能显著提升 AI 在复杂任务中的表现，帮助开发者构建更稳定、更智能的生产级 AI 代理。其独特的“研究优先”开发理念和针对 Token 消耗的优化策略，使得模型响应更快、成本更低，同时有效防御潜在的攻击向量。这套工具特别适合软件开发者、AI 研究人员以及希望深度定制 AI 工作流的技术团队使用。无论您是在构建大型代码库，还是需要 AI 协助进行安全审计与自动化测试，everything-claude-code 都能提供强大的底层支持。作为一个曾荣获 Anthropic 黑客大奖的开源项目，它融合了多语言支持与丰富的实战钩子（hooks），让 AI 真正成长为懂上

★ 140.4k|★★☆☆☆|今天

开发框架Agent语言模型

ComfyUI

ComfyUI 是一款功能强大且高度模块化的视觉 AI 引擎，专为设计和执行复杂的 Stable Diffusion 图像生成流程而打造。它摒弃了传统的代码编写模式，采用直观的节点式流程图界面，让用户通过连接不同的功能模块即可构建个性化的生成管线。这一设计巧妙解决了高级 AI 绘图工作流配置复杂、灵活性不足的痛点。用户无需具备编程背景，也能自由组合模型、调整参数并实时预览效果，轻松实现从基础文生图到多步骤高清修复等各类复杂任务。ComfyUI 拥有极佳的兼容性，不仅支持 Windows、macOS 和 Linux 全平台，还广泛适配 NVIDIA、AMD、Intel 及苹果 Silicon 等多种硬件架构，并率先支持 SDXL、Flux、SD3 等前沿模型。无论是希望深入探索算法潜力的研究人员和开发者，还是追求极致创作自由度的设计师与资深 AI 绘画爱好者，ComfyUI 都能提供强大的支持。其独特的模块化架构允许社区不断扩展新功能，使其成为当前最灵活、生态最丰富的开源扩散模型工具之一，帮助用户将创意高效转化为现实。

★ 107.7k|★★☆☆☆|2天前

开发框架图像Agent

NextChat

NextChat 是一款轻量且极速的 AI 助手，旨在为用户提供流畅、跨平台的大模型交互体验。它完美解决了用户在多设备间切换时难以保持对话连续性，以及面对众多 AI 模型不知如何统一管理的痛点。无论是日常办公、学习辅助还是创意激发，NextChat 都能让用户随时随地通过网页、iOS、Android、Windows、MacOS 或 Linux 端无缝接入智能服务。这款工具非常适合普通用户、学生、职场人士以及需要私有化部署的企业团队使用。对于开发者而言，它也提供了便捷的自托管方案，支持一键部署到 Vercel 或 Zeabur 等平台。 NextChat 的核心亮点在于其广泛的模型兼容性，原生支持 Claude、DeepSeek、GPT-4 及 Gemini Pro 等主流大模型，让用户在一个界面即可自由切换不同 AI 能力。此外，它还率先支持 MCP（Model Context Protocol）协议，增强了上下文处理能力。针对企业用户，NextChat 提供专业版解决方案，具备品牌定制、细粒度权限控制、内部知识库整合及安全审计等功能，满足公司对数据隐私和个性化管理的高标准要求。

★ 87.6k|★★☆☆☆|昨天

开发框架语言模型

ML-For-Beginners

ML-For-Beginners 是由微软推出的一套系统化机器学习入门课程，旨在帮助零基础用户轻松掌握经典机器学习知识。这套课程将学习路径规划为 12 周，包含 26 节精炼课程和 52 道配套测验，内容涵盖从基础概念到实际应用的完整流程，有效解决了初学者面对庞大知识体系时无从下手、缺乏结构化指导的痛点。无论是希望转型的开发者、需要补充算法背景的研究人员，还是对人工智能充满好奇的普通爱好者，都能从中受益。课程不仅提供了清晰的理论讲解，还强调动手实践，让用户在循序渐进中建立扎实的技能基础。其独特的亮点在于强大的多语言支持，通过自动化机制提供了包括简体中文在内的 50 多种语言版本，极大地降低了全球不同背景用户的学习门槛。此外，项目采用开源协作模式，社区活跃且内容持续更新，确保学习者能获取前沿且准确的技术资讯。如果你正寻找一条清晰、友好且专业的机器学习入门之路，ML-For-Beginners 将是理想的起点。

★ 85k|★★☆☆☆|今天

图像数据工具视频

ragflow

RAGFlow 是一款领先的开源检索增强生成（RAG）引擎，旨在为大语言模型构建更精准、可靠的上下文层。它巧妙地将前沿的 RAG 技术与智能体（Agent）能力相结合，不仅支持从各类文档中高效提取知识，还能让模型基于这些知识进行逻辑推理和任务执行。在大模型应用中，幻觉问题和知识滞后是常见痛点。RAGFlow 通过深度解析复杂文档结构（如表格、图表及混合排版），显著提升了信息检索的准确度，从而有效减少模型“胡编乱造”的现象，确保回答既有据可依又具备时效性。其内置的智能体机制更进一步，使系统不仅能回答问题，还能自主规划步骤解决复杂问题。这款工具特别适合开发者、企业技术团队以及 AI 研究人员使用。无论是希望快速搭建私有知识库问答系统，还是致力于探索大模型在垂直领域落地的创新者，都能从中受益。RAGFlow 提供了可视化的工作流编排界面和灵活的 API 接口，既降低了非算法背景用户的上手门槛，也满足了专业开发者对系统深度定制的需求。作为基于 Apache 2.0 协议开源的项目，它正成为连接通用大模型与行业专有知识之间的重要桥梁。

★ 77.1k|★★★☆☆|2天前

Agent图像开发框架

使用场景

没有 contextualized-topic-models 时

使用 contextualized-topic-models 后

运行环境要求

快速开始

=========================== 上下文主题模型

使用上下文嵌入进行主题建模

教程

概述

单语主题建模

跨语言主题建模

更多进阶内容

开发团队

软件详情

致谢

注

Contextualized Topic Models (CTM) 快速上手指南

环境准备

安装步骤

基本使用

1. 导入依赖与准备数据

2. 初始化并训练模型

3. 获取主题结果

常见问题

相似工具推荐

stable-diffusion-webui

everything-claude-code

ComfyUI

NextChat

ML-For-Beginners

ragflow