self-attentive-parser

906 158 简单 1 次阅读 3天前MITAgent语言模型图像开发框架

AI 解读由 AI 自动生成，仅供参考

self-attentive-parser（又称 Berkeley Neural Parser）是一款基于 Python 开发的高精度自然语言处理工具，专注于对 11 种语言进行成分句法分析。它能将句子拆解为具有层级结构的语法树，清晰展示词语如何组合成短语及句子，从而帮助机器深入理解语言的内在逻辑与结构关系。

该工具有效解决了传统解析器在多语言支持、长距离依赖捕捉及分析精度上的不足。其核心技术亮点在于采用了“自注意力编码器”架构，并结合了先进的预训练模型，显著提升了分析的准确性。2021 年更新的 0.2.0 版本更是全面转向 PyTorch 推理引擎，提供了质量更高的预训练模型，并支持与 spaCy 无缝集成，让用户能轻松在现有工作流中调用强大的句法分析能力。

self-attentive-parser 非常适合 NLP 研究人员、AI 开发者以及需要深度文本分析的数据科学家使用。无论是用于构建问答系统、机器翻译优化，还是进行语言学理论研究，它都能提供可靠的句法结构数据。虽然普通用户难以直接操作代码，但基于此工具开发的上层应用将能提供更精准的语言理解服务。

使用场景

某跨国教育科技公司的 NLP 团队正在构建一个多语言语法纠错系统，需要精准识别句子中的主谓宾结构以定位语法错误。

没有 self-attentive-parser 时

句法分析精度不足：依赖传统统计模型或基础规则，在处理长难句或复杂嵌套结构时，经常错误划分短语边界，导致纠错建议误导用户。
多语言支持割裂：为英语、德语、韩语等不同语言维护多套独立的解析管线，代码冗余严重且难以统一迭代升级。
深层语义缺失：只能获取浅层的词性标注，无法生成完整的成分树（Constituency Tree），难以判断“动作发出者”与“承受者”的逻辑关系。
集成开发成本高：缺乏与主流工业级框架（如 spaCy）的原生对接，每次调用需编写大量胶水代码进行数据格式转换。

使用 self-attentive-parser 后

解析准确率显著提升：基于自注意力机制的神经模型能精准拆解复杂句式，即使是多层嵌套的从句也能生成正确的树状结构，大幅降低误报率。
一套代码覆盖全球：直接加载预训练的 11 种语言模型，统一了后端处理逻辑，新语言上线仅需切换模型配置，无需重构核心代码。
结构化信息触手可及：通过 spaCy 扩展属性直接获取 parse_string 和成分标签，轻松提取主语、谓语等关键片段，为纠错逻辑提供坚实依据。
工程落地丝滑顺畅：原生支持 spaCy 管道集成，几行代码即可将高精度解析能力嵌入现有流程，且自动利用 GPU 加速推理，延迟极低。

self-attentive-parser 通过引入高精度的神经成分句法分析，将多语言深层语义理解从复杂的科研实验变成了可一键集成的工业级能力。

运行环境要求

操作系统

未说明

GPU

非必需
PyTorch 会自动检测并使用可用的 GPU，支持 CPU 模式运行
具体显卡型号、显存大小及 CUDA 版本未在文档中明确指定，取决于所选预训练模型（如 T5-large, BERT-large, XLM-R 等）的大小

内存

未说明

依赖

notes1. 推理默认使用 PyTorch（不再支持 TensorFlow）。2. 强烈建议通过 spaCy 集成使用以进行分词和句子分割；若仅使用 NLTK 接口，输入必须是已分词的文本。3. 解析模型需单独下载（例如 'benepar_en3'）。4. 训练时需要手动编译 EVALB 工具。5. 不同语言模型对 spaCy 的支持程度不同（如阿拉伯语和希伯来语不支持从原始文本解析，仅支持 NLTK 接口处理已分词数据）。6. 中文模型 ('benepar_zh2') 基于 Chinese ELECTRA，使用 spaCy 时需注意其分词限制。

python3.6+ (推理), 3.7+ (训练)

torch>=1.6

spacy

nltk>=3.2

transformers>=4.3.0

torch-struct>=0.4

pytokenizations>=0.7.2

快速开始

伯克利神经依存句法分析器

一款高精度的句法分析器，支持11种语言，使用Python实现。该工具基于2018年ACL会议论文《基于自注意力编码器的成分句法分析》（arXiv:1805.01052），并结合了多语言成分句法分析：自注意力与预训练中提出的改进方法。

2021年2月更新： 伯克利神经依存句法分析器现已发布0.2.0版本，所有语言的预训练模型质量均有所提升。推理阶段现采用PyTorch框架，而训练始终仅支持PyTorch。本版本不再支持Python 2.7和3.5。同时新增对自定义训练和使用解析器的支持，并可根据用户选择的预训练模型进行配置。

安装

要安装该句法分析器，运行以下命令：

$ pip install benepar

注意：benepar 0.2.0是上一版本的重大升级，配备了全新且质量更高的解析模型。如果您暂不准备升级，可以将benepar版本固定为之前的0.1.3版本。

需要Python 3.6及以上版本以及PyTorch 1.6及以上版本。请参阅PyTorch官网，了解如何选择GPU版或CPU版；benepar会在PyTorch可用时自动使用GPU。

推荐的使用方式是将其与spaCy集成。若使用spaCy，您应为您的语言安装相应的spaCy模型。例如，对于英语，安装命令如下：

$ python -m spacy download en_core_web_md

spaCy模型仅用于分词和句子切分。如果不需要超出句法分析的语言特定分析，也可以不使用特定语言的模型，而改用仅执行分词和句子切分的多语言模型。此类模型于spaCy 3.0中新增，适用于英语、德语、韩语、波兰语和瑞典语（但不适用于中文，因为它似乎不支持中文分词）。

句法分析模型需单独下载，使用以下命令：

>>> import benepar
>>> benepar.download('benepar_en3')

完整模型列表请参见下方的可用模型部分。

使用

与spaCy结合使用（推荐）

推荐的使用方式是通过与spaCy的集成：

>>> import benepar, spacy
>>> nlp = spacy.load('en_core_web_md')
>>> if spacy.__version__.startswith('2'):
        nlp.add_pipe(benepar.BeneparComponent("benepar_en3"))
    else:
        nlp.add_pipe("benepar", config={"model": "benepar_en3"})
>>> doc = nlp("The time for action is now. It's never too late to do something.")
>>> sent = list(doc.sents)[0]
>>> print(sent._.parse_string)
(S (NP (NP (DT The) (NN time)) (PP (IN for) (NP (NN action)))) (VP (VBZ is) (ADVP (RB now))) (. .))
>>> sent._.labels
('S',)
>>> list(sent._.children)[0]
The time for action

由于spaCy并未提供官方的成分句法分析API，所有方法均通过扩展命名空间Span._和Token._访问。

以下是可用的扩展属性：

Span._.labels：给定span的标签元组。当解析树中存在一元链时，一个span可能具有多个标签。
Span._.parse_string：给定span的解析树字符串表示。
Span._.constituents：按解析树的前序遍历迭代子构成的Span对象。
Span._.parent：解析树中的父span。
Span._.children：解析树中子span的迭代器。
Token._.labels、Token._.parse_string、Token._.parent：这些行为与调用包含该token的长度为1的Span上的相应方法相同。

在非解析树中的span上调用这些方法会引发异常。可通过从句子级别（遍历doc.sents）或从单个Token对象开始遍历解析树来避免此类错误。

与NLTK结合使用

此外，还提供了NLTK接口，专为处理预分词的数据集和语料库设计，或者在已具备分词和句子切分功能的NLP流水线中集成解析器时使用。对于从原始文本开始的解析任务，强烈建议使用spaCy和benepar.BeneparComponent。

NLTK的使用示例：

>>> import benepar
>>> parser = benepar.Parser("benepar_en3")
>>> input_sentence = benepar.InputSentence(
    words=['"', 'Fly', 'safely', '.', '"'],
    space_after=[False, True, False, False, False],
    tags=['``', 'VB', 'RB', '.', "''"],
    escaped_words=['``', 'Fly', 'safely', '.', "''"],
)
>>> tree = parser.parse(input_sentence)
>>> print(tree)
(TOP (S (`` ``) (VP (VB Fly) (ADVP (RB safely))) (. .) ('' '')))

并非benepar.InputSentence的所有字段都是必需的，但至少需要指定words或escaped_words之一。解析器会尝试猜测缺失字段的值，例如：

>>> input_sentence = benepar.InputSentence(
    words=['"', 'Fly', 'safely', '.', '"'],
)
>>> parser.parse(input_sentence)

使用parse_sents可解析多条句子。

>>> input_sentence1 = benepar.InputSentence(
    words=['The', 'time', 'for', 'action', 'is', 'now', '.'],
)
>>> input_sentence2 = benepar.InputSentence(
    words=['It', "'s", 'never', 'too', 'late', 'to', 'do', 'something', '.'],
)
>>> parser.parse_sents([input_sentence1, input_sentence2])

部分解析模型也支持Unicode文本输入，用于调试或交互式使用，但在任何对解析准确性有要求的应用场景中，强烈不建议直接传入原始文本字符串。

>>> parser.parse('"Fly safely."')  # 仅用于调试/交互式使用。

从原始文本进行解析时，我们仍推荐使用spaCy和benepar.BeneparComponent。原因是解析模型本身并不自带分词器或句子切分器，某些模型甚至可能没有词性标注器。因此必须借助其他工具来补充这些环节，而spaCy在这些方面的表现普遍优于NLTK，有时甚至差距显著。

可用模型

以下是可用的已训练解析器模型。要使用 spaCy 集成，您还需要安装适用于相应语言的 spaCy 模型。

模型	语言	信息
`benepar_en3`	英语	在修订版 WSJ 测试集上取得 95.40 的 F1 分数。训练数据采用了基于与 English Web Treebank 和 OntoNotes 相同指南的修订版分词和句法标注，这更符合 spaCy 等库中的现代分词实践。基于 T5-small。
`benepar_en3_large`	英语	在修订版 WSJ 测试集上取得 96.29 的 F1 分数。训练数据采用了基于与 English Web Treebank 和 OntoNotes 相同指南的修订版分词和句法标注，这更符合 spaCy 等库中的现代分词实践。基于 T5-large。
`benepar_zh2`	中文	在 CTB 5.1 测试集上取得 92.56 的 F1 分数。与 spaCy 一起使用时，支持从原始文本进行解析，但 NLTK API 仅支持对已分词句子进行解析。基于 Chinese ELECTRA-180G-large。
`benepar_ar2`	阿拉伯语	在 SPMRL2013/2014 测试集上取得 90.52 的 F1 分数。仅支持使用 NLTK API 对已分词句子进行解析。不支持从原始文本解析或与 spaCy 集成。基于 XLM-R。
`benepar_de2`	德语	在 SPMRL2013/2014 测试集上取得 92.10 的 F1 分数。基于 XLM-R。
`benepar_eu2`	巴斯克语	在 SPMRL2013/2014 测试集上取得 93.36 的 F1 分数。与 spaCy 一起使用时，首先需要在 spaCy 中实现巴斯克语支持。基于 XLM-R。
`benepar_fr2`	法语	在 SPMRL2013/2014 测试集上取得 88.43 的 F1 分数。基于 XLM-R。
`benepar_he2`	希伯来语	在 SPMRL2013/2014 测试集上取得 93.98 的 F1 分数。仅支持使用 NLTK API 对已分词句子进行解析。不支持从原始文本解析或与 spaCy 集成。基于 XLM-R。
`benepar_hu2`	匈牙利语	在 SPMRL2013/2014 测试集上取得 96.19 的 F1 分数。与 spaCy 一起使用时，需要一个匈牙利语 spaCy 模型。NLTK API 仅支持对已分词句子进行解析。基于 XLM-R。
`benepar_ko2`	韩语	在 SPMRL2013/2014 测试集上取得 91.72 的 F1 分数。可与 spaCy 的多语言句子分割模型一起使用（需 spaCy v3.0）。NLTK API 仅支持对已分词句子进行解析。基于 XLM-R。
`benepar_pl2`	波兰语	在 SPMRL2013/2014 测试集上取得 97.15 的 F1 分数。基于 XLM-R。
`benepar_sv2`	瑞典语	在 SPMRL2013/2014 测试集上取得 92.21 的 F1 分数。可与 spaCy 的多语言句子分割模型一起使用（需 spaCy v3.0）。基于 XLM-R。
`benepar_en3_wsj`	英语	建议改用 `benepar_en3` 或 `benepar_en3_large`。在用于数十年英语短语结构解析研究的标准版 WSJ 测试集上取得 95.55 的 F1 分数。基于 BERT-large-uncased。我们认为，用于训练 `benepar_en3`/`benepar_en3_large` 的修订版标注指南更适合下游应用，因为它们更能处理网络文本中的语言使用，并且与现代依存句法分析及 spaCy 等库的做法更加一致。尽管如此，我们仍提供 `benepar_en3_wsj` 模型，以备在不适合采用修订版树库规范的情况下使用，例如在同一数据集上比较不同模型的表现。

训练

训练需要从 GitHub 克隆本仓库。虽然 src/benepar 中的模型代码已发布在 PyPI 上的 benepar 包中，但直接位于 src/ 下的训练和评估脚本并未包含在内。

训练所需的软件

Python 3.7 或更高版本。
PyTorch 1.6.0 或任何兼容版本。
benepar 包所需的所有依赖项，包括：NLTK 3.2、torch-struct 0.4、transformers 4.3.0 或兼容版本。
pytokenizations 0.7.2 或兼容版本。
EVALB。开始前，请在 EVALB/ 目录下运行 make 编译出 evalb 可执行文件。该文件将在 Python 中调用以进行评估。若在 SPMRL 数据集上训练，则需在 EVALB_SPMRL/ 目录下运行 make。

训练说明

可以使用命令 python src/main.py train ... 来训练新模型。可用的参数包括：

参数	描述	默认值
`--model-path-base`	用于保存模型的基础路径	无
`--evalb-dir`	EVALB 目录的路径	`EVALB/`
`--train-path`	训练树文件的路径	`data/wsj/train_02-21.LDC99T42`
`--train-path-text`	训练数据的可选非破坏性分词	根据原始文本猜测；参见 `--text-processing`
`--dev-path`	开发集树文件的路径	`data/wsj/dev_22.LDC99T42`
`--dev-path-text`	开发集数据的可选非破坏性分词	根据原始文本猜测；参见 `--text-processing`
`--text-processing`	从非破坏性分词的树文件中推断原始文本的启发式方法。参见 `src/treebanks.py` 中的 `load_trees()`	非阿拉伯语、汉语和希伯来语语言的默认规则
`--subbatch-max-tokens`	训练时并行处理的最大词数（完整批次可能无法放入 GPU 内存）	2000
`--parallelize`	将预训练模型（如 T5）的层分布到多个 GPU 上。	最多使用一个 GPU
`--batch-size`	每次训练更新的样本数量	32
`--checks-per-epoch`	每个 epoch 的开发集评估次数	4
`--numpy-seed`	NumPy 随机种子	随机
`--use-pretrained`	使用预训练编码器	不使用预训练编码器
`--pretrained-model`	如果指定了 `--use-pretrained`，则使用的模型。可以是路径或 HuggingFace Model Hub 中的模型 ID	`bert-base-uncased`
`--predict-tags`	向解析器添加词性标注组件及辅助损失	不预测词性标签
`--use-chars-lstm`	使用学习到的 CharLSTM 词表示	不使用 CharLSTM
`--use-encoder`	在预训练模型或 CharLSTM 之上使用学习到的 Transformer 层	不使用额外的 Transformer 层
`--num-layers`	如果指定了 `--use-encoder`，则使用的 Transformer 层数量	8
`--encoder-max-len`	允许额外 Transformer 层处理的最大句子长度（以词为单位）	512

其他超参数也有相应的参数可供使用，详见 src/main.py 中的 make_hparams()。这些参数可以在命令行中指定，例如 --num-layers 2（数值型参数）、--predict-tags（默认为 False 的布尔型参数），或 --no-XXX（默认为 True 的布尔型参数）。

每次开发集评估时，都会计算开发集上的 F 分数，并与之前的最佳结果进行比较。如果当前模型更好，则会删除之前的模型并保存当前模型。新文件名将基于提供的模型路径基础和开发集 F 分数生成。

在训练解析器之前，您需要先获取合适的训练数据。我们提供了关于如何处理 PTB、CTB 以及 SMPRL 2013/2014 共享任务数据等标准数据集的说明。按照英语 WSJ 数据的说明操作后，您可以使用以下命令，以默认超参数训练一个英语解析器：

python src/main.py train --use-pretrained --model-path-base models/en_bert_base

更多良好的超参数选择示例，请参阅 EXPERIMENTS.md。

评估说明

可以使用命令 python src/main.py test ... 对已保存的模型进行测试集评估，参数如下：

参数	描述	默认值
`--model-path`	已保存模型的路径	无
`--evalb-dir`	EVALB 目录的路径	`EVALB/`
`--test-path`	测试树文件的路径	`data/23.auto.clean`
`--test-path-text`	测试数据的可选非破坏性分词	根据原始文本猜测；参见 `--text-processing`
`--text-processing`	从非破坏性分词的树文件中推断原始文本的启发式方法。参见 `src/treebanks.py` 中的 `load_trees()`	非阿拉伯语、汉语和希伯来语语言的默认规则
`--test-path-raw`	仅用于 EVALB 的测试树文件替代路径（用于双重检查对预处理树的评估是否包含任何错误）	与 `--test-path` 中的树进行对比
`--subbatch-max-tokens`	并行处理的最大词数（GPU 内存不足以一次性处理整个数据集）	500
`--parallelize`	将预训练模型（如 T5）的层分布到多个 GPU 上。	最多使用一个 GPU
`--output-path`	用于写入预测树的路径（使用 `"-"` 表示输出到标准输出）。	不保存预测树
`--no-predict-tags`	运行 EVALB 时使用金标准词性标签。这是发表论文的标准做法，省略此标志可能会导致 F1 分数虚高。	如果有可用的预测词性标签，则在 EVALB 中使用预测标签

例如，您可以使用以下命令评估已训练好的模型：

python src/main.py test --model-path models/en_bert_base_dev=*.pt

导出模型用于推理

benepar 包可以直接使用保存的检查点文件，只需将模型名称（如 benepar_en3）替换为路径（如 models/en_bert_base_dev_dev=95.67.pt）。然而，发布单文件检查点存在一些不足：

单文件检查点不包含分词器或预训练模型配置。这些通常可以从 HuggingFace 模型库自动下载，但需要互联网连接，并且可能会（无意中且不必要的）从 HuggingFace 模型库下载预训练权重。
单文件检查点比实际需要大三倍，因为它们还保存了优化器状态。

可以使用 src/export.py 脚本将检查点文件转换为一个包含训练好的模型所有信息的目录。例如：

python src/export.py export \
  --model-path models/en_bert_base_dev=*.pt \
  --output-dir=models/en_bert_base

在导出时，还有一个 --compress 选项，它会轻微调整模型权重，以便将输出目录压缩成一个体积小得多的 ZIP 压缩包。我们在官方模型发布中会使用此选项，因为分发大小超过 2GB 的模型权重非常麻烦。使用 --compress 选项时，建议指定一个测试集，以验证压缩对解析准确率的影响确实很小。不建议使用开发数据进行验证，因为在训练过程中，开发数据已经被用作模型选择的标准。

python src/export.py export \
  --model-path models/en_bert_base_dev=*.pt \
  --output-dir=models/en_bert_base \
  --test-path=data/wsj/test_23.LDC99T42

src/export.py 脚本还有一个 test 子命令，与 python src/main.py test 大致相同，只是它支持已导出的模型，并且标志略有不同。我们可以运行以下命令来验证我们使用的 BERT-large-uncased 英语句法分析器确实在标准 WSJ 测试集上达到了 95.55 的 F1 分数：

python src/export.py test --model-path benepar_en3_wsj --test-path data/wsj/test_23.LDC99T42

重现实验

请参阅 EXPERIMENTS.md，了解如何重现我们发表在 ACL 2018 和 2019 年论文中的实验。

引用

如果您将本软件用于研究，请按如下方式引用我们的论文：

@inproceedings{kitaev-etal-2019-multilingual,
    title = "多语言句法分析：基于自注意力机制与预训练的方法",
    author = "Kitaev, Nikita  and
      Cao, Steven  and
      Klein, Dan",
    booktitle = "第57届计算语言学协会年会论文集",
    month = jul,
    year = "2019",
    address = "意大利佛罗伦萨",
    publisher = "计算语言学协会",
    url = "https://www.aclweb.org/anthology/P19-1340",
    doi = "10.18653/v1/P19-1340",
    pages = "3499--3505",
}

@inproceedings{kitaev-klein-2018-constituency,
    title = "基于自注意力编码器的句法分析",
    author = "Kitaev, Nikita  and
      Klein, Dan",
    booktitle = "第56届计算语言学协会年会论文集（第一卷：长文）",
    month = jul,
    year = "2018",
    address = "澳大利亚墨尔本",
    publisher = "计算语言学协会",
    url = "https://www.aclweb.org/anthology/P18-1249",
    doi = "10.18653/v1/P18-1249",
    pages = "2676--2686",
}

致谢

本仓库中的代码以及本 README 的部分内容基于 https://github.com/mitchellstern/minimal-span-parser。

self-attentive-parser (Berkeley Neural Parser) 快速上手指南

self-attentive-parser (包名：benepar) 是一个基于自注意力机制的高精度成分句法分析器，支持包括中文在内的 11 种语言。本指南将帮助你快速在 Python 环境中部署并使用该工具。

1. 环境准备

在开始之前，请确保你的开发环境满足以下要求：

操作系统：Linux, macOS 或 Windows
Python 版本：3.6 或更高（训练建议 3.7+）
核心依赖：
- PyTorch 1.6 或更高版本
- spaCy (推荐用于分词和句子分割)
硬件加速：如果系统可用 GPU，benepar 会自动利用 PyTorch 进行加速。

提示：国内用户安装 PyTorch 时，建议访问 PyTorch 官网获取针对国内网络优化的安装命令，或使用清华/中科大镜像源。

2. 安装步骤

2.1 安装主程序包

使用 pip 安装 benepar：

pip install benepar

2.2 安装 spaCy 及语言模型

推荐使用 spaCy 进行预处理（分词和断句）。以英语为例，安装命令如下：

python -m spacy download en_core_web_md

中文用户注意：若需处理中文文本，请安装对应的 spaCy 中文模型（例如 zh_core_web_sm 或 zh_core_web_md）：

python -m spacy download zh_core_web_md

注：部分语言（如阿拉伯语、希伯来语）的模型暂不支持直接从原始文本解析，仅支持通过 NLTK 接口处理已分词数据。

2.3 下载预训练解析模型

解析模型需要单独下载。根据目标语言选择对应的模型名称（见下文“可用模型”），并在 Python 中执行下载：

import benepar
# 示例：下载英语模型 benepar_en3
benepar.download('benepar_en3')

# 示例：下载中文模型 benepar_zh2
# benepar.download('benepar_zh2')

3. 基本使用

最推荐的方式是通过 spaCy 集成 使用，它可以自动处理分词和句子边界检测。

3.1 基于 spaCy 的使用示例

import benepar
import spacy

# 1. 加载 spaCy 语言模型 (此处以英语为例，中文请替换为 'zh_core_web_md')
nlp = spacy.load('en_core_web_md')

# 2. 添加 benepar 组件
# spaCy v3.x+ 写法
nlp.add_pipe("benepar", config={"model": "benepar_en3"})
# 如果是 spaCy v2.x，请使用: nlp.add_pipe(benepar.BeneparComponent("benepar_en3"))

# 3. 处理文本
doc = nlp("The time for action is now. It's never too late to do something.")

# 4. 获取第一句话的分析结果
sent = list(doc.sents)[0]

# 打印成分句法树字符串
print(sent._.parse_string)
# 输出示例: (S (NP (NP (DT The) (NN time)) ...) ...)

# 获取当前 Span 的标签
print(sent._.labels)
# 输出: ('S',)

# 遍历子成分
for child in sent._.children:
    print(child.text, "->", child._.labels)

3.2 基于 NLTK 的使用示例（仅限已分词数据）

如果你已有分好词的数据集，或需要更底层的控制，可以使用 NLTK 接口：

import benepar

# 初始化解析器
parser = benepar.Parser("benepar_en3")

# 构建输入句子对象 (至少提供 words 列表)
input_sentence = benepar.InputSentence(
    words=['"', 'Fly', 'safely', '.', '"'],
    tags=['``', 'VB', 'RB', '.', "''"], # 可选：提供词性标注以提高准确率
)

# 执行解析
tree = parser.parse(input_sentence)
print(tree)
# 输出: (TOP (S (`` ``) (VP (VB Fly) (ADVP (RB safely))) (. .) ('' '')))

附：常用预训练模型列表

模型名称	语言	说明
`benepar_en3`	英语	推荐默认模型，基于 T5-small，F1 95.40
`benepar_en3_large`	英语	高精度模型，基于 T5-large，F1 96.29
`benepar_zh2`	中文	基于 Chinese ELECTRA，F1 92.56，支持 spaCy 原始文本解析
`benepar_de2`	德语	基于 XLM-R
`benepar_fr2`	法语	基于 XLM-R
`benepar_ko2`	韩语	基于 XLM-R
`benepar_pl2`	波兰语	基于 XLM-R，F1 97.15

完整模型列表请参考官方文档。对于中文开发者优先推荐使用 benepar_zh2。

版本历史

models2018/04/27

常见问题

运行解析器时遇到 "ValueError: No op named GatherV2 in defined operations" 错误怎么办？

训练英文模型需要多少个 epoch 才算完成？

如何导出模型？是否还需要使用 export_bert.py 脚本？

在 PyTorch 1.2 及以上版本运行训练脚本时崩溃或报错怎么办？

导入 benepar 时出现 "ImportError: cannot import name 'chart_decoder'" 错误如何解决？

在 macOS 上安装 benepar 失败怎么办？

安装时出现 "RuntimeError: module compiled against API version... but this version of numpy is..." 错误？

英文解析器的 constituency parse tree tags（成分句法树标签）遵循什么标准？

相似工具推荐

stable-diffusion-webui

stable-diffusion-webui 是一个基于 Gradio 构建的网页版操作界面，旨在让用户能够轻松地在本地运行和使用强大的 Stable Diffusion 图像生成模型。它解决了原始模型依赖命令行、操作门槛高且功能分散的痛点，将复杂的 AI 绘图流程整合进一个直观易用的图形化平台。无论是希望快速上手的普通创作者、需要精细控制画面细节的设计师，还是想要深入探索模型潜力的开发者与研究人员，都能从中获益。其核心亮点在于极高的功能丰富度：不仅支持文生图、图生图、局部重绘（Inpainting）和外绘（Outpainting）等基础模式，还独创了注意力机制调整、提示词矩阵、负向提示词以及“高清修复”等高级功能。此外，它内置了 GFPGAN 和 CodeFormer 等人脸修复工具，支持多种神经网络放大算法，并允许用户通过插件系统无限扩展能力。即使是显存有限的设备，stable-diffusion-webui 也提供了相应的优化选项，让高质量的 AI 艺术创作变得触手可及。

★ 162.1k|★★★☆☆|今天

开发框架图像Agent

everything-claude-code

everything-claude-code 是一套专为 AI 编程助手（如 Claude Code、Codex、Cursor 等）打造的高性能优化系统。它不仅仅是一组配置文件，而是一个经过长期实战打磨的完整框架，旨在解决 AI 代理在实际开发中面临的效率低下、记忆丢失、安全隐患及缺乏持续学习能力等核心痛点。通过引入技能模块化、直觉增强、记忆持久化机制以及内置的安全扫描功能，everything-claude-code 能显著提升 AI 在复杂任务中的表现，帮助开发者构建更稳定、更智能的生产级 AI 代理。其独特的“研究优先”开发理念和针对 Token 消耗的优化策略，使得模型响应更快、成本更低，同时有效防御潜在的攻击向量。这套工具特别适合软件开发者、AI 研究人员以及希望深度定制 AI 工作流的技术团队使用。无论您是在构建大型代码库，还是需要 AI 协助进行安全审计与自动化测试，everything-claude-code 都能提供强大的底层支持。作为一个曾荣获 Anthropic 黑客大奖的开源项目，它融合了多语言支持与丰富的实战钩子（hooks），让 AI 真正成长为懂上

★ 140.4k|★★☆☆☆|今天

开发框架Agent语言模型

ComfyUI

ComfyUI 是一款功能强大且高度模块化的视觉 AI 引擎，专为设计和执行复杂的 Stable Diffusion 图像生成流程而打造。它摒弃了传统的代码编写模式，采用直观的节点式流程图界面，让用户通过连接不同的功能模块即可构建个性化的生成管线。这一设计巧妙解决了高级 AI 绘图工作流配置复杂、灵活性不足的痛点。用户无需具备编程背景，也能自由组合模型、调整参数并实时预览效果，轻松实现从基础文生图到多步骤高清修复等各类复杂任务。ComfyUI 拥有极佳的兼容性，不仅支持 Windows、macOS 和 Linux 全平台，还广泛适配 NVIDIA、AMD、Intel 及苹果 Silicon 等多种硬件架构，并率先支持 SDXL、Flux、SD3 等前沿模型。无论是希望深入探索算法潜力的研究人员和开发者，还是追求极致创作自由度的设计师与资深 AI 绘画爱好者，ComfyUI 都能提供强大的支持。其独特的模块化架构允许社区不断扩展新功能，使其成为当前最灵活、生态最丰富的开源扩散模型工具之一，帮助用户将创意高效转化为现实。

★ 107.7k|★★☆☆☆|2天前

开发框架图像Agent

NextChat

NextChat 是一款轻量且极速的 AI 助手，旨在为用户提供流畅、跨平台的大模型交互体验。它完美解决了用户在多设备间切换时难以保持对话连续性，以及面对众多 AI 模型不知如何统一管理的痛点。无论是日常办公、学习辅助还是创意激发，NextChat 都能让用户随时随地通过网页、iOS、Android、Windows、MacOS 或 Linux 端无缝接入智能服务。这款工具非常适合普通用户、学生、职场人士以及需要私有化部署的企业团队使用。对于开发者而言，它也提供了便捷的自托管方案，支持一键部署到 Vercel 或 Zeabur 等平台。 NextChat 的核心亮点在于其广泛的模型兼容性，原生支持 Claude、DeepSeek、GPT-4 及 Gemini Pro 等主流大模型，让用户在一个界面即可自由切换不同 AI 能力。此外，它还率先支持 MCP（Model Context Protocol）协议，增强了上下文处理能力。针对企业用户，NextChat 提供专业版解决方案，具备品牌定制、细粒度权限控制、内部知识库整合及安全审计等功能，满足公司对数据隐私和个性化管理的高标准要求。

★ 87.6k|★★☆☆☆|昨天

开发框架语言模型

ML-For-Beginners

ML-For-Beginners 是由微软推出的一套系统化机器学习入门课程，旨在帮助零基础用户轻松掌握经典机器学习知识。这套课程将学习路径规划为 12 周，包含 26 节精炼课程和 52 道配套测验，内容涵盖从基础概念到实际应用的完整流程，有效解决了初学者面对庞大知识体系时无从下手、缺乏结构化指导的痛点。无论是希望转型的开发者、需要补充算法背景的研究人员，还是对人工智能充满好奇的普通爱好者，都能从中受益。课程不仅提供了清晰的理论讲解，还强调动手实践，让用户在循序渐进中建立扎实的技能基础。其独特的亮点在于强大的多语言支持，通过自动化机制提供了包括简体中文在内的 50 多种语言版本，极大地降低了全球不同背景用户的学习门槛。此外，项目采用开源协作模式，社区活跃且内容持续更新，确保学习者能获取前沿且准确的技术资讯。如果你正寻找一条清晰、友好且专业的机器学习入门之路，ML-For-Beginners 将是理想的起点。

★ 85k|★★☆☆☆|今天

图像数据工具视频

ragflow

RAGFlow 是一款领先的开源检索增强生成（RAG）引擎，旨在为大语言模型构建更精准、可靠的上下文层。它巧妙地将前沿的 RAG 技术与智能体（Agent）能力相结合，不仅支持从各类文档中高效提取知识，还能让模型基于这些知识进行逻辑推理和任务执行。在大模型应用中，幻觉问题和知识滞后是常见痛点。RAGFlow 通过深度解析复杂文档结构（如表格、图表及混合排版），显著提升了信息检索的准确度，从而有效减少模型“胡编乱造”的现象，确保回答既有据可依又具备时效性。其内置的智能体机制更进一步，使系统不仅能回答问题，还能自主规划步骤解决复杂问题。这款工具特别适合开发者、企业技术团队以及 AI 研究人员使用。无论是希望快速搭建私有知识库问答系统，还是致力于探索大模型在垂直领域落地的创新者，都能从中受益。RAGFlow 提供了可视化的工作流编排界面和灵活的 API 接口，既降低了非算法背景用户的上手门槛，也满足了专业开发者对系统深度定制的需求。作为基于 Apache 2.0 协议开源的项目，它正成为连接通用大模型与行业专有知识之间的重要桥梁。

★ 77.1k|★★★☆☆|2天前

Agent图像开发框架