spacy-3相关内容

在Spacy3中的文档中追加新实体失败

我正在Spacy的nlp管道中添加一个自定义组件。下面是我要遵循的步骤。 创建匹配器来挑选汽车名称 定义使用此匹配器的自定义组件,并将匹配项追加到现有的doc.ents。 尽管提供了SPAN对象类型,但最后一次追加失败。 # Matcher info cars = ['honda', 'toyota', 'yamaha', 'mazda', 'range rover', 'me ..
发布时间:2022-05-15 22:27:17 其他开发

给定一个词,我们可以使用 Spacy 得到它所有可能的引理吗?

输入词是独立的,不是句子的一部分,但我想获得它所有可能的引理,就好像输入词在不同的句子中一样,带有所有可能的词性标签.我也想得到单词引理的查找版本. 我为什么要这样做? 我已经从所有文档中提取了引理,并且还计算了引理之间的依赖链接的数量.我已经使用 en_core_web_sm 完成了这两项工作.现在,给定一个输入词,我想返回与输入词的所有可能引理链接最频繁的引理. 简而言之,我 ..
发布时间:2022-01-02 17:35:25 Python

使用 spaCy 3 的自定义 NER 训练抛出 ValueError

我正在尝试使用 spacy 3 添加自定义 NER 标签.我找到了旧版本的教程并对 spacy 3 进行了调整.这是我正在使用的整个代码: 随机导入进口空间从 spacy.training 导入示例标签 = '动物'火车数据 = [(“马太高了,他们假装关心你的感受",{'entities': [(0, 6, LABEL)]}),(“它们会咬人吗?", {'entities': []}),(“马 ..
发布时间:2021-06-07 20:41:24 Python

Spacy 3 命名实体识别的置信度评分

我需要获得 NER 'de_core_news_lg' 模型预测的标签的置信度分数.在 Spacy 2 中有一个众所周知的解决方案: nlp = spacy.load('de_core_news_lg')doc = nlp('ich möchte mit frau Mustermann in der Musterbank sprechen')文字 = 内容doc = nlp.make_doc(文 ..
发布时间:2021-06-07 20:38:55 Python