spacy相关内容

无法在WinPython上安装Spacy:";ModuleNotFoundError:没有命名的模块

我正在尝试使用可移植的Python解释器,因此我安装了WinPython,并计划有一天将我的应用程序部署到其他计算机。 对于我的应用程序,我需要使用NLP模块“spacy”。我尝试在WinPython上安装Spacy(pip Install-U spacy),但无法安装。当它安装模块依赖项时,似乎无法安装模块“Semver”: Collecting semver (from sputn ..
发布时间:2022-05-15 19:11:08 Python

希伯来语中的空格句子标记化错误

正在尝试对希伯来语使用拼写句子标记化。 import spacy nlp = spacy.load('he') doc = nlp(text) sents = list(doc.sents) 我得到: Warning: no model found for 'he' Only loading the 'he' tokenizer. Traceback (most ..
发布时间:2022-05-15 19:03:08 Python

在RASA-NLU训练数据中使用Spacy实体

我正在尝试使用Rasa创建一个简单的程序,该程序可以从文本输入中提取(法语)街道地址。 按照RASA-NLU文档(http://rasa-nlu.readthedocs.io/en/latest/entities.html)中的建议,我想使用Spacy进行地址检测。 我看到(https://spacy.io/usage/training)对应的Spacy预置实体将是LOC。 但是 ..
发布时间:2022-05-15 18:57:26 其他开发

Spacy:词汇中的单词

我尝试用空格纠正打字错误,为此,我需要知道单词中是否存在单词。如果没有,这个想法是把这个词一分为二,直到所有的片段都存在。例如,“of the”不存在,“of”和“the”则不存在。因此,我首先需要知道单词中是否存在某个单词。这就是问题的起点。我尝试: for token in nlp("apple"): print(token.lemma_, token.lemma, token. ..
发布时间:2022-05-15 18:48:08 其他开发

如何使用Spacy mini Batch和GoldParse来训练使用BILUO标签方案的NER模型?

我对Spacy NER模型的输入数据在BILUO标记方案中,我希望将其用作某些需求的一部分。当我试着在没有小批量的情况下简单地训练模型时,它工作得很好(注释部分)。但是我不知道如何在这里使用MiniBatch和GoldParse来提高模型的精度。我的期望在这里是有效的,因为我找不到一个具有这种组合的例子?此外,我已经用开始、结束、标签格式的方法训练了模型。请帮我弄清楚这一节。我的代码如下 i ..
发布时间:2022-05-15 18:36:50 Python

是否有可能找到Spacy POS标签的不确定性?

我正在尝试构建一个非英语拼写检查器,它依赖于按拼写对句子进行分类,这允许我的算法然后使用词性标签和单个标记的语法依赖来确定拼写错误(在我的情况下,更具体地说:荷兰语复合词的错误拆分)。 然而,如果句子包含语法错误,例如将名词归类为动词,即使分类的单词看起来甚至不像动词,Spacy似乎也会错误地对句子进行分类。 正因为如此,我想知道是否有可能获得Spacy分类的不确定性,从而有可能判断S ..
发布时间:2022-05-15 18:26:27 Python

连字词的空格标记化

再见, 我正在尝试对连接的单词进行后处理,这些单词被标记为单独的标记,而它们本应是一个单独的标记。例如: Example: Sentence: "up-scaled" Tokens: ['up', '-', 'scaled'] Expected: ['up-scaled'] 目前,我的解决方案是使用匹配器: matcher = Matcher(nlp.vocab) patt ..
发布时间:2022-05-15 18:05:51 Python

Spacy 2.0支持哪些日期和时间格式

我在我的应用程序中使用以下模型: en_core_web_sm xx_ent_wiki_sm 我想知道默认Spacy模型可以提取的受支持的日期和时间格式。 使用的Python版本:3.6 使用的Spacy版本:2.0.x 推荐答案 英语模型在支持more extensive label scheme包括DATE和TIME的OntoNotes5语料库上进行训练。 ..
发布时间:2022-05-15 17:58:44 其他开发

如何使用spacy或nltk检索句子的主要意图?

我有一个要使用Spacy或nltk或任何NLP库提取句子的主要有意义部分的用例。 例句1:“我怎样才能高声反对骚扰” 意图是:“大声反对骚扰” 例句2:“唐老鸭是由哪个漫画家/哪个人/谁创作的?” 意图为:“唐老鸭创建者” 例句3:“如何使用spacy或nltk检索句子的主要意图”? 意图:“使用空格nltk检索句子的主要意图” 我是依赖项解析的新手,不知道如何做这件事。请 ..
发布时间:2022-05-15 17:44:17 其他开发

如何将自定义符号添加到Spacy的标点符号功能?

是否有添加默认标点规则中不包括的自定义标点符号的选项?(https://github.com/explosion/spaCy/blob/develop/spacy/lang/de/punctuation.py) 我正在使用Spacy的Matcher类(https://spacy.io/usage/rule-based-matching)和属性“is_PUNCT”从我的文本中删除标点符号。 ..
发布时间:2022-05-15 17:34:33 Python

更改间距内的波束宽度(_W)

我要将nlp.entity.cfg Beam_Width(默认情况下为%1)更改为%3。 我尝试了nlp.entity.cfg.update({BEAM_WIDTH:3}),但在进行此更改后,NLP看起来好像坏了。 (如果我执行一个nlp(Str),它会给我一个dict,而不是像通常的那样,我把Beam_Width:1放入一个space y.tokens.doc.Doc) 我想更改它, ..
发布时间:2022-05-15 17:25:05 其他开发

具有空格的自定义实体标尺未返回匹配项

此link显示如何创建自定义实体标尺。 我基本上复制并修改了另一个自定义实体标尺的代码,并使用它在doc中查找匹配项,如下所示: nlp = spacy.load('en_core_web_lg') ruler = EntityRuler(nlp) grades = ["Level 1", "Level 2", "Level 3", "Level 4"] for item in gr ..
发布时间:2022-05-15 17:09:11 Python

Sl:下载python-m空格下载en时出现证书_验证_失败错误

我已经使用conda install-c conda-forge spacy在Anaconda提示中下载了Spacy。但是,当我尝试使用python-m空格下载en_core_we_sm时,我收到了ssl:证书_验证_失败错误。 推荐答案 使用HTTPS,尝试从远程主机下载内容时,在某些情况下会产生SSLConnection错误,例如,如果您的计算机位于不允许您自由建立SSLConne ..
发布时间:2022-05-15 16:53:43 其他开发