spacy相关内容

用空格获取单词在句子中的位置

我知道从文档获取各种属性的基本空格工作流程,但我找不到内置函数来返回作为句子一部分的单词的位置(开始/结束)。 有没有人知道Spacy能否做到这一点? 推荐答案 这些可用作句子中标记的属性。 Doc表示: idx int父文档中令牌的字符偏移量。 I int父文档中令牌的索引。 >>> import spacy >>> nlp = spacy.load('en' ..
发布时间:2022-05-15 16:06:12 其他开发

使用英语语言中的空格进行人名检测。寻找答案

我正在使用Spacy并尝试检测文本中的姓名。例如,Text=‘Kera是一个很好的套餐。Adam Smith使用一辆黑色的汽车。我希望Katrina在她的工作中做得很好。’ 答案应该是这样的:亚当·斯密和卡特里娜飓风。 谁能推荐 推荐答案 这是一个典型的命名实体识别问题。Spacy有一个预先训练的模型来实现这一点,该模型应该能够准确地检测人名。 查看this code s ..
发布时间:2022-05-15 15:58:26 Python

PYTHON中的主体对象标识

我想识别一组句子的主语和宾语。我的实际工作是从一组审查数据中识别因果关系。 我正在使用Spacy Package来分块和解析数据。但并没有真正达到我的目标。有没有办法做到这一点? 例如: I thought it was the complete set 输出: subject object I complete set 推荐答案 以最简单的 ..
发布时间:2022-05-15 15:50:36 Python

在Spacy Ner中区分国家和城市

我正在尝试使用Spacy NER从组织地址中提取国家/地区,然而,它使用相同的标签GPE标记国家/地区和城市。有什么方法可以区分它们吗? 例如: nlp = en_core_web_sm.load() doc= nlp('Resilience Engineering Institute, Tempe, AZ, United States; Naval Postgraduate Sch ..
发布时间:2022-05-15 15:38:12 Python

用于文本分类的训练空间

阅读docs并执行tutorial后,我想我应该做一个小演示。结果我的模特不想训练。以下是代码 import spacy import random import json TRAINING_DATA = [ ["My little kitty is so special", {"KAT": True}], ["Dude, Totally, Yeah, Video Game ..
发布时间:2022-05-15 15:27:47 Python

Spacy Language Model在哪里下载?

我有一个简单的命令: python -m spacy download en_core_web 而且我永远也想不出它在哪里下载。我搜索了“en_core_web”,但在任何地方都什么也找不到。我无论如何也想不出要搜索什么才能理解这个命令背后的语法。 你把这条线叫什么?一个python命令行参数?我找不到要搜索的内容以指定下载位置。 请帮帮忙! 推荐答案 我偶然遇到 ..
发布时间:2022-05-15 15:16:11 Python

En_core_web_sm、en_core_web_md和en_core_web_lg空间模型有什么不同?

我在我的系统上安装了Spacy,我想要解析/提取英文人名、组织。但是我看到here,英语有4种模式。还有model versioning.我不知道哪种型号大,我必须选择哪种型号进行开发? 推荐答案 sm/md/lg指的是型号的大小(小、中、大)。 如您链接到的模型页面上所示 模型差异主要是统计学上的。总体而言,我们确实预计较大的型号会“更好”,总体上会更准确。归根结底,这取 ..
发布时间:2022-05-15 15:12:41 Python

将NER空间格式转换为IOB格式

我有已经以拼写格式标记的数据。例如: ("Who is Shaka Khan?", {"entities": [(7, 17, "PERSON")]}), ("I like London and Berlin.", {"entities": [(7, 13, "LOC"), (18, 24, "LOC")]}) 但我想尝试使用任何其他NER模型来训练它,例如Bert-ner,它需要IOB ..
发布时间:2022-05-15 14:59:20 其他开发

区分大小写的实体识别

我有全部以小写形式存储的关键字,例如我正在尝试对其执行实体提取的“折扣耐克鞋”。我遇到的问题是,当涉及到NER时,Spacy似乎区分大小写。请注意,我不认为这是特定于Spacy的。 当我运行... doc = nlp(u"i love nike shoes from the uk") for ent in doc.ents: print(ent.text, ent.start ..
发布时间:2022-05-15 14:30:22 Python

如何获得Spacy Ner概率

我想将Spacy的NER引擎与单独的NER引擎(弓模型)结合在一起。我目前正在比较这两个引擎的输出,试图找出这两个引擎的最佳组合。两者都执行得很好,但Spacy经常会找到弓引擎遗漏的实体,反之亦然。我想要的是每当Spacy找到弓引擎没有找到的实体时,它都可以访问一个概率分数(或类似的东西)。我可以让Spacy为它找到的给定实体打印出自己的概率分数吗?比如,“嗨,我是Spacy。我找到了这个令牌(或 ..
发布时间:2022-05-15 14:24:51 其他开发

Spacy的词性和从属关系标签意味着什么?

用词性(以两种不同的格式,一种存储在Token的pos和pos_属性中,另一种存储在tag和tag_属性中)及其.head标记(存储在dep和dep_属性中)对Token中的每个Token进行空格标记。 其中一些标签不言而喻,甚至对像我这样没有语言学背景的人也是如此: >>> import spacy >>> en_nlp = spacy.load('en') >>> document ..
发布时间:2022-05-15 14:06:55 Python

GAE/STANDARD/Second/Python上的空间超过最大实例的内存

我已经使用GAE一段时间了,没有任何问题。最近唯一的变化是,我增加了Spacy和我训练的一个模型。 当我在本地使用dev_appserver运行时,该应用程序大约消耗153MB。部署后,我收到内存超出的错误。即使使用F4_1G实例,我也会超出内存: 在总共处理0个请求后,已超过1228 MB的硬盘内存限制,其中1280 MB。考虑在app.yaml中设置更大的实例类。 如果我导入 ..
发布时间:2022-05-15 13:54:04 其他开发

如何为TextCategorizer培训创建GOLD数据?

我要使用以下(text, label)对训练TextCategorizer模型。 标签颜色: 门是棕色的。 谷仓是红色的。 花是黄色的。 标签动物: 马在奔跑。 鱼在跳跃。 鸡睡着了。 我正在复制documentation for TextCategorizer中的示例代码。 textcat = TextCategorizer(nlp.vocab) lo ..
发布时间:2022-05-15 13:45:50 其他开发