pos-tagger相关内容
当文本由空格标记时,会根据上下文为竖条分配不同的POS标记,例如&Quot;ADV&Quot;、&Quot;Del&Quot;...而我希望";|";被识别为&puc";。是否有办法强制";|";使用此POS? 我尝试了此命令,但它不起作用。 nlp.tokenizer.add_special_case('|', [{ORTH: '|', POS
..
我有一个要使用Spacy或nltk或任何NLP库提取句子的主要有意义部分的用例。 例句1:“我怎样才能高声反对骚扰” 意图是:“大声反对骚扰” 例句2:“唐老鸭是由哪个漫画家/哪个人/谁创作的?” 意图为:“唐老鸭创建者” 例句3:“如何使用spacy或nltk检索句子的主要意图”? 意图:“使用空格nltk检索句子的主要意图” 我是依赖项解析的新手,不知道如何做这件事。请
..
可以去掉句子中的标签吗?你可以通过扫描文件并找到标签并删除它们来实现这一点,但由于标签很多(一些型号有30+,一些型号大约有48-50,它们基本上遵循penn treebank pos tags),有没有一种快速而甜蜜的方法来更有效地删除标签? 我确实检查了API,但没有这样的方法来移除标签。 推荐答案 没有为此专门构建的内容,但由于输出既包括单词又包括其标记,我不确定为什么需要再次扫
..
我在Python中使用‘nltk’进行位置标记,下面的代码在我打印它时工作得非常好。 import nltk import pos_tag import nltk.tokenize import numpy f = open(r'C:Userssample_data.txt') data = f.readlines() #Parse the text file for NER wit
..
我正在尝试使用 StanfordNERTagger 和 nltk 从一段文本中提取关键字. " docText="John Donk 为 POI 工作.Brian Jones 希望与 Xyz Corp. 会面,以衡量 POI 的短期绩效指标.words = re.split("\W+",docText)stop = set(stopwords.words("english"))#从列表中删除停
..
我想对一个英文句子进行 POSTag 并做一些处理.我想使用 openNLP.我已经安装了 当我执行命令时 I:\Workshop\Programming\nlp\opennlp-tools-1.5.0-bin\opennlp-tools-1.5.0>java -jar opennlp-tools-1.5.0.jar POSTagger 模型\en-pos-maxent.bin
..
我有以下两个带有 POS 标签的字符串: Sent1:“像专业作家或用语的工作方式这样的东西真的很酷." [('something', 'NN'), ('like', 'IN'), ('how', 'WRB'), ('writer','NN'), ('pro', 'NN'), ('or', 'CC'), ('phraseology', 'NN'), ('works','NNS'), (
..
我正在使用 nltk 通过首先删除给定的停用词从句子生成 n-gram.但是,nltk.pos_tag() 在我的 CPU (Intel i7) 上运行速度非常慢,最多需要 0.6 秒. 输出: ['第一次去,完全被现场爵士乐队和气氛所吸引,我点了龙虾科布沙拉.']0.620481014252[“这简直是纽约最好的一餐."]0.640982151031['在红眼烧烤店你不会出错.']0.6
..
请问R包openNLP中是否可以提取名词+名词或(adj|noun)+名词?也就是说,我想使用语言过滤来提取候选名词短语.你能指导我怎么做吗?非常感谢. 感谢您的回复.这是代码: library("openNLP")acq
..
我刚刚开始使用词性标注器,我面临着很多问题. 我开始使用以下 POS 标记: import nltktext=nltk.word_tokenize("我们要出去了.只有你和我.") 当我想打印 'text' 时,会发生以下情况: print nltk.pos_tag(text)回溯(最近一次调用最后一次):文件“",第 1 行,在 中文件“F:\Pyth
..
有谁知道如何解决 TreeTagger 中的这个文件读取错误,TreeTagger 是一种常用的自然语言处理工具,用于 POS 标记、词形还原和块句子? alvas@ikoma:~/treetagger$ echo 'Hello world!'|cmd/tree-tagger-english读取参数...错误:无法打开阅读:/home/alvas/treetagger/lib/english.p
..
有这个: text = word_tokenize("敏捷的棕色狐狸跳过懒狗") 并运行: nltk.pos_tag(text) 我明白了: [('The', 'DT'), ('quick', 'NN'), ('brown', 'NN'), ('fox', 'NN'), ('跳转', 'NNS'), ('over', 'IN'), ('the', 'DT'), ('lazy', 'NN'
..
嗨文本挖掘冠军, 我在 Windows 10 上使用带有 NLTK v3.2 的 Anaconda.(客户端环境) 当我尝试 POS 标记时,我不断收到 URLLIB2 错误: URLError: urllib2 似乎无法识别 windows 路径?我该如何解决这个问题? 命令很简单: nltk.pos_tag(nltk.word_tokenize("Hello Wo
..
我需要找到网站中给出的某些评论的意见.我为此使用了sentiwordnet.我首先将包含所有评论的文件发送到 POS Tagger. tokens=nltk.word_tokenize(line) #tokenization for line in filetagged=nltk.pos_tag(tokens) #用于POSTagging打印标记 除了将其视为 2 个单独的单词外,是否还有其他
..
我有一些单词列表,例如惊人的、有趣的、爱的、很棒的、不错的.我想检查单词是形容词还是动词,例如“love"是动词而 nice 是形容词...如何使用 python 或 nltk 进行操作,有帮助吗? 解决方案 在没有任何上下文的情况下猜测一个词是什么的唯一方法是使用 WordNet,但它不会是 100% 可靠的,因为例如“爱"在一个句子中可以有不同的作用. from nltk.corpu
..
中token.tag_的官方文档spaCy 如下: 一个细粒度、更详细的标签,代表词类和标记的一些基本形态信息.这些标签主要被设计为后续模型的良好特性,尤其是句法解析器.它们依赖于语言和树库.标记器经过训练来预测这些细粒度的标签,然后使用映射表将它们缩减为粗粒度的 .pos 标签. 但它没有列出完整的可用标签和每个标签的解释.我在哪里可以找到它? 解决方案 最后我在 spaCy
..
我是自然语言处理的初学者,我有一个关于计算POS Tagger(tagger使用语料库)的准确性的基本问题: (不要将下面的"set"一词与set的数学定义混淆.我只是将它用作普通的英语单词来传达一些"group"或"mapping") 有不同的准确性指标,例如“精确度/召回率"和“混淆矩阵".这两个都需要以下两点作为输入参数: 1. :预测结果集:POS Tagger在输入上运行后
..
有同样的问题!我得到 InputSteram = null ,我使用了IntelliJ IDEA,OpenNLP 1.9.1.在Ubuntu 18.04上 public void makeDataTrainingModel() { model = null; System.out.println("POS model started"); //InputStr
..
Stanford NLP postagger要求将命令性动词添加到最新版本中.我输入了很多带有丰富而又明显的命令的文本,但是在输出中似乎没有标签.毕竟必须为此训练一个吗? 解决方案 对于命令式来说,没有特殊的标记,它们被简单地标记为VB. 网站上的信息指的是我们在训练数据中添加了一堆手动注释的命令式句子的事实,这样POS标记器便可以正确地使用它们,即将动词标记为VB.
..
使用Stanford NPL .NET的POS Tagger,我试图提取每个句子的部分语音标签的详细列表. 例如:“去那儿看看.看看车!" 具有/VB a/DT外观/NN over/IN那里/RB ./.在/DT车/NN处/中查看/VB !/. 我需要: POS文本:“具有" POS标签:"VB" 原始文本中的位置 我设法通过反射访问结果的私有字段来实现这一点.
..