sentiment-analysis相关内容

使用senti_classifier和NLTK的情感分析

我没有做正确的事-从错误的外观来看,我得到的是我认为我丢失了一些数据.我已安装了sentiment_classifier( https://pypi.python.org/pypi/sentiment_classifier的所有先决条件/0.7 )是nltk,numpy和sentiwordnet.这是我的代码-我正在尝试工作的文档中的一个简单示例. from senti_classifier ..
发布时间:2020-05-18 01:15:57 Python

NLTK和停用词失败#lookuperror

我正在尝试启动一个情绪分析项目,我将使用停用词方法.我进行了一些研究,发现nltk有停用词,但是当我执行命令时会出现错误. 下面是我的操作,以便了解nltk所使用的单词(例如,您可能在此处找到的内容 http://www.nltk.org/book/ch02.html 在第4.1节中): from nltk.corpus import stopwords stopwords.words ..
发布时间:2020-05-18 01:13:35 Python

NLP-垃圾数据的情感处理需要时间

我正在尝试查找输入文本的情感.此测试是一个垃圾句子,当我尝试查找“情感"时,解析该句子的注释大约需要30秒.对于普通文本,它需要不到一秒钟的时间.如果我需要处理大约数百万个数据,它将增加处理时间.任何解决方案. String text = "Nm n n 4 n n bkj nun4hmnun Onn njnb hm5bn nm55m nbbh n mnrrnut but n rym4n n ..
发布时间:2020-05-18 01:07:01 其他开发

文本分析规则集-自然语言处理

是否存在包含用于文本分析/自然语言处理的规则的指南? 您是否有一些专门开发的软件包(例如,在Python中)用于文本情感分析? 这是我遇到的应用程序: 假设我有两个字典,A和B.A包含“负"字,B包含“正"字.我可以做的是 count 负数和正数. 这产生了一些问题,例如以下内容:假设"exceptionally"是一个positive单词,而"serious"是一个neg ..
发布时间:2020-05-18 01:06:52 其他开发

文本分析-无法在csv或xls文件中写入Python程序的输出

嗨,我正在尝试使用python 2.x中的朴素贝叶斯分类器进行情感分析.它使用txt文件读取情感,然后根据示例txt文件情感给出正或负输出. 我想要输出与输入相同的形式,例如我有一个让let坐着1000个原始情感的文本文件,并且我希望输出对每个情感都显示正面还是负面. 请帮忙. 下面是我正在使用的代码 import math import string def Naive_Bayes_Cl ..
发布时间:2020-05-18 01:05:36 Python

如何识别形容词或副词?

我是NLP的新手....是否有任何API或方法可以从句子中识别动词,形容词或副词? 我在项目中需要它吗? 解决方案 您将需要 Part-语音Tagger (POSTagger).这确定了句子中每个单词的作用. Wikipedia拥有NLP工具包的优秀列表,并且它们几乎都具有POSTaggers. 如果您的材料是普通的书面英语,那么POSTaggers会做的很好.如果口语性很强(例如在 ..
发布时间:2020-05-18 00:59:23 其他开发

使用斯坦福大学自然语言处理提取名词短语

我正在尝试使用Stanford NLP从一个句子中找到主题/名词短语 例如:我很想得到的句子“白虎" 主题/周围的短语为:白虎. 为此,我使用了pos标记器.我的示例代码如下. 我得到的结果是“老虎",这是不正确的.我以前运行的示例代码是 public static void main(String[] args) throws IOException { ..
发布时间:2020-05-18 00:58:23 其他开发

如何为一个句子计算极性? (在情绪分析中)

如何计算语句中单词的极性....就像 “我成功地完成了任务,但徒劳无功" 每个单词如何评分? (例如-成功-0.7完成-0.8但--0.5 徒劳的--0.8) 如何计算?每个单词如何得到一个值或分数?发生了什么事?在进行情感分析时,我几乎没有什么要弄清楚的.如果有人事先提供帮助,那就太好了 解决方案 单个单词的分数可以来自预定义的单词列表,例如ANEW,一般询问者,SentiW ..
发布时间:2020-05-18 00:57:12 其他开发

在线对话文本大集合的情感分析

标题说明了一切;我有一个SQL数据库,上面有在线对话文本.我已经在Python中完成了该项目的大部分工作,因此我想使用Python的NLTK库进行此操作(除非有 strong 理由不这样做). 数据由主题,用户名和发布组织.每个线程或多或少都专注于讨论我有兴趣分析的类别的一个“产品".最终,当完成此操作后,我希望获得每个用户对他们在某个时候讨论过的任何产品的估计意见(喜欢/不喜欢这种交易). ..
发布时间:2020-05-18 00:46:58 Python

如何在Python NLTK中计算Vader的“化合物"极性分数?

我正在使用Vader SentimentAnalyzer来获取极性分数.之前,我使用概率分数来表示正/负/中性,但我刚刚意识到“复合"分数范围从-1(最大负数)到1(最大正数)将提供极性的单个度量.我想知道“化合物"分数是如何计算的.是从[pos,neu,neg]向量计算得出的吗? 解决方案 VADER算法将情感分数输出到4类情感https://github.com/nltk/nltk/b ..
发布时间:2020-05-18 00:45:39 Python

关于情感分析的自然语言处理工具列表-您推荐哪一种

对不起,我英语不太好...我来自德国;) 因此,对于我的研究项目(学士学位论文),我需要分析关于某些公司和品牌的推文.为此,我将需要编写自己的程序脚本/使用某种经过修改的开放源代码(没有API'-我需要了解正在发生的事情). 在下面,您会找到我发现的一些NLP应用程序的列表.我的问题现在是您推荐哪种方法?哪一个不需要花很长时间调整代码? 例如:当我为音乐播放器> iPod ..
发布时间:2020-05-18 00:44:41 其他开发

情感分析-WordNet,sentiWordNet词典

我需要一个正词和负词的列表,并根据其强度和周度为它们分配权重.我有: 1.)WordNet-每个单词给出+或-分数. 2.)SentiWordNet-给出[0,1]范围内的正值和负值. 我用几句话检查了这些, 爱-wordNet为名词和动词都给出0.0,我不知道为什么我认为它至少在某些方面应该是正的. 压制-WordNet给出-9.93 -SentiWordNet给 ..
发布时间:2020-05-18 00:40:57 其他开发

使用命名实体训练模型

我正在使用命名实体识别器来查看standford corenlp.我有不同种类的输入文本,需要将其标记到自己的实体中.因此,我开始训练自己的模型,但似乎无法正常工作. 例如:我的输入文本字符串是“有关丰田陆地巡洋舰1956-1987年黄金投资组合的49条杂志文章的书, http://t.co/EqxmY1VmLg http://t.co/F0Vefuoj9Q " 我将通过示例来训练自己 ..

文本分类的特征选择和归约

我目前正在研究一个项目,一个简单的情感分析器,这样在单独的情况下将有 2和3个班级.我使用的语料库以唯一词(大约200.000)的方式非常丰富.我使用词袋方法进行功能选择,并减少了独特功能的数量,由于 出现频率的>阈值. 最终功能集包括大约20.000个功能,实际上减少了 90%,但对于预期的准确性,不足 强大的测试预测.我依次使用 LibSVM 和 SVM-light 进行训练和预测( line ..
发布时间:2020-05-18 00:35:47 其他开发

情感分析的最佳算法

我的要求是接受新闻报道,并确定它们对某个主题是正面还是负面.我采用的是下面概述的方法,但我继续阅读NLP可能在这里有用.我所读的所有内容都指向NLP从事实中发现意见,我认为这对我来说并没有多大意义.我想知道两件事: 1)为什么我的算法不起作用和/或如何改进它? (我知道讽刺可能是一个陷阱,但我再也看不到这种情况会在我们得到的新闻类型中太多发生) 2)NLP将如何提供帮助,为什么我应该使 ..
发布时间:2020-05-18 00:31:15 其他开发

nltk NaiveBayesClassifier情绪分析培训

我正在用句子训练Python中的NaiveBayesClassifier,它给了我下面的错误.我不明白错误可能是什么,任何帮助都将是很好的. 我尝试了许多其他输入格式,但错误仍然存​​在.下面给出的代码: from text.classifiers import NaiveBayesClassifier from text.blob import TextBlob train = [( ..
发布时间:2020-05-18 00:28:13 Python