sentiment-analysis相关内容

如何将情感分析脚本与聊天机器人集成在一起,在同一控制台屏幕上分析用户的回复?

我想做一个聊天机器人,它使用情绪分析器脚本来了解用户回复的情绪,我已经完成了聊天机器人的制作。 现在我唯一想做的就是使用这个脚本来分析用户使用我制作的聊天机器人的回复。 我应该如何将此sentiment_analysis.py脚本与chat bot.py文件集成以分析用户的情绪? 更新: 整体表现如下: 聊天机器人:今天过得怎么样? 用户:这是令人惊叹的一天。今天我感到非常振奋和 ..

用于情绪分析的好数据集?

我正在进行情绪分析,我正在使用此链接中给出的数据集:http://www.cs.jhu.edu/~mdredze/datasets/sentiment/index2.html 我已将我的数据集划分为 50:50 的比例.50%作为测试样本,50%作为训练样本,从训练样本中提取特征并使用Weka分类器进行分类,但我的预测准确率在70-75%左右. 任何人都可以建议一些其他数据集来帮助我提高结果 ..
发布时间:2022-01-21 13:05:02 其他开发

情感分析 - wordNet , sentiWordNet 词典

我需要一个正面和负面词的列表,并根据词的强度和周数为词分配权重.我有: 1.) WordNet - 它为每个单词提供 + 或 - 分数. 2.) SentiWordNet - 给出 [0,1] 范围内的正值和负值. 我检查了几个字, love - wordNet 对名词和动词都给出了 0.0,我不知道为什么我认为它至少在某些因素上应该是积极的. 压制 - wordNe ..
发布时间:2022-01-02 17:58:36 其他开发

如何在 Python NLTK 中计算 Vader“复合"极性分数?

我正在使用 Vader SentimentAnalyzer 来获取极性分数.我之前使用了正/负/中性的概率分数,但我刚刚意识到“复合"分数,范围从 -1(最负)到 1(最正)将提供单一的极性度量.我想知道“复合"分数是如何计算的.这是根据 [pos, neu, neg] 向量计算的吗? 解决方案 VADER 算法将情感分数输出到 4 类情感 https://github.com/nltk/ ..
发布时间:2022-01-02 17:41:24 Python

用于情感分析的训练数据

我可以从哪里获得在企业领域中已被归类为正面/负面情绪的文档语料库?我想要大量为公司提供评论的文档,例如分析师和媒体提供的公司评论. 我发现有产品和电影评论的语料库.是否有业务领域的语料库,包括与业务语言相匹配的公司评论? 解决方案 http://www.cs.cornell.edu/home/llee/data/ http://mpqa.cs.pitt.edu/corpora/ ..

情绪分析的最佳算法方法

我的要求是接收新闻文章并确定它们对某个主题是正面还是负面.我正在采用下面概述的方法,但我一直在阅读 NLP 可能在这里有用.我所读到的所有内容都指向 NLP 从事实中检测意见,我认为这对我来说并不重要.我想知道两件事: 1) 为什么我的算法不起作用和/或我该如何改进它?(我知道讽刺可能是一个陷阱,但我再次认为在我们将获得的新闻类型中不会发生太多) 2) NLP 有什么帮助,我为什么要使 ..
发布时间:2022-01-02 17:23:04 其他开发

文本分类的特征选择和减少

我目前正在做一个项目,一个简单的情绪分析器,这样在单独的案例中会有2和3个类.我使用的语料库在独特的词(大约 200.000)方面非常丰富.我使用词袋方法进行特征选择并减少独特特征的数量,由于消除发生频率的>阈值.最终的一组特征包括大约 20.000 个特征,这实际上减少了 90%,但不足以达到预期的准确性测试预测的强>.我依次使用 LibSVM 和 SVM-light 进行训练和预测(线性 和 ..
发布时间:2022-01-02 17:22:29 Python

如何训练斯坦福 NLP 情绪分析工具

见鬼去吧!我正在使用斯坦福核心 NLP 包,我的目标是对推文直播进行情感分析. 按原样使用情绪分析工具会返回对文本“态度"的非常糟糕的分析......许多正面被标记为中性,许多负面被评为正面.我已经在一个文本文件中获得了超过一百万条推文,但我不知道如何实际训练该工具并创建我自己的模型. 链接到斯坦福情绪分析页面 “可以使用以下命令使用 PTB 格式数据集重新训练模型:" jav ..
发布时间:2022-01-02 17:16:22 Java开发

用于情感分析的 nltk NaiveBayesClassifier 训练

我正在使用句子在 Python 中训练 NaiveBayesClassifier,它给了我以下错误.我不明白错误可能是什么,任何帮助都会很好. 我尝试了许多其他输入格式,但错误仍然存​​在.下面给出的代码: from text.classifiers import NaiveBayesClassifier从 text.blob 导入 TextBlobtrain = [('我喜欢这个三明治. ..
发布时间:2022-01-02 17:12:56 Python

在 NLTK/Python 中使用电影评论语料库进行分类

我希望按照 NLTK 第 6 章的思路进行一些分类.这本书似乎跳过了创建类别的步骤,我不确定我做错了什么.我的脚本在这里,响应如下.我的问题主要源于第一部分——基于目录名称的类别创建.这里的其他一些问题使用了文件名(即 pos_1.txt 和 neg_1.txt),但我更喜欢创建可以将文件转储到的目录. from nltk.corpus import movie_reviews评论 = Cate ..
发布时间:2022-01-02 17:12:28 Python

如何使用 SentiWordNet

我需要对一些包含推文的 csv 文件进行情感分析.我正在使用 SentiWordNet 进行情绪分析. 我得到了他们在其网站上提供的以下示例 Java 代码.我不确定如何使用它.我要分析的 csv 文件的路径是 C:\Users\MyName\Desktop\tweets.csv .SentiWordNet_3.0.0.txt的路径为C:\Users\MyName\Desktop\Senti ..
发布时间:2021-12-25 20:22:46 Java开发

无监督情感分析

我已经阅读了很多文章,这些文章解释了在情感分析系统真正起作用之前需要将一组初始文本分为“正面"或“负面"的必要性. 我的问题是:有没有人尝试过对“积极"形容词与“消极"形容词进行初步检查,并考虑到任何简单的否定词以避免将“不快乐"归类为积极?如果是这样,是否有任何文章讨论为什么这种策略不现实? 解决方案 经典论文作者:Peter Turney (2002) 解释了一种仅使用单词 ex ..
发布时间:2021-12-14 09:47:59 AI人工智能

用 Python 对 Twitter 进行情感分析

我正在寻找文本情感分析(http://en.wikipedia.org/wiki/Sentiment_analysis).有人熟悉我可以使用的这种开源实现吗? 我正在编写一个应用程序,可以在 Twitter 上搜索一些搜索词,比如“youtube",并计算“快乐"推文与“悲伤"推文的数量.我正在使用 Google 的 appengine,所以它是在 python 中的.我希望能够对从 twi ..

Spark MLLib 的问题导致概率和预测对所有事物都相同

我正在学习如何将机器学习与 Spark MLLib 结合使用,目的是对推文进行情感分析.我从这里得到了一个情绪分析数据集:http://thinknook.com/wp-content/uploads/2012/09/Sentiment-Analysis-Dataset.zip 该数据集包含 100 万条分类为正面或负面的推文.该数据集的第二列包含情绪,第四列包含推文. 这是我当前的 ..

使用python替换其值的首字母缩略词

我有这样的字典 我需要用它在字典中的值替换文本中的首字母缩略词 我使用这个代码但是当我使用 acronyms("we are gr8 andawsm") 它应该让我觉得我们很棒而且很棒 def 首字母缩略词(文本):my_dict = {}使用 open('acronym.txt') 作为 fileobj:对于 fileobj 中的行:key, value = line.split('\t')m ..
发布时间:2021-09-11 18:47:46 Python

AttributeError: 'float' 对象没有属性 'lower'

我正面临这个属性错误,我一直在纠结如何处理出现在推文中的浮点值.流推文必须小写并标记化,所以我使用了拆分功能. 有人可以帮我处理它吗,任何解决方法或解决方案..? 这是我刚开始的错误.... AttributeError Traceback(最近一次调用最后一次)在 ()1 stop_words = []- ..
发布时间:2021-09-11 18:37:19 Python

requests.exceptions.ChunkedEncodingError: ('连接中断:IncompleteRead(读取 0 个字节,预计还有 512 个)',IncompleteRead

我想编写一个程序来从 Twitter 获取推文,然后进行情感分析.我编写了以下代码,即使在导入所有必要的库后也出现错误.我对数据科学比较陌生,所以请帮助我.我无法理解此错误的原因: class TwitterClient(object):def __init__(self):# 来自 Twitter Dev Console 的密钥和令牌消费者密钥 = 'XXXXXXXXX'消费者秘密 = 'XX ..

如何从 GUI 获取多个文本条目并在主 python 脚本中使用它们?

我有一个 python 文件,可以提取推文,获取它们的地理坐标和情绪,最后将这些推文/情绪绘制为地图上的彩色圆圈. 需要以下输入(文本条目)才能使其工作:每个输入提示旁边还显示了一个示例用户输入: 输入推文的最大数量:*100*您想按主题搜索吗?类型:y 或 n:*y*输入主题:*MoSalah*输入可视化/投影类型:1.墨卡托2. 正字法3. 梅洛维德>>*墨卡托*放大到一个选择的大陆 ..