text-mining相关内容

解析 GATE 文档以获取共同参考文本

我正在创建一个用于查找共同引用文本的 GATE 应用程序.它工作正常,我已经通过 GATE 中提供的导出选项创建了应用程序的压缩文件. 现在我正在尝试在我的 Java 代码中使用相同的内容. Gate.runInSandbox(true);Gate.setGateHome(新文件(gateHome));Gate.setPluginsHome(new File(gateHome, "plu ..
发布时间:2021-11-10 22:50:04 Java开发

使用 XSLT 从 XML 文档中提取文本内容

如何最好使用 XSLT 提取 XML 文档的文本内容. 对于这样的片段, 文本内容文本内容文本内容 想要的结果是: 文字内容,文字内容,文字内容 输出(表格、CSV 等)的最佳格式是什么,其中内容可用于进一步操作,例如文本挖掘? 谢谢 更新 扩展问题,如何分别提取每条记录 ..
发布时间:2021-09-06 19:44:16 其他开发

如何在 R-3.3.0 中安装包 tm

我使用的是 R-3.3.3.我尝试使用以下命令安装包 tm install.packages('tm',dependencies = TRUE)图书馆('tm') 但是我收到错误消息 loadNamespace 中的错误(j 我在此处看到了针对相同类型错误的两种解决方案;安装TM包时依赖'slam'不可用.我试过这两个,但我收到像 这样的错误信息 安装失败:找不到构建 slam 所 ..
发布时间:2021-09-06 19:44:04 其他开发

删除R中的停用词

我有一个具有这种结构的数据框: Note.Reco 评论 Review.clean.lower10 好产品 好产品9 好片好片………… 第一列是电影的排名,第二列是客户的评论,第三列是小写字母的评论. 我现在尝试删除停用词: Data_clean$Raison.Reco.clean1 ..
发布时间:2021-09-06 19:43:53 其他开发

R文本挖掘:使用tm包中的stemDocuments对相似词进行分组

我正在对大约 30000 条推文进行文本挖掘,现在的问题是让结果更可靠,我想将“同义词"转换为类似的词,例如.一些用户使用单词“girl",一些用户使用“girls",一些用户使用“gal".同样,“给予"、“给予"仅表示一件事."come,"came" 也一样.一些用户使用简写形式,如 "plz","pls" 等.此外,来自 tm 包的“stemdocument"无法正常工作.它正在将舞蹈转换为 ..
发布时间:2021-09-06 19:43:41 其他开发

为数据帧的每一行提取情绪计算

我有一个带有文本行的数据框.我想为每一行文本提取一个特定情绪的向量,该向量将是一个二进制 0 不存在此情绪或存在 1. 总共有 5 种情绪,但我只想将 1 用于似乎是最多的情感. 我尝试过的示例: library(tidytext)text = data.frame(id = c(11,12,13)​​, text=c("bad movie","good movie","我认为宗教人士看 ..
发布时间:2021-09-06 19:43:38 其他开发

使用 Python 和 Pandas 进行文本挖掘

这可能是重复的,但我没有找到它... 我正在使用 Pandas 在 Python 中进行一些文本挖掘.我在 DataFrame 中有单词,旁边有 Porter 和其他一些统计数据.这意味着可以在此 DataFrame 中找到具有完全相同 Porter 词干的相似词.我想将这些相似的词汇总到一个新列中,然后删除与 Porter 词干相关的重复词. 将pandas导入为pdpda = pd.D ..
发布时间:2021-09-06 19:43:35 Python

将段落分解为 R 中的句子向量

我有以下段落: 嗯,嗯……这是一个私人话题.难怪我是第一个写评论的.可以说这些东西完全符合他们的要求并且味道很好.我在这方面遇到了主要问题,现在我没有.'纳夫说.:-) 为了应用 RSentiment 包中的 calculate_total_presence_sentiment 命令,我想将此段落分解成一个句子向量,如下所示: [1] “嗯,嗯……这是一个很私人的话题."[2] “难 ..
发布时间:2021-09-06 19:43:32 其他开发

使用 R 进行文本挖掘

我需要使用 R 进行文本挖掘的帮助 标题日期内容男孩 2015 年 5 月 13 日 “她很漂亮",汤姆说.汤姆很帅.动物 2015 年 6 月 14 日 企鹅很可爱,狮子补充道.Human March 09 2015 Koh 先生预测每个人都是聪明的...Monster Jan 22 2015 学生 May 女士说,John 有 10.80 美元.五月爱你. 我只想从人们所说的中获得意见. ..
发布时间:2021-09-06 19:43:22 其他开发