apriori相关内容
..
今天一个关于充满数据挖掘先验算法的for循环的问题.我正在研究先验算法中的结果分析,但是,正如您已经知道的那样,算法的两个主要参数(置信度和支持度)是之前设置的,但不知道结果.这意味着有时您必须尝试不同的参数组合才能达到令人满意的结果.我决定尝试在 R 中设置一个 for 循环,我打算达到这种类型的结果: vector s cx1 y1 z1x2 y1 z2x3 y1 z3x4 y2 z1x5
..
数据库: 交易#项目列表T1黄油T1果酱T2黄油T3面包T3冰淇淋T4黄油T4果酱 在上表中,mysql 语句中是否可以运行先验关联规则? 比如buys(T,butter)-->buys(T, jam)=50%的支持 因为有 4 个事务并且 T1、T4 满足“支持"规则. 我可以只用一个sql语句来找出这样的结果吗? 解决方案 是的,您可以使用 SQL 查找单个项目的
..
所以我有这张桌子: Trans_ID名称Fuzzy_Value Total_Item100 I1 0.33333333 3100 I2 0.33333333 3100 I5 0.33333333 3200 I2 0.5 2200 I5 0.5 2300 I2 0.5 2300 I3 0.5 2400 I1 0.33333333 3400 I2 0.33333333 3400 I4 0.3333
..
我正在尝试实现apriori算法.在最后的步骤之一中,我从产品列表中生成了两个元组数组. >>> arr1 = array([(2421,), (35682,), (30690,), ..., (18622,), (18285,), (31269,)], dtype=object) >>> arr2 = array([(2421, 35682), (2421, 30690), (242
..
请问我的英语水平, ,我想识别出一组数据中经常出现的属性,以便使用python的apyori软件包得出分类。我在20772个交易的数据帧上进行练习,最大交易是543个项目。 DataFrame 我将此DataFrame转换为列表: liste = df.astype(str).values.tolist() 我有此列表 列表 我使用了a
..
我有一个数据集(CSV文件),可以使用Apriori算法查找频繁的项目集。 col1,col2,col3 面包,黄油,? 可乐,面包和黄油 我正在为此目的使用WEKA。输出采用以下格式: ... 大型项目集L(2): col1 =面包col2 =黄油1 col1 =可乐col2 =面包1 col1 =可乐col3 =黄油1 col2 =面包co
..
当给出支持和置信度的百分比值时,如何在Apriori算法中找到最小支持。例如,当给定的支持和信心分别为60%和60%时,最低支持是多少? 解决方案 置信度是衡量规则有趣程度的度量。 最小支持和最小置信度由用户设置,并且是关联规则生成的Apriori算法的参数。这些参数用于排除结果中支持或置信度分别低于最小支持和最小置信度的规则。 因此,当您回答问题时,说:“例如,当支持和信心分
..
所以我有此表: Trans_ID名称Fuzzy_Value Total_Item 100 I1 0.33333333 3 100 I2 0.33333333 3 100 I5 0.33333333 3 200 I2 0.5 2 200 I5 0.5 2 300 I2 0.5 2 300 I3 0.5 2 400 I1 0.33333333 3 400 I
..
我有一个格式为 data.frame 的数据,我想将其转换为 transactions 或 itemMatrix 。 arules 中的Inspects功能支持这两种数据格式这就是为什么我问这个问题 解决方案 library(arules) 示例1:根据矩阵创建交易 a_matrix
..
我正在使用 apriori 函数进行数据挖掘。此函数仅适用于分类数据,没有值,只有文本。我的数据集满足了这些要求,因为我有五个类别变量,没有数字值,只有文本(因此变量“性别”分为“女性”和“男性”) 如果现在尝试使用 apriori()函数,则会出现以下错误: apriori(数据) asMethod(object)中的错误: 列1、2、3、4、5不符合逻
..
我正在使用Apriori算法来识别客户的常用商品集.基于已标识的常用商品集,我想在客户将新商品添加到购物清单时向客户提示建议商品,作为常用商品集,我得到的结果如下; [1],[3],[2],[5] [2.3],[3,5],[1,3],[2,5] [2,3,5] 我的问题是,如果我仅考虑设置[2,3,5]来向客户提出建议,那我错了吗?例如,如果客户将项目3添加到他的购物清单中,我会推荐项目
..
使用arules包,"apriori"返回一个"rules"对象. 我们如何进行查询-规则{lhs,rhs}中的项目是从哪一列来的? 示例: 我在文件"input.csv"中以表格形式存储了一些数据,并希望将返回的规则项集与文件中的列标题关联/解释.我该怎么办? 任何指针都值得赞赏. 谢谢, 可复制的示例: input.csv ABC,DEF,GHI,JKL,
..
我发现使用arule软件包有些棘手.我正在使用apriori算法查找关联规则;与arules文档中的示例类似. data("AdultUCI") dim(AdultUCI) AdultUCI[1:2,] #Ignore everything from here to the last two lines, this is just data preparation ## remove a
..
我想挖掘特定的rhs规则.文档中有一个示例说明了这是可能的,但仅适用于特定情况(如下所示).首先是一个数据集来说明我的问题: input
..
我正在处理一些大型交易数据.我一直在使用read.transactions和apriori(arules包的一部分)来进行频繁的项目配对. 我的问题是:生成规则时(使用"inspect()"),我可以在R控制台中轻松查看它们.现在,我将结果手动复制到文本文件中,然后在excel中保存并打开.我只想使用write.csv或类似的方法保存生成的规则,但是当我尝试执行此操作时,我收到一个错误,指出
..
在apriori函数中,我希望结果仅在LHS HouseOwnerFlag=0和HouseOwnerFlag=1中包含这两个变量. RHS仅应包含列Product中的属性.例如: # lhs rhs support confidence lift # 1 {Hou
..
我当前正在使用 R for Windows 版本3.5.3和 RStudio 1.2.1335版本。 我的目标是使用 RWeka 包导入ARFF 数据集,以便进行一些关联分析,更具体地说,是应用Apriori算法。 我想分析R中的数据集(.ARFF),由于方便,我使用RWeka软件包,因为我的目标是应用Apriori算法(该程序包中可用的关联程序之一)。 该程序包需要一些依赖项(
..
我之前几次听说过Apriori算法,但没有时间或机会深入研究它,有人能以简单的方式向我解释该算法的工作原理吗?另外,一个基本的示例会使我更容易理解。 解决方案 嗯,我认为您已经阅读了Wikipedia条目,但您说过“一个基本示例将使我更容易理解”。 Wikipedia就是这样,所以我假设您尚未阅读并建议您阅读。 阅读维基百科文章。
..
我正在使用Apriori算法和FPA执行顺序规则挖掘,我在excel中具有数据集,如下所示,我想知道,如何使用下面的read_excel命令将数据加载到pandas数据框中?数据包含项目之间的--->,并位于单个列中,如下所示. 我应该如何加载和执行模式挖掘. 解决方案 message是字符串类型,elif "what is" in message:的语法似乎正确. 您检查缩进是否正
..