hclust相关内容
我正在对一个定制的模拟相似性矩阵应用一个简单的聚类过程。(https://github.com/ewouddt/Files/blob/master/sim_col.RData) 但是,我注意到在使用平均链接时hclust和agnes过程之间的差异(注意:我也观察到了完整链接的相同行为) load("sim_col.RData") # A 606 x 606 similarity mat
..
有没有人找到解决 R 3 中明显错误的解决方法,该错误禁止更改聚类树状图上的标签大小? 以下代码在将 R 更新到 3.01 之前可以正常工作(我认为之前的版本是 2.15): plot(hclust, 标签 = data[, 1], cex = 0.3) 现在更改 cex 参数时标签大小没有变化. 解决方案 您可以在调用 之前使用 par() 函数设置 cex 参数情节().例如
..
我有一个包含近 2000 个样本的 hclust 树.我已将其切割为适当数量的集群,并希望绘制树状图,但以我切割集群的高度结束,而不是一直到每片叶子.每个绘图指南都是关于按簇为所有叶子着色或绘制一个框,但似乎没有什么能让切割线下方的叶子完全消失. 我的完整树状图如下所示: 我想绘制它,好像它停在我在这里绘制 abline 的地方(例如): 解决方案 这应该会让你开始.我建议阅读
..
我有一个距离/差异矩阵(3万行30K列),该矩阵是循环计算并存储在ROM中的. 我想对矩阵进行聚类.我将其导入并聚类如下: Mydata
..
我想为几个数据框调用NbClust()函数.我这样做是通过包含NbClust()函数调用的for循环“全部"发送它们. 代码如下: #combos of just all columns from df variations = unlist(lapply(seq_along(df), function(x) combn(df, x, simplify=FALSE)), recursive=
..
在Matlab中,您可以指定要绘制的树状图中的节点数,作为dendrogram函数的一部分:dendrogram(tree,P)生成不超过P个叶节点的树状图. 我对R中的heatmap2进行相同操作的尝试失败了.建议给stackoverflow和biostar的帖子使用cutree,但heatmap2会被帖子对Rowv选项的建议所困扰.这里的"TAD"是8列乘831行的数据矩阵. #
..
我知道我可以按照以下方式绘制树状图 库(群集) d
..
我想将R的树状图输出到数据表中,以便随后将其导入另一个(“自制”)软件。 str(unclass(fit))提供了树状图的文本概述,但我要查找的实际上是一个数字表。我已经看过Bioconductor ctc软件包,但是它产生的输出看起来有些神秘。我想要类似此表的内容: http://stn.spotfire.com/ spotfire_client_help / heat / heat_impor
..
我尝试通过以下方式将聚类方法构造为函数: mydata
..
我是R的新手。我正在尝试对大约5万个项目运行hclust()。我有10列要比较和5万行数据。当我尝试分配距离矩阵时,得到:“无法分配5GB的向量”。 对此是否有大小限制?如果是这样,我该如何做一些大型的事情呢? EDIT 我最终增加了最大限制,并将机器的内存增加到8GB,这似乎已经解决了。 解决方案 经典分层聚类方法是在运行时 O(n ^ 3)和在内存中 O(n ^ 2)
..
我有20个列的90个观测值(行)的数据集.我已经生成了一个非常简洁的热图,该热图将我的数据与软件包pheatmap分为两组.尽管它不是很干净,但根据我的条件,两个树状图簇将我的样本分成了两个不同的组.现在,我想将这90个集合减少为20-30个观测的更严格的集合,但仍然希望保留与pheatmap中所示相同的聚类顺序.有没有办法做到这一点?还是任何其他将我的观察结果减少到最小集的软件包,现在仍然可以通
..
我正在使用常规方法来执行“分层聚类"项目. mydata.dtm
..
有人发现R 3中明显的错误的变通办法,该错误禁止更改簇树状图上的标签大小吗? 以下代码在将R更新到3.01之前可以正常工作(我认为以前的版本是2.15): plot(hclust, labels = data[, 1], cex = 0.3) 现在,更改cex参数时,标签大小没有变化. 解决方案 在调用plot()之前,可以使用par()函数设置cex参数.例如: #
..