elki相关内容
我的目标是在包含许多几乎重复的点的数据集中找到离群值,并且我想使用DBSCAN的ELKI实现来完成此任务. 由于我不关心集群本身而是异常值(我认为离群值相对较远),所以我想通过在网格上聚集/合并点并使用scikit中实现的概念来加快运行时间-以
..
这两天,我一直在寻找ELKI,同时寻找最合适的密度聚类工具,并决定尝试使用它.对于DBSCAN,我成功地成功重现了对文件"3clusters-and-noise-2d.csv"进行聚类的测试,并且还设法通过来自github的ELKI代码打印了聚类元数据和每个聚类中的点(最新版本)在Java中(我对cli或ui工具并不真正感兴趣). 现在,我想使用某种内部Java结构来创建数据库,而不是通过文
..
我是ELKI的初学者,我一直在使用它来对.csv文件中的10K纬度点进行聚类.正确设置后,我想放大到1MM点. 我正在使用带有LngLatDistanceFunction的OPTICSXi算法 我一直在阅读有关“通过STR批量加载启用R *-树索引"的内容,以查看性能方面的巨大改进.这些教程对我没有多大帮助. 有关如何实现此功能的任何提示? 解决方案 在二维数据上使用空间
..
我正在尝试使用ELKI进行离群值检测;我有我的自定义距离矩阵,并且试图将其输入到ELKI中以执行LOF(例如,第一次). 我尝试遵循 http://elki.dbs.ifi.lmu. de/wiki/HowTo/PrecomputedDistances ,但对我来说不是很清楚.我的工作: 我不想从数据库加载数据,所以我使用: -dbc DBIDRangeDatabaseConne
..
我通常是R用户(刚开始的R用户,但是我开始感到困惑).但是,我听说过有关ELKI的正面信息-特别是它的速度.我碰到了这个旧帖子“如何进行分组存储在SQL中的附近的经纬度位置" ,Anony-Mousse发布的答案与我想要执行的操作类似.我希望能够将他完成的每个步骤复制到他在Google云端硬盘上共享的KML文件. 我已经下载了ELKI并能够运行如下所示的mini-GUI: 有人可以发布
..
很抱歉,您没有提出过天真的问题,但是在遵循所有可用教程的过程中,我陷入了困境. 因此,有没有一种方法可以从简单的列表填充数据库数据库,而不是通过读取文件来加载数据库数据库? 基本上我正在寻找的东西类似于: 列出对象= ... 数据库db = ClassGenericsUtil.parameterizeOrAbort(ArrayDatabase.class,params,objec
..
我正在寻找一种聚类算法,例如s DBSCAN可以处理3d数据,其中可以根据轴设置不同的epsilon.例如,在x-y平面上的epsilon为10m,在z轴上的epsilon为0.2m. 本质上,我正在寻找大型但扁平的集群. 注意:我是一名考古学家,该算法将用于查找散布在大表面但垂直的狭窄层中的物体之间的潜在相关性 解决方案 解决方案1: 缩放数据集以匹配所需的epsilo
..
我正在尝试在JAVA中使用ELKI来运行DBSCAN.为了进行测试,我使用了FileBasedDatabaseConnection.现在,我想使用自定义对象作为参数来运行DBSCAN. 我的对象具有以下结构: public class MyObject { private Long id; private Float param1; private Float param2
..
在MiniGUi中,我可以看到db.index.如何通过Java代码将其设置为tree.spatial.rstarvariants.rstar.RStartTreeFactory? 我已经实现: params.addParameter(AbstractDatabase.Parameterizer.INDEX_ID,tree.spatial.rstarvariants.rstar.RSt
..
这是来自上一个问题的后续行动,在这里我们评论说,使用带有lat,long坐标的欧几里得距离不会产生正确的结果. 我在文档中读到 ELKI启用了地理数据,即距离函数,存在于各种聚类算法中. 在ELKI的用户界面中,我可以看到有一些选项可以用更合适的替代默认距离功能(欧几里得).我还看到在那种情况下,您需要提供一个有意义的数据,因为您必须告诉ELKI数据是如何投影的. 我在UI中的选项是使用"geo.
..
我正在尝试使用我有一组需要集群的对象(我自己的类型).为此,我在聚类之前将它们转换为特征向量. 这是我目前如何运行它并产生一些结果的方法(代码在Scala中): val clusterer = new SLINK(CosineDistanceFunction.STATIC, 3) val connection = new ArrayAdapterDatabaseConnection(f
..
我正在使用ELKI来挖掘一些地理空间数据(纬长对),并且我非常关注使用正确的数据类型和算法.在算法的参数化程序上,我尝试通过以下方式通过地理函数(LngLatDistanceFunction,因为我使用的是x,y数据)来更改默认距离函数: params.addParameter (DISTANCE_FUNCTION_ID, geo.LngLatDistanceFunction.class)
..
我需要基于“编辑距离"/"Levenshtein距离",使用ELKI对大量字符串进行聚类.由于数据集太大,我想避免使用基于文件的预先计算的距离矩阵.我该怎么办 (a)从文件中将字符串数据加载到ELKI中(仅“标签")? (b)实现访问标签的距离函数(扩展AbstractDBIDDistanceFunction,但如何获取标签?) 某些代码段或示例输入文件会有所帮助. 解决方
..
我有60000个文档,我在gensim中进行了处理,并得到60000 * 300的矩阵.我将此导出为csv文件.当我在ELKI环境中导入此文件并运行Kmeans群集时,我遇到了以下错误. Task failed de.lmu.ifi.dbs.elki.data.type.NoSupportedDataTypeException: No data type found satisfying:
..
我需要以编程方式使用ELKI运行k-medoids聚类算法。我有一个相似矩阵,我想输入算法。 是否有任何代码片段可用于运行ELKI算法? 我基本上需要知道如何创建数据库和 Relation 对象,创建自定义距离函数,以及读取算法输出。 不幸的是ELKI教程( http://elki.dbs.ifi.lmu.de/wiki/Tutorial )专注于GUI版本和实现新算法,并试图通过查
..
我正在尝试使用ELKI进行OPTICS聚类( http://elki.dbs.ifi。 lmu.de/ )。 我尝试用提供的gui运行聚类,但后来我得到了这个例外: 启动可视化工具窗口时出错。 java.lang.NoClassDefFoundError:org / w3c / dom / svg / SVGSVGElement at de.lmu.ifi.dbs.elki.v
..
最新的ELKI发生故障,开发人员将其固定在GitHub上。 但是,我必须重新编译项目才能使用它。 我已经安装了最新的Java JDK和Maven。但是,构建命令总是以错误结尾: 错误:找不到或加载主类de.lmu.ifi。这是项目: https://github.com/elki-project/elki 。 我正在运行此命令: mvn -DskipTests
..