h2o相关内容

在 h2o 中加载大于内存大小的数据

我正在尝试在 h2o 中加载大于内存大小的数据. H2o blog 提到:关于大数据的注释和 GC:当 Java 堆太满时,我们会执行用户模式交换到磁盘,即,您使用的大数据比物理 DRAM 多.我们不会因为 GC 死亡螺旋而死,但我们会降级到核外速度.我们会在磁盘允许的范围内以最快的速度前进.我亲自测试了将 12Gb 数据集加载到 2Gb(32 位)JVM 中;加载数据大约需要 5 分钟,运 ..
发布时间:2022-01-16 10:27:30 Java开发

H2o 模型性能指标和增益图表定制

我看到 h2o 模型性能指标包含 AUC、logloss 等.有一个模型性能指标称为lift_top_group,它是提升到最高十分位数吗? 也可以指定 h2o 的波段来输出增益图表,例如 top 5%, 5%-10%, 10%-15% ....... 我能找到的函数是 h2o.gainsLift 解决方案 您可以在输出中看到所有分位数组(Flow 有一个很好的显示).顶级组是前 1%, ..
发布时间:2022-01-02 09:03:14 其他开发

如何解释 h2o.predict() 结果的概率 (p0, p1)

我想了解 h2o.predict() 函数来自 H2o R-package.我意识到在某些情况下,当 predict 列是 1 时,p1 列的值低于 p0.我对 p0 和 p1 列的解释是指每个事件的概率,所以我预计 predict=1 时 p1 的概率 应该高于相反事件的概率 (p0),但它并不总是发生,正如我在以下示例中所示:使用 前列腺数据集. 这是可执行的例子: 图书馆(h2o)h ..
发布时间:2021-12-27 17:23:27 AI人工智能

预测类别或类别概率?

我目前正在将 H2O 用于分类问题数据集.我正在 python 3.6 环境中使用 H2ORandomForestEstimator 对其进行测试.我注意到预测方法的结果给出了 0 到 1 之间的值(我假设这是概率). 在我的数据集中,目标属性是数字,即 True 值为 1,False 值为 0.我确保将类型转换为目标的类别属性,我仍然得到相同的结果. 然后我修改了代码,使用 H2OF ..

我可以使用自动编码器进行聚类吗?

在下面的代码中,他们使用自动编码器作为监督聚类或分类,因为它们有数据标签.http://amunategui.github.io/anomaly-detection-h2o/但是,如果我没有标签,我可以使用自动编码器来聚类数据吗?问候 解决方案 深度学习自动编码器始终是无监督学习.您链接到的文章的“监督"部分是为了评估它的表现. 以下示例(取自我的书《Practical Machin ..
发布时间:2021-11-30 19:41:59 其他开发

R h2o服务器CURL错误,可重复

起初,我认为这是一个随机的问题,但是重新运行脚本又会再次发生. .h2o.doSafeREST中的 错误(h2oRestApiVersion = h2oRestApiVersion,urlSuffix = urlSuffix,:意外的CURL错误:接收失败:对等重置连接 我正在使用梯度提升机模型在中等大小的数据集(大约40000 x 30)上进行网格搜索.网格中最大的树是1000.这通常是 ..
发布时间:2021-05-13 20:13:22 其他开发

如何安装特定版本的H2O

我需要安装较旧的H2O版本,因为即使模型之间只有一个(3.26.0.2与3.26.0.3),模型加载也不起作用.我正在努力寻找一个页面,从中可以找到下载链接.为什么不存在?所有软件为此都有一个存档或较旧版本的页面.我也尝试过使用当前版本的链接,但是没有运气,因为它没有您可以猜测的模式.那么如何在Python(pip)中安装H2O 3.26.0.2? 遍及整个网络和文档 model = ..
发布时间:2021-05-13 20:13:19 Python

H2O MOJO线程安全吗?

我正在使用Mojo模型对查询进行评分.我正在使用此语句来使用mojo模型 EasyPredictModelWrapper模型=新的EasyPredictModelWrapper(MojoModel.load("gbm.zip")); 问题是我可以在不同线程中使用此模型对象吗?线程安全吗? 解决方案 是的,带有Easy Wrapper的GBM MOJO(即问题中显示的内容)是线程安全 ..
发布时间:2021-05-13 20:13:16 其他开发

没有CUDA,是否可以在H2O中建立Deep Water/TensorFlow模型

我的目标是将H2O与TensorFlow集成在一起,而无需在计算机上使用CUDA. 由于TensorFlow同时支持CPU和GPU执行,因此我希望在没有CUDA的情况下实现H2O/TensorFlow集成.但是我很困惑在 您还可以在FLOW单元格中将gpu设置为false,如下所示: "gpu":false 但是,您的主要问题是没有后端(mxnet,tensorflow,c ..
发布时间:2021-05-13 20:13:13 其他开发

无法使用h2o.loadModel()函数导入binay h2o模型:412前提条件失败

在过去的几天里,我一直在与h2o和h2o Flow合作,并且一直很喜欢它.两天前,我从h2o Flow导出了一些模型(二进制格式),并用R导入了它们,所以我可以做进一步的研究.到今天为止,它一直运行良好.由于某种原因,当我尝试使用 h2o.loadModel 函数(在使用所有导出的二进制模型之前都可以正常工作)时,出现以下错误.为了澄清起见,我已经成功运行了 h2o.init()命令以打开H2O集 ..
发布时间:2021-05-13 20:13:07 其他开发

h2o vs scikit学习混淆矩阵

任何人都可以将sklearn混淆矩阵与水相匹配吗? 他们从不匹配.... 用Keras做类似的事情会产生完美的匹配. 但是在h2o中,它们始终处于关闭状态.尝试了每种方式... 从以下位置借用了一些代码: H2O和Scikit-Learn指标得分之间有何区别? #In [30]:将熊猫作为pd导入进口水从h2o.estimators.gbm导入H2OGradientBoo ..

h2o群集总内存异常低

我正在使用196 GB内存的远程服务器,但是当我使用h2o.init(nthreads = -1)时,它说群集的总内存为0.96 GB.此外,当我尝试使用max_mem_size ="2g"时,我收到一条错误消息,提示无法创建JVM. 现在,服务器正在使用32位Java版本,并且我没有管理员访问权限.我需要怎么做才能获得更多的群集内存? 谢谢 解决方案 现在,服务器正在使用 ..
发布时间:2020-11-22 01:18:27 Java开发

小数据的`as.h2o()`的替代品?

对于大多数使用as.h2o()的人来说,我面临相反的问题,尽管所产生的问题是相同的.我必须将仅19列宽的一系列单行向量转换并提供给h2o自动编码器.每个向量使用as.h2o()进行转换大约需要0.29秒,这会导致严重的瓶颈. 谁能建议一种可能更快的替代方法? (由于种种原因,我别无选择,只能一个接一个地发送单个行向量,因此在调用as.h2o之前将数据汇总到矩阵中是不可行的.) 非常感 ..
发布时间:2020-11-22 01:17:25 其他开发