h2o - IT屋-程序员软件开发技术分享社区

在 h2o 中加载大于内存大小的数据

我正在尝试在 h2o 中加载大于内存大小的数据. H2o blog 提到:关于大数据的注释和 GC:当 Java 堆太满时，我们会执行用户模式交换到磁盘，即，您使用的大数据比物理 DRAM 多.我们不会因为 GC 死亡螺旋而死，但我们会降级到核外速度.我们会在磁盘允许的范围内以最快的速度前进.我亲自测试了将 12Gb 数据集加载到 2Gb(32 位)JVM 中；加载数据大约需要 5 分钟，运 ..

发布时间：2022-01-16 10:27:30 java r garbage-collection out-of-memory h2o Java开发

H2o 模型性能指标和增益图表定制

我看到 h2o 模型性能指标包含 AUC、logloss 等.有一个模型性能指标称为lift_top_group，它是提升到最高十分位数吗? 也可以指定 h2o 的波段来输出增益图表，例如 top 5%, 5%-10%, 10%-15% ....... 我能找到的函数是 h2o.gainsLift 解决方案您可以在输出中看到所有分位数组(Flow 有一个很好的显示).顶级组是前 1%， ..

发布时间：2022-01-02 09:03:14 model h2o 其他开发

如何解释 h2o.predict() 结果的概率 (p0, p1)

我想了解 h2o.predict() 函数来自 H2o R-package.我意识到在某些情况下，当 predict 列是 1 时，p1 列的值低于 p0.我对 p0 和 p1 列的解释是指每个事件的概率，所以我预计 predict=1 时 p1 的概率应该高于相反事件的概率 (p0)，但它并不总是发生，正如我在以下示例中所示:使用前列腺数据集. 这是可执行的例子: 图书馆(h2o)h ..

发布时间：2021-12-27 17:23:27 r machine-learning deep-learning h2o glm AI人工智能

预测类别或类别概率?

我目前正在将 H2O 用于分类问题数据集.我正在 python 3.6 环境中使用 H2ORandomForestEstimator 对其进行测试.我注意到预测方法的结果给出了 0 到 1 之间的值(我假设这是概率). 在我的数据集中，目标属性是数字，即 True 值为 1，False 值为 0.我确保将类型转换为目标的类别属性，我仍然得到相同的结果. 然后我修改了代码，使用 H2OF ..

发布时间：2021-12-14 09:14:27 python machine-learning classification random-forest h2o AI人工智能

使用 H2O R 包中的 h2o.anomaly 函数重建 MSE 计算

我试图执行自动编码器以进行异常检测.我使用 H2O R 包使用 h2o.anomaly 函数为样本数据生成重建 MSE.但是，我也尝试根据以下文档链接中的 MSE 公式自己手动计算它:http://docs.h2o.ai/h2o/latest-stable/h2o-docs/performance-and-prediction.html#mse-mean-squared-error 我用来构 ..

发布时间：2021-11-30 19:46:29 r h2o autoencoder anomaly-detection 其他开发

我可以使用自动编码器进行聚类吗?

在下面的代码中，他们使用自动编码器作为监督聚类或分类，因为它们有数据标签.http://amunategui.github.io/anomaly-detection-h2o/但是，如果我没有标签，我可以使用自动编码器来聚类数据吗?问候解决方案深度学习自动编码器始终是无监督学习.您链接到的文章的“监督"部分是为了评估它的表现. 以下示例(取自我的书《Practical Machin ..

发布时间：2021-11-30 19:41:59 deep-learning h2o autoencoder 其他开发

H2O目标平均编码器“帧以相同顺序发送"错误

我正在按照 H2O 示例在 Sparking Water(sparking water 2.4.2 和 H2O 3.22.04)中运行目标均值编码.它在以下所有段落中运行良好 from h2o.targetencoder import TargetEncoder# 将标签更改为因子input_df_h2o['label'] = input_df_h2o['label'].asfactor()# ..

发布时间：2021-06-24 20:42:59 python-3.x pyspark h2o 其他开发

H2O Hadoop是否需要访问用户hdfs的HDFS主文件夹?

正在运行h2o( ..

发布时间：2021-05-13 20:13:28 h2o 其他开发

如何使用Python在H2o库中的GBM中重用cross_validation_fold_assignment()

我使用H2o库运行模型.我进行了5折交叉验证. 模型= H2OGradientBoostingEstimator(balance_classes =真实，nfolds = 5，keep_cross_validation_fold_assignment =正确，种子= 1234)model.train(x =预测变量，y =响应，training_frame =数据)print('rmse:'，m ..

发布时间：2021-05-13 20:13:24 python h2o gbm Python

R h2o服务器CURL错误，可重复

起初，我认为这是一个随机的问题，但是重新运行脚本又会再次发生. .h2o.doSafeREST中的错误(h2oRestApiVersion = h2oRestApiVersion，urlSuffix = urlSuffix，:意外的CURL错误:接收失败:对等重置连接我正在使用梯度提升机模型在中等大小的数据集(大约40000 x 30)上进行网格搜索.网格中最大的树是1000.这通常是 ..

发布时间：2021-05-13 20:13:22 r h2o 其他开发

如何安装特定版本的H2O

我需要安装较旧的H2O版本，因为即使模型之间只有一个(3.26.0.2与3.26.0.3)，模型加载也不起作用.我正在努力寻找一个页面，从中可以找到下载链接.为什么不存在?所有软件为此都有一个存档或较旧版本的页面.我也尝试过使用当前版本的链接，但是没有运气，因为它没有您可以猜测的模式.那么如何在Python(pip)中安装H2O 3.26.0.2? 遍及整个网络和文档 model = ..

发布时间：2021-05-13 20:13:19 python h2o Python

H2O MOJO线程安全吗?

我正在使用Mojo模型对查询进行评分.我正在使用此语句来使用mojo模型 EasyPredictModelWrapper模型=新的EasyPredictModelWrapper(MojoModel.load("gbm.zip")); 问题是我可以在不同线程中使用此模型对象吗?线程安全吗? 解决方案是的，带有Easy Wrapper的GBM MOJO(即问题中显示的内容)是线程安全 ..

发布时间：2021-05-13 20:13:16 thread-safety h2o mojo 其他开发

没有CUDA，是否可以在H2O中建立Deep Water/TensorFlow模型

我的目标是将H2O与TensorFlow集成在一起，而无需在计算机上使用CUDA. 由于TensorFlow同时支持CPU和GPU执行，因此我希望在没有CUDA的情况下实现H2O/TensorFlow集成.但是我很困惑在您还可以在FLOW单元格中将gpu设置为false，如下所示: "gpu":false 但是，您的主要问题是没有后端(mxnet，tensorflow，c ..

发布时间：2021-05-13 20:13:13 h2o 其他开发

无法使用h2o.loadModel()函数导入binay h2o模型:412前提条件失败

在过去的几天里，我一直在与h2o和h2o Flow合作，并且一直很喜欢它.两天前，我从h2o Flow导出了一些模型(二进制格式)，并用R导入了它们，所以我可以做进一步的研究.到今天为止，它一直运行良好.由于某种原因，当我尝试使用 h2o.loadModel 函数(在使用所有导出的二进制模型之前都可以正常工作)时，出现以下错误.为了澄清起见，我已经成功运行了 h2o.init()命令以打开H2O集 ..

发布时间：2021-05-13 20:13:07 r load h2o 其他开发

h2o vs scikit学习混淆矩阵

任何人都可以将sklearn混淆矩阵与水相匹配吗? 他们从不匹配.... 用Keras做类似的事情会产生完美的匹配. 但是在h2o中，它们始终处于关闭状态.尝试了每种方式... 从以下位置借用了一些代码: H2O和Scikit-Learn指标得分之间有何区别? #In [30]:将熊猫作为pd导入进口水从h2o.estimators.gbm导入H2OGradientBoo ..

发布时间：2021-04-22 19:08:27 python-3.x scikit-learn classification h2o confusion-matrix 其他开发

h2o.deeplearning自动编码器，手动计算深度特征

我试图了解自动编码器的深层功能. 我用 h2o.deeplearning 创建了一个自动编码器，然后尝试手动计算深度特征. 自动编码器 fit = h2o.deeplearning(x =名称(x_train)，training_frame = x_train，activation ="Tanh"，自动编码器= TRUE，隐藏= c(25,10)，历元= 100，export_we ..

发布时间：2021-04-12 20:21:39 r deep-learning h2o autoencoder 其他开发

密钥未加载:密钥< Frame>.通过H2O API调用中的ParseSetup发布源帧时

我的代码: curl -X POST http://localhost:54321/3/ParseSetup --data'source_frames = ["/root/documents/my_file.csv"]' 错误: java.lang.IllegalArgumentException:密钥未加载:密钥位于water.api.ParseSetupHandler.guess ..

发布时间：2021-04-08 20:49:47 java rest api curl h2o Java开发

h2o群集总内存异常低

我正在使用196 GB内存的远程服务器，但是当我使用h2o.init(nthreads = -1)时，它说群集的总内存为0.96 GB.此外，当我尝试使用max_mem_size ="2g"时，我收到一条错误消息，提示无法创建JVM. 现在，服务器正在使用32位Java版本，并且我没有管理员访问权限.我需要怎么做才能获得更多的群集内存? 谢谢解决方案现在，服务器正在使用 ..

发布时间：2020-11-22 01:18:27 java r h2o Java开发

小数据的`as.h2o()`的替代品?

对于大多数使用as.h2o()的人来说，我面临相反的问题，尽管所产生的问题是相同的.我必须将仅19列宽的一系列单行向量转换并提供给h2o自动编码器.每个向量使用as.h2o()进行转换大约需要0.29秒，这会导致严重的瓶颈. 谁能建议一种可能更快的替代方法? (由于种种原因，我别无选择，只能一个接一个地发送单个行向量，因此在调用as.h2o之前将数据汇总到矩阵中是不可行的.) 非常感 ..

发布时间：2020-11-22 01:17:25 h2o 其他开发

如何在H2Oframe中向新块添加字符串

通过使用newChunk.addNum(8)，我可以在新块中的行中添加数字.如何在新块中的行中添加字符串?谢谢！解决方案您的问题已在H2O谷歌网上论坛中回答:谢谢！ Avni ..

发布时间：2020-11-22 01:16:19 scala h2o 其他开发

h2o相关内容