h2o相关内容
我正在尝试在 h2o 中加载大于内存大小的数据. H2o blog 提到:关于大数据的注释和 GC:当 Java 堆太满时,我们会执行用户模式交换到磁盘,即,您使用的大数据比物理 DRAM 多.我们不会因为 GC 死亡螺旋而死,但我们会降级到核外速度.我们会在磁盘允许的范围内以最快的速度前进.我亲自测试了将 12Gb 数据集加载到 2Gb(32 位)JVM 中;加载数据大约需要 5 分钟,运
..
我看到 h2o 模型性能指标包含 AUC、logloss 等.有一个模型性能指标称为lift_top_group,它是提升到最高十分位数吗? 也可以指定 h2o 的波段来输出增益图表,例如 top 5%, 5%-10%, 10%-15% ....... 我能找到的函数是 h2o.gainsLift 解决方案 您可以在输出中看到所有分位数组(Flow 有一个很好的显示).顶级组是前 1%,
..
我想了解 h2o.predict() 函数来自 H2o R-package.我意识到在某些情况下,当 predict 列是 1 时,p1 列的值低于 p0.我对 p0 和 p1 列的解释是指每个事件的概率,所以我预计 predict=1 时 p1 的概率 应该高于相反事件的概率 (p0),但它并不总是发生,正如我在以下示例中所示:使用 前列腺数据集. 这是可执行的例子: 图书馆(h2o)h
..
我目前正在将 H2O 用于分类问题数据集.我正在 python 3.6 环境中使用 H2ORandomForestEstimator 对其进行测试.我注意到预测方法的结果给出了 0 到 1 之间的值(我假设这是概率). 在我的数据集中,目标属性是数字,即 True 值为 1,False 值为 0.我确保将类型转换为目标的类别属性,我仍然得到相同的结果. 然后我修改了代码,使用 H2OF
..
我试图执行自动编码器以进行异常检测.我使用 H2O R 包使用 h2o.anomaly 函数为样本数据生成重建 MSE.但是,我也尝试根据以下文档链接中的 MSE 公式自己手动计算它:http://docs.h2o.ai/h2o/latest-stable/h2o-docs/performance-and-prediction.html#mse-mean-squared-error 我用来构
..
在下面的代码中,他们使用自动编码器作为监督聚类或分类,因为它们有数据标签.http://amunategui.github.io/anomaly-detection-h2o/但是,如果我没有标签,我可以使用自动编码器来聚类数据吗?问候 解决方案 深度学习自动编码器始终是无监督学习.您链接到的文章的“监督"部分是为了评估它的表现. 以下示例(取自我的书《Practical Machin
..
我正在按照 H2O 示例在 Sparking Water(sparking water 2.4.2 和 H2O 3.22.04)中运行目标均值编码.它在以下所有段落中运行良好 from h2o.targetencoder import TargetEncoder# 将标签更改为因子input_df_h2o['label'] = input_df_h2o['label'].asfactor()#
..
正在运行h2o(
..
我使用H2o库运行模型.我进行了5折交叉验证. 模型= H2OGradientBoostingEstimator(balance_classes =真实,nfolds = 5,keep_cross_validation_fold_assignment =正确,种子= 1234)model.train(x =预测变量,y =响应,training_frame =数据)print('rmse:',m
..
起初,我认为这是一个随机的问题,但是重新运行脚本又会再次发生. .h2o.doSafeREST中的 错误(h2oRestApiVersion = h2oRestApiVersion,urlSuffix = urlSuffix,:意外的CURL错误:接收失败:对等重置连接 我正在使用梯度提升机模型在中等大小的数据集(大约40000 x 30)上进行网格搜索.网格中最大的树是1000.这通常是
..
我需要安装较旧的H2O版本,因为即使模型之间只有一个(3.26.0.2与3.26.0.3),模型加载也不起作用.我正在努力寻找一个页面,从中可以找到下载链接.为什么不存在?所有软件为此都有一个存档或较旧版本的页面.我也尝试过使用当前版本的链接,但是没有运气,因为它没有您可以猜测的模式.那么如何在Python(pip)中安装H2O 3.26.0.2? 遍及整个网络和文档 model =
..
我正在使用Mojo模型对查询进行评分.我正在使用此语句来使用mojo模型 EasyPredictModelWrapper模型=新的EasyPredictModelWrapper(MojoModel.load("gbm.zip")); 问题是我可以在不同线程中使用此模型对象吗?线程安全吗? 解决方案 是的,带有Easy Wrapper的GBM MOJO(即问题中显示的内容)是线程安全
..
我的目标是将H2O与TensorFlow集成在一起,而无需在计算机上使用CUDA. 由于TensorFlow同时支持CPU和GPU执行,因此我希望在没有CUDA的情况下实现H2O/TensorFlow集成.但是我很困惑在 您还可以在FLOW单元格中将gpu设置为false,如下所示: "gpu":false 但是,您的主要问题是没有后端(mxnet,tensorflow,c
..
在过去的几天里,我一直在与h2o和h2o Flow合作,并且一直很喜欢它.两天前,我从h2o Flow导出了一些模型(二进制格式),并用R导入了它们,所以我可以做进一步的研究.到今天为止,它一直运行良好.由于某种原因,当我尝试使用 h2o.loadModel 函数(在使用所有导出的二进制模型之前都可以正常工作)时,出现以下错误.为了澄清起见,我已经成功运行了 h2o.init()命令以打开H2O集
..
任何人都可以将sklearn混淆矩阵与水相匹配吗? 他们从不匹配.... 用Keras做类似的事情会产生完美的匹配. 但是在h2o中,它们始终处于关闭状态.尝试了每种方式... 从以下位置借用了一些代码: H2O和Scikit-Learn指标得分之间有何区别? #In [30]:将熊猫作为pd导入进口水从h2o.estimators.gbm导入H2OGradientBoo
..
我试图了解自动编码器的深层功能. 我用 h2o.deeplearning 创建了一个自动编码器,然后尝试手动计算深度特征. 自动编码器 fit = h2o.deeplearning(x =名称(x_train),training_frame = x_train,activation ="Tanh",自动编码器= TRUE,隐藏= c(25,10),历元= 100,export_we
..
我的代码: curl -X POST http://localhost:54321/3/ParseSetup --data'source_frames = ["/root/documents/my_file.csv"]' 错误: java.lang.IllegalArgumentException:密钥未加载:密钥位于water.api.ParseSetupHandler.guess
..
我正在使用196 GB内存的远程服务器,但是当我使用h2o.init(nthreads = -1)时,它说群集的总内存为0.96 GB.此外,当我尝试使用max_mem_size ="2g"时,我收到一条错误消息,提示无法创建JVM. 现在,服务器正在使用32位Java版本,并且我没有管理员访问权限.我需要怎么做才能获得更多的群集内存? 谢谢 解决方案 现在,服务器正在使用
..
对于大多数使用as.h2o()的人来说,我面临相反的问题,尽管所产生的问题是相同的.我必须将仅19列宽的一系列单行向量转换并提供给h2o自动编码器.每个向量使用as.h2o()进行转换大约需要0.29秒,这会导致严重的瓶颈. 谁能建议一种可能更快的替代方法? (由于种种原因,我别无选择,只能一个接一个地发送单个行向量,因此在调用as.h2o之前将数据汇总到矩阵中是不可行的.) 非常感
..
通过使用newChunk.addNum(8),我可以在新块中的行中添加数字.如何在新块中的行中添加字符串?谢谢! 解决方案 您的问题已在H2O谷歌网上论坛中回答:谢谢! Avni
..