h2o.predict()在新测试集上使用哪个阈值? [英] Which threshold does h2o.predict() use on new testing set?

查看:134
本文介绍了h2o.predict()在新测试集上使用哪个阈值?的处理方法,对大家解决问题具有一定的参考价值,需要的朋友们下面随着小编来一起学习吧!

问题描述

关于h2o.predict()和h2o.performance()的区别,我已经阅读了几个主题(如下面的链接所示).

I have read several threads on here in regards to h2o.predict() and h2o.performance() differences (as seen from link below).

如何解释h2o.predict()的结果的概率(p0,p1)

有人可以告诉我h2o.predict()使用哪个阈值?是max f1吗?如果是这样,是来自训练数据,验证数据还是交叉验证的阈值?

Can someone tell me which threshold does h2o.predict() use? Is it max f1? If so, is it the threshold from training data, validation data, or cross validation?

我尝试在测试集上使用max f1max f0point5使用验证阈值(与训练和验证数据完全分开),但是h2o.predict()的预测类和使用阈值的类均未使用" t完全匹配.

I tried to use the validation threshold using max f1 and max f0point5 on the testing set (completely separate from training and validation data) but the predicted class from h2o.predict() and the class from using the threshold doesn't match completely.

我得到的最接近的一个是使用训练中的max f0point5阈值并将其应用于测试集.

The closest one I got is to use max f0point5 threshold from training and apply it to testing set.

关于h2o.predict的文档不多.另外,是否存在关于阈值的最佳实践,即验证和培训的平均阈值等?

There is not much documentation on h2o.predict. Also, is there a best practice for threshold, i.e. mean threshold of validation and training, etc?

提前谢谢!

推荐答案

以下是当用户运行h2o.predict().predict()时如何选择预测阈值的详细信息:

Here are the specifics of how the prediction threshold is selected when a user runs h2o.predict() or .predict():

1)如果仅使用训练数据训练模型-使用训练数据模型指标中的最大F1阈值.

1) if you train a model with only training data - the Max F1 threshold from the train data model metrics is used.

2)如果您使用训练和验证数据训练模型-使用验证数据模型指标中的最大F1阈值.

2) if you train a model with train and validation data - the Max F1 threshold from the validation data model metrics is used.

3)如果使用训练数据训练模型并设置nfold参数-将使用训练数据模型指标中的最大F1阈值.

3) if you train a model with train data and set the nfold parameter - the Max F1 threshold from the train data model metrics is used.

4)如果使用训练数据,验证数据训练模型并设置nfold参数-使用验证数据模型指标中的最大F1阈值.

4) if you train a model with the train data, validation data and set the nfold parameter - the Max F1 threshold from the validation data model metrics is used.

这篇关于h2o.predict()在新测试集上使用哪个阈值?的文章就介绍到这了,希望我们推荐的答案对大家有所帮助,也希望大家多多支持IT屋!

查看全文
登录 关闭
扫码关注1秒登录
发送“验证码”获取 | 15天全站免登陆