Weka 3.7中RandomForest的确切实现 [英] Exact implementation of RandomForest in Weka 3.7

查看:562
本文介绍了Weka 3.7中RandomForest的确切实现的处理方法,对大家解决问题具有一定的参考价值,需要的朋友们下面随着小编来一起学习吧!

问题描述

在回顾了最初的Breiman(2001)论文以及其他一些董事会职位之后,我对WEKA的随机森林实现所使用的实际过程感到有些困惑.没有足够详尽的消息来源,甚至有很多相互矛盾的地方.

Having reviewed the original Breiman (2001) paper as well as some other board posts, I am slightly confused with the actual procedure used by WEKAs random forest implementation. None of the sources was sufficiently elaborate, many even contradict each other.

它如何详细工作,执行哪些步骤?

How does it work in detail, which steps are carried out?

到目前为止我的理解:

  • 为每棵树创建一个与训练数据大小相同的引导程序样本
  • 每个节点仅考虑定义大小的可用特征的随机子集(可以在WEKA中选择参数)
  • 关于所使用的基础树学习器,我发现2006年的一篇文章指出是经过修改的REPTree.
  • 树已完全生长且未修剪.
  • 应用多数投票(在准确性作为效果指标的情况下)

我的问题:

  • 是否实际使用了引导程序抽样?
  • REPTree是否仍在使用中?或者此后算法是否已更改?

澄清这些问题将对我有很大帮助!

Clarifying these issues would help me a lot!

推荐答案

回答您的问题

    确实使用了
  1. Bagging(引导聚合).您可以在似乎使用了RandomTree,如在

    It appears that RandomTree is used, as seen on line 530

    此信息来自Weka 3.7.5,我认为从3.6.8版本开始一直是正确的,但我尚未检查源代码.

    This information is from Weka 3.7.5, I believe this is correct all the way back to version 3.6.8, but I have not checked the source code.

    这篇关于Weka 3.7中RandomForest的确切实现的文章就介绍到这了,希望我们推荐的答案对大家有所帮助,也希望大家多多支持IT屋!

查看全文
登录 关闭
扫码关注1秒登录
发送“验证码”获取 | 15天全站免登陆