广告合作
  • 今日头条

    今日头条

  • 百度一下

    百度一下,你就知道

  • 新浪网

    新浪网 - 提供新闻线索,重大新闻爆料

  • 搜狐

    搜狐

  • 豆瓣

    豆瓣

  • 百度贴吧

    百度贴吧——全球领先的中文社区

  • 首页 尚未审核订阅工具 订阅

    R语言如何做RF随机森林分类

    来源:网络收集  点击:  时间:2024-04-29
    【导读】:
    随机森林是一种比较有效的有监督的分类方法,是目前分类性能比较优越的算法之一。现在使用随机森林做回归和分类主要基于R语言平台上实现的。下面简单介绍一下R语言中RF的用法如下。工具/原料moreR语言、随机森林(RF)、randomForest包方法/步骤1/6分步阅读

    R语言做随机森林分类首先需要安装randomForest函数包,打开RStudio主页面,找到倒数第二个“tools”菜单展开,点击“Install packages”,输入要下载的“randomForest”,点击安装,如图所示

    2/6

    randomForest函数包安装好之后,就可以分析数据了。本文以R语言自带数据为例,旨在介绍用法仅供参考。分析数据之前,需先下载randomForest及读取数据,部分数据截图如图所示,最右边一列为数据标签(类别)。

    3/6

    调用randomForest函数对训练样本进行训练,rfmodel既是训练后的模型。然后将数据去掉类别一列作为测试样本,如图所示

    4/6

    想要了解模型信息,如mtry、ntree、oob(袋外误差率)等,可以直接运行rfmodel打印模型信息:Call:之下的内容。若要了解各变量的的重要性则运行importance(rfmodel,2)即可输出变量权重。代码如图所示

    5/6

    另外随机森林也有两个参数mtry和ntree,这两个参数也可以有自己决定,最优组合既是OOB误差率最小。

    模型建立完成,就需要利用测试样本对模型进行检验,并输出模型的混淆矩阵来分析模型精度,如图所示,由混淆矩阵可以知,精度达到100%(固然是和原数据检验本身有关),说明随机森林性能还是挺优越的。

    6/6

    要想获得最优参数,一般采取的办法是遍历所有变量。分类:变量少还好,若是变量特征很多,遍历全部耗费巨大时间成本,这时mtry一般采取总特征的平方根,再来寻找最优ntree;回归:mtry一般采取总特征的三分之一,再来寻找最优ntree。

    注意事项

    袋外误差率(OOB)以此为参考确定最优参数组合

    R语言随机森林分类RFRANDOMFOREST
    本文关键词:

    版权声明:

    1、本文系转载,版权归原作者所有,旨在传递信息,不代表看本站的观点和立场。

    2、本站仅提供信息发布平台,不承担相关法律责任。

    3、若侵犯您的版权或隐私,请联系本站管理员删除。

    4、文章链接:http://www.1haoku.cn/art_624744.html

    相关资讯

    ©2019-2020 http://www.1haoku.cn/ 国ICP备20009186号05-06 13:09:16  耗时:0.024
    0.0243s