R---randomForest

cutwind

于 2017-09-07 17:46:29 发布

阅读量1.9k

点赞数 1

分类专栏： r语言文章标签：算法

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/cutwind/article/details/77884739

版权

r语言专栏收录该内容

11 篇文章

订阅专栏

本文介绍了随机森林算法的基本原理及其内部构造，解释了它是如何通过多棵决策树进行预测，并讨论了该算法的优势，如避免过拟合、处理高维数据的能力等。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

随机森林（randomForest）是利用多棵决策树对样本数据进行训练并预测的分类器。算法预测输出的类别标签 是由算法内部 多棵决策树 生成的标签的众数决定的。
内部构造：
假设数据集有m个变量，算法对数据集进行分裂，随机有放回的取出n(n<m)个变量和部分数据案例生成一个决策树（树不用剪枝，最大化生长），一直这样不断生成决策树，树多了就是森林了，加上又是随机分裂的，所以称随机森林了（我个人理解的）
因为随机分裂，所以算法中的决策树之间无关联，当一个新数据输入模型时，会根据算法中各决策树输出的标签的类别，取众数作为输出标签。
randomforest的优点：
1.相比于决策树，可以很好的避免过拟合问题。
2.能处理维度很高的数据集。
3.创建随机森林 是无偏估计
4.实现简单
R中randomForest包中的rondomForest函数
 rf_m=randomForest(label~.,data[train],ntree=50,nPerm=10,mtry=3,proximity=TRUE,importance=TRUE)
 leabel~.:代表需要预测的列，
ntree：生成决策树的数目
nperm：计算importance时的重复次数    #可以不写  
mtry：选择的分裂属性的个数    #可以不写
proximity=TRUE：表示生成临近矩阵  # 可以不写
importance=TRUE：输出分裂属性的重要性   #可以不写
rf_pred = predict(rf_m,data[test])
可以用gmodel包中的CrossTable 验证结果。

博客等级

码龄8年

39
原创

28
点赞

121
收藏

31
粉丝

关注

私信

热门文章

分类专栏

展开全部收起

上一篇：: R---岭回归 & lasso回归

下一篇：: R----简述时间序列（ARIMA）

最新评论

＜十四五规划以及2035年远景目标建议＞简单提炼
CSDN-Ada助手: 非常感谢CSDN博主的分享，这篇博客提炼了十四五规划以及2035年远景目标的建议，相信对读者们都有所启发。我觉得接下来可以继续写关于人工智能在未来社会应用的博客，探讨人工智能在医疗、教育、交通等领域的应用，以及对未来社会发展的影响。这样的技术文章对其他用户也会非常有帮助。相信你的下一篇博客会吸引更多的读者前来阅读！为了方便博主创作，提高生产力，CSDN上线了AI写作助手功能，就在创作编辑器右侧哦～（https://mp.csdn.net/edit?utm_source=blog_comment_recall ）诚邀您来加入测评，到此（https://activity.csdn.net/creatActivity?id=10450&utm_source=blog_comment_recall）发布测评文章即可获得「话题勋章」，同时还有机会拿定制奖牌。
R---randomForest
qq_36237433: 随机森林R语言实现方法，文章附件中有代码，文章作为案例分析，附件中有原代码。Jiang，H, et al. (2022). The influence of the neighbourhood environment on peer-to-peer accommodations: A random forest regression analysis. Journal of Hospitality and Tourism Management, 51: 105-118. https://doi.org/10.1016/j.jhtm.2022.02.028
R--NaiveBayes
gggggu1999: 单词拼错了，是naiveBayes，其他很有帮助，谢谢
画像简述
原味吐司: 喜欢这种文风
本卦、互卦、变卦、错卦、综卦及作用
validatetoken: 真好😊

大家在看

最新文章

目录

展开全部

收起

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。