没有合适的资源?快使用搜索试试~ 我知道了~
资源详情
资源评论
资源推荐

机器学习作业:
1、 试分析和总结 随机森林(Random Forest)和梯度提升树
(GBDT)的区别(至少写出三条)。
随机森林对训练集一视同仁,GBDT 是基于权值的弱分类器的集成;
随机森林采用多数投票等,BDT 则是将所有结果累加起来,或者加权累加来。
2、 解释随机森林预测算法的原理,并分析随机森林能够降低方
差的原因。
随机森林预测算法的原理:
① 从原始训练集中使用 Bootstraping 方法随机有放回采样选出 m 个样本,共进
行 n_tree 次采样,生成 n_tree 个训练集;
② 对于 n_tree 个训练集,分别训练 n_tree 个决策树模型;
③ 对于单个决策树模型,假设训练样本特征的个数为 n,那么每次分裂时根据信
息增益或信息增益比或基尼指数选择最好的特征进行分裂;
④ 每棵树都一直这样分裂下去,直到该节点的所有训练样例都属于同一类。在决
策树的分裂过程中不需要剪枝;
⑤ 将生成的多棵决策树组成随机森林。对于分类问题,按多棵树分类器投票决定
最终分类结果;对于回归问题,由多棵树预测值的均值决定最终预测结果。
原因:
随机性的引入使得随机森林模型不容易陷入过拟合,具有很好的抗噪能力。而且
随机性保证了各子模型间的多样性,子模型间差异越大,模型融合起来的效果会
越好,即降低方差的效果更好。
3、 举例说明 AdaBoost 中误差率的变化过程。
4、 假 设 已 知 训 练 集 T={(1, 5.5), (2, 6.5), (3,7.3), (4,8.5),




























苦茶子12138
- 粉丝: 1w+
上传资源 快速赚钱
我的内容管理 展开
我的资源 快来上传第一个资源
我的收益
登录查看自己的收益我的积分 登录查看自己的积分
我的C币 登录后查看C币余额
我的收藏
我的下载
下载帮助


最新资源
- Khsvig级通信工程人才培养措施.doc
- 大数据导论课程教学探索.docx
- VB语言第10章教案资料.ppt
- 易勤web考勤管理软件使用帮助.docx
- Web服务ERP与电子商务系统集成研究.doc
- 学生成绩管理系统数据库完整设计.doc
- 海量互联网数据中英语翻译术语高效搜索系统设计.docx
- 浅析大数据时代下高中英语写作.docx
- 别墅智能家居设计方案.doc
- 基于大数据的复杂装备企业决策支持体系建设.docx
- 电梯PLC控制系统方案设计书.doc
- 面向物联网的无线传感器网络节能策略研究.docx
- easy-query-SQL资源
- 基于大数据背景下的数字文化馆建设研究.docx
- 助理电子商务师--单选.doc
- 无线网络技术结课优秀论文.doc
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈



安全验证
文档复制为VIP权益,开通VIP直接复制

评论0