【机器学习】12-决策树1——概念、特征选择

qq_43507078

已于 2024-09-22 21:12:12 修改

阅读量1.4k

点赞数 10

CC 4.0 BY-SA版权

分类专栏：我的机器学习文章标签：机器学习决策树人工智能

于 2024-09-22 19:01:53 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_43507078/article/details/142261643

机器学习10-决策树1

学习样本的特征，将样本划分到不同的类别（分类问题）或预测连续的数值（回归问题）。

选择特征，划分数据集，划分完成形成模型（树结构），一个叶节点是一个类别
新的需要判断的数据进入模型，根据某种距离，最近的那个类就是模型输出

内容有点多，要分开

文章目录

机器学习10-决策树1
概念
- 流程
一、特征选择

概念

节点（Node）：决策树中的每一个点，包括决策节点和叶节点。
决策节点（Decision Node）：表示一个属性的判断节点。
叶节点（Leaf Node）：表示最终决策结果的节点。
分支（Branch）：连接节点的线，代表决策的路径。
路径（Path）：从根节点到叶节点的一条完整路径。

通过一系列的决策规则将数据集划分成不同的子集，形成一个树状结构。每个内部节点表示一个特征（或属性），每个分支表示该特征的一个取值，每个叶子节点表示一个类别或预测值。

流程

决策树算法的学习过程通常包括三个主要步骤：特征选择、决策树的生成和决策树的剪枝。

特征选择：在构建决策树时，首先需要从数据集中选择最具分类能力的特征。这通常通过计算特征的信息增益、信息增益比或基尼指数等指标来完成。
决策树的生成：根据选择的特征，将数据集划分为若干个子集，并为每个子集生成相应的子树。这个过程是递归进行的，直到满足某个停止条件。
常见的停止条件包括：
所有样本都属于同一个类别。
达到预设的树的最大深度。
节点中的样本数少于最小样本数限制。
特征无法再进一步划分。
决策树的剪枝：由于生成的决策树可能过于复杂，存在过拟合的风险，因此需要通过剪枝来简化树的结构，提高模型的泛化能力。剪枝

最低0.47元/天解锁文章

200万优质内容无限畅学

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

qq_43507078 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。