信息增益表示得知特征空间X的信息而使得类Y的信息不确定性减少的程度。信息增益依赖于特征,不同的特征往往具有不同的信息增益,信息增益大的特征具有更强的分类能力。
特征A对训练数据集D的信息增益 ,定义为集合D的经验熵H(D)与特征A给定条件下D的经验条件熵H(D|A)之差,即

通常,熵H(Y)与条件熵H(Y|X)之差称为互信息,决策树学习中的信息增益等价于训练数据集中类与特征的互信息。
信息增益表示得知特征空间X的信息而使得类Y的信息不确定性减少的程度。信息增益依赖于特征,不同的特征往往具有不同的信息增益,信息增益大的特征具有更强的分类能力。
特征A对训练数据集D的信息增益 ,定义为集合D的经验熵H(D)与特征A给定条件下D的经验条件熵H(D|A)之差,即

通常,熵H(Y)与条件熵H(Y|X)之差称为互信息,决策树学习中的信息增益等价于训练数据集中类与特征的互信息。
2560

被折叠的 条评论
为什么被折叠?