模型评估与选择_简易版

yuzaer

于 2019-05-09 12:15:46 发布

阅读量289

点赞数

CC 4.0 BY-SA版权

本文链接：https://blog.csdn.net/qq_37920823/article/details/90028077

模型评估与选择

文章目录

@[toc]
二分类问题的泛化误差上界
混淆矩阵
ROC 曲线与 AUC
交叉验证
自助法 $(bootstrapping)$
正则化 $(regularization)$
模型比较
偏差-方差分解

二分类问题的泛化误差上界

$T = \{(x_i,y_i)\}$ 来自于联合概率分布 $P (X, Y)$ 且有 $\in R^n, Y \in \{-1,+1\}$ ，而且 $F = \{f_1,...,f_n\}$ ，损失函数为 $0 - 1$ 损失

则关于 $f$ 的期望风险与经验风险为

$R (f) = E [L (Y, f (X))]$

$\hat R (f) = \frac{1}{N}\sum_{i=1}^NL(y_i,f(x_i))$

则经验风险最小化函数为

$\hat f = arg \min\limits _{f\in F} \hat R (f)$
$f_N$ 的泛化能力为

$R(\hat f) = E[L(Y,\hat f(X))]$

则对于任意一个函数，以概率 $1-\delta$ 有

$\leq \hat R(f) + \epsilon(d,N,\delta)$

其中 $\epsilon(d,N,\delta) = \sqrt {\frac{1}{2N}(\log d+\log \frac{1}{\delta})}$

$H o e f f d i n g$ 不等式：
$P(ES_n - S_n \geq t) \leq exp(\frac{-2t^2}{\sum_{i=1}^n(b_i-a_1)^2}),\forall t>0$
其中 $S_n = \sum_{i=1}^nX_i$ 是独立随机变量 $X_1,...,X_n$ 之和，且 $X_i \in [a_i,b_i]$

混淆矩阵

	1	0
1	a (TP)	b (FN)
0	c (FP)	d (TN)

一级指标

TP ( true positive ),真正，被正确预测的正样本数
FN ( false negative ),假负，被错误预测为负类的正样本数
FP ( false positive ),假正，被错误预测为正类的负样本数
TN ( true negative ), 真负，被正确预测的负样本数

二级指标

真正率 $T P R$ 或者灵敏度 $(S e n s i t i v i t y)$
- 模型正确预测的正样本比例
- $T P R = T P / (T P + F N)$
真负率 $T N R$ 或者特指度 $(S p e c i f i c i t y)$
- 模型正确预测的负样本比例
- $T N R = T N / (T N + F P)$
假正率 $F P R$
- 被预测为正类的负样本比例
- $F P R = F P / (T N + F P)$
假负率 $F N R$
- 被预测为负类的正样本比例
- $F N R = F N / (T P + F N)$
查准率 $p e r c i s i o n$
- 预测为正类的样本中实际为正类的比例
- $p = T P / (T P + F P)$
召回率 $r e c a l l$
- 被模型正确预测的正样本比例
- 高召回意味着，很少将正样本误分为负样本
- $r = T P / (T P + F N)$

三级指标

$F_1 - Score$ :

$\frac{2rp}{r+p} = \frac{2TP}{2TP+ FN + FP}$
精度与召回的调和平均 $\frac{2}{F} = \frac{1}{r} + \frac{1}{p}$

其余指标

$P - R$ 曲线
$F_\beta = \frac{(\beta^2 + 1)rp}{r + \beta^2 p}$

ROC 曲线与 AUC

$(Receiver\ Operating\ Characteristic)$
$T P R$ 沿 $y$ 轴绘制， $F P R$ 沿 $x$ 轴绘制
曲线每一个点对应了不同阈值下的一个模型

$C o d e$ :

# From 尹昊宇
#ROC曲线 y轴为真阳率(TP/(TP+FN)) x轴为假阳率(FP/FP+TN)
def plotroc(classscore,label):
    import matplotlib.pyplot as plt
    current = [1.0,1.0]  #用于记录当前绘图光标停止的位置,初始位置为(1,1),即全部预测为正类
    ysum = 0  #计算ROC曲线下的面积
    numpos = sum(np.array(label)==1.0)  #计算训练样本中正类个数
    ystep = 1/float(numpos)  #计算y的步长,相当于1/TP+FN
    xstep = 1/float(len(label)-numpos)  #计算x的步长,相当于1/FP+TN
    sortindex = classscore.T.argsort() #将该矩阵(m*1)从小到到大排序，返回索引
    fig = plt.figure()
    ax = fig.add_subplot(1,1,1)
    for index in sortindex.tolist():  #将所有样本从得分最小的开始依次预测为反类
        if label[index] == 1.0:
            delx = 0
            dely = -ystep
        else:
            delx = -xstep
            dely = 0
            ysum += current[1] #面积计算时，只有x轴发生偏移，才需要加一下此时y轴高度
            #由于面积可以看作是多个长方形之和，长方形宽一样，只要计算长(y)的和即可
        ax.plot([current[0],current[0]+delx],[current[1],current[1]+dely],c = 'b')
        current = [current[0]+delx,current[1]+dely]
    ax.plot([0,1],[0,1],'b--')#蓝色虚线
    ax.axis([-0.05,1.05,-0.05,1.05])
    plt.show()
    return ysum*xstep
auc = plotroc(prob,label)

交叉验证

如何估计模型的泛化能力？

交叉验证 $(C r o s s V a l i d a t i o n)$
留一法 $(L e a v e - O n e - O u t C r o s s V a l i d a t i o n)$

留一法的每一回合都用了几乎所有样本进行训练；同时没有随机因素的影响；但是计算成本太高。

自助法 $(b o o t s t r a p p i n g)$

利用自助采样法为基础

自助法重复 $m$ 次得到包含 $m$ 个样本的数据集 $D^{'}$

$\lim_{m -> \infty}(1-\frac{1}{m})^m -> \frac{1}{e} \approx 0.368$

正则化 $(r e g u l a r i z a t i o n)$

$\min_{f\in F} \frac{1}{N}\sum_{i=1}^N L(y_i,f(x_i))+ \lambda J(f), \lambda \geq 0$

常见的惩罚：
L1,L2惩罚。

模型比较

$t$ 检验
两个学习器 $A, B$
在 $k$ 折交叉验证下的训练误差为 $\epsilon_1^A,...,\epsilon_k^A;\epsilon_1^B,...,\epsilon_k^B$
如果两个模型性能相同，则有 $\Delta_i = \epsilon_i^A - \epsilon_i^B = 0$
所以有假设检验统计量 $\frac{|mean(\epsilon^A - \epsilon^B)|}{var(\epsilon^A - \epsilon^B)/\sqrt k} \sim t(k-1)$
$M c n e m a r$ 检验