朴素贝叶斯模型使用0-1损失函数来选择最优模型
0-1损失函数定义如下:
L(Y,f(X))={1,Y=f(X)0,Y≠f(X)
L(Y, f(X)) = \begin{cases}
1, && Y = f(X) \\
0, && Y \neq f(X)
\end{cases}
L(Y,f(X))={1,0,Y=f(X)Y=f(X)
L(Y, f(X))的期望为:
E[L(Y,f(X))]=∑kL(ck,f(x))P(Ck∣X)=∑kL(ck,f(x))P(Ck≠f(x)∣X)=1−P(f(x)=Ck∣X)
E[L(Y, f(X))] = \sum_kL(c_k, f(x))P(C_k|X) \\
= \sum_kL(c_k, f(x))P(C_k \neq f(x)|X) \\
= 1 - P(f(x)=C_k|X)
E[L(Y,f(X))]=k∑L(ck,f(x))P(Ck∣X)=k∑L(ck,f(x))P(Ck=f(x)∣X)=1−P(f(x)=Ck∣X)
L(Y, f(X))代表f(x)的损失函数,因此要让它和标记尽量小,也普是在让P(f(x)=Ck∣X)P(f(x)=C_k|X)P(f(x)=Ck∣X)尽量大,也就是后验概率最大化。