使用z-score标准化时,需要先减去均值再除标准差。
瞬间我就想不起标准差的定义和作用。就回顾了一下。顺便记记。
标准差是衡量样本偏离中心程度的一种特征值。
怎么衡量?直观想法,看每个样本离均值有多远,为了避免正负抵消,就把每次作差的结果平方一下,最后累加起来。这样还有缺点,你样本数越多,加起来的偏差值肯定越大,有时候个数多的集中分布的样本反而得到偏大的结果,这样肯定不行,为了去除样本个数的影响,把样本数也除掉。
每个样本与均值差的平方累加再除样本和,单位上还是有点说不通。因此开根号。
(有偏估计的原因,再优化一下,不是除样本数N,而是除N-1)
标准差(standard deviation)
最新推荐文章于 2024-11-07 09:30:28 发布