估计理论(4)：例5.8说明如何用完备的充分统计量找到MVU估计

最新推荐文章于 2024-03-18 00:15:28 发布

tanghonghanhaoli

最新推荐文章于 2024-03-18 00:15:28 发布

阅读量1.6k

点赞数 2

分类专栏： estimation

estimation 专栏收录该内容

10 篇文章

订阅专栏

本文通过例5.8解释了如何利用完备的充分统计量找到均匀噪声均值的MVU（最小方差无偏估计）。由于均匀分布的正则条件不满足，不能直接应用CRLB（Cramér-Rao下界），所以通过找到完备充分统计量T=max(x[n])，并计算其均值和方差，得出MVU估计为θ^=2NN+1max(x[n])，并比较了它与样本均值的方差，证明在N≥2时，该MVU估计的方差更小。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

本节内容摘自Steven M. Kay，《Fundamentals of Statistical Signal Processing: Estimation Theory》。
我们来个例子，如何用完备统计量找到MVU估计。
【例5.8】均匀噪声的均值

问题描述
我们有数据
$x[n]=w[n],n=0,1,…,N−1(1)\tag{1} x[n]=w[n],\quad n=0,1,\ldots,N-1$ 这里 $w[n]∼U(0,β)w[n]\sim {\mathcal U}(0,\beta)$ ， $β>0\beta>0$ 。我们希望能够得到均值 $θ=β/2\theta=\beta/2$ 的MVU估计。
CRLB为何不适用？
从【定理3.1】我们知道，要使用CRLB，需要概率密度函数满足正则条件
$E[∂ln⁡p(x;θ)∂θ]=0.(2)\tag{2} {\rm E}\left[\frac{\partial \ln p({\bf x};\theta)}{\partial \theta}\right]=0.$ 现在我们来证明，对于均匀分布噪声均值来说，正则条件(2)不满足。

下面我们来看看习题3.1。

顺便说一句，这本书的答案可见（https://download.csdn.net/download/qianlongchen/9433628?utm_source=iteye)。虽然是手写不太清楚，而且VIP才能下载，不过还是很解决问题啦。

【Problem 3.1】如果 $x[n]∼U(0,θ)x[n]\sim {\mathcal U}(0,\theta)$ ， $n=0,1,…,N−1n=0,1,\ldots,N-1$ 。试说明正则条件
${\rm E}\left[\frac{\partial \ln p({\bf x};\theta)}{\partial \theta}\right]=0$ 不成立，因而CRLB不适用。
【解答】
$p(x[n];\theta)=\frac{1}{\theta}\left(u(x[n])-u(x[n]-\theta) \right)$ 这里的 $u (x)$ 为阶跃函数。因此，我们可以得到
$p({\bf x};\theta)=\prod_{n=0}^{N-1}p(x[n];\theta),$ 显然，如果我们能够证明
${\rm E}\left[\frac{\partial \ln p({\bf x};\theta)}{\partial \theta}\right]\ne 0,{\rm \ for \ }n=0,\ldots,N-1$ 则获证。我们令 $y = x [n]$ ，有
$p(y;\theta)=\frac{1}{\theta}\left(u(y)-u(y-\theta) \right),$ 则可以得到 $p(y;θp(y;\theta$ 的图像如下图所示。看图的时候，可以考虑 $y$ 是固定值。显然应该有 $y = x [n] > 0$ 。这时，如果 $θ<y\theta<y$ ，函数值为0； $θ>y\theta>y$ ，则有函数值为 $1/θ1/\theta$ 。因此，有
${\rm E}\left[\frac{\partial \ln p({y};\theta)}{\partial \theta}\right]={\rm E}\left[\frac{\partial \ln (1/\theta)}{\partial \theta}\right]=-\frac{1}{\theta}\ne 0.$

在这里插入图片描述

下面我们来找到一个无偏估计，并且用充分统计量的完备性，来考察这个无偏估计是不是MVU估计。
我们很自然会想到用样本均值
$θ^=1N∑n=0N−1x[n] \hat \theta=\frac{1}{N}\sum_{n=0}^{N-1}x[n]$ 作为估计。这里 $x[n]∼U(0,2θ)x[n]\sim {\mathcal U}(0,2\theta)$ ，因此 $E(x[n])=θ{\rm E}(x[n])=\theta$ 。对估计求均值，得到
$E(θ^)=θ. {\rm E}(\hat \theta)=\theta.$ 因此 $θ^\hat \theta$ 为无偏估计，其方差为
$var(θ^)=1Nvar(x[n])=β212N=θ23N.(5.9)\tag{5.9} {\rm var}(\hat \theta)=\frac{1}{N}{\rm var}(x[n])=\frac{\beta^2}{12N}=\frac{\theta^2}{3N}.$

(1) 找到完备的充分统计量

我们可以用阶跃函数来表示均匀分布的PDF，即
$p(x[n];\theta)=\frac{1}{\beta}[u(x[n])-u(x[n]-\beta)]，$ 则可以得到对所有数据的PDF为
$p({\bf x};\theta)=\frac{1}{\beta^N}\prod_{n=0}^{N-1}[u(x[n])-u(x[n]-\beta)].$ 与Problem 3.1类似，我们可以得到
$p({\bf x};\theta)=\left\{\begin{matrix} \frac{1}{\beta^N} & 0\le x[n]\le \beta,n=0,1,\ldots,N-1 \\0& {\rm otherwise}\end{matrix}\right.$ 进一步，可以得到 $p({\bf x};\theta)=\left\{\begin{matrix} \frac{1}{\beta^N} & \max{x[n]}<\beta,\min x[n]>0 \\0& {\rm otherwise}\end{matrix}\right.$ 因此
$p({\bf x};\theta)=\frac{1}{\beta^N}u(\beta-\max x[n])u(\min x[n])=g(T({\bf x}),\theta)h({\bf x}),$ 其中
$g(T({\bf x}),\theta)=\frac{1}{\beta^N}u(\beta-\max x[n])，h({\bf x})=u(\min x[n]).$
通过Neyman-Fisher因式分解定理， $T(x)=max⁡x[n]T({\bf x})=\max x[n]$ 为充分统计量，并且可以证明其为完备的（证明略）。

(2) 找到 $T(x)T({\bf x})$ 的函数，得到无偏估计
上面我们找到完备的充分统计量为 $T(x)=max⁡x[n]T({\bf x})=\max x[n]$ 。我们首先来确定它的均值。显然， $T$ 为顺序统计量(order statistics)。我们先来看累积分布函数
$\begin{aligned} {\rm Pr}\{T\le \xi\}&=\Pr\{x[0]\le \xi,x[1]\le\xi, \ldots,x[N-1]\le \xi\}\\ &=\prod_{n=0}^{N-1}\Pr\{x[n]\le \xi\}\\ &=\Pr\{x[n]\le \xi\}^N. \end{aligned}$ 因此得到PDF为
$\begin{aligned} p_{T}(\xi)&=\frac{d{\rm Pr}\{T\le \xi\}}{d\xi}\\ &=N\Pr\{x[n]\le \xi\}^{N-1}\frac{d{\rm Pr}\{x[n]\le \xi\}}{d\xi}. \end{aligned}$ 注意到 $dPr{x[n]≤ξ}dξ\frac{d{\rm Pr}\{x[n]\le \xi\}}{d\xi}$ 为 $x [n]$ 的概率密度函数 $px[n](ξ;θ)p_{x[n]}(\xi; \theta)$ ，且
$p_{x[n]}(\xi; \theta)=\left\{\begin{matrix}\frac{1}{\beta}&0<\xi<\beta\\0&{\rm otherwise}.\end{matrix} \right.$ 积分后得到
$\Pr\{x[n]\le\xi\}=\left\{\begin{matrix}0&\xi<0\\\frac{\xi}{\beta}&0<\xi<\beta\\1&{\xi>\beta}.\end{matrix} \right.$ 最后，我们得到
$p_T(\xi)=\left\{\begin{matrix}0&\xi<0\\ N\left(\frac{\xi}{\beta}\right)^{N-1}\frac{1}{\beta} & 0<\xi<\beta\\ 0&{\xi>\beta}.\end{matrix} \right.$ 因此，可以求得
$\begin{aligned} {\rm E}(T)&=\int_{-\infty}^{\infty}\xi p_T({\xi})d\xi\\ &=\int_{0}^{\beta}\xi N\left(\frac{\xi}{\beta}\right)^{N-1}\frac{1}{\beta}d\xi\\ &=\frac{N}{N+1}\beta\\ &=\frac{2N}{N+1}\theta \end{aligned}$ 为了得到无偏估计，我们令 $θ^=N+12NT\hat \theta=\frac{N+1}{2N}T$ ，因此最终无偏估计为
$θ^=N+12Nmax⁡x[n]. \hat \theta=\frac{N+1}{2N}\max x[n].$
有点出人意料的是，样本均值不是均匀分布噪声的MVU估计！
下面我们来看看二者方差情况。
（3）最小估计方差
我们可以得到最小估计方差为
$var(θ^)=(N+12N)var(T), {\rm var}(\hat \theta)=\left(\frac{N+1}{2N}\right){\rm var}(T),$ 其中
$\begin{aligned} {\rm var}(T)&=\int_{0}^{\beta}\xi^2 \frac{N\xi^{N-1}}{\beta^N}d\xi-\left(\frac{N\beta}{N+1}\right)^2\\ &=\frac{N\beta^2}{(N+1)^2(N+2)}. \end{aligned}$ 最终，我们可以得到最小方差为
$var(θ^)=β24N(N+2).(5.10)\tag{5.10} {\rm var}(\hat \theta)=\frac{\beta^2}{4N(N+2)}.$ 我们把样本均值的方差(5.9)重写如下
$var(θ^)=1Nvar(x[n])=β212N(5.9)\tag{5.9} {\rm var}(\hat \theta)=\frac{1}{N}{\rm var}(x[n])=\frac{\beta^2}{12N}$ 显然如果 $N≥2N\ge 2$ ，则(5.10)更小。