置信带是统计学中一个重要的概念,它用于估计一个参数的范围,这个范围以一定的概率包含未知的参数值。在研究连续分布函数时,构造置信带可以帮助我们理解该分布函数的形状以及分布函数的估计精度。本文提出了一种利用Kolmogorov-Smirnov统计量来构造连续置信带的方法,并展示了其在模拟研究中的良好表现。
置信带的构建通常基于给定样本数据。设X1, X2, ..., Xn为独立同分布的随机样本,来自某个未知分布F(x)。置信带的目标是提供一个区间估计,即找到两个函数L(x)和H(x),使得对所有x属于实数集R,有P(L(x) ≤ F(x) ≤ H(x)) = 1 - α,其中α是显著性水平,1 - α是置信水平。
在这个框架下,大多数置信带构造方法基于经验分布函数Fn(x),这是理论分布F(x)的非参数估计,其形式为样本中不超过x的观测值的比例。经验分布函数通常是阶梯状函数,具有样本点作为跳跃点。虽然经验分布函数能够很好地逼近真实分布,但在连续分布的情况下,我们自然期望置信带也是连续的。
之前的研究,比如Hall和Wood的工作,提出了利用核估计来构造光滑的置信带。但这种方法在窗宽选择上有局限性。如果窗宽太小,核估计将趋于经验分布函数,可能导致覆盖率误差增大;如果窗宽太大,则置信带可能出现不必要的宽。
本文创新性地引入了Kolmogorov-Smirnov统计量,这种统计量在统计推断中常用于检验两个分布是否相同。文中定义的KS统计量为Dn = supx∈R|Fn(x) - F(x)|,并使用了Dn的1 - α分位点Dγα。基于此,提出了(1 - α)KS置信带,具体形式为L(x) = max{Fn(x) - Dγα, 0}和H(x) = min{Fn(x) + Dγα, 1}。这样,置信带是连续的,构造过程简单,并且在模拟研究中显示出小的覆盖率误差。
KS连续置信带不仅在每一点上连续,而且其构造方式避免了基于核估计方法中窗宽选择的难题。此外,作者还证明了KS连续置信带具有渐近频率性质,也就是说随着样本量的增加,覆盖真实分布函数的概率趋向于预先设定的置信水平1 - α。
总体上,本文的研究对于统计学、可靠性工程以及寿命测试等领域具有重要意义。它提供了一种有效的工具,用于估计连续随机变量的分布函数,并且能够给出关于估计精度的直观度量。随着数据科学和机器学习的发展,对于更精确的概率分布估计的需求日益增加,KS连续置信带的提出为这一需求提供了有力的支持。