贝叶斯（一）先验分布与后验分布

最新推荐文章于 2025-03-19 22:12:43 发布

麓山君陌

最新推荐文章于 2025-03-19 22:12:43 发布

阅读量1.1w

点赞数 13

CC 4.0 BY-SA版权

分类专栏：贝叶斯科研生文章标签：机器学习人工智能深度学习

本文链接：https://blog.csdn.net/qq_40851744/article/details/121589380

本文详细介绍了贝叶斯统计中的先验分布和后验分布概念，包括先验分布如何描述未知量的初步信息，后验分布如何结合样本信息更新对未知量的估计。讨论了样本信息、总体分布和参数的共轭先验分布，并通过实例展示了如何计算二项分布、正态分布等情形下的后验分布。此外，还提到了充分统计量和因子分解定理的重要性。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

一、先验分布与后验分布

先验分布：将一个未知量 $θ\theta$ （这个 $θ\theta$ 并不是样本x）看做随机变量，应用一个概率分布在抽样前描述关于 $θ\theta$ 的先验信息的概率陈述，即先验分布
总体信息：样本x所属的数据空间X的分布情况
样本信息：样本x自身的分布情况，一般用 $P(x∣θ)=∏i=0nP(xi∣θ)P(x|\theta)=\prod_{i=0}^nP(x_i|\theta)$ 表示
后验分布：根据先验分布和样本信息通过贝叶斯公式得到的针对未知量 $θ\theta$ 的再次估计得到的概率分布
贝叶斯公式：有三种形式：
1. 事件形式：假定 $A_1,...,A_k$ 是互不相容的事件，他们的和 $⋃i=1kAi\bigcup_{i=1}^{k}A_i$ 包含事件B，则有：
  
  $P(Ai/B)=P(Ai)P(B/Ai)∑i=1kP(Ai)P(B/Ai)P(A_i/B)=\frac{P(A_i)P(B/A_i)}{\sum_{i=1}^{k}P(A_i)P(B/A_i)}$
2. 密度函数：随机变量X有一个密度函数P(x| $θ\theta$ )， $θ\theta$ 是一个参数，不同 $θ\theta$ 表示不同的密度函数，因此P(x| $θ\theta$ )可以看做给定 $θ\theta$ 后的一个条件密度函数，这就可以看做总体的分布。
  1. $θ\theta$ 的先验分布为 $π(θ)\pi(\theta)$ ，同理，后验分布可以表示为 $π(θ∣x)\pi(\theta|x)$ 其中x是我们抽样后得到的样本
  2. 可以把样本x和参数的先验分布联合得到联合密度函数：
    
    $h(x1,...,xn,θ)=p(x1,...,xn∣θ)π(θ)h(x_1,...,x_n,\theta)=p(x_1,...,x_n|\theta)\pi(\theta)$
  3. 在联合密度函数中，当样本 $x_1,...,x_n$ 给定之后，未知的参数就只有 $θ\theta$ 了，就可以通过样本和先验分布去估计 $θ\theta$ 的后验分布，只要去掉样本 $x_1,...,x_n$ 的分布就可以了，相当于在这里，事件B就是样本 $x_1,...,x_n$ 的分布，通过积分求得全概率，事件A是 $θ\theta$ 的分布
    
    $π(θ∣x1,...,xn)=h(x1,...,xn,θ)m(x1,...,xn)=p(x1,...,xn∣θ)π(θ)∫θp(x1,...,xn∣θ)π(θ)dθ\pi(\theta|x_1,...,x_n)=\frac{h(x_1,...,x_n,\theta)}{m(x_1,...,x_n)}=\frac{p(x_1,...,x_n|\theta)\pi(\theta)}{\int_{\theta}{p(x_1,...,x_n|\theta)\pi(\theta)}d\theta}$
  4. 其中， $m(x_1,...,x_n)$ 是样本x的边缘分布，或者说全概率
3. 离散形式：当 $θ\theta$ 是离散随机变量的时候，先验分布是 $π(θi)\pi(\theta_i)$ ，后验分布是
  
  $π(θi∣x)=p(x∣θi)π(θi)∑jp(x∣θj)π(θj),i=1,2,...\pi(\theta_i|x)=\frac{p(x|\theta_i)\pi(\theta_i)}{\sum_j{p(x|\theta_j)\pi(\theta_j)}},i=1,2,...$

共轭先验分布：未知量 $θ\theta$ 的先验分布 $π(θ)\pi(\theta)$ 和后验分布 $π(θ∣x)\pi(\theta|x)$ 有着相同的分布函数形式，只是参数不同，则 $π(θ)\pi(\theta)$ 是变量 $θ\theta$ 的共轭先验分布

总体分布	参数	共轭先验分布
正态分布 $N(θ,σ2)N(\theta,\sigma^2)$	均值 $θ\theta$	正态分布 $N(μ,γ2)−N(x‾σ−2n+μγ−2σ−2n+γ−2,σ2nγ2σ2n+γ2)N(\mu,\gamma^2)-N(\frac{\overline{x}\frac{\sigma^{-2}}{n}+\mu\gamma^{-2}}{\frac{\sigma^{-2}}{n}+\gamma^{-2}},\frac{\frac{\sigma^2}{n}\gamma^2}{\frac{\sigma^2}{n}+\gamma^2})$