CRPS和NLL

参考:CRPS:贝叶斯机器学习模型的评分函数_continuous ranked probability score连续概率评分计算步骤-CSDN博客

连续分级概率评分(CRPS)和负对数似然损失(Negative Log-Likelihood, NLL)都是用于评估概率预测模型的指标,但它们在数学定义、应用场景和侧重点上存在显著差异。

  • CRPS:

衡量预测分布的累积分布函数(CDF)与真实观测值的CDF(阶跃函数)之间的差异。公式为:


其中,F(x)是预测分布的CDF,y是真实观测值。

  • NLL:

基于预测分布的概率密度函数(PDF)计算数据点的负对数似然:


其中,f(y)是预测分布在真实值y处的概率密度。

核心区别

特性CRPSNLL
比较对象预测CDF与真实CDF的差异预测PDF在真实值处的概率密度
积分范围全局积分(整个实数轴)仅依赖真实值处的局部密度
对分布的敏感度关注分布整体形状(如均值、方差)仅关注真实值附近的局部拟合
异常值敏感度较稳健(积分平滑化差异)较敏感(直接依赖单点密度)
适用场景连续变量预测(如温度、降水量)参数估计、模型训练(如贝叶斯模型)
指标最小值最大值敏感度极端情况
CRPS0(完美预测)无理论上限对整体分布形状敏感预测分布越宽,CRPS 越大
NLL0(理论极限)+∞(概率密度→0)对真实值附近的概率密度敏感预测方差太小或均值偏离时,NLL 可能爆炸

CRPS(连续分级概率评分)的取值范围是 [0, +∞)

CRPS与MAE(平均绝对误差)

点预测的极限:当预测分布退化为点估计(Dirac delta函数)时,CRPS退化为绝对误差(MAE),而NLL趋向无穷大(无法处理确定性预测)。

总结

CRPS和NLL虽然都用于概率模型评估,但本质不同

CRPS:衡量预测的「整个概率分布」和「真实值」的差距。通过积分全局比较CDF,更适合评估连续分布的整体性能;

NLL:衡量预测分布中「真实值出现的概率」有多高。通过局部密度计算似然,更适合参数优化和密度估计任务。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值