一次pytorch中出现的nan问题

博客讲述了在PyTorch中遇到loss变为nan的问题,经过排查发现是由于负数开方操作导致。文章指出,数学上虽然负数的某些次方有实数解,但在Python和PyTorch中会得到虚数或nan。通过举例说明了(-27)**(1/3)的结果,并提出解决方案:在开方前确保数值为正或者对负数进行特殊处理。建议在计算时要避免负数开方,以免出现nan错误。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

nan排查

最近调试代码时,发现一个loss全部变为nan。网上主流的解释大多千篇一律,比如

1.学习率太高。

2.loss函数

3.对于回归问题,可能出现了除0 的计算,加一个很小的余项可能可以解决

4.数据本身,是否存在Nan,可以用numpy.any(numpy.isnan(x))检查一下input和target
...

我这儿问题可以确定,是由于数学运算造成的nan。最后具体定位到,是由于一个池化操作造成的。在pycharm中单步调试,使用如下表达式判断x中是否有nan,因为nan!=nan结果是True,而其他任何实数!=实数本身结果均为False

torch.sum(x!=x)
torch.sum(x[:1000] != x[:1000])  # 依次这样二分法查找第一次出现nan的那个位置

最后发现是对负数开方将会产生nan,如下

p = 3.
 x_i = (torch.mean(x_i**p, dim=-1) + 1e-12)**(1/p) # 如果x_i中有负数,那么开方之后,对应位置就会为nan

解释

主流的计算器,编程语言均是不支持负数的开方的,即便是数学上成立,计算器还是会给出虚数解, 对于pytorch来说,就成了nan。比如:

>>>(-27)**(1/3)
(1.5000000000000004+2.598076211353316j)

-27的1/3次是存在实数解的,但是计算结果还是一个虚数解。所以以后要开方的话,一定要对负数特别处理,比如把负号拿出来:

>>>-(1)**(1/3)
-1.0
>>>-(27)**(1/3)
-3.0

这篇博文也提到了python中这个问题,实际上一般的计算器也是这样的。

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值