这个错误和GPU的算力有关系 CUDA error: no kernel image is available for execution on the device

marsjin

已于 2024-05-13 14:54:29 修改

阅读量379

点赞数 3

文章标签：人工智能深度学习

于 2024-05-13 14:51:28 首次发布

本文链接：https://blog.csdn.net/marsjin/article/details/138802751

版权

这个错误折腾了好几天，最后发现是GPU算原因

GPU算力图如下

环境：本地GPU是P40，部署到阿里云P100
python部署是在本地编译后部署到阿里云服务器上

开始解决了Nvidia内核版本，CUDA版本，和python组建的cuda和torch的软件的版本

经过多次修改后环境版本如下：

GPU Type: Tesla P40
Nvidia Driver Version: 535.161.08
CUDA Version: 12.2
CUDNN Version: 8500
Operating System + Version: Ubuntu 22.04
Python Version: 3.9.19

torch==2.0.1
torchaudio==2.0.2
torchvision==0.15.2

环境版本没有问题了，后来在网上看到说算力的问题

如上图所示本地P40的算力是6.1，云上P100的算力是6.0 算力降低了

经过多次尝试后，云上版本更改为V100是7.0的算力

注意：本地的P40和云上V100的GPU不是一个系列的版本没有问题；但是注意镜像内不要安装GPU驱动，使用实体主机的驱动版本（这一段一定要注意，我踩了个大坑）

终于成功了，又前进了一步。。。，路途还遥远，继续前行

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

marsjin

关注关注

3
点赞
踩
0

收藏

觉得还不错? 一键收藏
2
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

【深度学习故障排除】解决 CUDA “no kernel image is available“ 错误的指南

m0_51098495的博客

04-28

2万+

错误通常表明当前的PyTorch安装不支持你的GPU的CUDA计算能力。这可能是由于安装了错误的CUDA或PyTorch版本。

成功解决：RuntimeError: CUDA error: no kernel image is available for execution on the device

qq_23022733的博客

08-23

4393

安装的 PyTorch 版本和 CUDA 版本不兼容。可以重新安装与系统上 CUDA 版本匹配的 PyTorch 版本。CUDA 版本与 GPU 驱动程序或 PyTorch 安装的 CUDA 编译版本不兼容。安装完成后，就可以完美解决这个Bug！

2 条评论您还未登录，请先登录后发表或查看评论

[解决bug]CUDA error: no kernel image is available for execution on the device

a180736的博客

02-27

7236

我在复现论文的代码时反复出现这个错误，终于在今天被我解决了，特此立帖记录。

CUDA error: no kernel image is available for execution on the device

最新发布

liurui50的博客

04-06

408

这个没有什么好办法因为每个人机器不一样(安装流程就是：1.安装cuda+cudnn；2.安装pytorch；3.安装transforms；)，就是利用conda创建一个新的环境，然后重新安装环境。官网： https://developer.nvidia.com/cudnn-downloads。查看教程： 1.ubunbu 22.04安装nvidia驱动.mhtml。2.2 cuda版本与pytorch的版本是否匹配。2.1 cuda+cudnn配置是否正确。3. pytorch安装。

CUDA error: no kernel image is available for execution on the device 报错解决方法

weixin_44001371的博客

10-19

2052

装新环境按CLRNet项目要求装了个1.8.0的 pytroch，训练的时候报错。先是显示，网上查了一圈都说是当前显卡的算力太低，不支持高版本的 CUDA。看了一眼显卡：3090；而且之前用 pytorch 也没出现这种问题。往上翻了一下训练途中的 warning，看到一句：CUDA capability sm_86 是说当前 GPU 3090 算力是 8.6，与安装的 PyTorch 版本不匹配。虽然错误描述里说的是 PyTorch，但实际上是说 PyTorch 依赖的CUDA 版本。

[已解决]RuntimeError: CUDA error: no kernel image is available for execution on the device

qq_40833391的博客

01-15

2万+

NVIDIA GeForce RTX 3090 with CUDA capability sm_86 is not compatible with the current PyTorch installation；RuntimeError: CUDA error: no kernel image is available for execution on the device

【GPU】no kernel image is available for execution on the device

从善若水的博客

10-08

4947

前段时间在一个很古老的笔记本（lenovo Y400 GT650M*2）上安装NVIDIA内核驱动和CUDA，安装过程也是一波三折，首先是NVIDIA内核一直无法加载，提示原因是内核签名失败，最后发现是因为UEFI开启了选项，后来关闭这个feature之后内核正常加载了，nvidia-smi也可以正常使用了，

当出现RuntimeError:CUDA error:no kernel image is available for execution on the device 问题时候的pytorch安装方法

m0_65931988的博客

04-07

2363

本人由于需要学习深度学习，因此要用到pytorch.经过不断摸索终于成功安装好了pytorch,其中走过很多弯路，其中最大的原因就是没有意识到显卡算力的问题导致安装pytorch不匹配。

解决RuntimeError: CUDA error: no kernel image is available for execution on the deviceCUDA

m0_54000677的博客

01-11

4170

解决RuntimeError: CUDA error: no kernel image is available for execution on the deviceCUDA kernel errors might be asynchronously reported at some other API call,so the stacktrace below might be incorrect.在服务器复现代码的时候，遇到了上述错误，解决办法如下。

[Ubuntu Error] RuntimeError: CUDA error: no kernel image is available for execution on the device

挪威的深林的博客

07-07

1014

命令显示使用的是CUDA 11.8编译器。这种不一致可能导致运行时出现问题，因为库和编译器版本不匹配。提供的输出信息来看，系统上安装了CUDA 10.1相关的包，但。如果你不再需要CUDA 10.1，可以卸载它以避免冲突。

【bug】RuntimeError: CUDA error: no kernel image is available for execution on the device 解决方案

Light.T的博客

06-10

1783

使用demo程序验证GPU是否正常，代码如下： import pytorch print(torch.__version__) t=torch.ones(1,1,2,2) t=torch.cuda() 发现报错： RuntimeError: CUDA error: no kernel image is available for execution on the device 查明是torch的版本和cuda的版本不匹配，升级torch可以解决这个问题。升级命令可以使用如下网页查询： https:/

Pytorch：报错RuntimeError: CUDA error: no kernel image is available for execution on the device详细处理报告

WinterShiver

01-19

1543

这个报错的原因就是pytorch和cuda的版本不匹配。具体的解决方案如下照做即可。本文主要分享一些干货，即个人踩的一些坑、造成的原因以及对应的解决方法......

解决CUDA error: no kernel image is available for execution on the device

热门推荐

HPG的博客

05-24

9万+

1. 电脑配置 GPU 3080 算力8.6 CUDA 11.1 CUDNN 8.2.0 conda 4.9.2 python 3.8.5 2. 问题描述首先在pytroch官网根据电脑相应配置使用pip命令 pip3 install torch==1.8.1+cu111 torchvision==0.9.1+cu111 torchaudio==0.8.1 -f https://download.pytorch.org/whl/torch_stable.html 安装torch、torchau

c++ CUDA error: no kernel image is available for execution on the device的一种可能原因

qq_31467375的博客

07-19

1463

或者将-gencode arch=compute_89,code=sm_89去掉也可以。原因之一：设置的算力和本机GPU的算力不匹配。可以通过以下网站查询。我使用的是4090，cmakelist中设置编译选项。

RuntimeError: CUDA error: an illegal memory access was encountered

qq_43733107的博客

07-25

9794

RuntimeError: CUDA error: an illegal memory access was encountered

[CUDA编程] --- nvcc编译过程和GPU计算能力

M2嵌入式

08-25

1338

nvcc编译流程具体可参看官方文档： nvcc编译过程：https://docs.nvidia.com/cuda/cuda-compiler-driver-nvcc/index.html下面结合这张图进行具体讲解 NVCC的编译过程分为离线编译和即时编译两部分组成：离线编译（绿色虚线框内）：CUDA源程序（即xxx.cu文件）在编译前的预处理会被分为主机端代码和设备段代码（即图中的左右分支）：1.如图右分支：在设备端代码会被编译成ptx文件（可以看作是用于设备端的汇编文件）或是直接可运行的二进制文件xx

【已解决】RuntimeError: No CUDA GPUs are availableERROR:torch.distributed.elastic.multiprocessing.api:fa

BetrayFree的博客

04-19

3545

0为服务器中的GPU编号，可以为0, 1, 2, 3等，表明对程序可见的GPU编号。1. 命令：CUDA_VISIBLE_DEVICES=1 # 只有编号为1的GPU对程序是可见的，在代码中gpu[0]指的就是这块儿GPUCUDA_VISIBLE_DEVICES=0..._cuda_visible_devices。不过，很有意思的是，看的出来我这里面使用的是分布式计算，那我单机多GPU训练的时候，一个GPU上能跑几个进程呢？果然，我这机器里面只有2个GPU，但是呢，这里面的却是5，显然是没办法找到的！

报错“CUDA error: no kernel image is available for execution on the device”

weixin_43501330的博客

09-13

1123

报错“CUDA error: no kernel image is available for execution on the device”

CUDA-设备属性

u011613991的专栏

12-28

410

struct cudaDeviceProp { char name[256]; /**< 设备的ASCII标识 */ size_t totalGlobalMem; /**< 可用的全局内存量，单位字节 */ size_t totalConstMem; /**< 可用的常量...

jetson nx RuntimeError: CUDA error: no kernel image is available for execution on the device

01-18

### 解决Jetson NX上CUDA错误：no kernel image available for execution on device 当遇到`RuntimeError: CUDA error: no kernel image is available for execution on the device`这一错误时，通常意味着当前设备无法执行特定的CUDA内核。这可能是由于硬件架构不匹配、驱动程序版本不对或是CUDA工具包与PyTorch之间的兼容性问题所引起的[^1]。对于Jetson NX平台而言，确保安装了适合该平台的操作系统和CUDA环境至关重要。NVIDIA官方提供了针对Jetson系列优化过的Linux发行版L4T (Linux for Tegra)，建议使用此操作系统来减少潜在的兼容性风险[^4]。 #### 验证并更新CUDA和cuDNN版本确认已正确配置适用于Jetson NX的CUDA版本，并且cuDNN库也已经适配好。可以通过以下命令检查现有安装情况： ```bash nvcc --version cat /usr/local/cuda/version.txt apt list --installed | grep cudnn ``` 如果发现版本不符，则应按照[NVIDIA开发者博客](https://developer.nvidia.com/blog/)中的指导进行适当调整。 #### 设置正确的PyTorch构建选项为了使PyTorch能够在Jetson平台上顺利运行，可能需要手动编译带有特定标志的源码，以适应ARM架构下的计算需求。可以尝试通过预编译二进制文件或遵循社区贡献者分享的方法来进行部署[^2]。另外，在导入任何依赖之前，请先验证Python环境中是否存在必要的扩展模块： ```python import torch print(torch.cuda.is_available()) print(torch.backends.cudnn.enabled) ``` 上述代码片段可以帮助判断当前设置是否能够识别到可用的GPU资源以及CUDNN加速功能是否开启。 #### 调试技巧启用同步模式有助于更精确地定位实际发生错误的位置。可以在启动应用程序前设置如下环境变量： ```bash export CUDA_LAUNCH_BLOCKING=1 ``` 这样做之后再重现问题，可以获得更加详细的调用栈信息用于进一步分析。