File "E:\yolact-master2\layers\box_utils.py", line 178, in match decoded_priors = decode(loc_data, priors, cfg.use_yolo_regressors) if cfg.use_prediction_matching else point_form(priors) RuntimeError: nvrtc: error: invalid value for --gpu-architecture (-arch) nvrtc compilation failed: #define NAN __int_as_float(0x7fffffff) #define POS_INFINITY __int_as_float(0x7f800000) #define NEG_INFINITY __int_as_float(0xff800000) template<typename T> device T maximum(T a, T b) { return isnan(a) ? a : (a > b ? a : b); } template<typename T> device T minimum(T a, T b) { return isnan(a) ? a : (a < b ? a : b); } extern "C" global void fused_div_sub_add_cat(float* t0, float* t1, float* aten_cat) { { if (512 * blockIdx.x + threadIdx.x<76992 ? 1 : 0) { aten_cat[512 * blockIdx.x + threadIdx.x] = (((512 * blockIdx.x + threadIdx.x) % 4<2 ? 1 : 0) ? (ldg(t0 + 512 * blockIdx.x + threadIdx.x)) - (ldg(t1 + 512 * blockIdx.x + threadIdx.x)) / 2.f : (ldg(t0 + (512 * blockIdx.x + threadIdx.x) - 2)) + (ldg(t1 + (512 * blockIdx.x + threadIdx.x) - 2)) / 2.f); } } }

时间: 2025-07-06 21:42:10 浏览: 21

<think>好的，我需要帮助用户解决CUDA编译时出现的nvrtc错误，特别是invalid value for --gpu-architecture的问题。用户提到在编译CUDA代码时遇到了这个错误，并且YOLACT项目报错RuntimeError: nvrtc compilation failed，特别是在box_utils.py中的decode函数调用处。首先，我需要理解这个错误的原因。根据用户提供的引用[1]和[2]，错误信息是nvrtc: error: invalid value for --gpu-architecture (-arch)。通常，这种错误是由于指定的GPU架构（-arch）参数不正确导致的。可能的情况包括使用了不被支持的架构名称，或者架构与CUDA版本不兼容。接下来，我需要考虑可能的解决方法。首先，用户需要检查他们指定的GPU架构是否正确。例如，常见的架构有sm_30、sm_52、sm_61等，具体取决于GPU的计算能力。如果用户指定的架构高于当前CUDA版本支持的架构，或者与显卡硬件不兼容，就会出现这个错误。然后，用户应该确认他们的CUDA工具包版本是否支持所选的架构。不同版本的CUDA支持的架构不同，例如CUDA 10.x可能不支持sm_86这样的架构。因此，查看CUDA文档中的兼容性列表是必要的。另外，用户可能需要检查他们的显卡型号和计算能力。使用nvidia-smi命令可以查看显卡型号，然后查找对应的计算能力。例如，RTX 30系列通常需要sm_86或更高，但需要CUDA 11.x及以上支持。此外，项目中的编译脚本或Makefile中的-arch参数设置可能有误，需要用户检查并更正。如果用户使用的是CMake，可能需要检查CMakeLists.txt中的相关配置。还有一个可能性是YOLACT项目本身对CUDA版本有特定要求，用户可能需要安装指定版本的CUDA工具包。例如，某些项目可能需要CUDA 10.1而不是11.x，这会导致架构参数不匹配。另外，用户可能需要更新NVIDIA驱动程序，因为旧版驱动可能不支持较新的架构。使用nvidia-smi查看驱动版本，并到官网下载最新驱动。最后，如果问题仍然存在，用户可能需要查阅YOLACT项目的文档或Issues页面，看看是否有其他开发者遇到类似问题及解决方案。在整理这些思路时，我需要确保建议的步骤清晰，并引导用户逐一排查可能的原因。同时，要提醒用户注意版本兼容性和硬件支持，避免遗漏关键点。</think>要解决CUDA编译时出现的`nvrtc: error: invalid value for --gpu-architecture (-arch)`错误，需从GPU架构兼容性、CUDA版本匹配、代码配置三方面入手。以下是分步解决方案： --- ### 1. **检查GPU架构与CUDA版本的兼容性** - **查看显卡计算能力**：通过[NVIDIA官方计算能力表](https://developer.nvidia.com/cuda-gpus)确认GPU型号对应的架构（如RTX 3090对应`sm_86`）。 - **确认CUDA支持的架构**：不同CUDA版本支持的架构不同（例如CUDA 11.4支持到`sm_87`）。若CUDA版本过旧，需升级CUDA工具包[^1]。 --- ### 2. **修正编译参数中的GPU架构标志** - **检查编译命令或脚本**：在项目的Makefile或CMakeLists.txt中找到`-arch=`或`--gpu-architecture`参数，确保其值与当前GPU和CUDA版本匹配。例如： ```bash # 错误示例（CUDA 10.x不支持sm_86） nvcc -arch=sm_86 mycode.cu # 正确示例（CUDA 11.x支持sm_86） nvcc -arch=sm_86 mycode.cu ``` - **使用通用虚拟架构**：尝试改用虚拟架构`compute_XX`配合真实架构`sm_XX`，例如： ```bash nvcc -gencode arch=compute_86,code=sm_86 ``` --- ### 3. **验证YOLACT项目的CUDA依赖** - **检查项目文档**：YOLACT可能对CUDA版本有明确要求（如需要CUDA 10.1）。通过`nvcc --version`确认本地CUDA版本是否符合。 - **更新第三方库**：确保使用的PyTorch、TorchVision等库与CUDA版本兼容。例如： ```bash # 安装与CUDA 11.3兼容的PyTorch conda install pytorch torchvision cudatoolkit=11.3 -c pytorch ``` --- ### 4. **更新驱动和CUDA工具包** - **升级NVIDIA驱动**：旧版驱动可能导致架构识别错误。使用以下命令更新： ```bash sudo apt-get install nvidia-driver-510 # 示例版本 ``` - **重新安装CUDA**：从[NVIDIA官网](https://developer.nvidia.com/cuda-toolkit-archive)下载与GPU匹配的CUDA版本。 --- ### 5. **修改YOLACT代码中的编译设置** 在YOLACT的`box_utils.py`中，可能硬编码了不兼容的架构参数。找到类似以下代码段并修正`arch`值： ```python # 示例：原代码可能包含错误的sm_80 torch.utils.cpp_extension.load(name='decode', sources=['src/decode.cu'], extra_cflags=['-arch=sm_86']) ``` --- ### 6. **清理并重新编译项目** ```bash # 清除旧编译文件 make clean # 或对于Python项目 python setup.py clean # 重新编译 python setup.py build_ext --inplace ``` --- ### 验证解决效果运行以下命令确认GPU架构是否被正确识别： ```bash nvcc --list-gpu-arch # 查看支持的架构 nvidia-smi # 检查驱动和GPU状态 ``` ---

阅读全文

相关推荐

System.Drawing.PSD-master.zip_HIX_System.Drawing.PSD_c# psd to j

LTE-xilinx_PFGA_reference_design.zip_LTE 设计_LTE-xilinx_hppt: //

word2vec.rar_VEC-361_layers5cb_vec361_word2vec_word2vec 中文

vulkan-validation-layers-1.2.182.0-2.el8_4.x86_64.rpm

Understanding-the-Layers-in-JESD204B_ZQ.rar

vulkan-validation-layers-1.2.182.0-1.el8_4.x86_64.rpm

vulkan-validation-layers-1.2.182.0-2.el8_4.aarch64.rpm

vulkan-validation-layers-1.2.189.0-2.el8.x86_64.rpm

P-Neural-Network-master_ANN_源码.zip

vulkan-validation-layers-1.2.182.0-1.el8_4.aarch64.rpm

vulkan-validation-layers-1.2.162.0-1.el8.x86_64.rpm

tenforflow_five_layers_relu_lrdecay.py

Python库 | econ_layers-0.0.20-py2.py3-none-any.whl

Multiply_Layers_DPNN.py

tenforflow_five_layers_sigmoid.py

PyPI 官网下载 | econ_layers-0.0.20-py2.py3-none-any.whl

tenforflow_batchnorm_five_layers_relu.py

tenforflow_batchnorm_five_layers_sigmoid.py

Python库 | psd_tools-1.9.6-cp27-cp27m-manylinux1_x86_64.whl

Python库 | psd_tools-1.9.2-cp37-cp37m-manylinux1_x86_64.whl

大家在看

select图片下拉框

Jtopo demo

linphone 4.1.1 SDK，C# Demo封装包，包含封装CS文件和所需要Dll，直接拉入项目即可

pb调用支付宝接口的例子

IFPUG工作量算法总结.pdf

最新推荐

解决Tensorflow2.0 tf.keras.Model.load_weights() 报错处理问题

学校图书馆管理系统JspLibrary

大学毕业论文-—基于web的图书管理系统的设计(1).doc

基于Flask的任务清单管理系统.zip

全面掌握Oracle9i：基础教程与实践指南

【数据融合技术】：甘肃土壤类型空间分析中的专业性应用

模糊大津法

SOA服务设计原则：2007年7月版原理深入解析

【空间分布规律】：甘肃土壤类型与农业生产的关联性研究

rc滤波导致相位