服务器输入nvidia-smi提示No devices were found
时间: 2025-04-24 22:11:29 浏览: 45
### 可能的原因分析
当遇到 `nvidia-smi` 命令返回 “No devices were found” 的情况时,这通常意味着系统无法识别到任何 NVIDIA GPU 设备。可能原因包括但不限于:
- Nouveau 开源驱动程序正在被使用而不是官方的 NVIDIA 驱动程序[^1]。
- 安装过程中某些组件未能正确配置或者存在版本兼容性问题[^3]。
### 解决方法建议
#### 卸载并禁用 Nouveau 驱动器
如果当前确实是由 Nouveau 控制硬件,则需先将其移除以确保可以顺利加载专有的 NVIDIA 显卡驱动。可以通过编辑 GRUB 参数来阻止 Nouveau 加载,并重启机器后再尝试重新安装合适的 NVIDIA 软件包。
```bash
sudo nano /etc/modprobe.d/blacklist.conf
```
向文件末尾追加如下两行内容:
```text
blacklist nouveau
options nouveau modeset=0
```
更新引导装载程序设置以便更改生效:
```bash
sudo update-initramfs -u
sudo reboot
```
#### 检查 BIOS 设置
确认服务器主板上的 UEFI/BIOS 是否启用了 PCIe 插槽中的 GPU 功能以及是否设置了正确的电源管理模式[^4]。
#### 更新或重置 Nvidia Driver
即使之前成功安装过一次驱动也可能因为内核升级或其他因素而失效。因此应当考虑下载最新的稳定版驱动进行覆盖安装,同时注意清理旧残留数据防止冲突发生。
对于基于 Debian/Ubuntu 发行版的操作系统来说,推荐通过 PPA 来获取最新发布的二进制闭源驱动而非手动编译 RPM 文件形式分发的产品。
```bash
distribution=$(. /etc/os-release;echo $ID$VERSION_ID)
wget https://developer.download.nvidia.com/compute/cuda/repos/$distribution/x86_64/cuda-$distribution.pin
sudo mv cuda-$distribution.pin /etc/apt/preferences.d/cuda-repository-pin-600
sudo apt-key adv --fetch-keys https://developer.download.nvidia.com/compute/cuda/repos/$distribution/x86_64/7fa2af80.pub
sudo add-apt-repository "deb http://developer.download.nvidia.com/compute/cuda/repos/$distribution/x86_64/ /"
sudo apt-get update
sudo apt-get -y install cuda-drivers
```
完成上述操作之后再次启动计算机验证问题是否得到解决。
#### 核实物理连接状况
最后还需仔细排查实际连线是否存在松脱现象,尤其是多GPU集群环境中更要注意各节点间的互联稳定性[^5]。
阅读全文
相关推荐


















