le@le-Legion-Y9000P-IRX8:~$ nvidia-smi NVIDIA-SMI has failed because it couldn't communicate with the NVIDIA driver. Make sure that the latest NVIDIA driver is installed and running.
时间: 2025-07-04 13:18:29 浏览: 10
### 检查当前内核版本与已安装驱动是否匹配
当服务器重启后,若系统更新了内核版本而未重新编译 NVIDIA 驱动模块,则可能导致 `nvidia-smi` 无法正常通信。此时应使用以下命令检查当前运行的内核和已安装的内核版本:
```bash
uname -a
dpkg --get-selections | grep linux-image
```
若发现当前使用的内核版本不同于已安装的版本,则说明可能因内核更新导致 NVIDIA 驱动模块未能正确加载。此时需要重新构建 DKMS 模块以适配当前内核。
### 安装或修复 DKMS 支持
为确保 NVIDIA 驱动能够在不同内核版本中自动重建模块,需确保 `dkms` 工具已正确安装。若在执行过程中遇到网络问题导致无法获取包列表,可尝试手动配置 DNS 解析信息:
```bash
sudo echo "nameserver 8.8.8.8" > /etc/resolv.conf
sudo apt update
sudo apt install dkms
```
完成 `dkms` 安装后,查看 `/usr/src/` 目录下已安装的 NVIDIA 驱动模块版本,并使用以下命令重新构建对应模块:
```bash
ls /usr/src | grep nvidia
sudo dkms install -m nvidia -v <version>
```
其中 `<version>` 替换为实际显示的驱动版本号,例如 `470.82.01`。此操作将使驱动模块适配当前内核并恢复 `nvidia-smi` 的功能[^3]。
### 重新安装 NVIDIA 驱动程序
若上述方法无效,建议直接卸载当前驱动并重新安装最新版本。可使用以下命令清除旧驱动:
```bash
sudo apt purge nvidia-*
```
随后重新安装指定版本的 NVIDIA 驱动,例如推荐使用的稳定版本:
```bash
sudo apt install nvidia-driver-535
```
安装完成后重启系统,并再次运行 `nvidia-smi` 查看是否恢复正常。该方式适用于驱动损坏、版本不兼容或与 CUDA 工具链冲突的情况[^2]。
### 使用 `nvidia-smi` 和 `nvcc` 检查驱动状态
安装完成后,运行以下命令验证驱动是否正常工作:
```bash
nvidia-smi
```
若输出 GPU 状态信息则表示驱动已成功加载。此外,可通过以下命令确认 CUDA 编译器是否能够识别当前环境:
```bash
nvcc -V
```
如果 `nvcc` 显示 CUDA 版本信息但 `nvidia-smi` 仍报错,则可能是驱动路径未正确设置或存在多版本冲突,需进一步检查环境变量和驱动链接配置。
阅读全文
相关推荐


















